/
Похожие
Текст
GREGORY A. KIMBLE
How to use
(and misuse
Statistics
Prentice-Hail, lnc.f
Englewood Cliffs, N-J.
Г. КИМБЛ
НАН ПРАВИЛЬНО
ПОЛЬЗОВАТЬСЯ
СТАТИСТИНОЙ
Перевод с английского Б. И. КЛИМЕНКО
Предисловие Н. К. ДРУЖИНИНА
МОСКВА
«ФИНАНСЫ И СТАТИСТИКА»
1982
ББК 22.172
К40
БИБЛИОТЕЧКА ИНОСТРАННЫХ КНИГ
ДЛЯ ЭКОНОМИСТОВ И СТАТИСТИКОВ
Издательство «Финансы и статистика» выпускает на русском языке серию
книг иностранных авторов, рассчитанных на специалистов, нуждающихся в по-
полнении своих математических и статистических знаний. Задача серии — позна-
комить советского читателя с методами, применяемыми за рубежом в экономи-
ческом анализе и различных хозяйственных расчетах. В серию включаются так-
же работы по общим вопросам статистики.
Вышли из печати книги:
1. М. Броуди. О статистическом рассуждении. 1968.
2. А. Б ер нетей и. Справочник статистических решений. 1968.
3. У. Дж. Рейхи ап. Применение статистики. 1969.
4. X. Крыньский. Математика для экономистов. 1970.
5. С. Дайменд. Мир вероятностей. 1970.
6. А. Хьютсон. Дисперсионный анализ. 1971.
7. С. Лизер. Эконометрические методы и задачи. 1971.
8. Эм. Бор ель, Р. Дельт ей ль, Р. 10 р о н. Вероятности, ошибки*
1972.
9. Статистические методы исследования корреляций в экономике. 1972.
10. Л. Сто лер ю. Равновесие и экономический рост. 1974.
11. Я. Окунь. Факторный анализ. 1974.
12. С. С и р л, У. Г о с м а и. Матричная алгебра в экономике. 1974.
13. Е. Г р е н ь. Статистические игры и их применение. 1975.
14. Д. Тёрнер. Вероятность, статистика и исследование операций. 1976.
15. Э. Кейн. Экономическая статистика и эконометрия. Вып. 1. 1977.
16. Э. Кейн. Экономическая статистика и эконометрия. Вып. 2. 1977.
17. Э. Кол кот. Проверка значимости. 1978.
18. Г. Дэвид. Метод парных сравнений. 1978.
19. М. Г. Кенуй. Быстрые статистические вычисления. 1979.
20. Дж. Вайнберг, Дж. Шу мекер. Статистика. 1979.
21. Н. Хастингс, Дж. Пикок. Справочник по статистическим рас-
пределениям. 1980.
22. А. Гильберт. Как работать с матрицами. 1981.
23. М. Кен дэл. Временные ряды. 1981.
24. Ю. К ю п. Описательная и индуктивная статистика. 1981.
25. А. Эренберг. Анализ и интерпретация статистических данных. 1981.
26. П. Мюллер, II. Нойман, Р. Шторм. Таблицы по математи-
ческой статистике. 1982.
Подготавливаются к изданию:
Э. Фёрстер, Б. Р ё н ц. Методы корреляционного и регрессионного
анализа.
М. X о л л е н д е р, Д. В у л ф. Непараметрические методы статистики.
РЕДКОЛЛЕГИЯ СЕРИИ:
В. М. ИВАНОВА, В. А. КОЛЕМАЕВ, Г. Г. ПИРОГОВ,
А. А. РЫВКИН, Е. М. ЧЕТЫРКИН, Р. М. ЭНТОВ.
К
0702000000—166
010(01)—82
41—82
© Prentice-Hall, Inc., 1978
© Перевод на русский язык, предисловие к русскому изданию, «Финансы,
и статистика», 1982
ПРЕДИСЛОВИЕ
К РУССКОМУ ИЗДАНИЮ
Предлагаемая советскому читателю книга Грегори А. Кимбла
«Как правильно пользоваться статистикой» принадлежит к научно-
популярной литературе, польза которой во всех областях знания
несомненна. Она насыщена шутливыми примерами, с помощью
которых автор стремится заинтересовать читателя и довести до
него смысл и значение излагаемых им положений статистической
науки. В предисловии к своей книге автор пишет: «Было бы при-
скорбно, если бы многочисленные шутливые истории и любопыт-
ные факты, с помощью которых я пытался как-то оживить изло-
жение, отвлекли ваше внимание от восприятия более серьезных
вопросов и концепций». При этом он считает, что если иногда чте-
ние книги будет вызывать улыбку, то это сделает ее более доход-
чивой. Таким образом, цель автора не состояла в том, чтобы про-
сто развлечь читателя. Знакомя читателя со статистическими
методами, очень важными, по его мнению, в научном исследо-
вании, он желал привить ему «статистический образ мыш-
ления».
Уместно вспомнить, что еще 70 лет назад известный русский
статистик А. А. Чупров отметил, что стремление научного знания
облекаться в статистические формы составляет его характерную
черту. Он считал, что «рост современной науки идет под знаком
интереса к массовым явлениям и скоро не будет такой ветви зна-
ния, куда, с большим или меньшим успехом, не простирали бы
своего влияния статистические формы знания» (Чупров А. А.
Закон больших чисел в современной пауке. — В кн.: О теории ве-
роятностей и математической статистике. М., Наука, 1977, с. 178).
Грегори А. Кимбл — психолог по своей научной специальности,
и, естественно, трактовка им проблем статистической методологии
отражает специфику его научных интересов. Он представляет эту
методологию в свете задач применения математико-статистических
приемов в работе экспериментатора-психолога. Рассказ об этих
приемах и составляет содержание книги. Однако автор на протя-
жении всего изложения имеет в виду главным образом приложе-
ние статистических методов при интерпретации результатов экспе-
5
римента. Даже говоря о задачах науки, на самом деле он подра-
зумевает принципы планирования научного эксперимента.
Особенность книги Грегори А. Кимбла заключается также и в
том, что она не перегружена математическими формулами. Свой
облегченный подход к математической стороне излагаемого мате-
риала автор оговаривает в предисловии, отмечая, что он не видит
«необходимости особо детально останавливаться на формулах и
расчетах». Но в приложении к книге все же дается описание не-
которых приемов статистических вычислений для тех читателей,
«кто считает, что без арифметики обойтись никак нельзя». Пере-
грузка популярной книги математическими формулами и вычисле-
ниями всегда, конечно, нежелательна. Однако нельзя сказать, что
Грегори А. Кимбл обходится без всякой «математики». Это едва
ли было бы возможно в рассказе, хотя и популярном, о математи-
ческой статистике. Важно лишь отметить, что автор очень умерен-
но пользуется математическими формулами. Прежде чем обра-
титься к содержанию книги, необходимо сказать несколько слов
о том материале, который привлекается автором для раскрытия
смысла статистических показателей и для иллюстрации вычисле-
ний. Будучи психологом, Грегори Л. Кимбл не прошел мимо ши-
роко распространенных в американских психологических исследо-
ваниях показателей уровня умственного развития (коэффициентов
IQ), а также пресловутых показателей «стресса», научная ценность
которых, по нашему мнению, равна нулю. Но он обращается и к
другому" самому разнообразному материалу, порой действительно
вызывающему улыбку. Так, например, к случаю он упоминает
о «магическом» значении числа «семь», а желая истолковать по-
нятие частоты в статистике, обращается к «Энциклопедии мело-
чей».
Книга Грегори А. Кимбла состоит из 10 глав и приложения.
В конце каждой главы дается краткий обзор основных понятий,
встречающихся в данной главе, что, несомненно, облегчает усвое-
ние читателем предлагаемого ему материала. В приложении по-
казан порядок вычислений по некоторым формулам, приведенным
в основном тексте. В последнем разделе книги — «Заключительных
комментариях» — читателю предлагаются задачи, дополняющие
соответствующие главы книги. В общем автору удалось изложить
почти все главные темы математической статистики в аспекте
приложения ее приемов при интерпретации результатов экспери-
мента. Однако автор совершенно не коснулся факторного анализа,
основанного па статистическом изучении матрицы коэффициентов
корреляции. Как известно, этот анализ возник и развивался при-
менительно к изучению различных психологических тестов, т. е.
именно в той области научного знания, представителем которой
и является автор книги. По-видимому, особая сложность приемов
факторного анализа, трудно поддающихся популяризации, не по-
зволила автору их изложить. К сожалению, в книге не уделено
внимания и вопросам так называемой ранговой статистики.
Книга Грегори А. Кимбла в смысле порядка излагаемых вопро-
6
сов построена необычно. В курсах статистики учащийся первона-
чально вводится в круг элементарных понятий статистического ме-
тода и алгоритмов простейших статистических величин, которые
затем входят в состав более сложных конструкций (средние, пока-
затели вариации и т. д.). Автор предпочитает в первой же главе
книги познакомить читателя с понятиями и терминами, относящи-
мися к вопросам планирования эксперимента и интерпретации его
результатов. Он говорит здесь уже о генеральной и выборочной
совокупностях, о доверительных границах и уровне значимости,
о типах ошибок, отодвигая разговор об элементарных понятиях
статистики на дальнейшие главы. Насколько педагогично такое
предварительное введение читателя в круг идей, получающих свое
конкретное статистическое выражение уже в дальнейшем изложе-
нии, мы не беремся судить. Можно только заметить, что основное
педагогическое правило — сначала простое, а затем более слож-
ное— здесь нарушено. В следующей главе читателю сообщаются
некоторые сведения о составлении графиков и об их элементах.
При этом имеются в виду графики, изображающие отношения за-
висимости, в связи с чем дается истолкование понятия зависимой
и независимой переменной. Приведенные автором примеры отно-
шения зависимости, в которых роль независимой переменной, или
фактора, играет время, представляются нам неудачными. Если
мы отмечаем, что происходят какие-то перемены в изучаемом на-
ми явлении в течение данного периода, то мы ищем условия, ко-
торые, скрываясь за течением времени, производят эти перемены.
Само же время при этом не может рассматриваться как произво-
дящая причина. Например, на графике, изображающем затраты
домашней хозяйки на свою работу в часах, независимой перемен-
ной, или фактором, который определял эти затраты, было, конеч-
но, не время, а условия этой работы.
В последующих главах изложение остается в общем на уровне,
научной популяризации. При истолковании вопроса о статистиче-
ских распределениях (гл. 3) к числу удач принадлежит рассказ
о том, какую роль в установлении авторства статей сыграл однаж-
ды анализ статистического распределения. Такой материал помо-
гает читателю яснее понять, какова роль статистики в научном ис-
следовании. Можно напомнить, что язык индейцев майя , был рас-
шифрован с помощью анализа статистических распределений.
Автор также весьма доходчиво разъясняет основные принципы
планирования научного эксперимента (гл. 4), использовав для
этого анекдот о короле Фридрихе II и пример с бритьем. Он сумел
показать, зачем нужна контрольная группа в опыте, как обеспе-
чить равенство условий в нем, что такое смешение действия раз-
ных факторов, как могут быть построены групповая и межгруппо-
вая схемы опытов. Внимание читателя, несомненно, привлечет
здесь трактовка автором вопроса о множественности и взаимо-
действии причин и разъяснение им общих основ так называемого
факторного эксперимента. Рассуждая о главных эффектах и взаи-
модействиях, автор предварительно знакомит читателя с принци-
7
пами дисперсионного анализа, которые развертываются затем в
специально посвященной им главе.
Гл. 5, посвященная «законам случайности», довольно интересна.
Автор, следуя своему правилу ссылаться на привлекающие внима-
ние примеры, убедительно доказывает читателю, что расчеты
азартного игрока, ожидающего, что после «полосы неудач» пойдет
«полоса удач», а также и предположения родителей, что после
рождения ребенка одного пола родится ребенок другого пола, ни
на чем не основаны. Однако согласиться с автором, когда он все
события в жизни человека уподобляет выпадению той или иной
стороны монеты при ее подбрасывании, конечно, нельзя. Изрече-
ние неизвестного философа, на которое ссылается автор, гласящее,
что «если мы будем жить достаточно долго, то все неприятности,
которые случайно могут произойти с нами, обязательно произой-
дут», не имеет никакого отношения к научному подходу к законам
случая.
В этой же главе Грегори Л. Кимбл обращается и к основному
вопросу статистической теории — к вопросу о законе больших чи-
сел. Нужно сказать, что трактовка этого закона недостаточно ясна.
Как известно, в нашей философской литературе действие закона
больших чисел трактуется в связи с диалектическим тезисом о слу-
чайности и необходимости. Согласно этому тезису случайность
представляет собой ту форму, в которой может проявляться не-
обходимость. Она характеризует внешние неустойчивые связи
между явлениями действительного мира, в то время как необхо-
димость выражает внутренние связи, обусловленные самой струк-
турой явления, его закономерности. Действие закона больших чи-
сел и состоит в том, что достаточно'большое число фактов позво-
ляет выявить в «пестрой толпе» случайностей закономерность дан-
ного явления. Характеристика закона больших чисел, которую
дает автор, иная и недостаточно точная. Он, ссылаясь па автори-
тет известного французского математика А. Пуанкаре, связывает
закон больших чисел с представлением о массе независимых слу-
чайных явлений, не сформулировав определенного понимания слу-
чайного события, которое может наступить или не наступить и
имеет при этом известную вероятность.
В гл. 6 автор обратился к истолкованию нормального распре-
деления. Известно, что это распределение является одним из тех
трех основных распределений, на которые опирается теория ста-
тистического метода. Оно рассматривается как предел, к которому
при известных условиях стремятся два других распределения
(уже дискретных, а не непрерывных), а именно биномиальное и
распределение Пуассона. Нормальное распределение считается
характерным для случайных независимых событий, с ним связана
и таблица значений интеграла вероятностей, выражающая распре-
деление последних. Поэтому в книге вызывает недоумение про-
тивопоставление нормального распределения распределению слу-
чайных событий. Утверждение автора, что «кривая нормального
распределения применяется для отражения непрерывных характе-
8
ристик, в то время как при рассмотрении распределения случай-
ных событий имеют дело с дискретными (прерывными) характери-
стиками и дискретными событиями», следует, очевидно, считать
чистым недоразумением.
Только вместе с истолкованием нормального распределения
автор обратился к вопросу о средних величинах и мерах вариа-
ции. Какими соображениями руководствовался он, связывая эти
величины с нормальным распределением, мы не знаем, но у чита-
теля может создаться превратное впечатление, что они являются
атрибутом нормального распределения. Показ основного свойства
средней арифметической (равенство пулю суммы отклонений от
нее) на примере с перераспределением дохода ста семей оригина-
лен, но, вероятно, к иллюстрации указанного свойства можно было
подойти более простым путем. Что касается моды и медианы, то
следовало бы показать, что в нормальном распределении эти ха-
рактеристики совпадают со средней арифметической. Это важно
отметить, описывая свойства данного распределения. Пример с
распределением смертей кавалеристов от удара копытом лошади
едва ли удачен для показа моды в скученном распределении.
Этот пример в свое время был приведен В. Борткевичем и имел
другое назначение, а именно: иллюстрацию «закона малых чисел»,
связанного с распределением редких событий. Обращаясь к мерам
вариации, автор почему-то ограничился средним квадратическим
отклонением (стандартным отклонением по западной терминоло-
гии) и, говоря о сравнении степени вариации в разных совокупно-
стях, не упомянул о коэффициенте вариации. Между тем толь-
ко последний показатель пригоден для сравнения степени вариа-
ции.
О выборочном методе автор вкратце сказал еще в начале кни-
ги, но он посвящает вопросу об этом методе целую главу (гл. 7).
Он ограничивается классическим образцом этого метода, пред-
полагающим соблюдение принципа случайного отбора, справедли-
во при этом отмечая, что получение случайной выборки — дело
более сложное, нежели это может показаться на первый взгляд.
Трудности случайного отбора заключаются, как известно, в том,
что при таком отборе должна быть исключена всякая тенденциоз-
ность. Поэтому случайный отбор не может быть представлен про-
сто как отбор беспорядочный. «Если беспорядочно втыкать бу-
лавки в карту, — замечает автор известной монографии о выбо-
рочном методе английский статистик Фрэнк Йейтс, — то это не
даст случайного распределения точек па карте. Если отбирать
данные для обследования, просто идя по улицам города, то это
не будет случайным отбором домов» (Йейтс Ф. Выборочный
метод в переписях и обследованиях. М., Статистика, 1965, с. 34).
Автор рассматриваемой нами книги также указывает на ряд об-
стоятельств, которые способны сделать нерепрезентативной слу-
чайную выборку. Ярким примером служит проведенный в 1936 г.
опрос подписчиков журнала «Literary Digest» о выборах будуще-
го президента США.
9
Однако в главе о выборочном методе содержится и существен-
ный методологический просчет, который автор попытался не совсем
удачно исправить в приложении. Это относится к примеру с дегу-
стацией вина. Автор не разъяснил, что ошибка разности в двух
примерах вариантов опыта — межгрупповом и внутригруппо-
вом— должна исчисляться по-разному. В межгрупповом варианте,
когда дегустация вина производилась двадцатью случайно ото-
бранными дегустаторами, ошибка разности средних должна быть
определена как корень квадратный из сумм квадратов случайных
ошибок обоих рядов дегустаторов. Но при этом она не может быть
представлена как корень квадратный из дисперсии разностей меж-
ду членами этих рядов, деленной на число наблюдений. Во внут-
ригрупповом варианте, когда один и тот же дегустатор оценивает
качество вина в обоих предусмотренных опытом случаях, в фор-
муле ошибки разности средних в подкоренном ее выражении из
суммы квадратов случайных ошибок должны быть исключены уд-
военное произведение этих ошибок и коэффициенты корреляции
между соответствующими двумя показаниями дегустатора. В этом
случае формулу ошибки можно представить и в виде корня квад-
ратного из дисперсии разностей, деленной на их число. Об этой
особенности вычисления ошибки во втором случае автор не смог
ясно сказать потому, что вопрос о феномене корреляции оставал-
ся пока неразъясненным читателю. Грегори А. Кимбл подошел
к нему лишь в следующих двух главах.
Первая из них (гл. 8) имеет чисто технический характер. Ее
содержание составляют в основном алгоритмы. Никаких рассуж-
дений о природе феномена корреляции автор здесь не ведет. В ис-
толковании автора корреляция — это просто параллелизм в изме-
нениях двух сопоставляемых признаков.
Значение корреляции, по мнению автора, заключается в том,
что она позволяет по изменениям одного признака предсказать из-
менения другого признака. Автор ничего не говорит и о форме
связи, коэффициент корреляции он рассматривает как такой пока-
затель тесноты корреляционной связи, которым чаще всего поль-
зуются на практике, хотя имеются и другие «типы коэффициентов
корреляции». Далее он приступает к вопросу о технике прогнозов.
К сожалению, эта часть главы написана так, что неподготовленно-
му, только начинающему осваивать статистику, читателю трудно
будет разобраться в ней.
Во второй из посвященных вопросам корреляции главе читатель
найдет уже некоторые общие рассуждения о характере корреляци-
онных связей. Автор справедливо подчеркивает, что эти связи да-
леко не всегда отражают причинно-следственные отношения. Од-
нако приводимые автором шутливые примеры не подходят для
разъяснения этого важного гносеологического положения.
Причинно-следственные связи нередко имеют такой характер,
что их возможно установить, лишь прослеживая длинную цепь
взаимодействий. Но нельзя согласиться, что причинно-следствен-
ная связь, если она все же имеется, обусловливается действием не-
10
которого третьего фактора. Эта точка зрения своим происхожде-
нием обязана Ф. Гальтону, который объяснял «механизм» возник-
новения феномена корреляции воздействием каких-то общих для
обоих сопоставляемых признаков причин. Подобная концепция
корреляционной связи была обусловлена самим материалом, с ко-
торым имел дело Ф. Гальтон: измерение частей одного и того же
организма пли признаки, принадлежащие родителям и потомкам.
В работах Ф. Гальтона речь шла не о зависимостях, а о взапмо-
зависимостях. Поэтому распространять на случаи причинно-след-
ственных связей представление о действии общих условий как
«возбудителей» корреляции нет оснований.
В рассуждениях о корреляции автор не сказал о вероятностном
характере ее и о том, что имеются определенные теоретические
принципы, на которые опирается ее математико-статистическая
концепция. На это обстоятельство важно было указать, так как
в корреляционных исчислениях практика нередко расходится
с теорией и, таким образом, вероятностная оценка эмпирических
коэффициентов корреляции оказывается ненадежной. Заявление
автора, что коэффициенты корреляции могут быть названы «ко-
эффициентами надежности и обоснованности» и что они являются
инструментом, с помощью которого удается определить меру,
в какой статистические показатели обладают указанными свойст-
вами, противоречат действительному положению вещей. Специаль-
ные исследования показали, что корреляционный анализ сопро-
вождается различными условностями, которые никак не позволя-
ют считать коэффициенты корреляции «коэффициентами надежно-
сти». Поэтому мы не считаем, что «человеческая справедливость»
сможет лучше проявиться, как это думает автор, если начальник,
изучая способности своего сотрудника, прибегнет не к «теплым»,
учитывающим все нюансы конкретной ситуации интуитивным ме-
тодам, а к помощи «критических оценок, основанных на изучении
корреляционных связей между различными показателями деятель-
ности человека».
В конце концов и сам автор в некоторых местах своего изло-
жения проявляет все же известный скептицизм к познавательным
возможностям, создаваемым корреляцией.
Последняя глава книги посвящена методу, который называется
дисперсионным анализом. Этот метод был разработан Р. Фишером
для интерпретации результатов агрономических опытов. В настоя-
щее время он получил широкое распространение во многих облас-
тях экспериментальных научных исследований. В данной книге мы
видим пример его приложения к психологии.
Основным материалом для иллюстрации дисперсионного ана-
лиза служат для автора показатели «стресса». На наш взгляд,
выбор материала не был наилучшим. Характер показателей
«стресса» таков, что к ним нельзя отнестись с требуемой серьез-
ностью. Эти показатели чрезвычайно субъективны, и сопоставле-
ние их друг с другом обнаруживает различные нелепости. Разу-
меется, каких-либо содержательных результатов в примере приме-
11
нения дисперсионного анализа к этим показателям невозможно
было ожидать.
Чем же может быть полезна книга Грегори Л. Кимбла совет-
скому читателю? Полезна эта книга тем, что она может возбудить
у читателя интерес к статистике. Изучая ее, читатель, возможно,
сделает лишь первые шаги в своем знакомстве с теоретическими
вопросами статистической науки. И это знакомство может ока-
заться достаточно интересным, чтобы пожелать и далее углубить-
ся в суть рассмотренных автором проблем. Книга Грегори А. Кимб-
ла, несомненно, может сыграть роль катализатора в положитель-
ной реакции читателя на его знакомство с новой для него наукой.
II. К. ДРУЖИНИН
ПРЕДИСЛОВИЕ
Давным-давно, когда многих из вас еще не было на свете, я
изучал психологию в Карлетон-колледже.- В те времена при со-
ставлении планов своих учебных занятий1 я придерживался прин-
ципа наименьших затрат труда. Как всегда бывает в подобных
случаях, возможностей для этого было предостаточно, и я не пре-
минул ими воспользоваться. В результате, окончив колледж,
я практически не был знаком с естественными науками, математи-
кой и статистикой.
Позднее, однако, мне пришлось пострадать за проявленное ра-
нее легкомыслие. Чтобы восполнить пробелы в своем образовании,
я прослушал в аспирантуре несколько специальных дополнитель-
ных курсов лекций. Полученные мною при этом опыт и знания су-
щественным образом изменили мои взгляды па роль и значение
количественной информации. Изучение различных предметов, и в
особенности статистики, практическая работа с количественным
материалом, а также опыт преподавания спецкурсов статистики
в университете Брауна, где я работал после окончания аспиранту-
ры, наглядно показали мне всю важность тех отраслей знания,
без которых я надеялся обойтись, будучи студентом. В настоящее
время я считаю, что курс статистики может и должен стать одним
из наиболее привлекательных предметов из всех, какие только
студент может включить в программу своего обучения. В мире,
в котором мы живем, много неизвестного. И лучшей гарантией
успеха в более глубоком изучении окружающей действительности
является овладение статистическим образом мышления.j
Из сказанного вы, возможно, поняли, что автор не собирает-
ся в книге много внимания уделять проведению различных мате-
матических преобразований и вычислений. Все, чего я хочу, —это
чтобы читатель после прочтения настоящей книги научился мыс-
лить статистически и достиг достаточного уровня статистической
грамотности. В связи с этим я не вижу необходимости особо де-
тально останавливаться на формулах и расчетах. Те, кто считает,
что без арифметики обойтись никак нельзя, могут найти описание
1 В колледжах США студенты могут включать некоторые предметы в про-
грамму изучаемого ими курса наук по своему усмотрению. — Приме'ч. пер.
13
технических приемов статистических вычислений в заключительной
части книги. Однако в соответствии с целями, которые я пресле-
довал при написании данной книги, глубокого овладения этим ма-
териалом не требуется.
Я очень старался, чтобы чтение доставило вам настоящее
удовольствие. Однако искренне надеюсь, что не переусердствовал
в своем намерении. Было бы прискорбно, если бы многочислен-
ные шутливые истории и любопытные факты, с помощью которых
я пытался как-то оживить изложение, отвлекли ваше внимание от
восприятия более серьезных вопросов й концепций. К этому пре-
дупреждению необходимо отнестись со всей серьезностью. Если вы
овладеете статистическим образом мышления, то оно обогатит
вашу жизнь, подобно тому, как это произошло с автором настоя-
щей книги. Итак, пожалуйста, читайте ради того, чтобы попять.
Если же временами чтение книги вызовет у вас еще и улыбку—-
тем лучше.
ГРЕГОРИ А. КИМБЛ
1
ПРИРОДА СТАТИСТИКИ
Что такое статистика? Спросите об этом первого встречного и,
скорее всего, вы услышите ответ, близкий по смыслу к известно-
му изречению Б. Дизраэли1: «Имеется три рода лжи: ложь, на-
глая ложь и статистика». Если же вы обратитесь с подобным во-
просом к статистику-профессионалу, то ответ будет иным: статис-
тика — это область науки, имеющая дело со сбором, анализом
и интерпретацией данных. Как следует из заголовка предлагае-
мой вниманию читателя книги, и первое, и второе из приведенных
определений статистики заслуживают подробного и обстоятельно-
го разговора. Широко распространенное представление о том, что
с помощью статистики можно доказать все что угодно, является,
конечно, слишком преувеличенным, однако несомненно и то, что
статистические методы могут применяться с целью ввести людей
в заблуждение. И все же основная задача и предназначение ста-
тистики состоят в том, чтобы помочь людям лучше понять многие
проблемы, с которыми мир сталкивается в настоящее время.
В дальнейшем будут рассмотрены различные примеры правильно-
го и неправильного применения статистических методов. При этом
необходимо постоянно иметь в виду, что статистика выполняет две
основные функции: описательную и объясняющую. В гл. 1 приво-
дится характеристика этих двух функций.
ОПИСАТЕЛЬНАЯ СТАТИСТИКА
О назначении описательной статистики можно судить по ее
названию: она имеет дело с числами, характеризующими ту или
иную интересующую нас ситуацию. Среднее число забитых голов
в футболе, уровень безработицы, уровень заболеваемости на про-
изводстве, количество автомобилей, проданных в ноябре текущего
года, среднее число детей в семье, средний уровень дохода, табли-
цы роста и веса человека, таблицы продолжительности жизни —
все это примеры статистической информации подобного рода.
Ценность описательной статистики заключается прежде всего
1 Б. Дизраэли (1804—1881)—английский государственный деятель и писа-
тель— Примеч. пер.
15
в том, что она дает сжатую и концентрированную характеристику
изучаемого явления. Профессиональный игрок в бейсбол за сезон
может произвести 500, а то и 600 подач. Перечень ситуаций, в ко-
торых игрок сделал каждую свою подачу, будет таким длинным
и сложным, что, ознакомившись с ним, никто не сможет получить
ясного представления о силе данного игрока и качестве его игры.
Так, в 1976 г. бейсболист Кэрыо из команды «Миннесота Твинз»
осуществил 605 подач, 200 из которых оказались результативными.
Полный перечень всех поданных им мячей с подробным описани-
ем обстоятельств, сопутствующих каждой подаче, занял бы многие
страницы текста. Однако краткую и содержательную характерис-
тику всей этой информации можно дать, разделив 200 па 605. Та-
ким образом мы определим среднюю результативность подачи
Кэрью, она равна 0,331.
Средняя результативность является простым и понятным по-
казателем, поскольку мы хорошо представляем себе смысл опера-
ции, с помощью которой этот показатель был найден. Нам хоро-
шо известно, что означает выиграть подачу. Мы знаем также, что
получится, если одно из приведенных значений разделить на дру-
гое. Однако в ряде ситуаций подобной ясности и определенности
нет.
ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ ГОРОДА И ЕЕ ИЗМЕНЕНИЕ
Если вы обратитесь к справочнику «The World Almanac», то
в разделе, где приводятся данные о численности населения горо-
дов, обнаружите для каждого города вполне определенную цифру.
Так, например, население Боулдера, штат Колорадо (здесь в на-
стоящее время проживает автор данной книги), насчитывает
66 870 человек. Что же в действительности стоит за этой цифрой?
Включает ли она, например, студентов местного университета?
Возможно, и нет, если эти студенты не являются постоянными
жителями Боулдера. Сколько человек следует тогда добавить
к численности населения города? На этот вопрос нельзя дать вра-
зумительного ответа, поскольку «студент университета» в дейст-
вительности является не более чем статистической абстракцией.
В соответствии с уставом университета в нем должно обучаться
20 000 студентов в год. Однако на самом деле это означает не
20 000 человек, как могло показаться читателю, неискушенному
в тонкостях определения контингента учащихся, а 300 000 зачет-
ных студенческих часов. Дело в том, что в-целях ограничения чис-
ленности студентов университета па каждого из них отводится не
более 15 зачетных часов в год. Поскольку каждый студент в сред-
нем набирает, как правило, менее 15 зачетных часов, общее число
обучающихся в университете несколько превышает 20 000 «услов-
ных студентов в соответствии с уставом». Таким образом, чтобы
более точно определить общее число жителей Боулдера, необхо-
димо к 66 870 прибавить некоторое неизвестное нам число студен-
16
тов университета, которые не являются постоянными жителями
города.
Оценка численности населения Боулдера усложняется еще и
тем, что город давно перерос свои официальные границы. В рас-
сматриваемом нами случае это имеет принципиально важное зна-
чение, поскольку довольно большое число людей, фактически яв-
ляющихся жителями Боулдера, проживает за пределами его офи-
циально установленных границ. По некоторым оценкам общее чис-
ло таких людей составляет 20 000 — 25 000. Если эти данные,
а также число студентов университета, не являющихся постоянны-
ми жителями Боулдера (предположим, что оно составляет при-
мерно 15 000), прибавить к приведенному в «The World Almanac»
официальному показателю, то общее число жителей города соста-
вит уже не 67 000, а примерно 100 000.
Такая же неопределенность присуща и сообщениям о темпах
роста численности населения городов. Для иллюстрации восполь-
зуемся сведениями о городах Роли и Дарема, штат Северная Ка-
ролина, где автор книги проживал до того, как переехал в Ко-
лорадо. Данные о численности населения двух городов, взятые
из ряда статистических справочников, приводятся в табл. 1.1.
Таблица 1.1
Численность населения Роли и Дарема, штат Северная Каролина,
1960 и 1970 гг.
Город 4)ic.icnnoci 1960 г. Ь ‘•иссден,: н 1970 г. Абсолютный прирост населения i iponeiiT увеличения численности населения
Дарем Роли 78 302 93 931 95 438 123 793 17 136 . 29 862 22 32
Очевидно, что Роли больше Дарема. Из таблицы следует так-
же, что Роли растет быстрее. Однако и здесь не все так просто.
В обоих городах имеются университеты, и, следовательно, факти-
ческие данные о численности населения не в последнюю очередь
зависят от того, каким образом будет решена проблема учета сту-
дентов. Здесь имеет место и проблема, связанная с определением
границ города, что, как будет показано, оказало самое непосредст-
венное воздействие на появление столь существенных различий
в темпах роста населения городов. Если память мне не изменяет,
границы Роли менялись в 60-х годах, в то время как границы
Дарема остались неизменными. Если в результате расширения
границ население Роли увеличилось на 9218 человек, то это как
раз и будет причиной различий в процентах прироста численности
населения двух городов в 60-е годы.
Здесь, видимо, следует отметить, что решение вопроса о фак-
тической численности населения города представляет не только
отвлеченный академический интерес. Подобная информация име-
2- 1778
17
ет также и большое практическое значение. Так, например, тор-
говец, собирающийся открыть в Боулдере отделение своего мага-
зина, может принять совершенно различные решения относительно
количества продавцов в штате магазина, величины запасов това-
ров на складе и т. п. в зависимости от того, сколько человек —
67 000 или 100 000 — проживает в городе. Учитывая большое прак-
тическое значение подобной информации, Бюро по управлению
и бюджету США на базе данных переписей населения разработа-
ло и регулярно публикует Стандартную классификацию районов
США, в которой в настоящее время содержатся сведения по
266 городским районам страны. Время от времени в случаях, ког-
да происходит слияние некоторых районов в отдельную экономи-
ческую единицу, Бюро по управлению и бюджету объединяет их
в рамках Стандартной классификации в один территориально-эко-
номический район. Результаты такого объединения могут оказать-
ся впечатляющими. Так, в 1970 г. население территориально-эко-
номического района Роли насчитывало 228 453 человека (135-е ме-
сто по стране). В 1975 г. в результате объединения был образован
единый район Роли —Дарем с населением 462 300 человек, зани-
мающий 78 место в общенациональном масштабе.
БЕЗРАБОТИЦА
В течение многих лет одной из самых животрепещущих тем
в Америке является состояние хозяйственной конъюнктуры. «Спад
уже наступил или самое худшее еще впереди?» — вот что занима-
ет умы многих американцев. Чтобы правильно ответить на этот
вопрос, надо сначала дать определение понятию «экономический
спад». При формулировке такого определения можно воспользо-
ваться рядом экономических показателей, в число которых обыч-
но включают уровень производства в промышленности, объем за-
пасов в розничной торговле, а также уровень безработицы. Оп-
ределение спада с помощью показателя безработицы представля-
ется наиболее естественным, поскольку именно этим показателем
в значительной мере характеризуется уровень благосостояния. Ви-
димо, поэтому большинство из нас уделяют основное внимание
информации об уровне безработицы, рассматривая эту характери-
стику в качестве важного индикатора «экономического здоровья
нации». Возможно, мы для себя даже решили, что если уровень
безработицы превысил 9%, то экономика страны пребывает в не-
завидном состоянии — наступил спад. Тем самым мы фактически
дали определение экономическому спаду как периоду времени,
в течение которого более 9% населения не имеет работы. Таким
образом, ответ па вопрос «Переживает ли экономика в настоящее
время спад?» зависит от того, как мы ответим на более конкрет-
ный вопрос «Превышает ли в настоящее время уровень безработи-
цы 9%?».
В ноябре 1975 г. в соответствии с официальными данными
18'
правительства США уровень безработицы в стране составил 8,3%.
Критикуя эти цифры, специалист в области рыночных отношений
Альберт Синдлинджер утверждал, что уровень безработицы в это
время превысил 9,2% и достиг, по его мнению, 10,6%- Таким об-
разом, если официальные данные в соответствии с нашим опре-
делением свидетельствуют о более или менее благополучном со-
стоянии экономики, то данные Синдлипджера говорят об обрат-
ном. Что же послужило причиной указанного противоречия?
Чтобы ответить на этот вопрос, необходимо знать, каким об-
разом определяется уровень безработицы. Данный показатель рас-
считывается примерно так же, как и средняя результативность
в бейсболе. Чтобы получить уровень безработицы, нужно число
людей, не имеющих работы, разделить на общую численность ра-
бочей силы в стране.. В соответствии с официальными данными
численность безработных в США в ноябре 1975 г. составляла
7 717 257 человек. Разделив это число на общую численность ра-
бочей силы в стране, равную 92 979 000 человек, мы и получим
0,083, или 8,3%.
Разница между этим расчетом и нахождением средней резуль-
тативности в бейсболе состоит в том, что в данном случае оба
участвующих в вычислениях показателя определены недостаточно
четко. При этом концепция рабочей силы выглядит более ясной
и понятной, и Синдлинджер не подвергал сомнению официальные
правительственные данные о численности рабочей силы в США.
В состав рабочей силы входят лица, которым исполнилось 16 лет
и которые в состоянии выполнять ту или иную работу. Во время
учебного года в этот показатель не включаются учащиеся (если
только они не подрабатывают в свободное от занятий время).
Однако в течение летних каникул данная категория населения
представляет собой часть контингента рабочей силы. Таким об-
разом, каждый июнь численность рабочей силы возрастает на не-
сколько миллионов человек и поэтому при расчете уровня без-
работицы должна быть сделана поправка на сезонные колебания.
Другой большой категорией лиц, не включаемых в состав рабочей
силы, являются домашние хозяйки. Они причисляются к контин-
генту рабочей силы только тогда, когда начинают искать рабо-
ту. Нравится нам или нет подобная трактовка некоторых кате-
горий населения, входящих в состав рабочей силы,— это другой
вопрос. С формальной точки зрения все они имеют достаточно
четкое определение, благодаря чему при нахождении численно-
сти рабочей силы страны каких-либо методологических трудно-
стей не возникает.
Дать определение безработному значительно труднее. Безра-
ботными можно считать всех, кто занимается поисками работы.
Тогда под это определение попадают также и лица, которые име-
ют работу, но пытаются устроиться получше. Уровень безработи-
цы в этом случае может подскочить до 11 или 12%, а то и выше.
Мы бы впали в другую крайность, если бы определили безработ-
ного как человека, который, по крайней мерс, в течение 15 не-
2:
19
дель ие имеет работы. В этом случае уровень безработицы соста-
вит лишь около 3,3%.
Показателю безработицы гораздо труднее дать точное опреде-
ление, чем может показаться на первый взгляд. Основная слож-
ность здесь связана с нахождением численного состава безработ-
ных. Следует ли частично запятых на производстве рассматри-
вать в качестве лиц, имеющих работу? Если да, то достаточно
ли нескольких часов в неделю, отработанных студентом по про-
грамме производственного обучения, чтобы отнести его к лицам,
имеющим работу? Может быть, данный показатель должен быть
существенно больше? А как быть с людьми, охваченными прави-
тельственной программой общественных работ, предназначенной
специально для привлечения к труду безработных? Список подоб-
ных вопросов можно было бы продолжить. Указанные выше две
категории населения были выделены мною потому, что именно
различиями в их трактовке в значительной степени объясняются
расхождения между данными Синдлинджера и официальным по-
казателем уровня безработицы. Если в официальные расчеты до-
полнительно включить 700 000 студентов, проходивших производ-
ственную практику, и 315000 рабочих, охваченных в ноябре 1975 г.
правительственной программой общественных работ (примерная
оценка), и если мы будем их рассматривать в качестве лиц, не
имеющих работы, то уровень безработицы составит, скорее, 9,4%,
а не 8,3%, как сообщалось официально. Именно в силу неодно-
значной интерпретации подобные показатели с одинаковым успе-
хом могут использоваться при доказательстве противоречащих
друг другу утверждений, как случилось, например, в 1976г.вовре-
мя предвыборных дебатов между Картером и Фордом.
СТЕПЕНЬ РАСПРОСТРАНЕННОСТИ ПСИХИЧЕСКИХ ЗАБОЛЕВАНИЙ
Тот, кто любит порассуждать на тему о том, что мир катит-
ся в тартарары, нередко при этом в качестве доказательства
ссылается на увеличение степени распространенности психиче-
ских заболеваний. В соответствии с подобной точкой зрения дан-
ное явление обусловлено усложнением характера человеческих
взаимоотношений, ростом числа стрессовых ситуаций, ускорением
темпа жизни. Оценка степени достоверности подобного утвержде-
ния в свою очередь ставит перед нами целый ряд специфических
проблем. Прежде всего, чтобы установить, имеются ли различия
в величине интересующего нас показателя, необходимо сравнить
данные о степени распространенности психических заболеваний
для двух достаточно отдаленных друг от друга (в идеале на
75—100 лет) моментов времени. Такое сравнение может быть про-
ведено, например, по данным журналов регистрации больных. По
этим данным легко определить коэффициент госпитализации — по-
казатель, характеризующий долю населения, подвергшегося лече-
нию в психиатрических клиниках. Подобные исследования были
осуществлены, и полученные результаты, па первый взгляд, дейст-
20
вительпо свидетельствуют о наличии тенденции к увеличению сте-
пени распространенности психических заболеваний.
Однако имеется ряд обстоятельств, которые позволяют нам
усомниться в справедливости подобного вывода:
1. В настоящее время значительно большее число признаков,
чем это было 100 лет назад, рассматривается в качестве симпто-
мов психического заболевания. Так, например, повышенная раз-
дражительность считается сейчас одной из форм психического
расстройства, тогда как раньше психиатры на это не обращали
внимания. Отсюда следует, что сравнение должно проводиться по
таким заболеваниям, как, например, шизофрения, которая во все
времена определялась психиатрами практически по одним и тем
же характерным симптомам.
2. Получившая в настоящее время значительное развитие сеть
специальных лечебных заведений позволяет, независимо от харак-
тера заболевания, охватить существенно большее, чем раньше,
число больных.
3. В составе населения сейчас относительно больше, чем 100 лет
назад, людей пожилого возраста, у которых предрасположенность
к психическим заболеваниям выше.
Учет отмеченных факторов в анализе данных о распространен-
ности психических заболеваний может привести к выводу о том,
что степень распространенности психических заболеваний в на-
стоящее время по сравнению с серединой прошлого века практи-
чески не изменилась [21].
УРОВЕНЬ ПРЕСТУПНОСТИ
Обосновать увеличение или снижение уровня преступности
с помощью какого-либо относительного показателя не так уж лег-
ко, как, возможно, представляется читателю.
1. Базой для определения числа преступлений (не связанных
с убийством) является число заявлений потерпевших. Однако если
по каким-либо причинам люди станут меньше доверять органам
правосудия и полиции и в ряде случаев перестанут сообщать им
о преступлениях, жертвами которых они оказались, то статистика
покажет снижение уровня преступности, хотя в действительности
этого могло и не произойти.
2. Другой базой для определения уровня преступности являет-
ся число лиц, задержанных и арестованных при совершении пре-
ступлений. Если по тем или иным причинам произойдет укрепле-
ние полицейских сил данного района, увеличение их численности
и оснащенности, то соответственно может возрасти и число аре-
стованных преступников, что приведет к повышению уровня пре-
ступности.
3. Аналогичным образом улучшение системы регистрации за-
явлений о совершенных преступлениях также приведет к увеличе-
нию показателя уровня преступности, однако за этим будет сто-
21
ять не реальное явление, а лишь улучшение работы канцелярских
служб.
4. Показатель уровня преступности в значительной мере за-
висит и от самого определения понятия «преступление». Так, в.
ряде стран хранение незначительных количеств марихуаны счи-
тается уголовно наказуемым преступлением. Однако если бы про-
изошло изменение законов и это нарушение стало бы классифици-
роваться не как уголовное преступление, а всего лишь как про-
ступок1, то это привело бы к уменьшению числа уголовных пре-
ступлений.
ОПРЕДЕЛЕНИЯ
В наиболее общем смысле олределениехм называется форму-
лировка, с помощью которой раскрывается- содержание того или
иного слова или группы слов. В качестве примера сошлемся на
только что прочитанное вами предложение. Это предложение яв-
ляется определением слова определение. Однако при использова-
нии определений подобного типа могут возникнуть некоторые труд-
ности. Определение становится непонятным, если вам не извест-
но, что означает то или иное выражение, приведенное в его фор-
мулировке (например, вам может быть непонятен смысл выраже-
ния «раскрыть содержание»). Поясню свою мысль па примере.
Предположим, я сообщаю вам, что «Z-оцепка представляет собой
отклонение фактического значения от средней арифметической,
выраженное в единицах стандартного отклонения». Данное опре-
деление является верным, однако для большинства людей его
смысл останется непонятным, поскольку не все знают, что такое
фактическое значение, средняя арифметическая или стандартное
отклонение.
Рассмотрим теперь с этой точки зрения любое из двух сле-
дующих определений безработного как человека, (1) который за-
являет о том, что он ищет работу, или (2) который не имеет ра-
боты в течение трех месяцев. Очевидно, что эти определения ме-
нее сложные, чем определение Z-оцепки, однако не на это разли-
чие в данном случае мы должны обратить внимание. Существен-
ным здесь является то, что определения безработного содержат
в себе способ идентификации этой категории населения.
Значительная часть материала, представленного в первом па-
раграфе настоящей главы, представляет собой небольшое упраж-
нение в области формулирования и использования определений.
В каждом примере, а в этом мы сможем сейчас убедиться, основ-
ное внимание уделялось определению той или иной концепции,
а именно:
1. Численность населения города зависит от того, какое опре-
деление будет дано проживающему в этом городе жителю.
1 Вид правонарушения, которое в отличие от преступления не имеет общест-
венно опасного характера и влечет за собой гражданскую, административную
или дисциплинарную ответственность. — Примеч. пер.
22
2. Изменения в численности населения зависят зачастую от
произвольного характера определений района, в границах кото-
рого осуществляется учет населения.
3. Уровень безработицы зависит от двух определений: (а) ра-
бочей силы и (б) безработного.
4. Изменения в степени распространенности психических забо-
леваний зависят от особенностей регистрации больных.
5. То же можно сказать и в отношении уровня преступности.
РЕШАЮЩИЕ АРГУМЕНТЫ
Очевидно, что довольно легко привести аргументы для дока-
зательства правильности той или иной позиции при определении
численности населения, изменения уровня преступности, степени
распространения психических заболеваний или при нахождении
уровня безработицы. Так, в последнем случае один человек может
утверждать, что уровень безработицы составляет 10 или 12%,
в то время как другой будет считать, что он составит только 3
или 4%. Нами уже были рассмотрены аргументы, с помощью ко-
торых обосновывалось каждое из этих двух утверждений. В ре-
зультате мы пришли к выводу, что весь вопрос упирается в то,
какие категории населения будут рассматриваться в качестве без-
работных. Если к безработным отнести всех лиц, занимающихся
поисками работы, то уровень безработицы окажется высоким,
если же безработным будет считаться человек, который в течение
трех месяцев не имеет работы, то уровень безработицы окажется
низким. Иными словами, в данном случае все зависит от опреде-
ления категории безработицы. Если два человека, приводящие раз-
личные количественные значения' показателя уровня безработицы,
примут одно и то же определение безработицы, то их спор можно
будет быстро разрешить. При использовании различных опреде-
лений они должны, по крайней мере, отдавать себе отчет в том,
что их спор касается, скорее, самих определений, а не фактов ре-
альной жизни.
БЕССМЫСЛЕННЫЕ УТВЕРЖДЕНИЯ
Мои студенты, изучающие вводный курс психологии, время от
времени сообщают мне как о хорошо известном факте, что че-
ловек никогда не использует всю «мощность» своего мозга, до-
вольствуясь лищь 10% этой мощности (иногда приводится какая-
нибудь другая, такая же небольшая, но обязательно «точная»
цифра). Студенты обычно хотят знать, почему так происходит,
надеясь повысить эффективность работы собственного мозга. К не-
счастью, данное утверждение является бессмысленным:
1. Каким образом можно определить «мощность мозга»?
2. Какой способ измерения должен быть выбран, чтобы полу-
чить количественную оценку положений данного утверждения?
3. Если 100% мозга никогда не использовалось, то каким об-
23
разом можно установить, что используется только 10% ? (Чтобы
дать количественную оценку доле, необходимо, чтобы была из-
вестна величина целого.)
4. Если поведение людей в повседневной жизни часто оказы-
вается весьма далеким от потенциально возможного идеального
уровня, то почему причину этого следует искать в недостаточном
использовании мощности человеческого мозга, а не в слабой заин-
тересованности в результатах труда, в неумении правильно орга-
низовать свою деятельность или в чем-нибудь еще?
В современных дискуссиях о характере умственной деятельно-
сти человека можно найти массу аналогичных совершенно бес-
смысленных утверждений. Из попавшихся на глаза за последнее
время мне наиболее запомнился пример, приведенный в книге До-
роти Теннов [19]: «...фраза «умом это понять невозможно, это
можно только почувствовать» сведет с ума любого, кто отважит-
ся послушать монотонную проповедь приверженца феноменоло-
гии Е Один автор за четверть часа умудрился повторить ее четыр-
надцать раз. Эта курьезная фраза по существу своему является
насмешкой над методом научного познания мира. Чувственное вос-
приятие здесь фактически противопоставляется процессу физиче-
ского исследования и анализа объектов и явлений реальной
жизни».
Рассмотрим, наконец, еще один маленький пример из облас-
ти рекламы. Так, в одной телевизионной передаче, посвященной
рекламе котлет, утверждалось, что фарш, из которого изготавли-
вается каждая котлетка, на 100% состоит из натурального мяса.
Скорее всего, так оно и есть, однако в приведенном нами утверж-
дении не содержится никаких доказательств, подтверждающих его
истинность.
СТАТИСТИЧЕСКИЕ ВЫВОДЫ
Предшествующее обсуждение было посвящено проблемам, ко-
торые имеют мало общего собственно с понятием описательной
статистики. В последующих частях книги к этой теме мы еще вер-
немся, здесь же мне бы хотелось познакомить читателя с другим
важным разделом статистической пауки, а именно со статистиче-
скими выводами — принятием разумных решений в условиях не-
определенности.
Бенджамину Франклину1 2 приписывают слова о том, что в этой
жизни нет ничего определенного, за исключением смерти и нало-
гов. я бы добавил к этому перечню реальностей нашей жизни еще
и определенность неопределенности. Мы живем в вероятностном
мире и в большинстве принимаемых нами решений содержится
1 Феноменология — идеалистическое философское направление, исходящее из
тезиса о том, что непосредственным объектом познания являются только ощу-
щения человека. — Примеч. пер.
2 Б. Франклин (1706—1790)—американский просветитель, государственный
деятель и ученый. — Примеч. пер.
24
элемент риска. Так, владелец магазина готового платья должен
принять решение о том, какое соотношение между длинными и
короткими платьями следует поддерживать на складе магазина.
Одни женщины предпочитают носить длинные платья, другие —
короткие, продавцу же важно угадать пропорцию между ними.
Играя в карты, мы постоянно решаем вопросы типа вистовать
или нет, играть в открытую или потемнить, сыграет ли «второй
король», хватит ли козырей и т. д. Студент, отвечая на вопрос,
к которому приложено несколько вариантов ответов, может вы-
брать вариант Ь, а может — и вариант d. Он может быть не зна-
ком с данным вопросом и поэтому остановится на том варианте
ответа, который покажется ему наиболее правдоподобным. Боль-
ной, которому должны сделать операцию, знает, что в случае ее
успешного исхода болезнь может быть побеждена. Однако не ис-
ключено, что операция окажется для него слишком тяжелой и он
умрет на операционном столе.
В рассмотренных случаях значительную роль играет созна-
ние человека, и не так уж велик элемент случайности, по мы и
не собираемся утверждать, что с помощью одной только статис-
тики могут быть решены все важные проблемы. Однако во многих
случаях статистика может существенно помочь в оценке той или
иной ситуации, в обосновании принятия того или иного решения.
Именно в этом и состоит главная задача статистического вывода.
В данном параграфе мы познакомимся с основными идеями, на
которых базируется указанный раздел статистики, и для начала
рассмотрим несколько легкомысленный пример.
ДИЛЕЛАМА НЕРЕШИТЕЛЬНОГО ВЛЮБЛЕННОГО
Действие разворачивается в большом городе. Важным элемен-
том описанной истории является схема движения городского же-
лезнодорожного транспорта, образующая на карте города двой-
ную петлю, по которой всегда в одном и том же направлении дви-
жется поезд. По форме эта схема напоминает восьмерку или ган-
телю, как показано на рис. 1.1 (просим обратить на это особое
внимание). Главная станция дороги находится в точке, где обе
петли расположены ближе всего друг к другу. Подходя к этой
станции с одной или с другой стороны, пассажир может сесть на
поезд, идущий в любом направлении. Все остальные станции рас-
положены па некотором расстоянии друг от друга по всей протя-
женности железнодорожной линии. Две из этих станций фигури-
руют в событиях, к описанию которых мы приступаем.
В нашем рассказе имеются три действующих лица, пользую-
щиеся для передвижения по городу описанной железнодорожной
линией: мистер Z, чей оффис находится неподалеку от главной
станции, и две его знакомые, мисс Л и мисс В, проживающие
в противоположных концах города рядом со станциями, располо-
женными на разных участках нашей железной дороги.
Перед мистером Z стоит проблема. Обе девушки кажутся ему
25
одинаково привлекательными. Однако он никак не может ре-
шить, какой же из них сделать предложение. Ежедневно он встре-
чается с одной из девушек, однако ему всегда бывает трудно вы-
брать, к кому же поехать в очередной раз. Поэтому при решении
данного вопроса он решил полагаться на случай. Рабочий день
у него был ненормированным, и поэтому, справившись с текущи-
Рис. 1.1. Схема движения
городского железнодорож-
ного транспорта как ее
представляет мистер Z.
Если эта схема верна и
если мистер Z появляется
на главной станции в слу-
чайные моменты времени,
то он с одинаковой вероят-
ностью может попасть как
•на поезд, идущий в запад-
ном направлении, так и на
поезд, идущий в восточном
направлении
ми делами, мистер Z мог уходить с работы в любое время. Он
садился в первый подошедший к станции поезд и, если этот по-
езд отправлялся в восточном направлении, приезжал к мисс А,
если в западном — к мисс В. В предположении, что вероятность
уехать в западном направлении примерно равна вероятности
уехать на восток, число свиданий мистера Z с мисс А и с мисс В
за достаточно длительный промежуток времени должно оказаться
примерно одинаковым.
Однако на практике получилось совсем иначе: в один прекрас-
ный день мисс В пожаловалась мистеру Z, что они встречаются
редко, и, по-видимому, у мистера Z есть кто-то еще. Обескуражен-
ный подобным оборотом событий, мистер Z решил подсчитать
число своих свиданий с мисс А и мисс В и с удивлением обнару-
жил, что у мисс В действительно были все основания для подозре-
ний: в течение месяца он 21 раз встретился с мисс А и только 9 раз
с мисс В *. "
Случайность или прихоть судьбы? Какова же причина подоб-
ной несправедливости по отношению к мисс В? Прежде чем будет
дано возможное объяснение сложившейся ситуации, рассмотрим
стоящую перед нами проблему несколько более внимательно.
Имеющихся в вашем распоряжении знаний пока явно недоста-
точно, по к тому времени, когда вы закончите читать эту книгу,
вы поймете, что по своей структуре дилемма, с которой столкнул-
ся мистер Z (разумеется, если отвлечься от ее конкретного содер-
* Надеюсь, вас не очень удивила некоторая легковесность сюжета в нашем
примере. Если же вас не устраивает характер распределения ролей, их можно
легко перераспределить в соответствии с вашими вкусами и предпочтениями.
Однако и в этом случае логика аргументов останется той же, а это и является
главным, что вы должны усвоить после прочтения данного параграфа. Ведь оби-
женной могла оказаться и мисс А, однако со статистической точки зрения опи-
санная ситуация выглядела бы точно так же.
26
жания), является одной из типичных проблем, при исследовании
которых применяются стандартные методы проверки статистиче-
ских гипотез. Единственное различие в данном случае связано
лишь с количественной определенностью той или иной конкретной
ситуации.
Рассмотрим вначале, с помощью каких аргументов мистер Z
обосновывал решение доверить выбор направления своей поезд-
ки случаю. За достаточно длительный промежуток времени, рас-
суждал он, число свиданий с мисс Лис мисс В должно оказать-
ся примерно одинаковым, поскольку вероятность попасть на по-
езд, идущий в западном направлении, равна вероятности уехать
на поезде, идущем на восток. Таким образом, можно говорить
об отсутствии различий в количестве встреч с той и другой де-
вушкой. Подобное предположение об «отсутствии различий» по-
лучило в статистике название нулевая гипотеза. В пашем конкрет-
ном случае, следовательно, пулевая гипотеза будет состоять в вы-
движении предположения о том, что мистер Z в течение месяца
15 раз встретится с мисс Л и 15 раз —с мисс В.
Точно 15 раз? Скорее всего, нет. Наша интуиция, в основе
которой лежит «закон средних», подсказывает нам, что в дейст-
вительности вряд ли будет иметь место подобная строгая, в от-
ношении 50:50, пропорциональность во встречах с обеими девуш-
ками. Что же тогда можно сказать о фактическом соотношении,
составившем 21:9? Возможно, большинство читателей будут
склонны отвергнуть идею о том, что подобное несбалансированное
соотношение может иметь место в условиях, когда теоретически
это соотношение должно составить 15:15. Выражаясь научным
языком, эти читатели отвергают данную нулевую гипотезу и счи-
тают, что предположения, из которых исходил мистер Z, оказа-
лись неверными.
Чтобы рассмотреть сложившуюся ситуацию несколько более
детально, предположим, что соотношение между встречами соста-
вило 17 : 13. Что можно сказать в этом случае? Возможно, дан-
ный результат покажется вам правдоподобным. А как быть тогда
с соотношениями 18: 12, или 19: 11, или 20: 10? По-видимому, где-
то здесь лежит граница, после прохождения которой вы скажете:
«Нет, это уж слишком! Подобное не могло произойти случайно.
Я отвергаю такое предположение. Имеются какие-то скрытые фак-
торы, в силу которых мистер Z чаще попадал на поезд, отвозив-
ший его к мисс А».
Принятие обоснованных решений в условиях неопределенности.
Но если мы сделали подобный вывод, то можно ли утверждать,
что этот вывод является правильным? На данный вопрос мы не
можем дать четко определенного положительного или отрицатель-
ного ответа. Однако очевидно, что ответ на этот вопрос имеет
принципиально важное значение.
Соотношение 21 : 9 все же могло случайным образом получить-
ся и при тех условиях, в которых совершал свои поездки мистер Z.
Если 30 раз подкинуть монету, то, вообще говоря, может случить-
27
ся, что 21 раз выпадет решка и только 9 раз орел. Подобные со-
бытия хотя и редко, но встречаются. Можно подсчитать*, что
при 30 подбрасываниях монеты 21 раз выпадет орел (решка)
примерно в 5 случаях из 100. Однако такие редкие события все
же происходят, и именно но этой причине не существует одно-
значно определенного положительного или отрицательного ответа
для случаев, сходных с ситуацией, в которой оказался мистер Z.
Здесь всегда возможен выбор между следующими двумя интер-
претациями:
1. Анализируемая ситуация не удовлетворяет первоначально
выдвинутому предположению (нулевая гипотеза оказалась оши-
бочной), и полученный результат является верным отражением
реальной действительности.
2. Анализируемая ситуация соответствует первоначально вы-
двинутому предположению (нулевая гипотеза оказалась верной),
и мы просто встретились с той редкой случайностью, которая в
принципе возможна и о которой только что говорилось.
Типы ошибок. Столкнувшись с подобной альтернативой, мис-
тер Z мог рассуждать следующим образом: если шансы попасть
на восточный или западный поезд действительно находятся в со-
отношении 50:50 (если нулевая гипотеза верна), то такое несба-
лансированное соотношение между фактическими поездками, как
21 :9, может встретиться лишь в 4 или 5 случаях из 100. Поскольку
подобный результат представляется малоправдоподобпым, видимо,
имеет смысл рассмотреть какие-либо альтернативы выдвинутой
ранее нулевой гипотезе (отбросить нулевую гипотезу).
Какие же варианты возможны в этом случае? Вообще говоря,
все, что способствует увеличению продолжительности пробега по-
езда в части города, где проживает мисс В, увеличивает и вероят-
ность того, что подходящий к главной станции поезд отправляется
в сторону, где проживает мисс А. Возможно, эти два участка пути
не одинаковы по длине, как показано па рис. 1.2(a). Возможно
также, что они одинаковы по длине, однако па одном участке пу-
ти больше остановок и это приводит к увеличению потерь време-
ни при прохождении поезда (рис. 1.2(6)). Возможно, качество
железнодорожного полотна в части города, где проживает мисс В,
хуже, и поезду здесь приходится снижать скорость движения. Учи-
тывая эти возможности, а также располагая фактическими дан-
ными, мистер Z со статистической точки зрения имеет все осно-
вания полагать, что первоначально выдвинутая нулевая гипотеза
неверна и ее следует отвергнуть. Точнее говоря, мистер Z может
отвергнуть данную нулевую гипотезу при определенном уровне
* Читая эту книгу, вы обнаружите, что автор не проявляет ни малейшего
интереса к объяснению процедур, которые обычно применяются при осуществле-
нии статистических вычислений. Я отказался от объяснения методов вычислений,
стремясь сосредоточить внимание читателя на содержательной стороне излагае-
мого материала. С другой стороны, читатель имеет право при желании убедить-
ся, что цифры, приведенные автором, не взяты им с потолка. По этой причине
в книгу включено приложение (с. 238), в котором содержатся формулы и про-
демонстрированы многие из упомянутых в тексте расчеты.
28
значимости. При этом ход его рассуждений будет выглядеть так:
«Я могу ошибиться, однако это может случиться лишь в 4 или 5
случаях из 100. Таким образом, я отвергаю нулевую гипотезу при
4%-ном или 5 %-ном уровне значимости». ‘
Рис. 1.2. Альтернативные
схемы движения городского
железнодорожного транс-
порта, при которых поезд
проходит участок дороги,
где проживает мисс В, за
более длительный промежу-
ток времени по сравнению
со временем, затрачивае-
мым им на прохождение
участка дороги, где прожи-
вает мисс Л. При таких
схемах движения возра-
стает вероятность того, что
подходящий к главной
станции поезд движется по
направлению к станции, те
проживает мисс Л
Однако, как признает сам мистер Z, он может и ошибиться.
Реализацию такой редкой возможности полностью исключить
нельзя. Если же мистер Z все же ошибается, это означает, что он
совершил так называемую ошибку I рода. Хотя у мистера Z были
все основания для уверенности в своей правоте, он все же отверг
нулевую гипотезу в случае, когда в действительности она верна.
Рассмотрим теперь другую возможность. Предположим, что
имеет место одна из ситуаций, представленных на рис. 1.2. Од-
нако случайным образом получилось, что число поездок мистера Z
в обе стороны оказалось одинаковым. Не имея оснований для
рассмотрения каких-либо других альтернативных вариантов, он
будет считать, что нулевая гипотеза является верной (вероят-
ность попасть на западный поезд равна вероятности попасть на
восточный поезд), не догадываясь, что в действительности ему
просто очень повезло. В данном случае мистер Z совершил ошиб-
ку II рода: он принял нулевую гипотезу, которая на самом деле
ошибочна.
Как и многие из пас, мистер Z может считать, что после серии
поездов, которые привозили его к мисс А, в соответствии с «зако-
ном средних» должна последовать серия поездов в направлении
станции мисс В, в результате чего число поездок в обе стороны
с течением времени уравняется. Если мистер Z придет к подобно-
го
му выводу, то он может стать жертвой ошибки совершенно иного
рода — «самообмана азартного игрока». Более подробно об этом
будет сказано позднее (см. с. 111).
ПОВТОРИМ ПРОЙДЕННОЕ
Хотите верьте, хотите пет, но на изучение идей, изложенных
на нескольких только что прочитанных вами страницах, обычно
уходит почти вся первая половина курса статистики. Надеюсь,
читателю стало ясно, что рассмотренный материал вовсе не так
уж труден. В статистике главное состоит не столько в использо-
вании математических формул и проведении расчетов, сколько в
определении последовательности хода рассуждений. В данном па-
раграфе мне хотелось бы дать обобщенную схему этой последо-
вательности в том ее виде, какой используется при статистических
выводах. Эта последовательность состоит из ряда этапов, которые
могут быть выделены при решении широкого круга статистических
задач. Укажем эти этапы, прибегнув к помощи рассмотренного
выше примера:
1. Сформулируем нулевую гипотезу: если не считать случай-
ных отклонений от общего правила, различий между числом по-
ездок к мисс А и мисс В быть не должно; за 30 дней соотноше-
ние между ними составит 15 : 15.
2. Получим фактические данные о событиях, относительно ко-
торых была сформулирована нулевая гипотеза: 21 поездка к
мисс Л и 9 — к мисс В.
3. Определим вероятность того, что полученный результат мог
быть получен в случае, когда нулевая гипотеза верна. Процедура,
осуществляемая на данном этапе рассуждений, не была в явном
виде продемонстрирована при изложении нашего примера. Более
полная ее характеристика будет дана позднее, начиная со с. 137.
Вероятность эта, однако, составляет лишь 4 или 5 на 100.
4. Если вероятность получения данного результата мала, от-
вергнем нулевую гипотезу при уровне значимости, равном этой
вероятности: 4 или 5 на 100. Если вероятность получения дан-
ного результата велика, примем пулевую гипотезу.
5. Признаем, что, и принимая и отвергая нулевую гипотезу,
мы подвергаем себя определенному риску. Нулевая гипотеза до-
пускает, что соотношение 21:9 может встретиться в 4 или 5 слу-
чаях из 100. Если статистик из-за необычайности полученного ре-
зультата отвергнет нулевую гипотезу, несмотря на то что она яв-
ляется верной (этот факт, правда, ему может быть не известен),
то он допустит ошибку I рода. Однако если статистик примет ну-
левую гипотезу, в случае когда она ошибочна, то он допустит
ошибку II рода.
Скорее всего, с концепциями ошибок I и II рода читатель
столкнулся впервые и поэтому, видимо, имеет смысл остановить-
ся на этих понятиях несколько более подробно. Провести различие
между двумя типами ошибок нам поможет аналогия с вынесением
30
решения присяжными о виновности или невиновности подсудимо-
1<>. В соответствии с законом подсудимый является невиновным
(нулевая гипотеза (этап 1 пашей схемы): подсудимый не совер-
шал преступления), до тех пор пока не будет доказано противное
(в результате показаний свидетелей или других данных—-этап 2)
н не останется места для сомнений (при высоком уровне значимо-
сти— этапы 3 и 4). Теперь подумаем о тех двух ошибках, которые
могут допустить присяжные, вынося свое решение: Они могут не-
виновного человека считать преступником (ошибка I рода) или
же настоящего преступника признать невиновным (ошибка II ро-
да). Два других решения, которые могут быть приняты присяжны-
ми, являются верными и, следовательно, справедливыми.
Такая интерпретация позволяет воспользоваться еще одним
способом наглядного представления различий между двумя типа-
ми ошибок. В столбцах табл. 1.2 приводится фактическая оценка
нулевой гипотезы, а в строках — статистический результат приня-
тых решений. В клетках, лежащих на пересечении столбцов и строк
таблицы, содержатся оценки всех четырех возможных результа-
тов. Если смысл показателей таблицы все еще не очень понятен,
можно составить аналогичную таблицу для решений присяжных со
столбцами «действительно виновен» и «действительно невиновен»,
по строкам которой дается оценка решениям «оправдать» и «при-
знать виновным». Смысл показателей четырех клеток этой табли-
цы аналогичен смыслу показателей таблицы, приведенной в на-
стоящей книге.
Таблица 1.2
Верные решения и типы ошибок при проверке статистических гипотез
Статистическое решение Фактическая оценка нулевой гипотезы
Верно Неверно
Принять пулевую гипотезу Отвергнуть пулевую гипотезу Правильное решение Ошибка I рода Ошибка 11 рода Правильное решение
ИССЛЕДОВАНИЕ ГИПОТЕЗ
Прежде чем идти дальше, коротко остановимся еще на одном
важном для дальнейшего изложения моменте. Каждое исследова-
ние обычно начинается с постановки и проверки какой-либо гипо-
тезы. Исследователь полагает, что тот или иной фактор, измене-
ние которого он может контролировать, оказывает воздействие на
интересующее его явление. Он собирает данные, надеясь с их по-
мощью подтвердить свои предположения. Тем самым исследователь
фактически осуществляет проверку нулевой гипотезы. Если нуле-
вая гипотеза в результате такой проверки отвергается, то это
свидетельствует о правдоподобности выдвинутого предложения.
31
ОЦЕНКА ПАРАМЕТРОВ
Чтобы завершить это предварительное рассмотрение вопросов,
более подробное изложение которых будет представлено в других
разделах книги, мне бы хотелось коротко остановиться на пробле-
ме оценки параметров. Как и раньше, вы обнаружите, что в дей-
ствительности это не такое уж сложное дело, как можно было бы
ожидать первоначально. Параметр представляет собой значение не-
которой характеристики исследуемой совокупности. Совокупностью
является набор тех или иных объектов или предметов, обладающих
некоторыми общими свойствами, например все люди, проживающие
в данном населенном пункте, все значения ‘температуры, отмеченные
за все годы наблюдений 14 августа в Сан-Франциско, все сорта
чая, выращиваемые в Китае. Обычно нас интересует некоторая
характеристика, или параметр, исследуемой совокупности. Приме-
рами такой характеристики могут служить средний доход и
вариация уровней дохода работающего населения той или иной
страны. Более часто имеется информация только о некоторой вы-
борке, являющейся лишь небольшой частью исходной совокуп-
ности. Характеристики, полученные для выборок, называются ста-
тистиками. Польза от получения таких статистик состоит в том,
что по их значениям можно дать оценку величине параметров ис-
ходной совокупности.
ЧИСЛО РЫБ В МОРЕ
Возможно, интересным примером оценивания параметров, учи-
тывая быстро растущую в мировом масштабе потребность в пи-
щевых продуктах, может послужить оценка числа съедобных
рыб во всех океанах мира. Проиллюстрировать применяемый здесь
метод оценивания можно и па примере реализации более скром-
ного проекта подсчета числа рыб в пруду. Имеется стандартный
способ проведения подобных подсчетов. Осуществим отлов (вы-
борку), например, 100 рыб, пометим их с помощью металлических
меток и выпустим обратно в пруд. Произведем еще одну выборку,
состоящую, скажем, снова из 100 рыб, и сосчитаем попавших в
нее помеченных рыб. Предположим, их оказалось 10. Это озна-
чает, что вероятность попасть в сеть равна 10 из 100, или 1/10, и
что в пруду число рыб должно быть в 10 раз больше, чем в выбор-
ке, т. е. 1000 рыб.
Очень важно отметить один из моментов описанной процеду-
ры, а именно предположение о том, что каждая из плавающих в
пруду рыб имеет равные шансы быть пойманной. Отбор, при ко-
тором каждый элемент совокупности имеет равные шансы попасть
в выборку, называется случайным отбором. Это предположение о
«случайном характере» рассматриваемых процессов является ос-
новополагающим при многих статистических процедурах.
32
ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ВЫБОРОВ
Параметр, который оценивался в предыдущем примере, пред-
ставляет собой численность исходной совокупности. Другой тип
оценки связан с определением доли совокупности, обладающей
теми или иными характеристиками, что важно, например, при про-
гнозировании исхода президентских выборов. Главная идея, ле-
жащая в основе проведения подобных расчетов, еще более прос-
тая, чем при определении численности исходной совокупности.
Исследователь должен осуществить представительную (репрезен-
тативную) выборку избирателей, определить по ней, кто за кого
голосует (значения статистик), и использовать полученные резуль-
таты в качестве оценок показателей (параметров) совокупности
в целом.
ОШИБКИ ОЦЕНОК
Выводы о том, что в пруду плавает 1000 рыб или что 54%
избирателей будут голосовать на предстоящих выборах за демо-
кратов, являются точечными оценками, поскольку они состоят из
одного числа, или точки, представленной в определенном масшта-
бе. Легко увидеть, что подобные оценки вряд ли абсолютно точ-
ные. Другая выборка (рыб или избирателей) почти наверняка
даст оценки, более или менее отличающиеся от первоначальных.
По этим причинам оценки параметров почти всегда приводятся
вместе с соответствующим доверительным интервалом. В нашем
случае исследователь скажет, что наилучшая оценка процента из-
бирателей, которые будут голосовать за демократов, равна 54%,
и на 95% можно быть уверенным в том, что эта оценка будет за-
ключена в интервале 52—56%, и на 99,9% можно быть уверен-
ным, что она окажется в интервале 49—59%. Как определяются
доверительные интервалы, мы рассмотрим несколько позже.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
В дополнение к цыводам, разбросанным в тексте книги, в кон-
це каждой главы будет дан краткий обзор основных рассмотрен-
ных понятий. Так, познакомившись с гл. 1, читатель должен быть
уверен в том, что ему ясен смысл следующих понятий.
Статистика. Область науки, имеющая дело со сбором, анали-
зом и интерпретацией данных.
Описательная статистика. Получение показателей, с помощью
которых обобщаются характеристики некоторой совокупности
данных.
Статистические выводы. Процедуры оценки характеристик со-
вокупности по данным выборок.
Нулевая гипотеза. Гипотеза об «отсутствии различий», сфор-
мулированная в целях статистической проверки. Проводя иссле-
дование, ученый обычно надеется, что он сможет отвергнуть нуле-
3-1778
33
вую гипотезу, в результате чего будет подтверждена- гипотеза,
выдвинутая исследователем первоначально. Нулевая гипотеза яв-
ляется примером статистического вывода. Если нулевую гипотезу
отвергнуть, то вывод будет состоять в том, что в рассматриваемой
совокупности имеются интересующие исследователя различия.
Уровень значимости. Вероятность получения результата, в та-
кой же степени отличного от нуля, как было получено при прове-
дении исследования, при условии, что нулевая гипотеза верна.
Ошибка 1 рода. Отбрасывание нулевой гипотезы, когда она
является верной.
Ошибка 11 рода. Принятие нулевой гипотезы, когда она являет-
ся ошибочной.
Исследование гипотез. Гипотеза, которая фактически прове-
ряется в эмпирическом исследовании.
Оценка параметров. Процесс оценивания значений исходной
совокупности по значениям выборки, т. е. оценка значений пара-
метров по значениям статистик.
Генеральная (исходная) совокупность. Все элементы теорети-
ческого или реально существующего набора предметов или каких-
либо других единиц, из которого осуществляются статистические
выборки.
Параметр. Показатель совокупности.
Выборка. Некоторая подгруппа наблюдений, состоящая из
элементов исходной совокупности.
Статистика. Показатель, полученный для выборки и исполь-
зуемый обычно для оценки соответствующего значения параметра
в исходной совокупности.
Случайная выборка. Выборка, в которой каждый отдельный
элемент и каждая комбинация элементов имеют одинаковый шанс
быть отобранными.
Точечная оценка. Точное значение параметра, оцененного для
исходной совокупности.
Доверительные границы.. Диапазон изменения значений по обе
стороны от полученной точечной оценки, содержащий с опреде-
ленной степенью вероятности истинное значение параметра.
34
2 ГРАФИЧЕСКОЕ
ИЗОБРАЖЕНИЕ ДАННЫХ
Говорят, лучше один раз увидеть, чем сто раз услышать. Хо-
тя справедливость этого выражения и вызывает некоторые сом-
нения, а в ряде случаев точность визуальных наблюдений явля-
ется только кажущейся (для меня, например, состоящая всего из
нескольких слов метафора поэта Карла Сэндберга «туман подкра-
дывался тахо, как кошка к своей добыче» может сказать гораздо
больше, чем любая самая реалистическая картина), графическое
изображение в ряде случаев может иметь весьма выразительный
характер. В этой главе мы будем иметь дело с различными спосо-
бами графического изображения данных, а именно с графиками,
схемами и т. и.
Опыт показывает, что по восприятию графического материала
все люди делятся на два основных типа. Для некоторых графи-
ческое представление является наиболее естественным и эффек-
тивным способом рассмотрения различных проблем. Для других
графики представляются тайной за семью печатями. Настоящая
глава адресуется главным образом второй группе читателей.
Я думаю, что, немного попрактиковавшись в построении графи-
ков, вы уже не сможете себе представить, как вам удавалось об-
ходиться без них раньше. Если вы усвоите несколько простых пра-
вил построения графиков, вся их таинственность исчезнет. Чтобы
не было скучно читателям, для которых графики — привычный
инструмент анализа, я постараюсь их немножко развлечь с по-
мощью специально подобранных примеров. Даже если читатель
хорошо знаком с содержащимся в данной главе материалом, ему
будет полезно познакомиться с иллюстрациями, с помощью кото-
рых автор поясняет тс или иные моменты в своем изложении.
ВВЕДЕНИЕ. ОБЪЯСНЕНИЕ В НАУКЕ
• Обычно считают, что цель науки — объяснение явлений ре-
ального мира. К несчастью, само определение понятия объясне-
ние вызывает дискуссии. При этом в большей мере имеется согла-
сие по поводу того, каким объяснение быть не должно.
з
35
Суть объяснения состоит не в том, чтобы дать то или иное
название рассматриваемому предмету или явлению. Хотя данное
утверждение кажется очевидным, на практике многие объяснения
фактически представляют собой не более чем игру в слова. Кри-
тикуя с этой точки зрения определение понятия «инстинкт», Е. Б.
Холт дал выразительную характеристику сложившейся в этой об-
ласти науки ситуации. Утверждают, что человека побуждают к
действиям его инстинкты. Если человек любит бывать в обществе,
им руководит «стадное чувство»; если он предпочитает одиноче-
ство, это «антисоциальный инстинкт»; если он подрался с кем-то,
это проявление «инстинкта драчливости»; если он боится выска-
зать свое мнение, то у него комплекс неполноценности; если он
любитель бить баклуши, то в этом повинен «инстинкт лени»; если
же он не является бездельником, то у пего развит «инстинкт
творчества». Таким образом, все проявления поведения человека
можно объяснить с помощью одного универсального средства —
магии слов [5, с. 4—5].
Еще в XVII веке подобное словоблудие было беспощадно вы-
смеяно Мольером в его знаменитом произведении, в котором гово-
рилось, что причины усыпляющего воздействия опиума на орга-
низм человека связаны с сопорифическим свойством опиума, спо-
собствующим временному отключению сознания1.
Получается замкнутый круг: в подобных «объяснениях» с по-
мощью новых наукообразных выражений лишь повторяется то,
что нужно объяснить. В примере с опиумом требуется объяснить,
почему опиум усыпляет людей. «Сопорифическое свойство», на
которое ссылается герой Мольера, в переводе означает «вызываю-
щее сон». Таким образом, опиум усыпляет людей, потому что он
обладает свойством вызывать сои, т. е. он усыпляет люден, пото-
му что он усыпляет людей.
Даже спустя 300 лет медицина все еще иногда прибегает к
палочке-выручалочке с подменой названий для объяснения непо-
нятных явлений. Наглядным примером здесь может служить по-
становка диагноза дислексии (широко распространенного в прак-
тике школьных "врачей). Во всяком случае, вначале мы узнаем,
что Джонни не умеет читать, а потом нам сообщают, что Джонни
не умеет читать, потому что у него дислексия. Ох уж эта квази-
медицинская терминология! Дислексия попросту означает возник-
новение затруднений при чтении, и объяснять с помощью этого
выражения причину малограмотности того или иного ученика —
значит вводить людей в заблуждение. Более того, если родители
ребенка с подобным диагнозом попытаются выяснить, что же та-
кое дислексия, они могут столкнуться с определением, в соответ-
ствии с которым это — затруднения при чтении, причиной кото-
рых является довольно редкое нарушение некоторых функций
1 Ж.-Б. Мольер. Мнимый больной. Действие III, интермедия III. — При-
меч. пер.
36
мозга. Последствия подобного рода «объяснений» для ребенка и
для родителей легко представить *.
Приведем еще несколько примеров таких же бессодержатель-
ных «объяснений». Джонни нс слушается родителей и учителей,
потому что у него наступил «трудный возраст». Ник не справился
с этим тестом, потому что он глуп. Эмилия любит ходить в гости,
потому что она общительна. Лмос молчалив, потому что серьезен.
В каждом примере мною выделены слова, потому что с целью
подчеркнуть существо проблемы. На мой взгляд, понятия «труд-
ного возраста», умственной отсталости, общительности и серьез-
ности представляют собой некоторую ценность, но не являются
объяснениями. Они только описывают, а ведь то, что с их по-
мощью описывается, как раз и должно быть объяснено. Таким
образом, подобное объяснение образует замкнутый круг.
Последнее утверждение может привести вас к выводу, что
для объяснения явления нужно разорвать этот порочный круг и
связать интересующее нас явление с некоторыми другими. Эта
догадка имеет большое значение: одно из определений объясне-
ния как раз и состоит в соотнесении изучаемого явления с некото-
рой другой системой условий **.
Таким образом, мы пришли к тому, с чего была начата на-
стоящая глава. Графики представляют собой средство, с помощью
которого можно наглядно показать связь между различными явле-
ниями. И поскольку определение связей и зависимостей — суще-
ственный момент любого объяснения, графическое изображение
вносит значительный вклад в объяснения явлений реального мира.
ЗАВИСИМЫЕ И НЕЗАВИСИМЫЕ ПЕРЕМЕННЫЕ
В предыдущем параграфе говорилось о связи между некото-
рым явлением, которое требуется объяснить, и некоторым другим
набором условий. То же самое можно выразить иначе, сказав,
что явление, которое требуется объяснить, представляет собой
зависимую переменную, а другие наборы условий — независимые
переменные. Таким образом, в данном параграфе мы сосредото-
чим внимание на рассмотрении связи между зависимой и незави-
симой переменными. С помощью подобных соотношений можно
показать, как изменится зависимая переменная при некотором из-
* Диагноз «незначительное нарушение некоторых функций мозга», с голь
часто использующийся теми, кто имеет довольно смутное представление о рабо-
те мозга, может привести к печальным результатам. Одним из последствий по-
добных бессодержательных «объяснений» является то, что они зачастую обрека-
ют людей на пассивность, отказ от борьбы с недугом и т. д.
** Имеется также два других более или менее часто встречающихся опре-
деления понятия «объяснение». Одно из них заключается в том, что объяснение
того или иного явления состоит в демонстрации того факта, что это явление
может быть дедуктивным образом выведено из данной системы предпосылок.
В соответствии со вторым определением объяснить явление—значит предска-
зать возможные изменения его состояния. Характеристика связи между этими
определениями выходит за рамки настоящей книги. Однако позднее на этот счет
все же будет кое-что сказано. .
37
'менении значения независимой переменной. Настало, видимо, вре-
мя перейти от слов к делу. Для начала обсудим несколько хорошо
всем знакомых примеров.
Сигаретный дым и рак легких. Управление медицинской служ-
бы предупреждает, что сигаретный дым опасен для вашего здо-
ровья*. Такая надпись (в соответствии с законом она должна
быть на всех пачках сигарет и присутствовать в рекламе табач-
ных изделий) фактически постулирует, хотя и в довольно прими-
тивной форме, зависимость, существующую между курением и
здоровьем людей. Это и будет являться нашим первым примером
взаимосвязи между зависимой и независимой переменными. Из
предупредительной надписи следует, что опасность заболеть раком
легких и некоторыми другими болезнями (зависимая переменная)
возрастает (форма зависимости) при курении сигарет (независимая
переменная). Конечно, гораздо более важное значение имела бы
зависимость, сформулированная в более точной форме. Однако
пока нас вполне может удовлетворить и такая формулировка.
Склонность к обучению и успеваемость. Во многих колледжах
абитуриенты, подавая документы па поступление, должны так-
же представить сведения об оценках, полученных ими в школе при
прохождении теста на склонность к обучению (ТСО). Причина
этого состоит в том, что существует некоторая положительная
связь между этими оценками и величиной средней оценки, кото-
рую будет получать абитуриент, став студентом. В общей форме
чем выше у данного абитуриента ТСО-оцепка, тем лучше будет
его успеваемость в колледже. Таким образом, величина оценок,
получаемых в колледже (зависимая переменная), изменяется пря-
мо пропорционально (форма зависимости) величине ТСО-оценок
(независимая переменная).
Интеллект и дошкольное обучение. ТСО-оценки из предыду-
щего примера являются показателями уровня развития интеллек-
та. Имеется много экспериментальных данных, свидетельствую-
щих о том, что дошкольные занятия (независимая переменная)
могут повысить (форма зависимости) результаты теста по опре-
делению коэффициента умственного развития IQ (зависимая
переменная) в среднем примерно на 10 пунктов. Данный пример
поможет нам выявить два важных момента.
1. Является ли данная переменная зависимой или независи-
мой --нельзя определить исходя из природы самой переменной.
В примере с ТСО-оцснкамп показатель уровня развития интеллек-
та -независимая переменная; в примере с дошкольным обучени-
ем аналогичная мера оказалась па положении зависимой пере-
* В какой степени «опасен» — непонятно. И уж. конечно, перестаралась
студенческая газета «Colorado Daily», у которой разыгралось вдруг статистиче-
ское воображение, и она сообщила своим читателям, что «коэффициент смерт-
ности у курильщиков на 70% выше, чем у остальной части населения». Итак,
перед теми из нас, кто на отказался от этой вредной привычки, открывается
поистине безрадостная перспектива умереть более одного раза, поскольку коэф-
фициент смертности у курилыников, но мнению редакции «Colorado Daily», со-
ставляет 170%.
38
менной. Характер переменной, таким образом, зависит от того,
является эта переменная «результирующей» переменной (рак лег-
ких, успеваемость в колледже, улучшение показателя IQ) или
каузальной, причинной, переменной (курение, ТСО-оценки, до-
школьное обучение). Результирующие переменные являются зави-
симыми переменными, каузальные переменные — независимыми.
2. В экспериментах независимыми переменными обычно быва-
ют физические условия, которые могут контролироваться или из-
меняться экспериментатором. Некоторые авторы сужают понятие
независимой переменной до показателя, представляющего лишь
те физические условия, которые могут произвольно изменяться
исследователем. Очевидно, что подобное определение не подходит
для случаев, о которых шла. речь в двух последних примерах.
Адаптация к темноте. Когда человек заходит из ярко освещен-
ного холла в темноту кинотеатра, на некоторое время он как бы
слепнет. Однако вскоре его зрение улучшается. Подобное явление
называется адаптацией к темноте. Эксперименты показали, что
с увеличением времени нахождения человека в темноте (незави-
симая переменная) интенсивность самого слабого света, который
он может различить (зависимая переменная), уменьшается (фор-
ма зависимости) примерно в течение 30 минут.
В этом примере мы вновь столкнулись с переменными, о кото-
рых заранее трудно сказать, зависимые они или лет. В нашем
случае физическая характеристика интенсивность света — зависи-
мая переменная. Обычно при проведении экспериментов такие
физические характеристики, контролируемые экспериментатором,
как число опытов, интенсивность света, физическая величина дру-
гих показателей, являются независимыми переменными. Однако,
как мы только что видели, физические переменные могут быть и
зависимыми. Все обусловлено той конкретной ролью, какую иг-
рают те или иные переменные в каждом отдельном случае.
КООРДИНАТЫ
Допустим, что в распоряжении исследователя рыночной конъюнк-
туры имеется ряд данных по 10 компаниям, зарегистрированным
на Нью-Йоркской фондовой бирже. Данные, приведенные в
табл. 2.1, вымышленные и могут оказаться полезными скорее при
прояснении некоторых моментов, связанных с графическим пред-
ставлением данных, чем при анализе экономического положения
компаний. 'Представим, однако, что по каждой из этих компаний
имеются данные об изменениях в величине прибыли, происшедших
за 5 последних лет, а также об изменении стоимости их акций
в течение того же периода времени. Первый показатель выражен
в процентах, второй - - в долларах.
Если вы рассмотрите эти данные более внимательно, то обна-
ружите наличие взаимосвязи между числами в двух столбцах:
увеличения в прибыли сочетаются с возрастанием цены акций.
Чем больше увеличение или уменьшение в величине прибыли, тем
39
сильнее возрастает или снижается цена одной акции. График по-
может представить нам это более наглядно. С его помощью можно
также определить степень регулярности в характере изменения
данных, что трудно было сделать при табличном представлении
информации. График, представленный на рис. 2.1, позволит нам
также понять принципы построения графиков.
"ни -J0 - 20 -to 0 + !0 i-20 +30 нЦазбО
Процент изменения прибила,
Ось X, абсцисса,
Рис. 2.1. Взаимосвязь между из-
менениями в величине прибыли 10
компаний и изменениями стоимо-
сти акций. Представленные на
графике данные вымышленные; в
действительности связь между
этими показателями выглядит го-
раздо сложнее. Полученный
график является примером возра-
стающей линейной функции. От-
метим, что у любой компании, у
которой изменение в прибыли
было на 10% больше, чем у дру-
гой компании, цена на акции воз-
растала на 2 дол. больше по
сравнению с ценами акций другой
компании (или же уменьшалась
на 2 дол. больше, если соответст-
вующее изменение в прибыли
имело отрицательный знак)
Построение графика начинается с осей координат. При этом
необходимо иметь в виду следующее:
1. Внимательное ознакомление с данными табл. 2.1 показы-
вает, что границами интервала, в котором колеблются значения
показателя процентного изменения в величине прибыли, будут
40%-ное снижение прибыли (—40) и 50%-пос ее увеличение
( + 50). Теперь если вы посмотрите на горизонтальную линию на
рис. 2.1 (она называется осью X или абсциссой), то обнаружите,
что масштаб, в котором представлены па ней процентные значения
изменений показателя прибыли, выбран таким образом, чтобы от-
разить весь диапазон изменения данных: от —40 до +50.
Таблица 2.1
Прибыль и цены на фондовой бирже
Компания Процент изменения в величине прибыли за пять лет Изменение цены акций за пять лег, дол. Компания Процент изменения в величине прибыли за пять лет Изменение цены акций за пять лет, дол.
А —10 *—2 г -т-30 +6
В +20 +4 а -40 —8
С +40 +8 н + 10
D 0 0 I - 20 —4
Е 10 +2 j —30 —6
40
2. Изменения цены акций за то же время колебались в интер-
вале от —8 до +10 долларов. На вертикальной оси (она назы-
вается осью У или ординатой) также представлен именно этот
диапазон изменения фактических данных.
Здесь у читателя может возникнуть вопрос, почему процент-
ные изменения в прибыли откладываются по ©си X, а изменения
в цене акций — по оси У, а не наоборот. В данном конкретном
случае решение автора носило до некоторой степени произволь-
ный характер. По оси X обычно откладываются значения незави-
симой переменной, по оси Y — значения зависимой переменной.
Во многих случаях независимые переменные отождествляются с
факторами, оказывающими воздействие на величину зависимой
переменной. На мой взгляд, повышение или понижение цепы ак-
ций обусловлено возрастанием или уменьшением величины при-
были компании, а не наоборот. Таким образом, зависимой пере-
менной, в соответствии с моей точкой зрения, является изменение
в цене акции, а независимой переменной- -изменение в величине
прибыли. Поэтому я и расположил их на графике соответствую-
щим образом.
Однако в некоторых случаях решение о характере переменных
почти полностью произвольно. Графики могут строиться для отра-
жения взаимосвязи между ростом и весом 20 мальчиков пяти лет
или между оценками по социологии и истории, полученными
50 студентами в течение одного и того же семестра. Все это (как
и график на рис. 2.1) является примерами так называемой диа-
граммы рассеяния, с помощью которой- отражается корреляцион-
ная взаимосвязь между теми или иными характеристиками изу-
чаемого объекта (более подробно о корреляции будет сказано в
гл. 8).
Во многих случаях при рассмотрении корреляционных вза-
имосвязей понятия причины и следствия становятся практически
бессмысленными, вследствие чего не остается базы для принятия
решения о том, какая из переменных зависимая, а какая неза-
висимая.
Связь между изменением прибыли и изменением в цепе одной
акции для наших 10 воображаемых компаний может быть нагляд-
ным образом представлена при нанесении соответствующих друг
другу значений этих характеристик на график. Данная процедура
проделана нами на рис. 2.1. Теперь если мы опустим из любой
точки графика, помеченной буквой, обозначающей ту или иную
компанию, перпендикуляр на ось X, то получим значение X, сов-
падающее с величиной показателя соответствующей компании из
первого столбца табл. 2.1. Если же из этой же точки мы опустим
перпендикуляр на ось У, то получим значение У, равное величине
показателя этой же компании из второго столбца табл. 2.1. Не
следует, однако, придавать большого значения нашему малень-
кому открытию. Дело в том, что построение графика как раз и
осуществлялось по числам, приведенным в табл. 2.1. Так что, .если
в других аналогичных случаях вам не удастся получить значения
41
исходных показателей, с уверенностью можно сказать, .что график
был построен неправильно.
ТИПЫ ЗАВИСИМОСТЕЙ
После того как мы рассмотрели некоторые основные идеи,
связанные с графическим изображением данных, мне бы хотелось
прежде всего представить читателю возможность попрактиковать-
ся в построении и интерпретации различных графиков, а затем
мы приступим к описанию некоторых из наиболее важных типов
математических кривых, особенно часто встречающихся при по-
строении графиков.
Рис. 2.2. Среднее число часов is неделю,
которое домашняя хозяйка посвящала
ведению домашних дел, для отдельных
лет с 1926 по 1966 г. Большое впечатле-
ние производит тот факт, что число от-
работанных домашней хозяйкой часов
оставалось стабильным в течение всего
40-летнего периода. И это, несмотря па
появление в течение рассматриваемого
периода времени многочисленных машин
и механизмов, сберегающих и облегчаю-
щих труд домашних хозяек
Для начала полезно будет отметить, что график может помочь
нам убедиться в отсутствии какой бы то ни было взаимосвязи
между двумя .переменными. Рассмотрим, например, данные о чис-
ле часов, которые «безработная» домашняя хозяйка посвящает
домашним делам, и сравним, как изменилась ситуация в этой об-
ласти за достаточно продолжительный период времени. В нашем
распоряжении имеются выборочные данные за период с 1927 по
1966 г. [201. Эти данные графически представлены па рис. 2.2.
На горизонтальной линии (ось X, абсцисса, независимая пере-
менная) указаны годы, по которым у нас имеются данные. Сле-
дует иметь в виду, что эти годы разделены между собой нерав-
ными промежутками времени и поэтому па оси X они располо-
жены па неодинаковом расстоянии друг от друга. По вертикаль-
ной осн (ось У, ордината, зависимая переменная) откладывается
среднее число часов в неделю, затрачиваемых домашней хозяйкой
на ведение домашних дел. Обратите внимание на небольшой раз-
рыв в нижней части вертикальной оси, с его помощью показано,
что время работы с 10 до 40 часов в неделю рассматривать не
имеет смысла. Данный прием применяется для придания графику
более компактной и удобной для анализа формы.
На графике перед нами предстает довольно' безрадостная кар-
тина. Домашняя хозяйка в среднем тратит более 50 часов в неде-
лю на различные домашние работы. И несмотря на появление
в течение рассматриваемого периода электрических стиральных
машин, сушилок, пылесосов, автоматических посудомоек, магази-
42
ион самообслуживания и полуфабрикатов различных блюд, число
часов в неделю, затрачиваемых на домашние дела, осталось прак-
тически* неизменным. И хотя график свидетельствует о наличии
незначительной повышательной тенденции, присущей рассматри-
ваемым данным, прежде всего в глаза бросается тот факт, что в
течение 40 лет число часов, затрачиваемых среднестатистической
хозяйкой на выполнение домашних работ, оставалось практиче-
ски неизменным. Статистические проверки подтверждают, что
имеющиеся различия незначительны (нулевая гипотеза не может
быть отвергнута).
КАК ГРАФИК ПРЕВРАЩАЕТСЯ В ЛЖЕСВИДЕТЕЛЯ
Предположим, что данные о средней продолжительности ра-
бочей недели домашней хозяйки, представленные на рис. 2.2, бы-
ли опубликованы в трех газетах, редакции которых по-разному
понимают свой долг правдиво и объективно информировать об-
щественность о текущих событиях. В последнем, кстати, можно
убедиться даже из заголовков публикуемых is этих газетах сооб-
щений.
Сдержанный и базирующийся на фактических данных:
РАБОЧАЯ НЕДЕЛЯ ДОМАШНЕЙ ХОЗЯЙКИ ОСТАЕТСЯ НЕИЗМЕННОЙ
За 40 лет произошли лишь небольшие изменения
Слегка сенсационный:
ДОМАШНИХ ДЕЛ ВСЕХ НЕ ПЕРЕДЕЛАЕШЬ
«Трудосберегающее» домашнее оборудование лишь прибавляет забот
Вопли бульварной газеты:
ТЯГОТЫ ЗАМУЖНИХ ЖЕНЩИН СТРЕМИТЕЛЬНО РАСТУТ
Американская семья в серьезной опасности
Что же стоит за каждым из приведенных заголовков? В пер-
вом из них объективно сообщается об имеющихся фактических
данных. Для их иллюстрации вполне достаточно будет рис. 2.2.
Чтобы придать материалу более сенсационный характер, в после-
дующих двух заголовках внимание читателя акцентируется на
увеличении затрат времени на ведение хозяйства. Имеется не-
сколько способов представить такое увеличение более, существен-
ным, чем это было на самом деле (рис. 2.3(a) и 2.3(6)):
1. Перенесение исходной точки линии, изображенной на гра-
фике, ближе к началу координат и некоторое увеличение масштаба
единиц измерения по оси Y. На рис. 2.3(a) показано, к чему мо-
жет привести осуществление подобной операции. Форма графика
по сравнению с рис. 2.2 почти не изменилась, однако в нем есть
одна небольшая хитрость. Поскольку линия на графике выходит
почти из самого начала координат и обрывается у верхней гра-
ницы рисунка, создается преувеличенное впечатление о существо-
вании тенденции к росту отображаемых с помощью графика
данных.
43
2. Отсутствие числовых делений на оси Y. Чтобы создать впе-
чатление о наличии существенных изменений, можно просто опус-
тить числовые обозначения на оси У (см. рис. 2.3(a)). В этом
случае читатель сможет судить о характере происшедших изме-
нений, основываясь лишь на собственных визуальных впечат-
лениях.
Рнс. 2.3. Преувеличение с помощью графи-
ков. В действительности нет статистически
значимого возрастания числа часов, затра-
чиваемых средней домашней хозяйкой в
педелю па ведение домашних дел. Однако
различные уловки, применяемые при по-
строении графиков, могут создать впечат-
ление, что такое возрастание действительно
имело место
3. Существенное увеличение масштаба единиц измерения, по
оси Y. Последствия осуществления данной операции хорошо вид-
ны на рис. 2.3(6).
4. Тенденциозный подбор данных. На рис. 2.3(6) опущены
данные за 1929 г., которые выпадают из общей картины изменения
интересующего пас показателя.
ВОЗРАСТАЮЩИЕ И УБЫВАЮЩИЕ ФУНКЦИИ
Представленные на рис. 2.1 и 2.3(6) графики, независимо от
их индивидуальных особенностей, являются хорошими примерами
возрастающих функций: увеличению значений, расположенных на
оси X, соответствует возрастание значений, расположенных на
оси У. Графики, на которых увеличению значений, расположен-
ных на оси X, соответствует уменьшение значений на оси У, пред-
ставляют собой убывающие функции. Примером такого рода функ-
ции может служить характерная для последнего времени тенден-
ция к снижению коэффициента рождаемости. Приведенные в
табл. 2.2 данные о величине коэффициента рождаемости взяты
нами из «The World Almanac» за 1976 г. (с. 959). Коэффициент
44
рождаемости показывает, сколько родилось живых младенцев в
расчете на тысячу человек. При внимательном изучении таблицы
вы обнаружите число, которое, несомненно, заставит вас удивить-
ся. Речь идет о коэффициенте рождаемости для 1972 г. В период,
когда значения коэффициента рождаемости устойчиво снижались,
коэффициент для 1972 г. оказался наибольшим за 20 последних
лет. Почему же это произошло? Не тратьте времени на создание
различных фантастических теорий, объясняющих данный феномен.
Все объясняется очень просто: это — опечатка. Если ознакомить-
ся с остальной частью таблицы, то сразу станет ясно, что так оно
и есть: показатель для 1972 г. должен быть равен 15,6.
Таблица 2.2
Коэффициенты рождаемости за отдельные годы
Год Коэффициент рождаемости ' Год Коэффициент рождаемости
1955 24,6 | 1971 17,2
1960 23,7 1972 25,6
1965 19,4 1973 14,9
1970 18,4 1974' 15,0
Исправленные данные табл. 2.2 представлены на рис. 2.4. По
оси X (абсциссе) вновь откладываются значения времени, по
оси Y (ординате)—значения коэффициента рождаемости. Из гра-
Рис. 2.4: Коэффициент рож-
даемости за отдельные годы.
Приведенный график может
служить примером графика
убывающей функции. Коэффи-
циент рождаемости довольно
устойчиво снижается. Самые
последние данные (для 1973 и
1974 гг.) свидетельствуют о
том, что представленная функ-
ция, возможно, достигла своего
нижнего предела. Однако ин-
формация за последующие го-
ды опровергает это представ-
- ление
фика хорошо видно, что мы имеем дело с убывающей функцией.
Увеличению значений X (годы) соответствует уменьшение значе-
ний У (коэффициент рождаемости).
ЛИНЕЙНЫЕ И КРИВОЛИНЕЙНЫЕ ФУНКЦИИ
На рис. 2.1, как отмечается в пояснении к нему, изображена
линейная функция. Последнее означает, что одинаковым измене-
ниям в величине X всегда соответствует одно и то же изменение
45
в величине У. На рис. 2.5 представлены четыре линейных функции,
две из которых являются возрастающими и две у-убывающими.
Небольшое исследование графиков этих функций/'приведет нас к
следующим двум заключениям: (1) для каждой' отдельно взятой
функции величина изменения в значении У всегда одинакова для
одних и тех же изменений в величине X (4-2,5; +5,0; —1,5; -2,4
Ось л, абсцесса
Рис. 2.5. Возрастающие и убывающие
функции с разлн шыин углами наклона
соответственно для каждого
из четырех графиков), и (2)
как следует из приведенных
числовых значений, величи-
на изменения У при данном,
одинаковом для всех функ-
ций, изменении в величи-
не А' различна для различ-
ных функций. Говоря науч-
ным языком, различные
функции отличаются друг
от друга углом своего на-
клона. Чем больше величи-
на изменения значения У
для данного, одинакового
для всех функций, измене-
ния в величине X, тем боль-
ше, или круче, этот угол
наклона.
Линейная функция, та-
ким образом, характеризу-
ется постоянным коэффици-
ентом изменения: одинако-
вым приращениям в величи-
не X во всех случаях будут
соответствовать одинаковые
приращения (положитель-
ные или отрицательные) в
величине У. Функции, для
которых одинаковым прира-
щениям в величине X соот-
ветствуют изменяющиеся
У, называются криволи-
нс с помощью прямых
функций, а с помощью раз-
приращения или уменьшения в величине
нейными. Графически они изображаются
линий, как было в случае линейных
личных кривых.
ВОЗРАСТАЮЩИЕ И УБЫВАЮЩИЕ ПРИРАЩЕНИЯ
Возможно, каждый из вас знаком с историей крестьянина, ко-
торый спас короля от разбойников. В награду за это король пред-
ложил крестьянину самому выбрать себе награду. «О, мой ко-
роль,— отвечал крестьянин, — мне много не нужно. Возьмите
46
меня, если так будет угодно Вашему Величеству, к себе на служ-
бу, но только на один месяц. И пусть в первый день мне заплатят
всего только один цент, во второй день — два цента, в третий —
четыре, в четвертый — восемь и так далее в течение всех 30 дней.
Большего я не заслуживаю».
Если бы король опрометчиво согласился на это предложение,
он совершил бы большую ошибку. На рис. 2.6 показано, как уве-
Рлс. 2.6. Кривая с возрастаю-
щими приращениями. Приве-
денные рядом с выделенными
на кривой точками числа пред-
ставляют собой значения, по
которым осуществлялось по-
строение графика. Последова-
тельно вычитая эти числа одно
из другого, можно лучше себе
представить смысл концепции
возрастающих приращений
дичится вознаграждение крестьянина только за первые 11 дней
срока его службы. Из чертежа видно также, что величина выплат
с некоторого момента начинает резко расти. Теперь вы понимае-
те, почему на графике представлены данные лишь за первые 11
дней. Дело в том, что с каждым днем сумма вознаграждения
увеличивается на все более возрастающую величину: с первого по
второй день она возросла всего на 1- цент, но с 10 по II—уже
на 512 центов. С 29 по 30 день сумма вознаграждения увеличит-
ся с примерно 311 млн. центов (3,11 млн. дол.) до примерно
622 млн. центов (6,22 млн. дол.). Подобные кривые, для которых
одинаковые приращения значения X соотносятся со все более
возрастающими приращениями в величине У, мы будем называть
кривыми с возрастающим приростом1. Так, если из каждого зна-
чения У, отмеченного на кривой, последовательно вычесть пред-
шествующее ему значение, то легко убедиться, что с каждым
разом величина полученной разности будет становиться все боль-
ше и больше, в то время как число отработанных крестьянином
дней (X) всякий раз будет возрастать ровно на одну единицу.
Кривые, для которых одинаковые приращения значения X со-
относятся со все .менее значительной величиной прироста У, назы-
ваются кривыми с уменьшающимся приростом. В качестве иллю-
страции рассмотрим зависимость между величиной показателя
уровня преступности и численностью населения города. Соответ-
ствующие данные приведены в табл. 2.3.
1 При этом следует иметь в виду, что величина прироста может быть как
положительной, так и отрицательной. — Примеч. пер.
47
Таблица 2.3
Численность населения города и уровень
преступности
Средняя численность на- Число преступ-
селения города пений в расчете
на 1000 чел.
750 000 65
145 000 62
70 000 49
35 000 44
16 000 38
4 500 33
Сельские населенные 15
пункты
Очевидно, что с ростом
численности населения го-
рода возрастает уровень пре-
ступности, однако точный
вид зависимости по имею-
щимся в нашем распоряже-
нии данным представить
трудно, поскольку величина
показателя численности на-
селения изменяется очень
неравномерно. Ситуация
станет значительно более
ясной после нанесения дан-
ных на график (рис. 2.7).
Изображенная па графике
кривая является кривой с уменьшающимся приростом. При уве-
личении численности населения города уровень преступности так-
же возрастает, однако этот прирост на конце кривой значительно
менее существен, чем в ее начале. Для примера достаточно срав-
нить величину изменения показателя уровня преступности при
переходе от города с населением 145 000 человек к городу с на-
селением 750000 человек и от города с населением 4500 человек
к городу с населением 16 000 человек.
Кривые этого типа, как хорошо видно на рис. 2.7, стремятся
к некоторому верхнему пределу, величину которого они превы-
сить не могут. В нашем конкретном случае это означает, что уро-
вень преступности не будет существенно возрастать при переходе
от города с достаточно большим населением к городу, в котором
численность населения еще выше. Так, например, уровень пре-
ступности, равный 65 в расчете на 1000 человек для города с
числом жителей 750 000 человек, будет лишь незначительно отли-
чаться от соответствующего показателя, полученного для города
с численностью 1 млн. или даже 10 млн. человек. Если мы еще
раз посмотрим на рис. 2.4, то обнаружим, что изображенная на
нем кривая также, по-видимому, стремится к достижению некото-
рого предела, на этот раз — нижнего, ниже которого величина
коэффициента рождаемости никогда не опустится. Верхние и
нижние границы, к достижению которых стремятся те пли иные
функции, называются асимптотами. К понятию асимптоты мы еще
вернемся при обсуждении характеристик статистических функций.
Кривые данного типа могут помочь нам понять смысл опера-
ций интерполяции и экстраполяции, к которым иногда приходится
прибегать, когда мы имеем дело с графиками. Обе эти процедуры
применяются для оценки значений представленного на графике
показателя в точках, по которым информации не имеется. Так, на-
пример, при построении графика, приведенного на рис. 2.7, в на-
шем распоряжении не было данных о городах, численность насе-
ления которых была бы меньше 750 000, но больше 145 000 чело-
век, а также о городах с населением свыше 750 000 человек.
48
Оценить уровень преступности для городов, численность населе-
ния которых заключена в интервале между известными нам зна-
чениями, можно с помощью интерполяции. Для этого нужно из
точки кривой, соответствующей численности населения интересую-
щего нас города опустить перпендикуляр па ось Y. Аналогичным
Средняя численность населения города {тыс. чел.)
Рис. 2.7. Численность населения города и уровень преступности. Представленная
па графике функция является возрастающей функцией с возрастающими прира-
щениями. График помогает также лучше попять смысл концепций интерполяции
и экстраполяции. В имеющейся у нас информации пет сведений об уровне пре-
ступности в городах с численностью населения 500 тыс. человек. Однако этот по-
казатель можно оцепить значением 63/1000, которое получено с помощью интер-
поляции. Данное значение находится посредством восстановления перпендикуля-
ра из расположенной на оси X точки, соответствующей численности населения
500 000 человек, до пересечения с изображенной на графике кривой, после чего из
точки пересечения опускается перпендикуляр на ось У. Отсутствуют данные и об
уровне преступности в городах с населением 1 млн. человек. Если продлить послед-
ний участок кривой, представленный прямой линией, до пересечения с перпендику-
ляром, выходящим из точки на оси X, которая соответствует численности населе-
ния города, равной 1 млн. человек, то мы осуществим операцию экстраполяции.
Опустив из точки пересечения перпендикуляр на ось У, получим оценку уровня
преступности, равную 66/1000. Процесс экстраполяции кривой показан с помощью
пунктирных стрелок
образом, предварительно продлив кривую на графике до нужного
.значения, можно оценить и уровень преступности для городов,
численность населения которых превышает 750 000 человек. В дан-
ном случае процедура оценивания носит название экстраполяции.
На рис. 2.7 приводятся примеры применения обоих методов оце-
нивания.
ОГИВА
Довольно часто различные виды зависимостей удается отра-
зить с помощью S-образной кривой, или огивы. Так, например,
кривые этого типа могут быть использованы для описания взаимо-
связи между возрастом и некоторыми физическими или психоло-
гическими характеристиками человека. На рис. 2.8 представлена
4- П78
49
Рис. 2.8. Пополнение пассивного
словарного запаса. Начальный
участок этой кривой характери-
зуется возрастающими прираще-
ниями ее ординат, а заключитель-
ный участок — уменьшающимися
приращениями. Между этими
участками * кривая изменяется ли-
нейно
такая кривая, с ее помощью описывается динамика процесса по-
полпения пассивного словарного запаса (количества слов, смысл
которых ясен тому или иному человеку). Свое начало данная кри-
вая берет, естественно, в точке начала координат. Затем величина
приростов ее ординат увеличивается. Однако на заключительном
участке кривой величина приростов начинает уменьшаться, а сама
кривая с течением времени по-
степенно приближается к
асимптотическому пределу, ко-
торый для «среднего» человека
равен примерно 60 000 слов.
Огива, изображенная па
рис. 2.9, служит примером
убывающей кривой. С ее по-
мощью показано, сколько про-
центов тридцатилетпих муж-
чин, принадлежащих к одному
и тому же поколению, дожи-
вает до того или иного воз-
раста. И на этот раз вначале
происходит увеличение при-
ростов ординат кривой, а за-
тем их уменьшение, причем
кривая достигает нулевого
значения в точке, соответст-
вующей примерно 110 г,одам.
МОНОТОННЫЕ И НЕМОНОТОННЫЕ ФУНКЦИИ
Все рассмотренные нами до сих пор зависимости были моно-
тонными: при увеличении значения X величина Y или все время
увеличивалась, или все время уменьшалась. Кривые, не удовлет-
воряющие этому строгому требованию, не являются монотонными.
Далее приводится пример зависимости подобного рода.
50
Люди, занимающиеся парашютным спортом, утверждают, что
прыжок с парашютом — один из самых волнующих экспериментов,
с. каким только может столкнуться человек в своей жизни. В осо-
бенности это относится к первому прыжку. Первый прыжок рож-
дает у человека необыкновенное сочетание чувств радости и испу-
га, впечатление от которого остается на всю жизнь. Однако толь-
ко примерно 15% лиц, совершивших свой первый прыжок,
отваживается впоследствии прыгнуть снова. Один из таких «дезер-
тиров» говорил: «Это был один из самых волнующих эксперимен-
тов в моей жизни, однако я уверен, что больше никогда в жизни
не захочу подвергнуться ему снова» [2]. Изучение реакции начи-
нающих парашютистов на предложение совершить повторный
прыжок может предоставить в распоряжение исследователя цен-
ную информацию о психическом состоянии обследуемых людей.
Многочисленные признаки свидетельствуют о том, что эти люди
находятся в состоянии крайнего возбуждения. Проверка показы-
вает, что слух у них несколько ослаблен. Тесты на ассоциатив-
ность слов показали, что все их мысли сосредоточены на пред-
стоящем прыжке. В табл. 2.4 приводятся ответы одного парашю-
тиста, которого попросили произнести «первое попавшееся слово,
которое придет ему на ум» в качестве реакции на то или иное
слово, сказанное исследователем. Те же, кого попросили придумать
рассказы по предложенным им картинкам, также продемонстри-
ровали, что больше всего на свете их занимает предстоящий
прыжок. Некоторые из этих рассказов свидетельствовали о том,
что их авторы боятся прыгать, другие — о попытке скрыть свой
страх.
Определенный интерес
представляют также оценки,
которые парашютисты-но-
вички дают состоянию своих
Табл и ц а 2.4
Ассоциативность слов у начинающих
парашютистов
чувств на протяжении неко-
торого периода времени, на-
чинающегося за неделю до
прыжка и заканчивающего-
ся сразу же после призем-
ления. Оценке подвергались
два чувства. Первое из них
-связано с положительными
эмоциями и его можно ус-
ловно определить как «пред-
вкушение прыжка». Оно
Летать
Голодный
Радиатор
Счастливый
Велосипед
Ответ
Прыгать
Прыгать
Горячий
I lapaniiOT
Прыгать, черт возьми!
11е могу отвязаться от
.этого слова!
характеризуется приподня-
тым настроением, стремлением приблизить момент прыжка, быть
первым среди товарищей. Второе чувство....это страх и сомнения.
Начинающий парашютист испытывает смутное беспокойство, у не-
го растет желание отказаться от прыжка, он ругает себя за то,
что ввязался в эту «авантюру». Сила каждого из этих чувств
характеризовалась по десятибалльно!! шкале оценок (мипималь-
ная оценка при этом равнялась 1, максимальная —10). Средние
значения полученных оценок представлены на рис. 2.10. Обе изо-
браженные на графике кривые являются немонотонными. Кривая
«предвкушение» берет свое начало в верхней части графика и за-
Рис 2.10. Немонотонные санк-
ции. .Характерной особенно-
стью немонотонных функций
является то, что характер из-
менения их ординат меняется,
по крайней мере, однажды.
В данном случае ординаты кри-
вой «предвкушение» вначале
уменьшаются, а затем возра-
стают, ординаты кривой «страх
и сомнения» вначале возра-
стают, а затем убывают
тем, постепенно снижаясь, достигает точки, соответствующей мо-
менту совершения прыжка, после чего она вновь возрастает. Кривая
«страх и сомнения» начинается й нижней части графика и воз-
растает также вплоть до момента совершения прыжка, а затем
снижается. Таким образом, ординаты рассмотренных кривых на
одних участках графика возрастают, а на других — уменьшаются.
По этому признаку данные кривые отличаются от всех других
кривых, с которыми мы до сих пор имели дело в настоящей
главе.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
На этом мы прервем изложение с тем, чтобы коротко обобщить
прочитанный материал. На рис. 2.11 представлены все типы рас-
смотренных нами графиков. Далее приводится характеристика ос-
новных понятий, с которыми мы познакомились в настоящей
главе.
Объяснение. В настоящей главе под этим термином понима-
ется соотнесение интересующего нас явления с другими процес-
сами и явлениями. Однако имеются и другие определения. Под
объяснением может пониматься также (.1) демонстрация того фак-
та, что данное явление дедуктивным образом может быть получе-
но из некоторого набора предпосылок, или (2) предсказание воз-
можных изменений в состоянии данного явления.
«Замкнутый круг» при объяснении. «Объяснение» явления по-
средством присвоения ему нового (часто наукообразного) наиме-
52
новация. Встречается .в случаях, когда с помощью нового назва-
ния пытаются описать то, что как раз и должно быть объяснено.
Зависимая переменная. Интересующее нас явление или иссле-
дуемый объект в той или иной области науки.
Независимая переменная. Переменная, с которой связана зави-
симая переменная, или переменная, значение которой подвергают
изменению с целью определить, существует ли связь между этими
изменениями и изменением зависимой переменной.
Координаты. Оси X и У графика.
А - возрастающая,
линейная
р - убывающая, линейная
Абсиисса, ось К
Независимая переменная
С- возрастающая,
убывающие npu.pa~.e-
„ вия ' ;
X - возрастающая, воз -
ристающие прираще-
ния
£ - убывающая, убываю-
щие приращения
F-убывающая, возрас-
тающие приращения
S--возрастающая огива
Н-убывающая огива
'I и в-обе немонотонные
Рис. 2.11. Рассмотренные типы графиков
Абсцисса (ось X). Горизонтальная ось графика. Обычно на
ней откладываются значения независимой переменной.
Ордината (ось Y). Вертикальная ось графика. Обычно на ней
откладываются значения зависимой переменной.
Возрастающая функция. Функция, у которой при увеличении
значения X всегда происходит возрастание величины У. На
рис. 2.11 возрастающими являются функции А, С, D и G.
Убывающая функция. Функция, у которой при увеличении зна-
чения X всегда происходит уменьшение величины У. На рис. 2.11
убывающими являются функции В, Е, F и Н.
53
Линейная функция. Функция, у которой одинаковым прираще-
ниям значения X всегда соответствуют одни и те же приращения
в величине У.
Наклон прямой. Характеристика степени возрастания ордина-
ты прямой „тинии. Чем круче наклон, тем в большей степени воз-
растает значение ординаты данной прямой при одинаковых из-
менениях величины X по сравнению с ординатами прямых, имею-
щих меньший угол наклона.
Криволинейная функция. Функция, у которой при одинаковых
изменениях величины А' величина У меняется неодинаково. Стро-
го говоря, данное определение справедливо лишь для монотонных
функций (см. далее). Так, на рис. 2.11 оно относится к функ-
циям С — II.
Кривая с возрастающими приращениями. Кривая, у которой
при последовательных, равных между собой, одинаковых прираще-
ниях значения X величина приращений значения У становится
с каждым разом все больше. Кривые данного типа представлены
па рис. 2.11 графиками D и F.
Кривая с убывающими приращениями. Кривая, у которой при
последовательных, равных между собой приращениях значения X
величина приращений значения У становится с каждым разом вес
меньше. Кривые данного типа представлены на рис. 2.11 графи-
ками С и Е.
Асимптота. Верхний или нижний предел, к которому стремит-
ся кривая. Так, на рис. 2.11 кривые С, Е, G и II, по-видимому,
стремятся к достижению соответствующих пределов.
Интерполяция. Определение на графике ординаты точки, абс-
цисса которой заключена в интервале между значениями X, по ко-
торым осуществлялось построение графика. Интерполировать, та-
ким образом, значит найти на графике точку, лежащую между
точками, ранее нанесенными на график.
Экстраполяция. Определение на графике ординаты точки, абс-
цисса которой по своей величине больше или меньше любого зна-
чения X, по которым осуществлялось построение графика. Экстра-
полировать, таким образом, значит продлить нанесенную на гра-
фик линию в ту или иную сторону.
Огива. S-образная кривая, одни участки которой характеризу-
ются возрастающими значениями приростов, а другие — умень-
шающимися значениями приростов. На рис. 2.11 огивы представ-
лены кривыми G и И.
Монотонная функция. Функция, у которой при возрастании
значения X величина У или все время увеличивается, или все
время уменьшается. На оме. 2.11 монотонными являются кривые
А - II.
Немонотонная функция. Функция, у которой при возрастании
значения X величина У в некоторых интервалах возрастает, а в
некоторых уменьшается. На рис. 2.11 немонотонными являются
кривые I и I.
54
3 ЧАСТОТНЫЕ РАСПРЕДЕЛЕНИЯ
Наиболее важной функцией в статистике является немонотон-
ная функция, описывающая так называемое нормальное распре-
деление. Более детально это распределение будет рассмотрено
нами позднее, а сейчас мне бы хотелось познакомить читателя
с концепцией частотного распределения Б Частотные распределе-
ния могут быть представлены с помощью графиков, по оси абс-
цисс которых откладывается числовая оценка того или иного
признака изучаемого явления, а ио оси ординат — частота, с
которой данная оценка встречается. Такое определение может по-
казаться вам непонятным и сложным, однако в действительности
все очень просто. Несколько примеров помогут нам прояснить
суть дела.
ТИПЫ ЧАСТОТНЫХ РАСПРЕДЕЛЕНИЙ
Верхний график па рис. 3.1, называемый частотным полиго-
ном, представляет собой наиболее типичный способ графическо-
го изображения частотного распределения. На липин, лежащей в
основании этого графика, отложены оценки, полученные за от-
веты па вопросы теста, в котором предлагалось подтвердить или
опровергнуть достоверность тех или иных суждений. Диапазон
вариации оценок составил от 3 до 28 баллов. По оси ординат по-
казано, сколько человек получили ту или иную оценку. График
в целом характеризует распределение этих оценок. Смысл сказан-
ного станет более понятным, если вы обратитесь к среднему
графику на рис. 3.1. Каждый крестик на нем означает оценку,
полученную тем или иным студентом. Соединив прямыми линия-
ми вершины состоящих из крестиков столбцов, мы вновь легко
получим изображение верхнего графика.
Нижний график па рис. 3.1 называется столбиковым графиком
или гистограммой1 2. На этом графике значения частот сгруп-
1 В статистической литературе используются также термины: ряд распреде-
ления, распределение численностей и вариационный ряд (в математической ста-
тистике).— Примеч. пер.
2 На практике иногда проводят различия между этими терминами. Столби-
ковый график (диаграмму) используют для отражения частотных распределений
качественных признаков изучаемого явления; гистограмму — количественных при-
знаков, сгруппированных в интервалы. — Примеч. пер.
55
пированы в трехбалльные последовательные интервалы. Над каж-
дым прямоугольником указано, сколько человек получили оцен-
ки, значения которых попадают в интервал с границами, указан-
ными на оси абсцисс. В этом можно легко убедиться, сосчитав
х
X
X
XXX
X X X у
ХХХХХХХ XXX
X хххххххххххх
хххххххххххххх
X X ХХХХХХХХХХЧХХХХ X
X X X X X X XXX XXX X х X X X X X X X X X X- X
3 4 5 6 7 8 9 tfftuzti ГЧ ‘Л(6 t7tet92Snii23147526Z7№
Оценки
Рис. 3.1. Графики частот-
ных распределений. Верх-
ний график называется ча-
стотным полигоном. На
среднем графике показано,
где располагается каждая
оценка рассматриваемого
распределения. Нижний
график называется столби-
ковым графиком или гисто-
граммой. На этом графике
значения частот сгруппиро-
ваны в трехбалльные после-
довательные интервалы. На
подобных графиках N ха-
рактеризует число пред-
ставленных на них наблю-
дений
на среднем рисунке число крестиков для соответствующих зна-
чений оценок, попадающих в тот или иной интервал. Средний
график на рис. 3.1 также можно превратить в гистограмму, если
над каждым столбцом крестиков построить прямоугольник.
Важная особенность данных, представленных на рис. 3.1,
состоит в том, что, независимо от способа отображения, их рас-
пределение приблизительно симметрично. Значения этих данных
концентрируются в средней части графика. По обе стороны от
56
этой центральной оси и на одинаковом расстоянии от нее распо-
ложены приблизительно равные друг другу значения.
БИМОДАЛЬНОЕ ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ
Вы, наверное, замечали, что чаще всего в пашей жизни упо-
требляются числа «три» и «семь»? Вспомним хотя бы о трех
грациях (Аглая, Талия, Эвфросина—дочери Зевса и Эвриномы),
о трех пространственных измерениях предметов (длина, ширина,
высота). Вся Галлия, по словам Цезаря, была разделена на три
части. Что касается числа «семь», то и здесь можно привести
достаточно примеров: семь чудес света, семь периодов в жизни
человека, семь холмов, на которых стоит Рим.
Рис. 3.2. Число различных предметов
и явлений, встречающихся группами.
Как видим, имеется ярко выражен-
ная тенденция, в соответствии с ко-
торой чаще всего встречаются пред-
меты и явления, сгруппированные по
3 и по 7
Происхождение этого интересного феномена неизвестно. Не-
которые объясняют популярность числа «три» тем, что в древнем
мире объединение трех лиц рассматривалось как надежный спо-
соб избежать заговора с целью захвата единоличной власти
(вспомним знаменитые триумвираты). Однако вполне возможно,
что это не причина, а лишь проявление все той же закономерно-
сти, которую мы пытаемся объяснить.
Причину «магической» силы числа «семь» иногда видят в том,
что вокруг одной окружности можно разместить ровно шесть ок-
ружностей того же диаметра (вместе с первой их будет семь).
Этот факт вы можете проверить с помощью семи одинаковых мо-
нет. Однако и в этом случае нельзя с уверенностью утверждать,
что причина широкой распространенности числа «семь» кроется
именно в этом.
Но, возможно, наша память устроена таки,м образом, что в
ней лучше сохраняются образы вещей и явлений, сгруппирован-
ных по 3 и по 7? Обратимся поэтому к такому источнику, как
Энциклопедия мелочей [22}, и представим интересующую нас ин-
формацию на графике' (рис. 3.2). Как видим, частота предметов
и явлений, встречающихся по 3 и по 7, действительно более чем
57
в два раза превышает частоту предметов и явлений, имеющих
любую другую количественную группировку.
Частотные распределения, сходные с распределением, кото-
рое представлено на рис. 3.2, называются бимодальными («би»
означает «два»)—в противоположность унимодальным распреде-
лениям, имеющим только одно значение моды (см. рис. 3.1). Мо-
дой называется значение элемента распределения, встречающееся
наиболее часто. Большинство распределений имеет только одну
моду. В распределении, представленном на рис. 3.2*, имеются две
моды, и, следовательно, оно является бимодальным.
ЧАСТНАЯ ЖИЗНЬ ЭЛЕКТРИЧЕСКИХ ЛАМПОЧЕК
Всем известно, что различные экземпляры многих товаров мо-
гут довольно сильно отличаться друг от друга но качеству. Так,
например, некоторые только что купленные автомобили оказыва-
ются годными разве что только ыа металлолом. Проиллюстрируем
данное утверждение па примере с электрическими лампочками
(рис. 3.3). На горизонтальной оси полученного в результате испы-
2'рс< службы лан,течек. (сеынч члс.)
Рае. 3.3. Частотное распределение 150 электрических лампочек, перегоревших
после различного числа часов горения (от 200 ч до 3400 ч). Вопрос: к какому ин-
тервалу вы отнесете лампу, перегоревшую ровно после 3200 ч горе ния. В интерна i
3000 — 3200 или же в интервал 3200 — 3400? Ответ: подобные проблемы возни-
кают сплошь и рядом. Фактически можно поступить так, как вам удобнее, и отне-
сти все такие пограничные наблюдения к любому из этих двух выделенных интер-
валов. Данное распределение имеет правостороннюю асимметрию. Более длинный
хвост распределения вытянут в сторону более высоких значений наблюдений.
II здесь N выражает общее число наблюдений, представленных на графике, т. е.
общее число электрических лампочек
таний 150 лампочек графика показана продолжительность срока
их службы (одному делению соответствуют 200 часов непрерыв-
ного горения), на вертикальной- значения частот, т. е. колпчест-
Соогветствующие данные приведены в заключительных комментариях.
58
во лампочек, перегоревших через тот или иной промежуток вре-
мени.
Полученное распределение является асимметричным. Два край-
них участка распределения, на которых значения частот невели-
ки, принято называть хвостами распределения. В нашем случае бо-
лее длинный хвост распределения расположен в той части графи-
ка, где находятся более высокие показатели срока службы лампо-
чек. Подобные распределения называются распределениями с пра-
восторонней асимметрией.
Распределения оценок, полученных студентами колледжа за
ответы на те или иные тесты, часто имеют несколько другую фор-
му. В большинстве случаев частота оценок, имеющих более высо-
кие значения, выше. Такие распределения имеют левостороннюю
асимметрию. Таким образом, тип асимметричности зависит от то-
го, где находится более длинный хвост распределения:если в пра-
вой части графика, то мы имеем дело с правосторонней асиммет-
рией, если в левой, то с левосторонней.
ИГРА ПО ПРАВИЛАМ
Большинство из нас в своей жизни строго подчиняется раз-
личным правилам. Мы не ходим но газонам, послушно пристеги-
ваем ремни и прекращаем курить во время взлета и посадки само-
лета, говорим шепотом и стараемся не шуметь в библиотеке, ос-
танавливаем свою машину у красного сигнала светофора. Однако
далеко не все ведут себя столь примерно. На рис. 3.4 представ-
Рис. 3.4. J-образная кривая.
На графике отражено (в про-
центах) число водителей авто-
мобилей, по-разному реагирую-
щих на красный сигнал свето-
фора. Подобная кривая до-
вольно часто получается при
изучении поведения людей в
ситуациях, регламентирован-
ных какими-либо правилами
или обычаями. Эти данные
собраны автором в Дареме,
Северная Каролина. Многочис-
ленные поездки в Бостон
дают мне основания утвер-
ждать, что крайнее слева зна-
чение, возможно, и не равно
нулю
роста мая шгпея пение новка.
движения
Реакция на'каасныл сигнал светофора
Слабое ciojuu.-il.-iug—Строгое выполнение
правилам правил
лен график распределения, полученного при изучении различных
типов реакций водителей автомобилей на красный сигнал свето-
фора.
По вполне понятным причинам распределения этого типа на-
зываются J-образными. Такие распределения довольно часто по-
лучаются при изучении поведения людей в ситуациях, регламеп-
59
тированных теми или иными правилами или обычаями. При харак-
теристике графика, представленного на рис. 3.4, особо следует
отметить два момента: (1) данный график имеет левостороннюю
асимметрию и (2) откладываемые по оси ординат значения частот
могут быть представлены не только в абсолютном выражении, но
и, как в нашем случае, в процентах1.
ПРОВЕРКА ГИПОТЕЗ И ЧАСТОТНЫЕ РАСПРЕДЕЛЕНИЯ
До сих пор в настоящей главе мы имели дело с описательной
статистикой. Однако в гл. 1 мы видели, что статистика может
также помочь и при получении тех или иных выводов. Наше зна-
комство с частотными распределениями позволяет еще раз по-
новому проиллюстрировать эту важную функцию статистики. Рас-
смотрим следующие два примера. В каждом случае, как вы убеди-
тесь в дальнейшем, паше исследование будет развиваться по той
же логической схеме, какую мы применяли при проверке гипотез
относительно ситуации, в которой оказался наш нерешительный
влюбленный мистер Z (см. с. 25—30).
кто АВТОР?
США, 1787—1788 гг. Война за независимость только что за-
кончилась. Разработана конституция, которую должны ратифици-
ровать штаты, входящие в состав нового государства. В это вре-
мя в штате Нью-Йорк в газете «The Federalist» была опублико-
вана серия из 85 статей, подписанных псевдонимом «Публий»,
в которых обосновывалась необходимость скорейшей ратификации
конституции. Известно, что авторами этих статей были Джон
Джей, Александер Гамильтон и Джеймс Медисон. Часть статей
была написана ими в соавторстве. Однако авторство отдельных
статей оставалось неизвестным.
В последнее время в связи с изысканиями в области истории
политики интерес к данному вопросу несколько возрос. С помощью
различных исторических свидетельств было достоверно установле-
но авторство 70 федералистских статей. Полагают также, что 3
из оставшихся 15 статей были написаны в соавторстве. Авторами
остальных 12 статей, как считают, могли оказаться Гамильтон
или Медисон, однако, кто именно—-не известно.
Позиции, которых придерживались в своих статьях Гамиль-
тон и Медисон, не могут дать нам ключа к разгадке тайны, по-
скольку оба автора старались в своих аргументах быть беспри-
страстными. Тема статьи также не может ничем нам помочь, так
как она задавалась автору редакцией газеты. Общий стиль пись-
ма у обоих авторов не имел каких-либо характерных особеннос-
тей и был вполне обычным для XVIII века. Так, например, и Га-
1 Показатель частоты, выраженный в процентах или в долях, называют
частостью. — Примеч.. пер.
60
мильтон, и Медисон использовали очень длинные предложения:
у Гамильтона каждое предложение состояло в среднем из 34,5 сло-
ва, у Медисона — из 34,6. Единственное, за что мы здесь сможем,
пожалуй, зацепиться, так это частота, с какой они употребляли
те или иные предлоги (например, по, от, из, на, к и т. д.). Как
оказалось, в этом отношении стиль Гамильтона существенно от-
Рис. 3.5. Распределения по-
казывают, что употребление
предлога по в спорных фе-
дералистских статьях в
Полыней степени напомина-
ет соответствующее распре-
деление Медисона, а не Га-
мильтона. Подобная форма
представления данных по
очевидным для читателя
причинам называется стол-
биковым графиком. Доля
статей, в которых предлог
по встречается с той или
иной частотой, отражается
высотой столбика. И здесь
возникает проблема погра-
ничных значений интерва-
лов (например, 7 на 1000
слов). В данном случае
эти значения относились к
интервалу с более высоки-
ми опенками (например, к
интервалу 7—9, а не к ин-
тервалу 5—7)
личастся от стиля Медисона. Для решения проблемы, таким об-
разом, достаточно определить частоту, с какой встречаются эти
слова в спорных статьях, и сравнить полученный результат с со-
ответствующими показателями статей, авторство которых сомне-
ний пе вызывает.
Возьмем, к примеру, предлог на. Сведения о частоте, с какой
встречается это слово в спорных статьях, а также в статьях Га-
мильтона и Медисона (в расчете на 1000 слов) приводятся
в табл. 3.1. Соответствующие показатели были рассчитаны па
основании 48 работ Гамильтона, 50 работ Медисона (рассматри-
вались не только федералистские статьи) и 12 статей, авторст-
во которых мы желаем определить. Не производя никаких специ-
альных дополнительных вычислений, сразу можно убедиться в том,
что распределение, полученное для спорных статей, очень на-
поминает распределение, характерное для статей Медисона. Ана-
логичное частотное распределение для предлога• по представле-
но на рис. 3.5. И в данном случае вид распределения, получен-
ного для спорных статей, напоминает распределение Медисона.
Поскольку и для других предлогов были получены сходные резуль-
таты, есть все основания утверждать, что автором спорных фе-
дералистских статей был, скорее всего, Медисон.
6t
Если вы не возражаете против подобного доказательства, пе-
речислим еще раз основные этапы наших рассуждений. Это мож-
но сделать одним из двух возможных способов (все зависит от
того, какую пулевую гипотезу мы примем), но мы остановимся на
том, при котором нулевая гипотеза после завершения исследова-
ния будет отвергнута:
1. Вначале примем нулевую гипотезу об отсутствии разли-
чий в относительной частоте употребления предлогов в спорных
статьях и статьях Гамильтона.
2. Мы — а в действительности Мостеллер и Уоллес [13] — со-
брали все необходимые данные.
3. Интуитивно мы оцепили * величину вероятности, при кото-
рой нулевая гипотеза может быть с уверенностью отвергнута.
4. Мы отвергли нулевую гипотезу и методом исключения при-
шли к выводу о том, что автором спорных статей является ЛГеди-
сон.
Логически последовательность перечисленных этапов совпа-
дает со схемой, описанной в гл. 1. Однако в большинстве случа-
ев метод проверки гипотез применяется при анализе проблем, име-
ющих одно принципиальное отличие от только что разобранного
нами примера. Отбрасывание нулевой гипотезы в последнем слу-
чае фактически подтверждает справедливость другой гипотезы, а
именно гипотезы о том, что автором спорных статей является Ме-
дисон. Это стало возможным ввиду ограниченности числа содер-
жательных гипотез, которые можно было сформулировать относи-
тельно существа изучаемой нами проблемы. Однако гораздо чаще
приходится сталкиваться с ситуациями иного рода. Поясним это
утверждение с помощью следующего примера.
КУДА ПОДЕВАЛИСЬ ВСЕ ЖЕНЩИНЫ?
В 1968 г. доктор Бенджамин Спок, один из организаторов
движения против войны во Вьетнаме, был вызван в районный суд
Бостона, где ему предъявили обвинение в проведении незаконной
* На этот раз соответствующие вычисления в приложении не приводятся.
Отметим только, что даже по самым сомнительным из спорных с гатей соотно-
шение шансов в пользу авторства Медисона составило 80 : 1. По остальным
статьям данное соотношение выглядело еще более убедительным — 800:1 и
выше.
62
деятельности, препятствующей осуществлению па практике зако-
на о воинской повинности. Адвокаты. Спока подвергли сомнению
объективность процедуры, использованной при определении сос-
тава присяжных, поскольку среди присяжных не оказалось ни од-
ной женщины. Последнее имело немаловажное значение, так как
всемирно известная книга Спока об уходе за младенцами являет-
ся настольной для миллионов матерей. Вопрос состоит в том, слу-
чайно ли получилось, что в состав присяжных попали одни муж-
чины, или причина здесь кроется в преднамеренной дискримина-
ции женщин. Ответ на этот вопрос позволит глубже понять логи-
ку метода проверки гипотез.
Познакомимся вначале с процедурой отбора присяжных. Дан-
ная процедура состоит из нескольких этапов. На первом этапе
секретарь суда случайным образом * отбирает имена 300 потен-
циальных присяжных. На втором этапе снова, как предполагает-
ся, наугад из этих 300 выбирается около 30 человек, на имя ко-
торых выписываются повестки. И наконец, перед началом су-
да, из них отбираются 12 человек, которые и выполняют соответ-
ствующие функции. Со статистической точки зрения важным здесь
является то, что па протяжении всего процесса формирования
состава присяжных мы имели дело не с конкретными людьми, а с
выборками, осуществляемыми из тех или иных совокупностей имен.
Доля женщин в населении Бостона несколько выше доли муж-
чин. Поэтому мы вправе ожидать, что среди имен, отобранных
секретарем суда на первом этапе, окажется чуть больше 150 жен-
ских имен. Однако па практике, как видно из рис. 3.6, в вы-
борку, как правило, попадало не более 90 женщин. По моим рас-
четам подобный перекос в сторону мужчин может произойти лишь
в одном случае па несколько миллионов выборок. Таким образом,
в соответствии с логикой метода проверки гипотез мы должны
отвергнуть гипотезу о случайном характере формирования выбор-
ки на первом этапе отбора присяжных.
Что же теперь можно сказать о выборке, осуществленной
случайным образом из этой, уже не являющейся, как нам извест-
но, представительной совокупности, состоящей из 300 имен, среди
которых 210 мужских и 90 женских? В данном случае полезно
ознакомиться с распределениями долей женщин в выборках, про-
веденных судьей, ведущим процесс Спока, и судьями, работав-
шими в том же районе Бостона. Па рис. 3.6 интересующие нас
данные представлены в форме частотных распределений 9 выбо-
рок, произведенных судьей Спока, и 37 выборок, осуществлен-
ных другими судьями.
Эти два распределения значительно отличаются друг от дру-
га. Средний процент (полученный как средняя арифметическая)
женщин в выборках судьи Спока составил 14,6%, в то время как
* Более подробно об этом будет сказано позднее (см. гл. 7). Случайная
выборка представляет собой выборку, при которой каждый отдельный элемент
и каждая комбинация элементов данной совокупности имеет одинаковые шансы
быть отобранными. Если этого нет, то выборка не будет представительной.
63
у остальных судей этот показатель был равен 29%. Причем ни в
одной выборке судьи, ведшего процесс Спока, число женщин ни
разу не достигло среднего уровня, полученного в первом распре-
делении. Свои интуитивные выводы, которые легко сделать при
рассмотрении рис. 3.6, можно подтвердить с помощью соот-
ветствующих вычислений. Расчеты показывают, что шансы полу-
чить выборку, аналогичную выборке, осуществленной судьей Спо-
ка, при случайном отборе из населения Бостона астрономически
малы—1 на 1000 000 000 000 000 000.
женщин
Рис. 3.6. Доли женщин в выборках судьи, ведущего процесс Спока, и в выборках
других судей Бостона. Из этих графиков (в данном случае столбиковых графи-
ков) следует, что в выборки судьи Спока, как правило, включалось меньшее число
женщин, чем в выборки других судей
Итак, куда же подевались все женщины? Данный вопрос воз-
вращает нас к существу проблемы, сформулированной в конце пре-
дыдущего параграфа. В противоположность примеру с авторством
статей в данном случае мы не можем сформулировать какую-либо
четко определенную альтернативную гипотезу. Единственное, что
можно здесь сказать, так это то, что имелся какой-то фактор,
вносивший систематические искажения в процесс формирования
состава присяжных — вначале на стадии отбора 300 кандидатов
и затем при осуществлении выборки судьей, ведшим процесс Спока.
УДАЧНАЯ ПОКУПКА НА АУКЦИОНЕ СОТБИ
Сотби Парк Бернет представляет собой компанию, занимаю-
щуюся проведением аукционов, со штаб-квартирой в Лондоне и
многочисленными отделениями в главных городах мира, включая
Нью-Йорк, где и произошла история, которую я хочу сейчас рас-
сказать. Сотби занимается продажей через аукционы таких экзо-
тических товаров, как китайский фарфор, старые коллекционные
французские вина, произведения великих художников и восточные
ковры. Естественно, что каждый представляет себе аукцион мес-
64
том, где можно совершить какую-либо покупку. Время от време-
ни это удается сделать и на аукционе Сотби.
Если заглянуть в каталог Сотби аукциона восточных ковров,
то можно прочесть что-нибудь в этом роде:
121 Старинный восточный ковер
Три белых восьмиугольника „а красном фоно. Имеется типичный орнамент
красного и серого цвета. Но краю обрамлен каймой нз растительного орнамен-
та. Приблизительно 4 ф. 3 дюймаХб ф. 5 дюймов (130x196 см).
В конце каталога указано, что, по мнению Сотби, ковер бу-
дет реализован за 2500—3000 дол. Однако очевидно, что сделка
может быть произведена и по цене, несколько мепыпей, чем ниж-
няя граница указанного интервала; вопрос в том, на сколько
ниже? Чтобы попытаться ответить на этот вопрос, необходимо
знать некоторые особенности построения каталогов и проведения
аукционов Сотби. Символ И перед номером того или иного предме-
та, описанного в каталоге, означает, что данный предмет имеет
«резервную» секретную цепу, ниже которой он продаваться не
может. Однако в последнее время этим символом помечен почти
каждый предмет, указанный в каталоге ковров. Если бы имелся
способ узнать эту секретную резервную цену, покупатели, заинте-
ресованные в приобретении тех или иных предметов, не допускали
бы понижения продажной цены ниже известного им критического
уровня.
ОЦЕНКА ПАРАМЕТРОВ
Не касаясь технической стороны дела, отметим, что проблема
нахождения значения резервной цены представляет собой еще
один пример применения метода статистического вывода — в дан-
ном случае эти процедура оценки параметров. Напомним, что
параметром называется 'значение той или иной характеристики
некоторой совокупности. В нашем случае параметром является
средняя резервная цена, а совокупностью — все ковры, проданные
на аукционах Сотби в Ныо-Иорке.
Необходимую информацию для оценки интересующего пас па-
раметра (резервной цены) можно извлечь из особенностей про-
цедуры проведения аукциона. До тех пор пока цена выставленно-
го на аукцион ковра не достигнет резервного уровня, в торгах
принимают участие и представители Сотби. Если кроме них жела-
ющих приобрести ковер не находится, то представители Сотби
сами набавляют цену до резервного уровня и таким образом, «по-
купают» ковер. Итак, чтобы не допустить продажи выставленного
на аукцион товара по слишком низкой цепе или скрыть тот факт,
что на данный товар покупателей не нашлось вообще, фирма Сот-
би сама набавляет цену и сама «приобретает» товар. В этом слу-
чае цена, по которой был продан данный товар, нс включается
в список продажных цен, составляемый фирмой после завершения
аукциона.
5 1778
65
Если посетить несколько аукционов и записать все цены, по
которым покупались (в том числе и самой фирмой Сотби) това-
ры, то в нашем распоряжении будет информация, достаточная
для оценки средней резервной цены. После каждого аукциона фир-
ма Сотби распространяет список продажных цен, по которым в
действительности были куплены товары. В этот список не вклю-
чаются товары, «приобретенные» самой фирмой Сотби. Однако ес-
ли записывать все продажные цены во время аукциона, то в на-
шем распоряжении будут все необходимые данные. Проанализи-
руем эту информацию, собранную автором в течение примерно од-
ного года при посещении четырех аукционов восточных ковров,
проводившихся фирмой Сотби в Нью-Йорке. Автор имел намерение
приобрести пару хороших ковров и нс представлял в то время,
что записи, которые он вел на аукционах, могут пригодиться ему
впоследствии при написании настоящей книги.
На аукционах я записывал (впрочем, так поступали почти
все присутствовавшие) продажную цену каждого купленного ков-
ра. Эти данные образовали выборку, по которой было оценено
значение интересующего пас параметра. При этом я поступил сле-
дующим образом: когда в мое распоряжение попали официальные
списки проданных товаров и их продажных цен, я первым делом
внес в них 50 ковров, которые были «приобретены» представи-
телями Сотби (эти ковры не были включены в официальный список
проданных товаров) и проставил их «продажную» цену, выразив
ее в процентах (с точностью до 5%) к нижней границе стоимост-
ного интервала, указанного в каталоге аукциона. Затем я отме-
тил 50 других ковров, которые были действительно проданы и у
которых интервалы продажных цен по каталогу Сотби совпадали
с соответствующими интервалами ковров, покупка которых носи-
ла фиктивный характер. Й опять я выразил их фактическую про-
дажную цену в процентах к нижней границе интервала, указанно-
го в каталоге Сотби. Перевод в проценты необходим, поскольку
различные ковры имеют различную продажную цену.
Частотные распределения, полученные после осуществления
описанной процедуры, представлены па рис. 3.7. При этом, по-
жалуйста, нс обращайте пока внимания на значения «кумулятив-
ных частот», указанные на этом рисунке. Позднее мы к ним еще
вернемся. Изучив полученный график, мы можем сделать вывод,
что резервная цепа у различных ковров различна. Так, видимо,
два ковра, проданные за сумму, составляющую всего 50% от ниж-
ней границы стоимостного интервала, указанного в каталоге,
имели довольно низкую резервную цену. Шесть других ковров,
продажа которых не состоялась даже тогда, когда за них дава-
ли 80% и более от нижней границы стоимостного интервала, долж-
но быть, имели высокую резервную цепу. Возможно, однако, что
эти ковры не были проданы по каким-то иным причинам, напри-
мер их покупатель оказался неплатежеспособным. Что касается
средней резервной цены, то данные недвусмысленно свидетельст-
вуют о том, что она составляет примерно 65% от нижней границы
66 7
интервала, указанного в каталоге. Тридцать четыре из 50 ковров,
покупка которых носила фиктивный характер, были проданы по
цене, составляющей 60% и менее от нижней границы стоимостно-
го интервала, предсказанного фирмой Сотби. Сорок один из 50
действительно купленных ковров были проданы по цене, равной
Рис. 3.7. Частотные распре-
деления. отражающие «про-
дажную цену» 50 восточных
ковров, которые были дей-
ствительно проданы на
аукционе Сотби, и 50 ков-
ров, продажа которых име-
ла фиктивный характер.
Данные выражены в про-
центах к нижней границе
интервала, указанного в ка-
талоге Сотби. Значения на-
копленных частот, пред-
ставленные в верхней части
этих графиков, получены
сложением частот, начиная
с низких значений указан-
ных на графике процентов
(верхний рисунок) и начи-
ная с высоких значений
процентов (нижний рису-
нок)
х х
ух х х
X X X X
X X X X
X X, X X X X X XXX
,Х___X ХХХХХХХ XXX УХ X X х X х х
35 75 55 65' 75 55 S5 105 115 125 115 1н5 155 165 ^215'
Цена(в процентах к нужней граыце интервала,
указанного вцсаталоге'*
—~— Накопленная ~;а етота
Р 2
9 Ъ
Pie продано
X X
,Х X X X
'SO llFllij
Цена ;в процентах к нижнг.й границе
интервала, указанного в л а талое е)
65% этого значения и более. Резкое уменьшение числа фиктив-
ных продаж в интервале 60—65% и резкое увеличение числа дей-
ствительных продаж в интервале 60—65% подтверждает справед-
ливость сделанного нами вывода.
РАСПРЕДЕЛЕНИЕ НАКОПЛЕННЫХ ЧАСТОТ
Более наглядно полученный результат можно представить с
помощью расчета значений накопленных частот (см. рис. 3.7).
С этой целью для распределения действительно проданных ков-
ров мы последовательно, начиная с более низких значений про-
центов, сложили частоты. Подсчет значений накопленных частот
для совокупности действительно проданных ковров осуществлялся,
начиная с низких значений процентов, чтобы показать, как про-
исходило увеличение числа проданных ковров по мере возраста-
ния уровня продажной цены. Для совокупности ковров, продажа
которых носила фиктивный характер, значения частот складыва-
67
лись, начиная с высоких значений процентов, чтобы продемонст-
рировать, как возрастает число непроданных ковров при умень-
шении уровня продажной цены. Полученные данные представлены
в виде графиков, имеющих название кумулятивная кривая, на
рис. 3.8. Особый интерес представляет для пас точка пересечения
за 46 50 60 70 89 90 100 110 120 130 140 150 W
Цена в процентах к нижней границе интервала^
указанного 3 каталоге
Рис. 3.8. Распределения накопленных частот. Соответствующие кумулятивные кри-
вые построены по данным, представленным над графиками на рис. 3.7
этих двух кумулятивных кривых. Соответствующее этой точке зна-
чение, расположенное на оси абсцисс, и представляет собой ис-
комую нами оценку резервной цены. Как и ожидалось, опа состав-
ляет примерно 65% от нижней границы предсказанного фирмой
Сотби интервала продажных цен.
ПРЕДУПРЕЖДЕНИЕ
Использованные нами данные не являются вымышленными, и
автор готов держать пари, что полученная оценка средней ре-
зервной цепы близка к истинной. Одиако подождите бросаться
на ближайший аукцион Сотби в надежде выгодно приобрести дав-
но интересующую вас диковинку. Ознакомьтесь сначала с некото-
рыми соображениями, которые, скорее всего, несколько поумерят
ваш пыл. Во-первых, полученная оценка может оказаться верной
только для аукционов восточных ковров и ошибочной для всех
других товаров. Во-вторых, уровень резервной цены с течением
времени может меняться. Нами лишь получена приблизительная
оценка среднего значения. При этом во внимание в первую оче-
редь принимались ковры, являвшиеся типичными представителями
видов ковров, которые интересовали автора. Наверняка подобные
экземпляры имели довольно высокую резервную цену. Однако
следует иметь в виду, что изменение вкусов покупателей может
вызвать резкое повышение или понижение уровня продажных цен
тех или иных типов ковров.
68
КРАТКИЙ ОБЗОР ОСНОВНЫХ понятий
Частотное распределение позволяет в графической форме
представить вариацию интересующего пас признака, присущего
той или иной совокупности наблюдений или их выборке. Наиболь-
шей известностью в статистике пользуется нормальное распреде-
ление, однако встречаются и другие типы распределений. С не-
которыми из этих распределений мы познакомились в настоящей
главе.
Определения основных понятий и концепций, встречающихся
в тексте главы, приводятся далее. Воспроизводятся также неко-
торые сформулированные ранее определения понятий, важных
для понимания материала настоящей главы.
Частотное распределение. Ряд, в котором представлено рас-
пределение единиц изучаемой совокупности по значениям какого-
либо признака. На графике, отражающем это распределение зна-
чение интересующего нас признака откладывается по оси X, а
число случаев, в которых встретилось данное значение этого при-
знака, — по оси Y. Данный показатель (называемый в общем слу-
чае частотой) может быть выражен также в процентах или до-
лях Г
Частотный полигон. Графическое представление частотного
распределения, полученное в результате соединения нанесенных
па график точек отрезками прямой. По своей форме представля-
ет собой многостороннюю фигуру (полигон).
Столбиковый график. График частотного распределения, по-
лученный в результате использования прямоугольников (столби-
ков), для отражения числа случаев, в которых встретилось то
или иное значение изучаемого признака.
Гистограмма. Столбиковый график.
Разбиение на интервалы. Выделение значений интересующего
нас признака, лежащих в определенных границах. Интервалов
может быть выделено два, три или любое другое удобное для ис-
следователя число.
Унимодальное распределение. Частотное распределение с од-
ной модой.
Мода. Буквально — наиболее часто встречающееся в данной
совокупности значение. Однако иногда бывает, что в изучаемой
совокупности две моды или даже больше.
Бимодальное распределение. Частотное распределение с дву-
мя модами. Распределения с несколькими модами называются
м ультимодальными.
Симметричное распределение. Распределение, форма графи-
ка которого по одну сторону от моды является зеркальным ото-
бражением фермы графика этого распределения по другую сто-
рону от моды.
Асимметричное распределение. Распределение, которое нс яв-
1 В этом случае его называют частостью. — Приме':, neip.
6!)
ляется симметричным и которое может иметь с одной стороны
более длинный «хвост», чем с другой.
Распределение с левосторонней асимметрией. Асимметричное
распределение, более длинный хвост которого расположен в ле-
вой части графика, где находятся более низкие значения X.
Распределение с правосторонней асимметрией. Асимметрич-
ное распределение, более длинный хвост которого находится в
правой части графика, где расположены высокие значения X.
i-образная кривая. График распределения, часто встречающе-
гося при изучении поведения людей в ситуациях, регламентиро-
ванных какими-либо правилами или обычаями. Значение моды
здесь соответствует законопослушному поведению, а поведение,
отличающееся от общепринятого, встречается довольно редко.
Проверка гипотез. Оценка той или иной гипотезы о свойст-
вах совокупности на базе данных, полученных при осуществлении
выборок из этой совокупности.
Нулевая гипотеза. Гипотеза об «отсутствии различий», часто
проверяемая при анализе эмпирических данных.
Уровень значимости, доверительная вероятность. Степень до-
стоверности, с которой может быть отвергнута нулевая гипотеза
на базе проведенного статистического теста; вероятность того, что
данное различие получено случайно в ситуации, когда кулевая
гипотеза верпа.
Оценка параметров. Оценка значения совокупности (парамет-
ра) на основе показателя (статистики), полученного для вы-
борки.
Распределение накопленных частот. Частотное распределение,
на графике которого по оси абсцисс, как и для других частотных
распределений, откладываются значения интересующего нас при-
знака, а по оси ординат — значения накопленных частот. Накоп-
ленные частоты получаются в результате последовательного сло-
жения частот, начиная с верхних или нижних значений изучаемого
признака. На рис. 3.7 показаны эти два метода подсчета накоп-
ленных частот, а на рис. 3.8 приведены графики кумулятивных
частотных распределений.
4 ЗАДАЧИ НАУКИ
Давным-давно, еще в XIII веке, германский король Фридрих II
захотел узнать, на каком языке станут говорить дети, если со дня
их рождения с ними никто нс будет разговаривать. Итак, он при-
казал кормилицам и нянькам ухаживать за младенцами, мыть их
и купать, но ни в коем случае не произносить при них ни одного
слова, поскольку хотел выяснить, на каком языке заговорят эти
дети — на древнееврейском или на греческом, а может быть — по
латыни или по-арабски, а, возможно, и па языке их собственных
родителей. Однако этого он так никогда и не узнал, поскольку
все дети умерли, . Они умерли потому, что нс могли обойтись без
заботливых нежных лиц и ласковых слов своих кормилиц [18].
Сейчас, семьсот лет спустя, кажется малоправдоподобным,
что дети умерли именно по этой причине, хотя и признается,
что смерть могла наступить в результате общего психологиче-
ского расстройства. По очевидным этическим причинам данные
предположения пель>я проверить экспериментально, и, следова-
тельно, они основываются на наблюдениях, имеющих менее фор-
мальный характер. Так, например, глухие от рождения дети ни-
когда не слышали человеческой речи, однако это не привело их
к смерти. И все-таки у детей, которым в раннем детстве не дове-
лось испытать благотворное воздействие внимательного и чуткого
отношения любящих их взрослых, иногда развиваются серьезные
физические недуги. Подобные наблюдения положены в основу сле-
дующего мысленного эксперимента, к описанию которого я и при-
ступаю.
ТРЕХСТАДИЙНЫЙ ПЛАН ЭКСПЕРИМЕНТА
Как уже отмечалось, настоящих экспериментов такого рода
никто не проводил. Однако предположим, что это не так. В чем
же тогда должен состоять подобный эксперимент? В простейшс?л
виде он мог бы быть построен по следующей стандартной трех-
стадийной схеме.
71
СТАДИЯ I. ФОРМИРОВАНИЕ ОДИНАКОВЫХ ГРУПП
Исследование начнем с выделения двух групп младенцев, ко-
торые па второй стадии эксперимента будут воспитываться в
различных условиях. На первой стадии главное внимание должно
быть уделено тому, чтобы сформированные группы детей сущест-
венно не различались. Если группы не будут приблизительно рав-
ноценными, то в «результатах» эксперимента могут найти свое
отражение различия в характеристиках исходных групп, а не эф-
фект от воздействия исследуемых с помощью данного эксперимен-
та факторов.
Драматический пример ошибок подобного рода имел место
много лет назад при проведении медицинского эксперимента по
применению вакцины против дифтерии. Несколько сот больных
дифтерией, находящихся на лечении в госпитале, составили экс-
периментальную группу пациентов, принимавших эту вакцину.
Контрольная группа больных вакцину не принимала и пользова-
лась обычным при этой болезни медицинским уходом. Результаты
эксперимента были обескураживающими: больных, принимавших
вакцину, умерло 16%, в то время как смертность среди тех, кто
пользовался обычным медицинским уходом, составила лишь 8%.
Подобные результаты при некритическом их восприятии могли бы
послужить доказательством того, что вакцина не лечит, а уби-
вает больных. Истинная причина их появления, однако, состоит
в том, что вакцину принимали в первую очередь те, кто переносил
заболевание в наиболее тяжелой форме. Пациенты же, переносив-
шие заболевание легко, относились к контрольной группе. При
наличии таких серьезных различий между исходными группами
пациентов любое заключение об общей эффективности применяв-
шейся вакцины будет необоснованным.
СТАДИЯ II. ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТА
Эксперименты того типа, который описывается в настоящем
параграфе, иногда называют бивалентными (что означает букваль-
но— два значения), поскольку в них имеют дело с двумя значе-
ниями некоторой независимой переменной, которые обычно опре-
деляются особенностями проведения эксперимента в контрольной
и экспериментальной группах. Так, в примере с экспериментом,
поставленным королем Фридрихом II, эти особенности состоят в
следующем. Дети в контрольной группе получали «обычный мате-
ринский уход», при которо.м кормилицы обращались со своими
воспитанниками так же, как это делает любая мать — разгова-
ривали с ними, пели, ласкали и баюкали их и, конечно, помо-
гали удовлетворять их физиологические потребности. Дети в экс-
периментальной группе получали уход, связанный лишь с удов-
летворением их физиологических потребностей.
Продолжительность проведения эксперимента определяется
заранее. Однако эта особенность схемы проведения эксперимен-
та содержит в себе определенный элемент риска. Дело в том, что
выбранное время может оказаться слишком продолжительным или
слишком коротким для выявления полного эффекта от воздействия
интересующего пас фактора на конечные результаты эксперимента.
При проведении нашего мысленного эксперимента мы можем вос-
пользоваться, однако, альтернативной тактикой, состоящей в про-
должении эксперимента до тех пор, пока не будет выявлен ин-
тересующий нас эффект или пока мы не убедимся в том, что дан-
ного эффекта нс существует вообще. Следует все же отметить, что
зачастую подобный подход используется недобросовестным обра-
зом, когда исследователь прекращает проведение эксперимента,
лишь получив устраивающие его результаты.
СТАДИЯ II!. ОЦЕНИВАНИЕ РЕЗУЛЬТАТОВ
Бивалентные эксперименты завершаются сопоставлением ре-
зультатов, полученных в двух группах. В рассматривавшемся при-
мере подобное сопоставление может проводиться на базе качест-
венных формулировок следующего типа. Контрольная группа:
«Нормальные, счастливые дети, с хорошим аппетитом, высоким
уровне?»! активности, проявляющие живой интерес к окружающему
их миру. Какие-либо признаки физического или умственного рас-
стройства отсутствуют. Экспериментальная группа: «Дети заметно
отличаются друг от друга. Некоторые находятся в состоянии край-
него возбуждения, излают дикие вопли, агрессивны. Другие, на-
оборот, апатичны, отказываются есть, часто впадают в состояние
сонного оцепенения и кажутся едва живыми».
Эти воображаемые результаты, полученные в эксперименталь-
ной группе, совпадают по своим признакам с симптомами общего
истощения организма, которое 75 или 100 лет назад в 50% слу-
чаев являлось причиной детской смертности. В настоящее время
считается доказанным, что отсутствие психологического контакта
между взрослыми и детьми представляет собой одну, если не са-
мую главную, причину общего истощения детского организма.
РЕЗЮАЛЕ
План проведения нашего бивалентного эксперимента может
быть схематически представлен с помощью таблицы. Клетки этой
таблицы могут быть заполнены примерами, взятыми из исследова-
ния воздействия фактора родительского ухода на организм ре-
бенка. Стадия I включает отбор двух групп младенцев, обладаю-
щих примерно одинаковым здоровьем. На стадии II дети из конт-
рольной группы пользуются обычным материнским уходом; детям
из экспериментальной группы помогали удовлетворять лишь их
самые насущные физиологические потребности. Существенно, что
выбор «экспериментальной» и «контрольной» групп имеет произ-
вольный характер. Наблюдения, проводимые на стадии III экспе-
73
римента, должны продемонстрировать силу воздействия фактора
ухода па состояние здоровья детей в обеих группах.
Таблица 4.1
Схема проведения бивалентного эксперимента
Эксперименталь- ная группа Измерение исход- ных характерис- тик группы Эксис римепталь- ные ХСЛОБИЯ Оценка получен- ных результатов
Контрольная группа Измерение исходных Обычные усло- характеристик группы’ вин i Оценка получен- ных результатов
СМЕШЕНИЕ ВОЗДЕЙСТВИЙ
Логика интерпретации результатов любого эксперимента в ме-
дицинской науке довольно прямолинейна: если люди, подверг-
шиеся воздействию интересующего исследователя фактора, вна-
чале практически не отличались от представителей контрольной
группы (стадия I), но затем в их состоянии произошли какие-то
более пли менее существенные отклонения от характеристик конт-
рольной группы (стадия III), то причина полученного результата
связывалась с различиями в условиях проведения эксперимента
в контрольной и экспериментальной группах (стадия II). Подоб-
ный способ доказательства является, однако, верным лишь при
том непременном условии, что какой-либо посторонний фактор
случайным образом не мог воздействовать на результаты экспери-
мента. В нашем примере таким фактором могло оказаться плохое
питание детей в экспериментальной группе.
Прекрасный и призрачный мир рекламы полой примеров, ког-
да это важное условие не выполняется. Так, во время телевизи-
онной передачи, рекламирующей некоторый крем для бритья, вни-
манию зрителей был предложен следующий «эксперимент», кото-
рый должен был, по замыслу авторов передачи, убедить покупа-
телей в преимуществах рекламируемого товара. Субъектом экспе-
римента был мужчина, которому явно не помешало бы побриться.
Обе стороны его лица были подготовлены для бритья, причем од-
на сторона — с помощью рекламируемого крема, а другая --с по-
мощью некоторого «прочего» препарата. Затем мужчина побрился,
причем в комментарии было сказано, что особенно сильный нажим
ыа бритву делался при сбривании бороды на той стороне лица,
на которую был нанесен рекламируемый крем. По-видимому, ав-
торы передачи хотели этим дать попять, что бритье с использо-
ванием этого крема совершенно безопасно. Наконец, наступило
время сравнить полученные результаты. Ведущий поскреб краем
кредитной карточки по обеим щекам участника эксперимента,
Звук, раздавшийся при этом со стороны щеки, выбритой с исполь-
зованием рекламируемого товара, оказался менее резким. Вывод:
рекламируемый крем способствует повышению качества бритья.
Наиболее очевидная ошибка плана проведения эксперимента
состоит в том, что па результаты опыта могли повлиять различия
74
в усилиях, прикладываемых к бритве в процессе бритья. Рекла-
мируемый же крем мог не иметь к этим результатам никакого
отношения-даже если допустить, что отсутствуют какие бы то
ни было другие источники ошибок (такие, например, как место
размещения микрофона). Данный вид ошибок называется ошиб-
ками смешении. На стадии II эксперимента были введены два (а
не один, как предполагалось) новых фактора: рекламируемый крем
для бритья и различия в усилиях, прилагаемых к бритве. В ре-
зультате эффект от воздействия независимой переменной (вида
крема для бритья) был совмещен с эффектом второй переменной
(усилием, прилагаемым к бритве), наличие которой, возможно, и
обусловило повышение качества бритья.
Другой пример касается предпочтения, отдаваемого покупа-
телями той или иной марке безалкогольных напитков. Широкую
известность получил проведенный компанией «Пепси-кола» опыт,
в котором любителям кока-колы было предложено «вслепую» оце-
нить вкусовые качества двух напитков. В первом стакане, поме-
ченном буквой М, содержалась пепси-кола; во втором, помечен-
ном буквой Q, — кока-кола. Результат: «Половина участников
эксперимента — поклонников кока-колы из Далласа и его приго-
родов--свое предпочтение отдали пепси-коле». При проведении
этого эксперимента и интерпретации его результатов было допу-
щено несколько ошибок.
Во-первых, полученные результаты могут просто означать,
что люди не в состоянии отличить кока-колу от пепси-колы. По-
скольку участникам эксперимента нужно было выбрать один ка-
кой-либо стакан, половина из них указала на стакан с пепси-ко-
лой и, таким образом, «предпочла» именно этот напиток. Кроме
того, и в самой процедуре проведения эксперимента имеются опре-
деленные недостатки. Об эюм свидетельствуют результаты экс-
перимента, поставленного «перешедшей в контратаку» компанией
«Кока-кола». И в этом эксперименте один стакан был помечен
буквой Л1, а другой — буквой Q. Однако в обоих стаканах содер-
жался один и тот же напиток — кока-кола. Участвовавших в экс-
перименте людей просили указать тот стакан, содержимое которо-
го больше пришлось им по вкусу. Большинство из них выбрало
стакан с буквой М, хотя и в том и в другом стакане был один и
тот же напиток. О чем это говорит? Полученный результат свиде-
тельствует лишь о том, что люди более часто выбирали букву М.
И в этом смысле М имеет определенные преимущества перед Q.
МУЛЬТИВАЛЕНТНЫЕ ЭКСПЕРИМЕНТЫ
Одно из слабых мест бивалентного эксперимента - - и, види-
мо, большинство из вас уже это поняли —состоит в том, что с его
помощью можно только выяснить, оказывает или ист интересую-
щая нас переменная воздействие на конечные результаты экспери-
мента. Например, наш мысленный эксперимент с родительским
7?
уходом лишь показал, что материнская забота — важное условие
для нормального развития ребенка. Однако более глубокая интер-
претация полученных результатов возможна только на базе рас-
смотрения конкретных особенностей экспериментальных данных.
В случае бивалентного эксперимента данное обстоятельство ста-
вит перед исследователем определенные проблемы.
Предположим (если есть такая необходимость), что вы яв-
ляетесь одним из родителей. Свидетельствуют ли результаты экс-
Рис. 1.1. Ограниченность воз-
можностей бивалентных экспе-
риментов. Если в действитель-
ности взаимосвязь между не-
которой независимой и неко-
торой зависимой переменными
является немонотонной, то об-
щий характер результатов би-
валентного эксперимента бу-
дет определяться двумя вы-
бранными исследователем зна-
чениями независимой перемен-
ной. Так, например, в экспери-
менте с уходом за ребенком
могут быть выделены три на-
ры подобных значений: низкий
уровень 1 и высокий уровень 1;
низкий уровень 2 и высокий
уровень 2; низкий уровень 3 и
высокий уровень 3. Как видно
из рисунка, результаты эксперимента, в зависимости от размещения этих пар
значений на графике, могут свидетельствовать соответственно о благотворном
воздействии улучшения ухода за ребенком на ход его развития, об отсутствии
какого-либо воздействия, об отрицательном воздействии
перимента с родительским уходом в случае, если ваш ребенок
развивается нормально, что вы каждую минуту окружали его вни-
манием, теплотой и заботой? А как быть с широко распростра-
ненным мнением, что избыток заботы — это тоже плохо: дети от
излишнего внимания «портятся»? Высказанные здесь соображения
наводят на мысль, что зависимость между развитием ребенка и
степенью родительского внимания является немонотонной. Внима-
ние родителей вплоть до некоторого своего уровня может оказы-
вать благотворное влияние на развитие ребенка. Внимание же,
проявляемое сверх этого уровня, может принести ребенку вред.
Возможно, интересующая нас зависимость выглядит примерно так,
как показано на рис. 4.1.
Допустим, что это действительно так. Посмотрим теперь, что
могут означать возможные результаты бивалентных эксперимен-
тов, в которых сравнивается воздействие двух различных уровней
родительского ухода на характер развития детей. Как видно из
рис .4.1, смысл этих результатов может быть различным. В зави-
симости от конкретных значений независимой переменной улучше-
ние ухода за детьми может благотворно влиять на развитие ре-
бенка, может не сказаться на его развитии вообще, а может и
76
нанести ему вред. Основной вывод, который мы должны извлечь
из сказанного, состоит в том, что зачастую, чтобы лучше предста-
вить себе зависимость, существующую между интересующими нас
явлениями, необходимо исследовать воздействие нескольких зна-
чений независимой переменной на конечные результаты экспери-
мента. Подобные эксперименты называются мультивалентными.
Общая схема проведения мультивалентных экспериментов
проста и естественна: экспериментатор должен выделить различ-
ные значения независимой переменной и определить их воздейст-
вие на зависимую переменную. Более детально эта процедура бу-
дет рассмотрена на нескольких конкретных примерах. Эти приме-
ры помогут также выяснить, в чем состоит важность различия
между (1) регулируемой и выделяемой независимыми переменны-
ми и (2) межгрупповой и внутригрупповой схемами проведения
эксперимента.
ИЗМЕНЕНИЕ РАЗМЕРА ЗРАЧКА И СОСТОЯНИЕ ЧЕЛОВЕКА
Известно, что по размеру зрачков можно судить о настроении
человека, состоянии его психики и т. д. Например, китайские
торговцы драгоценностями по увеличению зрачков определяли,
какой из предложенных камней привлек наибольшее внимание
покупателя и .соответствующим образом повышали па него цену.
Расширение зрачков происходит также у голодного человека при
виде пищи. Данный факт и будет положен нами в основу пер-
вого примера мультивалентного эксперимента, к описанию кото-
рого мы переходим. В этом эксперименте исследователь показы-
вал цветные слайды, на которых были представлены различные
блюда (спагетти, салат, бифштекс с картофелем, ростбиф и мя-
со по-турецки) 20 участникам эксперимента, не евшим до этого
в течение 5—8 часов, и измерял изменение диаметра их зрачков
(в миллиметрах). Зрачки увеличивались при изображении того
или иного блюда, однако величина этого увеличения каждый раз
была разной [4, с. 110—118].
Прежде чем приступить к более детальному рассмотрению по-
лученных результатов, имеет смысл выделить некоторые характер-
ные особенности эксперимента: (!) независимой переменной здесь
является изображение того или иного блюда (спагетти, ростбиф
и т. д.); (2) зависимой переменной—г изменение диаметра зрачка
в миллиметрах; (3) исследование в целом представляет собой при-
мер внутригруппового эксперимента. В эксперименте участвовало
20 человек, каждому из которых были показаны все 5 слайдов.
Чтобы провести такой же эксперимент по межгрупповой схеме,
нужно было бы из участников эксперимента составить 5 групп,
каждой из которых было бы показано только по 1 слайду.
Очевидное преимущество внутригрупповой процедуры прове-
дения эксперимента заключается в ее простоте. Потенциальный
недостаток этой процедуры, приводящий в ряде случаев к обес-
77
цениванию полученных в эксперименте результатов, состоит в том,
что реакция участников эксперимента на какое-либо одно значе-
ние независимой переменной может оказать воздействие на эффект,
производимый другими значениями. Если кто-то захочет исследо-
вать эффективность двух методов заучивания учениками содержа-
ния какого-либо параграфа в учебнике — скажем, при помощи ме-
тода механического запоминания и метода, основанного па запо-
минании главных идей в прочитанном материале, — то эксперимент
должен проводиться по межгрупповой схеме. В противном случае
если бы нужно было выучить только один параграф, то ученики,
по вполне понятным причинам, не смогли бы этого сделать сразу
двумя методами. Если же параграфов будет несколько, то испы-
тывать первый метод на одних параграфах, а второй --- на других
при внутригрупповой! схеме проведения эксперимента было бы до-
вольно рискованно, поскольку, если между эффективностью этих
методов действительно имеются различия, то ученики, обнаружив
это, почти наверняка в обоих случаях будут пользоваться более
эффективным методом, независимо от указаний экспериментатора
„ : . л 9 От учеников и парагра-
лица - ф()В верПСМСЯ теперь снова
Аппетитность блюд и диаметр зрачка
Блюда Увеличение зрачка, чм
Салат 0,08
Спагетти 0,12
Ростбиф 0,21
Мясо по-турецки 0,26
Бифштекс с картофелем 0,39
к зрачкам и аппетитным
блюдам Е Представленные
в табл. 4.2 результаты экс-
перимента расположены в
порядке величины возраста-
ния диаметра зрачка и, по-
видимому, отражают срав-
нительную аппетитность со-
ответствующих блюд,
таблицы следует,
Из
что вид
различных блюд (независимая переменная) вызывает нсодинако-
вое увеличение диаметра зрачка (зависимая переменная).
Рассмотренный пример позволяет нам обсудить одну из важ-
нейших проблем, связанных с интерпретацией данных, — пробле-
му степени общности полученных результатов. Имеются основания
полагать, что расположение блюд в соответствии с их аппетит-
ностью, произведенное в результате описанного эксперимента,
имеет довольно ограниченную степень общности. Данная проблема
отчасти обусловлена внутригрупповой схемой проведения экспери-
мента: поскольку во всех случаях экспериментальным испытани-
ям подвергались одни и те же люди, то полученные результаты
могут характеризовать вкусы и предпочтения лишь конкретных
участников эксперимента и (еще одно ограничение) только при
условии, что этим участникам будут показываться те же самые
изображения блюд. Если бы фотографии были другими, то рс-
1 Кроме того, материал, содержащийся в различных параграфах, может быть
неодинаковым по степени сложности. --Примеч. пер.
г Автор обыгрывает здесь тот факт, что в английском языке слова «ученик»
и «зрачок» имеют одинаковое написание (pupil). — Примеч. пер.
78
зультаты эксперимента могли быть совершенно иными. Таким об-
разом, при интерпретации данных очень важно понимание того
факта, что результаты эксперимента могут быть обобщены лишь
на те исходные генеральные совокупности, репрезентативными
представителями которых являются участники эксперимента и ма-
териалы, с которыми они работают.
СЧАСТЛИВЫЕ ГЛАЗА
Рассмотренный только что эксперимент проводился по внут-
ригрупповой схеме. В качестве примера эксперимента по межгруп-
повой схеме рассмотрим еще один эксперимент, связанный с оп-
ределением размера зрачка. На этот раз мы будем изучать связь
между размером зрачка и счастливым выражением лица. Имеется
довольно много свидетельств того, что люди с глазами, имеющи-
ми большой зрачок, кажутся счастливее людей с маленькими зрач-
ками. Например, если попросить кого-нибудь нарисовать зрачки
глаз людям, изображенным на рис. 4.2, то, как правило, зрачки
у смеющегося человека окажутся больше. В детских книжках
счастливые лица также изображаются с глазами, имеющими боль-
ший диаметр зрачка, чем у глаз несчастных или сердитых людей.
Располагая подобной информацией,
один из исследователей решил про-
верить реальность этой взаимосвя-
зи. С этой целью он показал девяти
группам людей в возрасте от 6
до 22 лет практически одинаковые
рисунки человеческих лиц, разли-
чающихся между собой лишь раз-
мером зрачков глаз. В эксперимен-
те определялся процент людей в
каждой группе, считающих, что ли-
ца с большими зрачками выглядят
более счастливыми.
И опять, прежде чем приступить
исследования, укажем главные особенности описанного выше экс-
перимента: (1) зависимой переменной в эксперименте является
процент людей в каждой группе, которые считают, что лица, имею-
щие глаза с большими зрачками, выглядят более счастливыми;
(2) независимой переменной является возраст участников экспе-
римента, входящих в ту или иную группу: 6, 8, 14 лет и т. д.;
(3) в данном случае независимая переменная представляет собой
выделяемую переменную. Дело в том, что при проведении экспе-
римента исследователь осуществляет отбор участников в опре-
деленном возрасте и, таким образом, заранее фиксирует желае-
мые значения независимой переменной и управлять ими в даль-
нейшем уже не может. В предыдущем эксперименте с фотография-
ми различных блюд ситуация была иной. Независимая переменная
Рис. 4.2. Источник: [4]
к изложению оезультатов
79
являлась там регулируемой переменной. Исследователь мог опре-
делять ее значения в процессе эксперимента.
Трудно указать каие-либо признаки, по которым можно бы-
ло бы безошибочно определить, какой тип независимой перемен-
ной следует использовать при проведении того или иного экспе-
римента. Выделяемая переменная почти всегда связана с харак-
теристикой личных качеств человека, регулировать которые ис-
следователь не в состоянии — возраст, пол, раса, образование,
уровень дохода, рост и т. д. Регулируемая переменная, в свою
очередь, описывает те характеристики исследуемой ситуации, ко-
торыми экспериментатор может управлять.
возраст (лет)
Рис. 4.3. Процент людей,
которые считают, что счаст-
ливее выглядят лица, имею-
щие глаза с большими
зрачками, возрастает, е
увеличением возраста
Представленные на рис. 4.3 результаты эксперимента ясно
свидетельствуют о том, что функция, с помощью которой харак-
теризуется процент людей, считающих, что «счастливее» выгля-
дят лица с большими зрачками, является, вообще говоря, устой-'
чиво возрастающей функцией переменной «возраст» [4].
ФАКТОРНЫЙ ЭКСПЕРИМЕНТ
С помощью мультивалентных экспериментов удается устано-
вить форму взаимосвязи между зависимой и независимой перемен-
ными. Однако исследователь должен понимать, что природа этой
взаимосвязи зависит от особенностей конкретных условий, в ко-
торых данная взаимосвязь была получена. Причем форма взаи-
мосвязи может измениться при изменении условий, в которых осу-
ществляется эксперимент.
Эту же мысль можно выразить и несколько иначе, сказав, что
большинство событий реального мира представляют собой слож-
поопределенныс явления. Данное утверждение фактически означа-
ет, что (!) каждое явление обусловлено воздействием множест-
ва "причин и (2) эти причины воздействуют друг на друга. Пер-
вое из приведенных положений, по-видимому, объяснять не стоит.
80
Второе положение, возможно, не столь очевидно. Однако посколь-
ку без ясного понимания концепции взаимодействия нельзя обой-
тись при объяснении-идеи сложноопределенной причинности, я ос-
тановлюсь на этой концепции максимально подробно. Не исклю-
чено, что, прочтя данный параграф, вы скажете примерно то же
самое, что сказала одна девочка, которая свой рассказ о прочи-
танной книге начала словами: «Из этой книжки я узнала о жиз-
ни бабочек даже больше, чем мне хотелось».
ГЛАВНЫЕ ЭФФЕКТЫ И ВЗАИМОДЕЙСТВИЯ
Из сказанного следует, что метод исследования, к рассмотре-
нию которого мы сейчас приступаем, а именно факторный экспе-
римент, характеризуется наличием нескольких независимых пере-
менных. С помощью подобных экспериментов исследуются вопро-
сы двух типов: (1) Имеется ли эффект от воздействия каждой
отдельно взятой независимой переменной? (2) Зависит ли сила
этого эффекта от величины значений других переменных? Други-
ми словами, в первом из вопросов речь идет о наличии главных
эффектов, а во втором — о взаимодействиях.
Для большей наглядности рассмотрим ряд конкретных приме-
ров. Чтобы сфокусировать наше внимание на характеристике кон-
цепций главного эффекта и взаимодействия, результаты экспе-
риментов будут представлены в несколько упрощенном виде.
Обучение чтению. Возможно, одной из наиболее серьезных
проблем педагогики является разработка эффективных способов
обучения грамоте. В течение многих лет в этой области не ощу-
щается недостатка в различного рода идеях и предложениях, од-
нако, как говорится, воз и ныне там. В исследованиях, подоб-
ных тому, которое будет сейчас рассмотрено, выявляется часть
причин, обусловивших отсутствие прогресса в этом важном деле.
В данном исследовании сравнивается эффективность двух
методов обучения чтению. Первый метод — звуковой. В соответ-
ствии с ним дети вначале произносят вслух слова, которые они
стараются научиться читать. Второй метод — визуальный, при ко-
тором дети стараются визуально запомнить те или иные слова и
таким образом научиться читать. Отметим, что метод обучения
чтению — регулируемая независимая переменная.
Вторая переменная в этом эксперименте является выделяемой.
Половина детей, участвовавших в эксперименте, обладала высо-
ким уровнем интеллектуальных способностей. Остальные дети
одаренными не были. Половина группы одаренных детей и по-
ловина группы неодаренных детей обучались чтению посредством
звукового метода, остальные — с помощью визуального метода.
Этот эксперимент проводится по факторной схеме 2 на 2
(или 2x2). Два значения независимой переменной (метод обуче-
ния) объединены с двумя значениями другой переменной (уровень
способностей). Схема эксперимента и полученные условные резуль-
таты представлены в табл. 4.3. Приведенные в таблице данные
позволяют сделать три вывода:
6 1778
81
1. Показатели средней скорости чтения, полученные при раз-
личных методах обучения чтению в двух группах детей, сущест-
венно отличаются друг от друга — 55 слов в минуту в группе I
против 20 слов в группе II. Данное различие характеризует глав-
ный эффект от воздействия уровня способностей.
2. Имеется также главный эффект метода обучения, выяв-
ляемый с помощью усреднения результатов, которые получены по
группам детей с разным уровнем способностей- 45 слов в ми-
нуту при звуковом методе против 30 слов при визуальном.
Табл н ц а 4.3
Средняя скорость чтения (слов в минуту)
Уровень способностей Метод обучения i |
зв>новой B11J\ П..1Ы1ЫЙ Средняя 1
Одаренные дети 60 50 55
Неодарепные дети 30 10 20
Средняя 15 30
3. Различия в эффективности применения двух методов обу-
чения по двум группам детей не одинаковы. Цели различия в
скорости чтения у одаренных детей, обучавшихся различными ме-
тодами, нс очень значительны (50 и 60 слов в минуту соответст-
венно), то неодарепные дети, обучавшиеся с помощью звуково-
го метода, читали значительно быстрее своих товарищей, обучав-
шихся визуальным методом.
Это свидетельствует о том, что имеется взаимодействие между
уровнем способностей и методом обучения. Результаты примене-
ния различных методов обучения различны для разных групп.
Как следует из табл. 4.3. значения разностей между показате-
лями столбцов для каждой строки отличаются друг от друга:
G0—50=10 против 30—10- 20; имеются различия и в значениях
разностей соответствующих показателей строк: 60—30 = 30 про-
тив 50-10=40.
Краткое резюме. Главный эффект воздействия независимой пе-
ременной наблюдается в тех случаях, когда различные значения
этой переменной приводят к появлению различного результата,
полученного путем обобщения (с помощью сложения или усредне-
ния) имеющихся данных по значениям других независимых пере-
менных, выделяемых при проведении эксперимента. В нашем при-
мере звуковой метод обучения обладает преимуществом над ви-
зуальным, о чем свидетельствуют усредненные данные по груп-
пам одаренных и неодаренных детей. В этом и проявляется глав-
ный эффект метода обучения.
Соответственно в рассмотренном примере имеет место глав-
82
нын эффект уровня способностей, поскольку после усреднения-
скорости чтения различных групп детей при различных методах
обучения показатели у одаренных детей оказываются выше, чем
у неодаренных.
Взаимодействие имеет место тогда, когда эффект от воздейст-
вия одной независимой переменной зависит от значения другой
независимой переменной. Взаимодействие в факторном экспери-
менте 2X2 всегда можно показать двумя способами. Так, в на-
шем примере преимущество звукового метода над визуальным при
обучении одаренных детей оценивалось лишь в 10 слов в минуту,
в то время как при обучении неодаренных детей оно оценивалось
уже в 20 слов в минуту. Короче говоря, различие между звуковым
и визуальным методами обучения оказалось неодинаковым для
разных уровней способностей.
Покажем существование взаимодействия другим способом.
В нашем примере было получено, что при обучении одаренных и
неодаренных детей с помощью звукового метода различие в ско-
рости чтения между этими двумя группами составило 30 слов в ми-
нуту. При применении визуального метода указанное различие
возрастало до 40 слов в минуту. И в этом случае различие в ско-
рости чтения между группами детей, обладающих разными уров-
нями способностей, оказалось неодинаковым для разных методов
обучения.
Мой педагогический опыт показывает, что концепция взаимо-
действия некоторыми людьми усваивается с трудом. Однако в
силу особой важности этого понятия мы остановимся на нем еще
раз, чтобы исключить всякую возможность непонимания. В этом
нам поможет следующий пример, в котором отсутствуют главные
эффекты и имеется только взаимодействие.
Раса и смертность. В европейских городах продолжительность
жизни у белых людей больше, чем у негров, в основном из-за
большей сопротивляемости их организма к заболеванию тубер-
кулезом. В африканских городах продолжительность жизни нег-
ров больше, чем у белых, в основном из-за большей сопротивляе-
мости их организма к заболеванию лихорадкой. Допустим, что в
нашем распоряжении имеются фактические данные, приведенные
в табл. 4.4. Эти данные позволяют сделать три следующих вывода.
1. У переменной «раса» нет главного эффекта: коэффициен-
ты смертности негров и белых, усредненные по европейской и
африканской общинам, одинаковы.
2. Отсутствует главный эффект и у переменной «место рас-
положения»: коэффициенты смертности, рассчитанные для европей-
ских и африканских городов и усредненные по черной и белой
расам, также одинаковы.
3. И все же между переменными существует довольно силь-
ное взаимодействие: в Европе коэффициент смертности у негров
на 300/100 000 больше, чем у белых, в то время как в Африке
обратная картина. Можно подойти к интерпретации данного фак-
та и по-другому: коэффициент смертности у негров в Европе па
6*
83
Т а б л и ц а 4.4
Смертность в расчете на 100 000 человек в год
Раса Место рождения Средняя
Европа Африка
I !егры Белые 1 050 750 750 I 050 900 900
Средняя 900 900
300/100 000 больше, чем в Африке; коэффициент смертности у бе-
лых, наоборот, па 300/100 000 больше в Африке, чем в Европе.
Выполняя обещание сделать изложение данного материала как
можно более понятным, я приступаю к описанию другого примера,
представляющего собой почти полную противоположность рассмот-
ренного. В новом примере имеются два главных эффекта, но от-
сутствует взаимодействие. .
Работа, отдых и производительность труда. Давно замечено,
что объем продукции, производимой рабочим вручную, в течение
фиксированного промежутка времени возрастает, если (1) про-
должительность рабочих периодов невелика (фиксированный про-
межуток времени состоит из рабочих периодов, перемежающихся
паузами отдыха) или (2) если паузы отдыха между рабочими пе-
риодами имеют большую продолжительность. Предположим, что
администрация фабрики, производящей электронное оборудова-
ние, хочет узнать, в каких условиях производительность труда ра-
бочих, собирающих вручную то или иное изделие, выше. С этой
целью был поставлен факторный эксперимент 2x2, при котором
короткие и длительные по продолжительности периоды работы
перемежались короткими и продолжительными периодами отдыха.
По истечении некоторого времени (общая продолжительность ра-
бочего времени во всех случаях оказалась одинаковой) были по-
лучены результаты, представленные в табл. 4.5. Как и рапынс,
отметим три особенности экспериментальных данных:
1. Присутствует главный эффект продолжительности периода
работы. При усреднении по коротким и длительным периодам
отдыха работавшие в течение коротких периодов времени произ-
вели 135 изделий, работавшие в течение длительных промежут-
ков времени — только 95.
2. Имеется также главный эффект продолжительности перио-
да отдыха. При усреднении по коротким и длительным по про-
должительности рабочим периодам рабочие, имевшие небольшие
перерывы для отдыха, произвели только 100 изделий; рабочие же,
имевшие большие перерывы для отдыха, произвели 130 изделий.
3. Взаимодействия между продолжительностью отдыха и про-
должительностью периода работы пет. Это можно показать двумя
способами: (а) увеличение продолжительности периода отдыха
84
Таблица 4.5
Число собранных изделий
Рабочий период Период отдыха Средня:;
Короткий Продо "Ж11 тел ;л1 ыП
Короткий Продолжительный 120 80 150 110 135 95
Средняя 100 131)
приводит к увеличению производства на 30 изделии независимо
от того, является ли продолжительность рабочего периода большой
или маленькой; (б) увеличение продолжительности рабочего пе-
риода приводит к уменьшению производства на 40 изделий незави-
симо от того, является ли продолжительность периода отдыха
большой или маленькой.
Заучивание и память. Рассмотрим последний пример. Предпо-
ложим, что две группы учеников готовятся к сдаче одного и того
же экзамена. Одна группа имеет в своем распоряжении время,
достаточное, чтобы полностью выучить весь материал. Другая же
группа и после этого продолжает готовиться к сдаче экзамена,
в результате чего у нее есть все возможности в совершенстве изу-
чить данный предмет. Назовем первую из этих групп обычной
группой, а вторую — группой, специализирующейся на данном
предмете. Допустим теперь, что на следующий день, а также
тридцать дней спустя после окончания подготовительного периода
обеим группам были предложены тесты, позволяющие определить
степень усвоения пройденного материала. Полученные результаты,
показывающие процент правильных ответов, представлены
в табл. 4.6. На эти результаты, как и в первом из рассмотренных
примеров, оказали воздействие три фактора: (1) главный эффект
продолжительности изучения материала, (2) главный эффект
продолжительности времени между периодом изучения и экзаме-
ном и (3) взаимодействие между этими независимыми перемен-
ными.
Таблица 4.6
Процент правильных ответов
। Группа Время между периодом , изучения п экзаменом 1 день 30 дней Средняя
|Обычная 90 50 70
i Специализирующаяся 95 85 90
। Средняя 92,5 67,5
85
ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ БОЛЕЕ ВЫСОКОГО ПОРЯДКА
Чтобы продемонстрировать основные принципы проведения
факторных экспериментов, мы ограничились рассмотренном плана
проведения факторного эксперимента типа 2x2 (читается «два на
два»). Однако необходимо иметь в виду, что факторные экспери-
менты, как правило, обладают более сложной структурой. Обыч-
но в эксперименте рассматривается более двух независимых пе-
ременных или же более двух значений двух независимых перемен-
ных, или же и то и другое. Как было показано, при схеме прове-
дения факторного эксперимента 2x2 в соответствующей таблице
имеется 2 строки и 2 столбца. Фактически план факторного экспе-
римента 2x2 представляет собой как бы пересечение одного би-
валентного эксперимента с. другим. Однако, вообще говоря, строк
и столбцов в плане эксперимента может быть существенно больше.
В этом случае в плане факторного эксперимента отражается пе-
ресечение двух мультивалентных экспериментов. Число групп., не-
обходимых для реализации подобного плана, определяется путем
перемножения между собой числа групп, участвующих в проведе-
нии каждого из двух мультивалентных экспериментов. Данные за-
мечания относятся к эксперименту с двумя независимыми перемен-
ными. Добавление новых переменных (каждая из которых пред-
ставлена несколькими значениями) приводит к дальнейшему уве-
личению числа групп, необходимых для проведения факторного
эксперимента. Так, для проведения эксперимента с тремя перемен-
ными требуется следующее количество групп: число значений пе-
ременной 1ХЧПСЛО значений переменной 2Хчисло значений пере-
менной 3. Можно оперировать и с большим числом переменных,
однако нетрудно заметить, что одновременно с этим резко возрас-
тают трудности, связанные с описанием и интерпретацией полу-
ченных результатов. Пример достаточно сложного факторного
эксперимента типа 4x4 приводится в приложении.
ЕЩЕ ОДИН СПОСОБ ПРЕДСТАВЛЕНИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
Четыре гипотетических примера, рассмотренных в предыдущем
параграфе, были подобраны таким образом, чтобы описать основ-
ные комбинации главных эффектов и взаимодействий, встречаю-
щиеся при проведении экспериментов. При описании этих приме-
ров соответствующие данные были представлены с помощью таб-
лиц. Тс же данные можно отразить также посредством графиков,
позволяющих по-новому охарактеризовать смысл концепций глав-
ного эффекта и взаимодействия. На рис. 4.4 представлено графи-
ческое изображение данных из рассмотренных примеров фактор-
ных экспериментов.
Построение графика результатов проведения факторного экспе-
римента с двумя независимыми переменными осуществляется сле-
дующим образом. По горизонтальной оси графика откладывают-
ся значения одной из независимых переменных. По вертикальной
86
оси — значения зависимой переменной. Вторая независимая пере-
менная используется при построении двух функций: одной для
первого значения этой второй независимой переменной и другой —
для ее второго значения. Поскольку в рассмотренных факторных
экспериментах имеется по две независимых переменных, в каждом
отдельном случае можно построить по два графика, в зависимо-
сти от того, какая из независимых переменных будет отклады-
ваться по оси абсцисс. На рис. 4.4 представлены обе такие воз-
можности.
Озаренные необзргнные
Карогпкий
Обь/чнря Спеииали-
зирук^аягя
ppi’f’iia.
Рис. 4.4. Графики, на ко-
торых представлены ре-
зультаты факторных эк-
спериментов тина 2x2.
Общий способ построе-
ния таких графиков за-
ключается в следующем.
Но оси Y откладываются
значения зависимой пе-
ременной, ио оси X---
значения какой-либо од-
ной из двух независимых
переменных. Вторая не-
зависимая переменная
используется ври по-
строении двух функций:
одной — для первого зна-
чения этой второй неза-
висимой переменной и
другой — для ее второго
значения. В каждом от-
дел ьно м сл уч ае, сл едо-
вателъно, можно по-
строить по два графика.
Главные эффекты мож-
но выявить двумя спо-
собами: (а) путем выяв-
ления общего наклона
линии, полученной з ре-
з ул ьт а 'г е у с р е д н е н и я
представленных на
графике функций (во
всех случаях, за исклю-
чением примера с коэф-
фициентами смертности
и расой, обе переменные
обладают главным эф-
фектом); (б) посредст-
вом вычитания одного
из другого крайних зна-
чений, принадлежащих
линии, полученной в ре-
зультате усреднения
представленных на
графике функций. Вза-
имодействие присутству-
ет там, где линии на
графике не являются параллельными (все графики, за исключением примера с
расотой и отдыхом)
87
При данном методе представления результатов главный эф-
фект может быть выявлен двумя способами. Первый способ свя-
зан с нахождением расстояния между крайними точками, принад-
лежащими линии, полученной после усреднения представленных
па графике функций. Поскольку для каждой независимой перемен-
ной на рис. 4.4 построены отдельные графики, легко заметить,
что во всех случаях, за исключением примера с коэффициентами
смертности негров и белых в Европе и Африке, обе независимые
переменные обладают главным эффектом.
Второй способ определения главного эффекта заключается в
выявлении общего наклона линии, полученной в результате ус-
реднения двух представленных на графике функций. Исследование
любого из графиков приведет нас к тем же выводам, что и при
нахождении среднего расстояния.
Взаимодействие присутствует там, где линии на графике не
являются параллельными. Последнее означает, что эффекты зна-
чений первой переменной неодинаковы для различных значений
второй переменной. Исследование графиков на рис. 4.4 свидетель-
ствует о том, что взаимодействие имеется во всех случаях, за ис-
ключением примера с работой и отдыхом. Я настоятельно советую
вам постараться хороню понять представленный в данном пара-
графе материал. Проявленное прилежание окупится сторицей.
КВАЗИЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ
Многие из вас, очевидно, слышали о принципе неопределенно-
сти Гейзенберга. Нечто подобное можно сформулировать и для
статистических исследований, связанных с проведением экспери-
ментов, в которых осуществляется изучение тех или иных харак-
теристик поведения человека: уже сама процедура измерения ока-
зывает воздействие па получаемый при этом результат*.
РЕАКТИВНЫЙ ЭФФЕКТ ИЗМЕРЕНИЯ
Тот факт, что люди, участвующие в проведении тех или иных
экспериментов, ведут себя иначе, чем в обычных обстоятельст-
вах, подтверждается результатами многочисленных специальных
исследований, проводившихся в течение последних двух десятиле-
тий. Люди, участвующие в эксперименте, ощущают себя чем-то
вроде «подопытного кролика» и стараются представить себя луч-
ше или, что случается гораздо реже, хуже, чем они есть на са-
мом деле. Иными словами, при измерении поведения человека име-
ет место реактивный эффект, который может обесценить резуль-
таты эксперимента.
Суть принципа Гейзенберга можно сформулировать примерно следующим
образом. Основываясь на обычных геометрических представлениях, невозможно
одновременно определить положение и импульс микрочастицы, поскольку чем
точнее будет определен один из этих факторов, тем менее точным окажется оп-
ределение другого фактора.
88
КОСВЕННЫЕ ИЗМЕРИТЕЛИ
Попытки обойти указанную проблему дали толчок развитию
исследований, в которых применялись методы, основанные на из-
мерении различных сопутствующих характеристик. В подобных
нереактивных исследованиях используются так называемые кос-
венные измерители, которые, на первый взгляд, непосредственно
не связаны с интересующим исследователя явлением. Часто они
имеют самую неожиданную природу. Например:
1. Интерес, проявленный читателями к той или иной рекла-
ме, помещаемой в одном из журналов, исследовался с помощью
подсчета различных отпечатков пальцев, обнаруженных на стра-
ницах библиотечных экземпляров этого журнала, на которых име-
лась реклама.
2. Исследование, проведенное в Великобритании, показало,
что резкие падения напряжения в электросети, как правило, сов-
падают по времени с окончанием тех или иных транслируемых по
телевидению программ. По-видимому, люди, включая свет, стара-
ются воспользоваться наступившей паузой для завершения неза-
конченных домашних дел, для приготовления чая и т. д. Таким
образом, одной из причин нарушений в энергоснабжении являют-
ся подобные колебания в потреблении энергии.
3. В методе, применявшемся при определении резервной це-
ны товаров, выставленных па аукцион Сотби, использовались дан-
ные специальных каталогов, а также записи, сделанные непосред-
ственно во время аукциона.
4. Исследователи, изучавшие в Чикагском музее науки и про-
мышленности степень популярности выставленных экспонатов,
в качестве индикатора интереса, проявляемого публикой к той
или иной экспозиции, использовали скорость стирания покрытия
полов. В залах, где выставлялись экспонаты, привлекавшие все-
общее внимание, покрытие пола выдерживало не более 6 недель;
в тех же залах, куда посетители заглядывали редко, его не об-
новляли годами.
5. Уровень потребления алкоголя в «сухих» городах1 изучал-
ся посредством подсчета бутылок из-под спиртного, обнаружен-
ных в бытовом мусоре.
6. В исследованиях эмоций, испытываемых детьми при про-
слушивании страшных сказок, показателем, характеризующим
степень испуга, служила площадь поверхности, с которой сопри-
касался ребенок сидя.
7. Однажды автором настоящей книги было проведено неболь-
шое исследование с целью выяснить, соответствует ли действи-
тельности распространенное представление о том, что изменение
ответов на вопросы тестов с прилагаемыми вариантами ответов
приводит к замене правильных ответов на неправильные. При этом
во внимание принимались исправления и подчистки в нервоначаль-
1 В некоторых городах США в соответствии с местным законодательством
продажа алкогольных напитков запрещена. — Примеч. пер.
89
но выбранных вариантах ответов. Оказалось, что в 65% случаев
вместо неправильного ответа выбирался правильный. Изменения
ответов в остальных случаях разделились примерно поровну меж-
ду исправлением правильного ответа на неправильный и непра-
вильного па неправильный.
Подобные исследования иногда называют квазиэксперимен-
тальными планами. Приставка квази означает нечто, напоминаю-
щее реальный объект пли явление. В большинстве этих исследо-
ваний можно также, например, идентифицировать квазинезависи-
мую переменную. В приведенных примерах ими являются различ-
ные типы рекламы, промежуток времени между телевизионными
программами, различные экспозиции в музее, время, в течение ко-
торого дети слушали страшные истории. Зависимые переменные
во всех случаях довольно точно характеризуют тс или иные аспек-
ты поведения человека.
ЭКСПЕРИМЕНТ С ДВОЙНЫМ ОСЛЕПЛЕНИЕМ
Несколько другую проблему, связанную с осуществлением про-
цедуры эксперимента, ставит перед исследователем существова-
ние так называемого эффекта предвосхищающих оценок. Как от-
мечалось, участники экспериментов стараются представить себя
в наиболее привлекательном свете. При этом многое зависит от
их индивидуальной интерпретации того типа поведения, которого,
как им кажется, ждет от них экспериментатор. Отсюда и выраже-
ние «предвосхищающие оценки». Вот типичный пример подобной
реакции: мужчины, участвующие в эксперименте, во время кото-
рого их подвергали разряду электрического тока, зачастую ин-
терпретировали эту процедуру как проверку степени их мужест-
венности и выдержки. Например, экспериментатор хочет просто
определить быстроту реакции человека на небольшой по мощно-
сти, по достаточно чувствительный удар электрическим током.
Предварительно экспериментатор должен установить достаточную
мощность электрического разряда. Для этого он осуществляет
серию из нескольких постепенно возрастающих по своей мощно-
сти импульсов тока, интересуясь при этом субъективными ощуще-
ниями участника эксперимента. Однако последний, стремясь до-
казать свою мужественность, заходит гораздо дальше того уровня,
который определяется объективной необходимостью конкретного
эксперимента. Подобный образ действий диктуется ему неправиль-
ной интерпретацией условий проведения эксперимента.
В медицине часто встречаются другие ситуации, существенно
отличающиеся от только что рассмотренной, при которых важную
роль также играют предвосхищающие оценки. Очевидно, что от
пациента, подвергающегося тому или иному курсу лечения, '"тре-
буется», чтобы он чувствовал себя лучше. И многие врачи по соб-
ственному опыту знают, что одно только осознание пациентом
того факта, что он лечится, может действительно вызвать улуч-
шение его самочувствия. Подобно тому, как болезнь может быть
90
вызвана психологическими факторами, те же факторы могут ока-
зывать и исцеляющее воздействие.
Более конкретно это означает, что если у группы пациентов,
принимавших одно и то же лекарство, самочувствие улучшается,
то у некоторых из них наступившее улучшение обусловлено
воздействием чисто психологических факторов. Данное явление
называется эффектом плацебо. Слово «плацебо» — латинского про-
исхождения и означает нечто вроде «я вам угожу». Смысл этого
выражения состоит в том, что пациент старается «угодить» леча-
щему врачу своим выздоровлением.
Ситуацию, с которой мы сталкиваемся в медицинском каби-
нете, усугубляет также тот факт, что и у доктора имеются ка-
кие-то свои ожидания и надежды. Врач обязан помочь пациентам
и использует для этого то или иное терапевтическое средство.
Он, естественно, ожидает, что данное средство окажется полез-
ным для его больного. Если проводятся клинические испытания
какого-либо лекарства, то экспериментатор, скорее всего, на-
деется подтвердить, что оно обладает приписываемыми ему тера-
певтическими свойствами. Другими словами, мы имеем здесь де-
ло с систематическим воздействием на результаты эксперимента
пристрастного отношения экспериментатора, которое обусловле-
но его надеждами, уверенностью или ожиданием того, что лекар-
ство окажется эффективным.
Сложности, связанные с наличием эффекта плацебо и факто-
ра предвзятости экспериментатора, привели к созданию экспери-
мента с двойным ослеплением. Предположим, исследователь хочет
определить терапевтические свойства некоторого лекарства. С этой
целью он дает одним пациентам настоящее лекарство, а дру-
гим плацебо, которое внешне и по вкусу не отличается от ле-
карства, испытываемого в эксперименте, ио не обладает никаки-
ми целебными или вредными свойствами. Участвующие в экспери-
менте пациенты не знают, к какой группе — к принимающим на-
стоящее лекарство или к принимающим плацебо — они принадле-
жат. В этом смысле они как бы «ослеплены» и не подозревают
даже о существовании указанных групп.
Кроме того, учитывая возможность предвзятого отношения
экспериментатора, важно, чтобы и сам исследователь также не
знал, какие пациенты получали лекарство, а какие — плацебо.
Простейший способ достигнуть этого состоит в том, чтобы пере-
доверить техническую сторону проведения эксперимента третьим,
незаинтересованным лицам, а исследователю предоставить лишь
регистрацию полученных результатов. Исследования, проводив-
шиеся по планам с двойным .ослеплением, показали, что оба ви-
да контроля имеют важное значение. Эффективность новых ле-
карств, испытания которых проводились без использования плана
с двойным ослеплением, часто оценивалась очень высоко. Однако
введение контроля с целью выявления фактора плацебо нередко
приводило к некоторому уменьшению оценки этой эффективности;
контроль же за субъективным отношением экспериментатора к це-
91
лям проводящегося исследования обесценивал первоначально по-
лученные результаты еще больше.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
В этой главе был рассмотрен ряд основных принципов теории
планирования.экспериментов1. Эксперимент'представляет собой
способ осуществления контролируемых наблюдений за эффектом,
оказываемым вариацией значений некоторой независимой пере-
менной на величину результирующего признака. Эксперименты
могут существенно различаться по степени сложности. Характе-
ристика некоторых наиболее часто применяющихся типов планов
экспериментов приводится далее.
Трехстадийный план эксперимента. По крайней мере, в неяв-
ном виде процедура осуществления большинства экспериментов
включает в себя следующие три стадии: (1) стадия, на которой
определяется, что выделяемые в эксперименте группы эквивалент-
ны и находятся в равноценных условиях по отношению к изучае-
мому явлению; (2) стадия', на которой независимая переменная
принимает различные значения для различных групп; (3) стадия,
на которой осуществляется оценка эффекта наблюдаемой на вто-
рой стадии вариации значений независимой переменной. Если
эксперимент проводился тщательно и по всем правилам, то раз-
личия, полученные на третьей стадии, могут быть соотнесены с
различиями в условиях, в которые были помещены эксперимен-
тальные группы на второй стадии эксперимента.
Бивалентный эксперимент. Эксперимент, в котором рассмат-
ривается только два значения независимой переменной. Часто по-
добные эксперименты состоят в том, что одна из групп, участвую-
щих в эксперименте, ставится в какие-либо специальные условия,
эффект от воздействия которых интересует исследователя. Другая
же группа находится в это время в обычных условиях.
Контрольная группа. Группа, которая при проведении экспе-
римента находится в обычных условиях.
Экспериментальная группа. Группа, которая при проведении
эксперимента помещается в особые условия, эффект от воздейст-
вия которых интересует исследователя.
Смешение. Случайное введение в эксперимент фактора, ко-
торый в действительности и производит эффект, приписываемый
исследователем изменению величины значений независимой пере-
менной.
: Читатели, желающие более глубоко познакомиться с затронутыми в на-
стоящей главе вопросами теории планирования экспериментов, могут обратить-
ся к дополнительной литературе: Кэмпбелл Д. Модели экспериментов в
социальной психологии и прикладных исследованиях. М., 1980: Методология и
методы социальной психологии. 1Л., 1977; Методы социальной психологии. Изд-
во ЛГУ, 1977; Андреева Г. М., Богомолова II. II., Петров-
ская Л. А. Современная социальная психология на Западе. М., 1978.—
Примеч. пе!р.
92
Мультивалентный эксперимент. Эксперимент, в котором рас-
сматривается более одного значения независимой переменной.
Независимая переменная. При обсуждении плана эксперимен-
та определяется условие, которое должно изменяться при пере-
ходе от одной группы к другой. Исследователя интересует эф-
фект, производимый этими изменениями.
Зависимая переменная. Явление, которое исследуется с по-
мощью данного эксперимента.
Межгрупповой эксперимент. Эксперимент, при* котором раз-
личные его участники подвергаются воздействию различных зна-
чений независимой переменной.
Внутригрупповой эксперимент. Эксперимент, при котором все
его участники подвергаются воздействию более одного значения
(теоретически — всех) независимой переменной.
Выделяемая независимая переменная. Условие, которое может
меняться с помощью подбора участников эксперимента, обладаю-
щих желаемыми характеристиками.
Регулируемая независимая переменная. Переменная, значения
которой экспериментатор может контролировать в процессе экспе-
римента и управлять ими по своему усмотрению.
Факторный эксперимент. Эксперимент, в котором рассматри-
вается более одной независимой переменной, каждая из которых
обладает двумя или большим количеством значений. В плане фак-
торного эксперимента каждое значение независимой переменной
рассматривается в комбинации с каждым значением остальных не-
зависимых переменных.
Факторный план 2\2. Факторный эксперимент, в плане кото-
рого представлены две независимые переменные и по два значе-
ния каждой из этих переменных.
Главный эффект. Эффект изменения значений одной незави-
симой переменной факторного эксперимента, обобщенный (с по-
мощью сложения или усреднения) по всем значениям других неза-
висимых переменных, с которыми данная переменная образует
комбинации.
Взаимодействие. При проведении факторного эксперимента
изменение значений одной независимой переменной может повли-
ять па величину эффекта, обусловленного воздействием другой
независимой переменной.
Факторные эксперименты более высокого порядка. Факторный
эксперимент, в плане которого представлено белее двух незави-
симых переменных и более одного значения каждой из этих пере-
менных.
Реактивный эффект измерения. При изучении человеческого
поведения исследователь часто сталкивается с так называемым
«эффектом подопытного кролика»: поведение участников экспери-
мента отклоняется от естественного или привычного, если они
знают, что их подвергают какой-либо проверке.
Нереактивное исследование. Исследование проводится таким
образом, чтобы избежать воздействия реактивного эффекта изме-
93
рения и предвосхищающих оценок па результаты эксперимента.
Обычно под этим подразумевается проведение эксперимента, уча-
стники которого не подозревают, что являются объектом иссле-
дования экспериментатора.
Косвенные характеристики. Показатели, полученные в услови-
ях, когда участники исследования не знают о проводящемся экспе-
рименте.
Квазиэкспериментальный план. Исследование, в котором ис-
пользуется естественная вариация значений независимой пере-
менной для определения эффекта, оказываемого ею на зависимую
переменную.
Предвоехшцающие оценки в эксперименте. Связаны с реактив-
ным эффектом измерения. Действия, которые, как считают участ-
ники эксперимента, они должны совершить в соответствии с ожи-
даниями (требованиями) экспериментатора.
Плацебо. Таблетки, порошок, капли и т. д., которые внешне
не отличаются от настоящих медикаментов, но не содержат ак-
тивного вещества, оказывающего лечебное воздействие. В более
широком смысле любое воздействие, которое, как считают участ-
ники проводимого исследования, носит экспериментальный харак-
тер, однако в действительности оно лишено тех свойств, которые,
как ожидается, должны оказывать воздействие на результаты
эксперимента.
Эффект плацебо. Воздействие плацебо на результаты экспери-
мента, по своей силе в ряде случаев сравнимое с воздействием
фактора, определению существенности которого посвящен прово-
дящий эксперимент.
Смещение результатов эксперимента, обусловленное пристраст-
ностью экспериментатора. Влияние ожиданий или надежд иссле-
дователя на результаты эксперимента.
Эксперимент с двойным ослеплением. Эксперимент, при кото-
ром его участники не знают, к какой группе — экспериментальной
или контрольной (плацебо)—они принадлежат. Это позволяет
избавиться от воздействия эффекта плацебо па результаты экспе-
римента. Аналогично, чтобы избавиться от эффекта пристрастно-
сти экспериментатора, исследователь, проводящий эксперимент,
должен оставаться в неведении относительно того, кто из участ-
ников эксперимента принадлежит к экспериментальной группе,
а кто — к контрольной.
5
ЗАКОНЫ
СЛУЧАЙНОСТЕЙ
Еще на рубеже нынешнего и прошлого столетий Анри Пуан-
каре задавал вопрос: как смеем мы говорить о законах случай-
ностей? Не является ли случайность противоположностью зако-
номерности? Ведь, как правило, мы используем слово «случай-
ность» для обозначения того, чего не знаем, а слово «закономер-
ность» употребляем, когда смысл происходящего нам понятен.
Не очевидное ли это противоречие — говорить о законах случай-
ностей? Древние не сталкивались с этой проблемой, поскольку
они различали два рода явлений: явления, которые подчиняются
законам, установленным богами раз и навсегда, и явления, кото-
рые неподвластны никаким законам. Эти последние явления они
относили к разряду случайностей. Таким образом, законы были
законами, а случайности оставались случайностями — для всех
людей и даже для богов.
Однако теперь наши представления изменились. При оценке
большинства явлений реального мира мы остаемся убежденными
детерминистами. Можно признать наличие свободы воли в том,
что касается человеческого поведения, однако в физическом мире
принципы детерминизма остаются для нас незыблемыми.' И имен-
но поэтому мы сталкиваемся с отмеченным выше противоречием.
Если каждое событие в физическом мире относится к разряду де-
терминированных, то что мы хотим сказать, когда утверждаем,
что результаты игры в рулетку, выпадение орла пли решки при
подбрасывании монеты или то, что мы можем дожить до 70 или
90 лет, зависит от случайностей? Итак, что же такое случай-
ность?
ОТ ДЕТЕРМИНИЗМА К ВЕРОЯТНОСТНОМУ МИРУ
Анри Пуанкаре отвечал на свой вопрос практически так же,
как это делается и теперь при современном уровне знаний, од-
нако в его ответе значительно большее внимание уделялось дета-
лям. Все явления, говорил он, имеют свою причину, однако яв-
ления, которые мы называем «случайными», характеризуются,
95
кроме того, двумя следующими особенностями. Во-первых, хотя
каждое «случайное» явление имеет причинно-обусловленный ха-
рактер, в каждом отдельном случае соответствующие причины
очень незначительны по своей силе. Во-вторых, эти небольшие
причины действуют независимо друг от друга.
А ВСЕ ИЗ-ЗА ОДНОГО ГВОЗДЯ
Поставьте конус или пирамиду вершиной вниз и попробуйте
удержать их в таком положении. Как только вы уберете руку,
конус сразу же упадет. Почему это происходит? Потому, что воз-
действие незначительных по силе причин, среди которых можно
указать вибрацию пола, слабую чувствительность вашей руки, не-
совершенство формы конуса и т. д., приводит к нарушению рав-
новесного состояния. Если бы этих причин не было и на конус
оказывала воздействие только сила тяжести, то он бы не упал.
Теперь представьте себе идеально сбалансированное колесо
рулетки, на котором выделены чередующиеся между собой крас-
ные и черные секторы. Колесо начинает вращаться, и крупье (че-
ловек, управляющий ходом игры в рулетку) бросает на него
в направлении, обратном вращению, идеально круглый шарик.
Где окажется этот шарик — на красном или на черном — после
остановки'колеса? В каждом конкретном случае это зависит от
очень незначительных различий, слишком слабых по своей вели-
чине, чтобы они могли контролироваться человеком — различий
в скорости вращения колеса, силе бросания шарика и т. д.
Вспомните, наконец, о Георге III, короле Англии во времена
Американской Революции1. В Америке он был объектом лютой
ненависти, и его поведение являлось одной из причин, которая
делала нетерпимым дальнейшее поддержание связей этой страны
с Британией. Его бестактность, враждебность, непреклонность бы-
ли частью симптомов болезни, настолько серьезной, что короля
Георга в народе прозвали «лунатиком». Хотя иногда утверждают,
что его сумасшествие было следствием пережитых им в детстве
потрясений, в настоящее время очевидно, что в действительности
болезнь короля Георга (она называется порфириновая болезнь)
была вызвана воздействием причин физического характера.
Порфириновая болезнь представляет собой генетическое за-
болевание, проявляющееся в нарушении пигментного обмена с по-
вышенным содержанием порфиринов в крови. Накопление этого
вещества в организме человека приводит к умственному расстрой-
ству. Классические симптомы порфириновой болезни наблюдались
и у короля Георга. Болезнь является следствием исключительно
редко встречающегося случайного повреждения одного из генов.
И если бы не эта редкая случайность, то вполне возможно, что
Америка отмечала бы сейчас не двухсотлетие своей пезависимо-
1 Георг III (J738 —1820)один из вдохновителен английской колониальной
политики и борьбы с восставшими северо-американскими колониями. - Примеч.
пер.
96
сти, а трехсотую годовщину членства в Британском содружестве
наций1. В данном случае, как и в других' приводившихся приме-
рах, очень существенные по своему значению последствия были
обусловлены очень слабыми по силе воздействия причинами. Как
охарактеризовала подобную ситуацию в своей газетной заметке,
из которой я впервые узнал об истории короля Георга III, Джоан
Бэк — «а причиной всему простой гвоздь» * *.
МНОЖЕСТВЕННАЯ ПРИЧИННОСТЬ
Выпадение орла или решки' при подбрасывании монеты в прин-
ципе не является случайным событием. И теоретически, распо-
лагая всеми необходимыми данными, с помощью компьютера, в
память которого заложены все сведения о законах механики,
можно предсказать результат подбрасывания монет. Однако объ-
ем информации, которую потребовалось бы при этом перерабо-
тать, настолько велик, что поставленная перед нами задача ста-
новится практически неразрешимой. Мы должны учесть силу,
с которой монета подброшена, скорость ее вращения, давление
воздуха и силу ветра, особенности поверхности, на которую пада-
ет монета, и т. д. Однако прежде, чем приступить к обработке
этих данных, нужно решить целый ряд сложнейших проблем, свя-
занных с получением всей необходимой информации. Кроме того,
следует учесть взаимодействие всех факторов, оказывающих воз-
действие на конечный результат. Так, если две одинаковые мо-
неты подбросить с различной силой, то это различие в прилагае-
мой силе будет усугубляться воздействием остальных факторов,
определяющих особенности траектории полета монеты и ее при-
земления. На монеты, вращающиеся с различной скоростью, по-
разному будет воздействовать сопротивление воздуха; почти навер-
няка эти монеты упадут в различных местах, имеющих неодина-
ковую поверхность. Но даже если они и упадут в одном месте,
то и в этом случае их дальнейшее поведение будет иметь свои
особенности.
Говоря о подбрасывании монеты, мы должны иметь в виду еще
один момент. Поведение человека, подбрасывающего монету, в
свою очередь, также определяется многими переменными. Дан-
ный факт, еще больше осложняя цепочку причинно-следственных
взаимосвязей, в то же время указывает на одну важную особен-
ность описываемой нами ситуации. Вообще говоря, все факторы,
оказывающие воздействие на конечный результат, не коррелиру-
1 Война за независимость США (1775—1783) явилась следствием глубоких
социально-экономических противоречий. Сведение автором книги причин возник-
новения этой войны к психическому заболеванию короля Англии можно воспри-
нимать только в порядке шутки. — Примеч. пер.
* Возможно, не все знакомы с этой пословицей, поэтому приведем ее пол-
ностью: «Гвоздь не забили — подкова потерялась. Подкова потерялась — лошадь
ногу сломала. Лошадь ногу сломала — всадник разбился. Всадник разбился—
армия битву проиграла. Армия битву проиграла — король войну проиграл.
А проиграв войну — лишился своего королевства. А все из-за простого гвоздя».
7—1778
97
ют между собой, или являются независимыми. Например, разли-
чия в силе, с которой человек подбрасывает монету, в каждом
конкретном случае не зависят от характера поверхности, на кото-
рую падает монета.
Последнее соображение позволяет нам, наконец, дать опре-
деление случайному событию. Случайным, называется событие,
являющееся результатом воздействия множества независимых
причин. В данном определении подчеркивается второй из данных
Пуанкаре критериев случайности — множественная причинность.
Первый критерий (значительный эффект от воздействия несущест-
венных по своей силе причин) акцентирует внимание па другой
.характеристике случайных явлений. Однако зачастую существен-
ность эффекта определяется лишь субъективным восприятием дан-
ной конкретной ситуации. В действительности же между различ-
ными результатами того или иного случайного процесса могут
существовать лишь незначительные физические различия (как, на-
пример, при игре в рулетку, когда шарик останавливается в крас-
ном или черном секторе колеса). Однако психологически эти раз-
личия, особенно когда ставки в игре высоки, могут показаться
очень большими.
ПРИНЦИПЫ ВЕРОЯТНОСТИ
Надеюсь, теперь вы лучше представляете, что такое случай-
ность. Однако вам, видимо, все еще непонятно, причем здесь
законы. Читатель будет прав также, если сделает вывод, что все
приводившиеся выше аргументы свидетельствуют, скорее, против
существования каких бы то ни было закономерностей, чем под-
тверждают их наличие.
Однако если вы внимательно ознакомились с ' изложенным
выше материалом, то наверняка заметили, что речь все^время шла
об отдельных случайных событиях. Такие события являются на-
столько сложноопределенпыми, что предсказать их каждое в от-
дельности фактически невозможно. Отсюда и впечатление, что они
не подчиняются никаким закономерностям. Однако если рассмат-
ривать подобные события в массе, то ситуация кардинальным об-
разом меняется. Именно при таких условиях обретает свой смысл
концепция законов случайностей. Нельзя правильно предсказывать
результаты каждого, отдельно взятого подбрасывания монеты, од-
нако если подбросить эту же монету 1000 раз, то вполне можно
с определенной степенью точности предсказать, сколько раз выпа-
дет при этом «орел» и сколько раз «решка». Математики, состоя-
щие на службе у страховых компаний, не могут сказать, какой
из тех или иных конкретных людей умрет, не дожив до 65 лет,
однако они в состоянии предсказать, сколько всего людей умрет
в этом возрасте. По результатам проведенного опроса нельзя оп-
ределить, будет ли данный конкретный человек голосовать за де-
мократов на предстоящих выборах, однако без существенных
ошибок можно предсказать долю избирателей, голосующих за де-
58 • '
мократов. Предвосхищая идеи, с которыми мы познакомимся не-
сколько позднее, скажем, что законы случайностей, или принципы
вероятностей, применяются нс к отдельным событиям, а к их об-
ширным совокупностям.
ЧТО НЕОБХОДИМО ЗНАТЬ О ВЕРОЯТНОСТИ
Предположим, что кто-нибудь подбрасывает в воздух пять
монет (или одну монету 5 раз — аргументация при этом будет
аналогичной) и отмечает число выпавших орлов и решек. Для
пяти дихотомических событий (событий с двумя возможными ис-
ходами) общий результат будет состоять в получении одного со-
четания из 32 возможных (таких, например, как ТПТНН или
НННТТ)1. Проявив немного терпения, вы можете выписать все
эти 32 сочетания. Впрочем, все они представлены в нижней части
рис. 5.2.
С по с сёЫ получения
Итого Зо
Рис. 5.1. Все 36 возможных исходов, которые можно получить при бросании двух
костей. Вероятность получения любого конкретного исхода равна '/зе- Чтобы найти
вероятность выпадения сочетания, при котором сумма очков, выпавших на двух
костях, равна 2, 3, . . . , 12, необходимо число сочетаний, в которых может встве-
тнться данное суммарное значение, разделить на 36
Прежде всего вы должны попять, что каждый из этих 32 ис-
ходов одинаково вероятен. Возможно, что данный факт не кажет-
ся очевидным. Из нашего утверждения следует, что и ТТТТТ, и
ТПТНТ, а также вес остальные возможные сочетания при доста-
точно большом количестве испытаний будут встречаться с одина-
1 буква Н используется в данном случае для обозначения лицевой стороны'
монеты, решки (от английского слова «head»), Т — для обозначения оборотной
стороны монеты, орла (от английского слова «tail»). — Примеч. пер.
7* ' 99
ковой частотой, а именно по одному разу на каждые 32 подбра-
сывания 5 монет. Аналогичные рассуждения будут справедливыми
"и по отношению к игре в кости. При бросании двух костей веро-
ятность выпадения сочетаний «змеиные глаза» (1 — 1), «Товарный
вагон» (6—6) или, например, семерки, состоящей из 3 очков ца
кости № 1 и 4 очков на кости № 2, одинакова. Каждое такое со-
четание может выпасть 1 раз при 36 бросаниях костей. На рис. 5.1
представлены все возможные сочетания, которые могут встретиться
при бросании двух костей, а также приводится некоторая допол-
нительная информация. Присвоим одной из костей номер 1, а дру-
гой — номер 2. Если на первой кости выпадет единица, то на
второй кости может выпасть любое значение от 1 до 6. Все эти
возможные варианты приводятся в крайнем левом столбце на
рис. 5.1. Во втором слева столбце показано, что может случиться,
если па кости № 1 выпадет 2 очка. В следующих четырех столб-
цах представлены все возможные сочетания, которые могут встре-
титься, если на кости № 1 выпадет соответственно 3, 4, 5 или 6 оч-
ков. В двух столбцах, расположенных на полях рисунка, содер-
жится информация о всех возможных суммарных значениях очков,
которые могут выпасть на двух костях при одном бросании (левый
столбец), и числе сочетаний, в которых может встретиться каждое
суммарное значение (правый столбец). Следует запомнить, что
общее число всех возможных исходов бросания костей равно 36
и что вероятность выпадения каждого отдельного сочетания со-
ставляет 1/36.
Необходимо также отметить, что при определении возможных
исходов случайного события учитывались и различия в порядке
расположения элементов, составляющих каждое отдельное соче-
тание. Так, сочетания ТНТТН и НТТНТ рассматривались в каче-
стве различных исходов подбрасывания 5 монет, хотя оба этих
сочетания состоят из двух решек и трех орлов. В примере с игрой
в кости сочетания 6—1, 5—2, 3—4, 4—3, 2—5 и 1—6 также рас-
сматриваются в качестве различных исходов, хотя в каждом из •
них сумма очков, выпавших на двух костях вместе, равна 7.
Подобные соображения необходимо учитывать при определении
вероятностей осуществления тех или иных случайных событий в
карточных играх. Так, при игре в покер из 52 карт может быть
получено 311875 200 сочетаний по 5 карт, сдаваемых в одни руки
(если рассматривать в качестве различных сочетаний и разли-
чия в порядке получения карт па руки). Эти 5 карт могут быть
получены 120 различными способами. Данное число определено
следующим образом. Первая карта может оказаться любой из тех
5 карт, которые в конечном счете будут получены игроком. Вто-
рая карта может оказаться, любой из 4 оставшихся; третья — лю-
бой из 3 оставшихся и т. д. В итоге: 5x4x3x2x1 = 120. При не-
которых разновидностях покера различия в порядке получения
карт на руки не учитываются, и поэтому число всех возможных
сочетаний из 5 карт существенно меньше и составляет 311875 200:
: 120 = 2 598 960. Более того, многие из этих 2,6 млн. сочетаний при-
100
мерно равноценны с точки зрения вероятности достижения вы- '
игрыша. И поэтому их обычно объединяют в отдельные группы
в специальных таблицах вероятностей (см. табл. 5.1).
Таблица 5.1
Вероятности получения различных сочетаний карт при игре в покер
Сочетания Способы | получения р
5 карт, следующих друг за другом по порядку
старшинства карт одной масти 40 0,00002
4 карты одинакового достоинства (например, 4 туза) 624 0,00024
3 и 2 карты одинакового достоинства 3 744 0,0014
5 карт одинаковой масти 5 108 0,0020
5 карт, следующих друг за другом в порядке стар-
ившетва 10 200 0,0039
3 карды одинакового достоинства (на пример, 3 ко-
роля) 54 912 0,0211
2 пары (например, 2 туза и 2 дамы) 123 552 0,0475
1 пара (например, 2 ва.чега) 1 098 240 0,4226
Все прочие сочетания 1 302 540 0,5012
Итого 2 598 960 0,99996
Как-будет показано, вероятность совершения любого случай-
ного события равна числу способов реализации этого события,
деленному па общее число всех возможных результатов. Рассчи-
танные подобным образом значения вероятностей приводятся в
последнем столбце табл. 5.1. Последовательность совершаемых
при получении этих значений действий легче всего продемонстри-
ровать па примере с 4 картами одинакового достоинства. В коло-
де карт содержится 13 таких сочетаний (4 туза, 4 короля и т. д.).
При игре в покер в каждой такой четверке может быть добавлена
пятая карта — любая из оставшихся 48 в колоде. Следовательно,
всего имеется 13X48 = 624 возможных сочетания из 5 карт, в ко-
торых 4 карты одинакового достоинства. Вероятность получения
одного такого сочетания равна: 624:2 598 960 = 0,00024, или 24 на
100 000 сочетаний. В табл. 5.1 различные сочетания карт располо-
жены по порядку возрастания вероятности их получения, которая,
как вы увпдете позднее, одновременно указывает и на ранг соот-
ветствующего сочетания.
РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ СОБЫТИЙ
Вернемся к подбрасыванию монет. Если подбросить одну мо-
нету, то возможны два исхода: Н или Т. При подбрасывании
двух монет возможны 4 исхода: НН, TH, НТ и ТТ. При подбра-
сывании трех монет возможных исходов будет 8: ННН, ИНТ, НТН,
ТНН, ТТН, ТНТ, НТТ и ТТТ. Вы, наверное, заметили, что увели-
101
чение числа возможных исходов при увеличенйи числа подбрасы-
ваемых монет подчиняется довольно простой закономерности.
В соответствии с этой закономерностью соответствующий ряд,
характеризующий число возможных исходов при увеличении числа
подбрасываемых монет, будет выглядеть так: 2, 4, 8, 16, 32 и т. д.
Остановимся более подробно на 8 исходах, получающихся при
подбрасывании 3 монет. Предположим, что мы объединили в от-
дельные группы равнозначные исходы. В этом случае будем иметь
две группы, в каждой из которых насчитывается по одному исходу:
Число Общее число
монет ' Возможные сочетания исходов
1 т н
1 1 1 + 2
1 г 2 + 1 --- 4
2 Т Т НТ TH НН
1 2 1
т нт нт н
ТТН н нт
тттнтттннннн
1 3 3 1 1 I3’3 + h 8
4 • тт нт т н т н н н т т т т н н н н н т 1 •; 4 + 6 + 4+ 1 16
т т т н нт нт н т н.н
нт т т т н нт ннт н
тт т т т НТТ н т т н Т Н НН нннн
1 4 6 4 1
5 т н т т н т н н н т
Т Н т Н 7 т нт н н
т н нт т т н н т н 1 + 5+ 10 10+5 i 1 32
т т н т н* т т н н н
т т н н т Н Т Н Н т
тттт и тттнн НТ Н Т н т н н н н
тттнт н т т т н НТТ н н н т н н н
т т н т т н т н т т Н Н Т нт н н т н н
I н т т т н т т н т н н т т н н н н т н
тттт т нтттт Н Н 7 Т Т н н н т т нннн т н н н н н
1 5 10 10 ь 1
Рис. 5.2. Все исходы, котооыс могут быть лри подбрасывании
I, 2,. . ., 5 монет
три решки (ИНН) и три орла (ТТТ); третья группа образуется
тремя исходами, в каждом из которых представлено по 2 решки
и 1 орлу: (ННТ, ТНН, НТН). В четвертой группе также имеются
три исхода, в каждом из которых представлено по 1 решке и 2 ор-
ла: (ТТН, НТТ, ТНТ). Таким образом, все 8 исходов распреде-
лены нами на 4 группы. На рис. 5.2 приводится аналогичная ин-
формация для случаев, когда число подбрасываемых монет из-
102
меняется от 1 до 5. Этот рисунок облегчит знакомство с идеями,
которые необходимо усвоить при знакомстве с концепцией веро-
ятности.
Вероятность случайного события. Если вы хотите узнать, ка-
кова вероятность одновременного выпадения 5 решек при подбра-
сывании 5 монет, то ход рассуждений должен быть следующим.
При подбрасывании 5 монет возможны 32 различных исхода. Толь-
ко при одном из этих исходов все 5 монет упадут лицевой сторо-
ной вверх. Таким образом, искомая вероятность равна 1/32, или
1:32 = 0,03125. Итак, в общем случае вероятность осуществления
любого конкретного случайного события равна отношению числа
всех возможных реализаций этого события к общему числу воз-
можных исходов. Поясним данную формулировку с помощью дру-
гого примера. Из 32 возможных исходов при подбрасывании 5 мо-
нет в 10 случаях выпадет по 3 решки. Таким образом, вероятность
выпадения 3 решек равна: 10:32 = 0,3125. Наконец, необходимо
оз метить, что вероятность выпадения 0 или 1, или 2, или 3, или 4,
или 5 решек равна: 32:32=1. Сумма всех индивидуальных веро-
ятностей даст достоверность (вероятность, равную единице): ка-
кой-нибудь из всех возможных исходов будет наверняка получен,
р= 1,0.
Правило сложения вероятностей. При определении вероятнос-
ти выпадения трех решек можно рассуждать и так. Три решки
при подбрасывании 5 монет могут выпасть в следующей последо-
вательности: HIIHTT. Поскольку любой исход в проводимом опы-
те является равновозможным, вероятность получения данного ре-
зультата равна V.42. Но с такой же вероятностью 3 решки могут
выпасть и в последовательности, НТННТ. На рис. 5.2 приводится
еще 8 различных способов получения 3 решек при подбрасывании
5 монет. Как известно, таких способов насчитывается 10. В соот-
ветствии с только что сформулированным общим правилом опре-
деления вероятности осуществления случайного события вероят-
ность выпадения 3 решек равна 10/.ч2. Однако очевидно, что эта
вероятность представляет собой также сумму вероятностей полу-
чения НННТТ или НТННТ, или ННТНТ и т. д. до конца перечня
всех возможных способов получения 3 решек.
Данный вывод, как и в предыдущем случае, может быть вы-
ражен с помощью более общей формулировки. Вероятность осу-
ществления того или иного случайного события из некоторого мно-
жества несовместных случайных событий равна сумме их вероят-
ностей. Выражение несовместных событий в этом определении име-
ет большое значение. Если бы вы попытались применить сформу-
лированное нами правило сложения вероятностей к игре в покер,
например, при определении вероятности того, что у кого-нибудь
из 3 игроков на руках окажется пара карт одинакового достоин-
ства, то получили бы (см. табл. 5.1) 0,4226 + 0,4226 + 0,4226 =
= 1,2678, что невозможно, поскольку сумма вероятностей всех воз-
можных исходов равна 1,0. Причина того, что правило сложения
вероятностей в данном случае «не работает», заключается в том,
103
что пары одинаковых по старшинству карт могут оказаться сразу
у двух или даже у трех игроков, и это нарушает предпосылку
несовместности случайных событий. В заключение приведем при-
мер, где применение правила сложения вероятностей вполне обо-
снованно. Вероятность получения 3 решек или 3 орлов при подбра-
сывании 5 монет равна: 10/32+10/32 = 20/32 = 0,6250. Отметим при
этом, что одновременно получить 3 решки и 3 орла невозможно.
Эти события являются несовместными.
Правило умножения вероятностей. Напомним, что вероятность
выпадения 5 решек при подбрасывании 5 монет равна */з2. Ис-
пользование другого подхода к получению такого вывода позволит
нам ввести ещ^ один важный закон случайностей, а именно пра-
вило умножения вероятностей. Логика рассуждений будет состоять
в следующем. Для первой монеты вероятность выпадения решки
равна */г- Для второй и всех остальных монет эта вероятность
также составляет '/г- Вероятность выпадения 5 решек равна:
1/2X1/2X1/2X1/2X1/2=1/2X2X2X2X2=1/32. Или, в более об-
щем случае: вероятность одновременного осуществления любого
числа случайных событий равна произведению их индивидуальных
вероятностей.
РЕЗЮМЕ. ТРЕУГОЛЬНИК ПАСКАЛЯ
В нижней части рис. 5.2 расположена строка, состоящая из
чисел (1, 5, 10, 10, 5, 1), которые показывают, в скольких соче-
таниях может оказаться пи одной решки, одна решка и'четыре ор-
ла, две решки и три орла и т. д. при подбрасывании 5 монет.
В строке, расположенной несколько выше, приводится аналогич-
ная информация для 4 монет: (1, 4, 6, 4, 1). В следующих по по-
рядку строках содержатся данные соответственно для 3, 2 и 1
монеты. В верхней части рис.' 5.3 подобная информация сведена
вместе. При этом число' монет меняется от 1 до 10. Приведенная
на рис. 5.3 фигура представляет собой часть треугольника Паска-
ля, названного так в честь впервые построившего его Блеза Па-
скаля.
Числа, составляющие этот треугольник, показывают, в сколь-
ких различных сочетаниях может встретиться то или иное число
орлов или решек. Так, при подбрасывании 10 монет (см. нижнюю
строку) в одном сочетании не будет ни одной решки, в 10 соче-
таниях может встретиться 1 решка и 9 орлов, в 45 — 2 решки и
8 орлов ..., в 252 — 5 решек, и 5 орлов ..., в 120 — 3 решки
и 7 орлов ..., в 1 — 10 решек. Чтобы лучше понять сказанное,
попытайтесь объяснить смысл пропущенных чисел, а также чисел,
расположенных в других строках. Обратитесь еще раз к рис. 5.2,
па котором в более наглядной форме представлена информация,
содержащаяся в верхних пяти строках рис. 5.3.
В левом столбце приводятся числа, характеризующие количест-
во подбрасываемых монет. Впрочем, это могли бы быть и не мо-
неты, а любые другие дихотомические (двузначные) случайные
104
события. В правом столбце содержатся данные об общем числе
возможных сочетаний, которые могут встретиться при подбрасы-
вании того или иного количества монет. Приведенные в этом
столбце числа получены в результате суммирования показателей
соответствующих строк таблицы. Взглянув на числа, заключенные
N Итога
1 11 -2
2 1_ 2_ 1 4
3 1 \ 3 'z~7 1 8
д 1 4 . 3 .' 4 1 16
5 15 1иХ'/10 5 1 22
g 1 S 15 20 15 6 1 ’ 64
7 1 7 21 35 35 . 21 7 1 .128
8 1 S__28_____56 70 56 28 8 1 256
g - 1 S \ 36 84,7126 126 84 36 9 1 512
ю 1 10 4E- \120/210 252 210 120 45 10 1 1024
1 0,500 0,500 ',0
2 . 0,250 0,500 0,250 , >0
3 ’ ’ 0,125 0.375 0,375 0,125 ’ 1,0
4 0,063 0,250 0,375 0,250 0,063 1,0
5 0,031 0,157 0,312 0,312 0,157 0,031 1,0
6 0,016 0,094 0,234 0,312 0,234 0,094 0,016 1,0
7 0.008 0,055 0,164 0,273 0,273 0,164 0,055 0,008 1,0
8 0,004 0,031 0,109 0,219 0,273 0,219 0,109 0,031 0,004 1,0
9 0,002 0,018 0,070 0,164 0,246 0,246 0,164 0,070 0,018 0,002 1,0
10 0,001 0,010 0,044 0,1170,205 0,246 0,205 0,1170,044 0,010 0,001 1,0
' Рис. 5.3. Треугольник Паскаля, построенный в показателях, выражающих число
возможных исходов, н в .показателях вероятности
в выделенных на рис. 5.3 двух маленьких треугольниках, можно
понять, что любое значение в треугольнике Паскаля может быть
последовательным образом получено путем суммирования двух
стоящих рядом чисел, расположенных в предыдущей строке. При-
чем результат записывается строкой ниже между участвовавшими
в сложении числами. Руководствуясь этим простым правилом,
можно с помощью минимальных вычислений получить треуголь-
ник Паскаля любых размеров.
В нижней части рис. 5.3 приводятся вероятности получения
каждого числа, принадлежащего треугольнику Паскаля. Каждое
значение в этой вероятностной версии треугольника Паскаля
представляет соответствующее исходное число, показывающее,
сколько существует способов получения того или иного конкрет-
ного результата, в виде десятичной дроби, характеризующей до-
лю этих способов в общем количестве всех возможных исходов.
При получении этих значений мы имели возможность 65 раз по-
вторить сформулированное определение вероятности (именно
столько показателей содержится в представленном па рис. 5.3
105
треугольнике Паскаля), поскольку, как известно, вероятность
осуществления случайного события находится посредством деле-
ния числа способов реализации этого события на общее число
всех возможных исходов.
Рис. 5.3 представляет также неограниченные возможности для
уяснения смысла правил сложения и умножения вероятностей.
Предположим, что вы хотели бы определить вероятность получе-
ния 5 или большего количества решек при подбрасывании 10 мо-
нет. Эта вероятность равна вероятности получения 5 или 6, или 7,
или 8, или 9, или 10. решек. На рис. 5.3 (см. верхнюю его часть)
показано, что число способов получения этих результатов равно
соответственно 252, 210, 120, 45, 10 и 1. В сумме это составляет
638 способов. Разделив далее 638 па 1024, получаем 0,623. То же
значение может быть получено, если мы просуммируем соответст-
вующие показатели в нижней строке фигуры, представляющей со-
бой вероятностную версию треугольника Паскаля, 0,246 + 0,205 +
+ 0,117 + 0,044 + 0,010 + 0,001 = 0,623. Правило сложения вероятнос-
тей состоит в том, что вероятность получения одного или другого
случайного события равна сумме индивидуальных вероятностей
осуществления каждого из этих событий.
Правило умножения вероятностей заключается в том, что ве-
роятность получения всех интересующих нас случайных событий
равна произведению индивидуальных вероятностей осуществления
каждого из этих событий. Проиллюстрируем действие этого пра-
вила на примере определения вероятности получения любого на-
перед заданного числа решек (орлов). Эта задача аналогична
задаче определения вероятности выпадения решки при первом
подбрасывании монеты и при второе подбрасывании монеты, и
при третьем и т. д. Соответствующее значение вероятности при
первом подбрасывании монеты "равно 0,50. Это значение умножает-
ся па вероятность выпадения решки при втором подбрасывании
монеты (она также равна 0,50) : 0,50X0,50 = 0,25. Полученный ре-
зультат также умножается на 0,50 = 0,125. Продолжая в том
же духе, мы получим следующий ряд чисел: 0,500; 0,250; 0,125;
0,063; 0,031; 0,016; 0,008; 0,004; 0,002 и 0,001. Если обратиться
к рис. 5.3, то можно легко заметить, что этот ряд чисел совпадает
с последовательностью диагональных элементов, характеризующих
вероятность выпадения 1, 2, 3, ..., 10 решек при однократном под-
брасывании такого же количества монет. Как отмечалось в начале
данного параграфа, величина вероятности будет одной и той же,
независимо от того, как будут подбрасываться монеты: все одно-
временно или по очереди.
ДЕМОНСТРАЦИЯ СЛУЧАЙНЫХ ЯВЛЕНИЙ
Знакомя студентов с концепцией вероятности, я часто начи-
наю с демонстрации простых и наглядных экспериментов. Час-
тично это объясняется тем, что получаемые при этом результаты
делают мой рассказ более конкретным. Кроме того, приводящие-
106
ся примеры позволяют еще раз продемонстрировать логику про-
верки гипотез. Перед началом опытов я делаю два предсказания,
которые записываю на листе бумаги, и отдаю его одному из
студентов. После окончания демонстрации опытов я прощу зачи-
тать эти предсказания вслух:
1. Ваши предсказания результатов опытов не имеют случайно-
го характера.
2. Ваши предсказания результатов опытов нельзя будет исполь-
зовать для подтверждения существования экстрасенсорного вос-
приятия.
Как следует из второго утверждения, наши опыты проводятся
в форме небольшого эксперимента по выявлению экстрасенсорных
способностей. При этом я просто буду подкидывать 10 раз монету,
регистрируя результаты каждого такого опыта. Задача студентов
заключается в том, чтобы предсказать, какой стороной вверх упа-
дет монета. Свои прогнозы они фиксируют, записывая ряды «ре-
шек» (Н) п «орлов» (Т). Затем я прошу каждого студента под-
считать следующие показатели: (1) количество решек, которые
в соответствии с их предсказаниями должны выпасть при первых
5 подбрасываниях монеты; (2) оценку их экстрасенсорных способ-
ностей, т. е. число «точных попаданий»—-правильных прогнозов,
по результатам всех К) опытов. Причина, по которой при опреде-
лении первого показателя учитываются только первые 5 опытов,
состоит в том, что при подобном подходе мы сможем осуществить
проверку сделанных прогнозов на базе двух различных по объему
совокупностей случайных событий: при предсказании решек ис-
пользуются данные 5 опытов, при подсчете правильных прогно-
зов- 10.
ПРОВЕРКА ГИПОТЕЗ
Если студенты будут себя вести в этом маленьком исследова-
нии случайным образом, то распределение сделанных ими прогно-
зов может быть определено на базе значений вероятностей, пред-
ставленных в нижней части рис. 5.3. Для первых 5 предсказаний
вероятности выпадения 0, 1, 2, 3, 4 и 5 решек составляют 0,031;
0,157; 0,312; 0,157; 0,031. Вероятности 0,1, ..., 10 правильных
предсказаний равны: 0,001; 0,010; ...; 0,001. Значения этих веро-
ятностей приводятся вой 10 строках таблицы, представленной
на рис. 5.3. Подвергнем проверке две нулевые гипотезы, состоящие
в том, что распределение прогнозов студентов не отличается от
двух приведенных выше теоретически ожидаемых распределений.
Количество предсказанных решек. Приведенное на рис. 5.4
симметричное распределение отражает вероятности выпадения 0,
1, 2, 3, 4 и 5 решек. Показанная пунктирной линией фигура, имею-
щая не такую правильную форму, представляет собой распределе-
ние прогнозов', сделанных 100 студентами, участвовавшими в экс-
перименте. Очевидно, чго распределение по прогнозам отличается
от теоретического распределения случайных событий. Очень мно-
107
гие студенты предсказали выпадение 3 решек и очень мало кто
предсказал,- что выпадет 4 или 5 решек. По моим расчетам (см.
с. 251), необычность этого результата в сравнении с распределе-
нием прогнозов, которое было бы получено при действительно
Рис. 5.4. Сравнение случай-
ного распределения числа
выпавших решек с распре-
делением прогнозов сту-
дентов. На оси ординат,
расположенной на графике
слева, откладываются зна-
чения вероятности получе-
ния каждого из этих резуль-
татов. На оси ординат,
расположенной справа, от-
кладывается процент сту-
дентов. угадавших, что вы-
падет то или иное число
решек. Как можно заме-
тить, прогнозы студентов
не имеют случайного харак-
тера. Слишком часто ими правильно предсказывалось, что выпадет 2 и 3 решки,
и слишком редко они предсказывали выпадение 0, 1, 4 и 5 решек
случайном поведении студентов, оценивается как 100:1. Таким
образом, в данном случае нулевая гипотеза отвергается, что и
предсказывалось мною в начале настоящего параграфа.
Причина получения подобного распределения по прогнозам
связана с особенностями представления большинства людей о
форме проявления случайных событий. Часто слишком сильный
акцент делается на отсутствии упорядоченности в мире случайных
явлений. При этом упускается из виду, что иногда последователь-
ность случайных событий может принимать форму упорядоченно-
го процесса. В сделанных студентами прогнозах слишком часто
встречались последовательности, имеющие неупорядоченную струк-
туру (такие, например, как НТННТ или ТТНТН), и недооценива-
лась возможность появления упорядоченных последовательностей
(таких, например, как ТТТТТ и ННННН). Это одна из причин
отклонения полученного распределения от распределения, показан-
ного на рис. 5.4, которое имеет случайную природу. В- дополнение
к этому в 66 случаях из 100 студенты предсказывали появление
решки при первом подкидывании монеты. Данный факт, наряду
с предпочтением, отдаваемым неупорядоченным последовательно-
стям орлов и- решек, и привел к появлению на рис. 5.4 пика в точ-
ке, соответствующей 3 решкам.
Я уже отмечал, что имеется всего 1 шанс из 100, что подоб-
ное распределение может быть получено случайным образом.
Таким образом, в нашем распоряжении имеется еще один пример
применения метода проверки гипотез. Рискуя вызвать у читателя
скуку (автора может извинить лишь степень важности излагаемо-
го материала), позволю себе еще раз повторить основные этапы
применения этого метода.
108
1. Формулируется нулевая гипотеза: распределение прогнозов
не отличается от теоретического случайного распределения.
2. Собираются необходимые данные. Они нанесены па график
(см. рис. 5.4).
3. Оценивается вероятность получения этих данных при усло-
вии, что пулевая гипотеза верна. С помощью критерия хи-квад-
рат (см. с. 251) определяется, что эта вероятность оказывается
меньше 0,01.
4. Принимается или отвергается нулевая гипотеза. Наши расче-
ты позволяют отвергнуть нулевую, гипотезу при уровне значимо-
сти 1 %.
Предвидение? Ожидаемое распределение правильных предска-
заний в «экстрасенсорной» части нашего эксперимента представ-
лено на рис. 5.5. Точки графика кривой, изображающей это рас-
Рис. 5.5. Проверка способности предска-
зывать. Сплошной линией отражается
ожидаемое (теоретическое) распределе-
ние правильных предсказаний, получен-
ных случайным образом. Точки на
графике представляют собой распреде-
ление правильных предсказаний. 100 сту-
дентов. Статистический анализ показы-
вает, что распределение предсказаний
студентов не очень существенно отли-
чается от случайного распределения. По
оси абсцисс откладывается число вер-
ных предсказаний выпадения решек пли
орлов; ио осп ординат, расположенной
слева, — вероятность случайного получе-
ния того или иного числа правильных
предсказаний; по оси ординат, располо-
женной справа, - процент студентов,
сделавших то h/ii: пиое чне.'ю верных
предсказаний
прсделение, определяются значениями из нижней строки таблицы
(см. рис. 5.3). Не связанные друг с другом точки на рис. 5.5 ха-
рактеризуют (в процентах) численность студентов (соответствую-
щие значения откладываются на расположенной справа оси орди-
нат), сделавших то или иное число правильных предсказаний. На
этот раз, видимо, нельзя сделать вывода о том, что фактические
данные систематическим образом отличаются от ожидаемых ре-
зультатов. Во всяком случае, более детальное ознакомление с эти-
ми данными показывает, что студенты не проявили каких-либо
особо выдающихся способностей по части предсказания резуль-
татов эксперимента. С помощью подходящего статистического кри-
терия (см. с. 252) показывается, что подобный результат может
быть получен в 10—20 случаях при 100 повторениях эксперимента.
А это слишком- большая величина, чтобы дать основания для ут-
верждений, что данная группа студентов обладает каким-либо да-
ром предвидения.
Но как же быть с теми 5 студентами, которые угадали в 8
пли 9 случаях из 10? Может быть, нам удалось выделить неболь-
109
-шую группу студентов, обладающих экстрасенсорными способно-
стями? Этот вопрос подводит нас к одной из наиболее интересных
проблем в области теории вероятностей.
БИНОМИАЛЬНЫЙ ПОДХОД
Законы случайностей начинают действовать там, где все мно-
гообразие явлений, каждое из которых по-своему характеризует
изучаемую ситуацию, может быть сведено к рассмотрению двух
альтернатив: получению некоторого конкретного результата Р
с вероятностью р и всех остальных возможных результатов Q,
которые встречаются с вероятностью q=l—р. В большинстве
наиболее важных примеров, рассматриваемых в настоящей главе,
вероятности р и q равны 0,5. Это означает, что в предположении
о случайном характере явлений, каждое из событий — выпадение
орлов или решек при подбрасывании монеты, а также правильные
и ошибочные предсказания относительно возможных результатов
подбрасывания — имеет вероятность 72- В противоположность
этому при игре в кости, например, вероятность, р, выпадения ка-
кого-либо конкретного числа равна ув, а величина q (вероятность
выпадения любого другого числа)—5/с. Таким образом, идеи,
с которыми мы будем иметь дело в оставшейся части настоящей
главы, связаны с рассмотрением ситуаций, в которых вероятности
совершения тех или иных событий соотносятся как 50/50*.
ЗАКОН БОЛЬШИХ ЧИСЕЛ
Сейчас настало время привлечь ваше внимание к еще одной
особенности рис. 5.5. Точки, изображающие фактические данные,
точно не совпадают с теоретической кривой. Наличие этих откло-
нений поможет нам сформулировать одну важную концепцию.
Предположим, что предсказания студентов в эксперименте по вы-
явлению экстрасенсорных способностей имеют случайный харак-
тер (данные, которыми мы располагаем, по-видимому, не противо-
речат этому предположению). Закон больших чисел говорит нам,
что фактические данные будут все больше и больше приближаться
к теоретически ожидаемым значениям по мере возрастания числа
наблюдений. Часто этот закон формулируется в терминах ожидае-
мых. (теоретических) долей. Для случая с подбрасыванием моне-
ты это означает, что доля полученных решек будет все больше
и больше приближаться к !/2 по мере увеличения числа подбра-
сываний. Ту же мысль можно выразить и по-другому, сказав,
* И в этом случае мне бы не хотелось касаться математической стороны дан-
ного вопроса. Однако читателям, имеющим определенную математическую под-
готовку, возможно, полезно будет узнать, что речь идет о разложении бипомй»
альиой формы (p + q)n, где р и q имеют значение, определенное в основном тек-
сте, а п характеризует число событий. Коэффициенты, получае?.п>1е при разложе-
нии этой формулы, указывают общее число всех возможных исходив, а каждый ко-
эффициент, деленный па их сумму, характеризует вероятность получения соот-
ветствующего исхода. Поскольку p+q-—{, то и (р I-</) ” также всегда равно 1.
ПО
что разница между фактической и ожидаемой (равной ’/г) доля-
ми решек, полученных при подбрасывании монеты, стремится
к нулю при стремлении числа подбрасываний монеты к беско-
нечности.
Самообман азартного игрока и полоса удач. То же правило
справедливо и по отношению к студентам, которые получили очень
высокие оценки при проведении эксперимента по выявлению экс-
трасенсорных способностей. Если их удачные предсказания при
10 подбрасываниях монеты рассматривать как случайные — а это
предполагает отсутствие у них какихглибо способностей к пред-
видению--; то в соответствии с законом больших чисел доля их
правильных догадок будет стремиться к величине 0,5 при неогра-
ниченном увеличении числа испытаний. Однако это вовсе не оз-
начает, что 3 человека, правильно угадавших в 9 случаях резуль-
тат эксперимента, при 10-й попытке, скорее, всего, ошибутся. Если
правильность их предсказаний имеет случайную природу, то это
предполагает, что результаты последовательных испытаний яв-
ляются независимыми. Думать иначе — значит допускать ошибку,
известную под названием самообман азартного игрока. Обычно эта
ошибка проявляется в форме ничем не обоснованной уверенности
в том, что продолжительная полоса неудач _ увеличивает шансы
на выигрыш при следующей сдаче карт, бросании костей и т. п.
Это далеко не так. Если игра ведется честно и ничто не меша-
ет проявлению законов случайностей, то результаты следующих
друг за другом карточных туров или бросаний костей будут не-
зависимыми между собой.
Ошибка азартного игрока — лишь один из двух способов само-
обмана, жертвой которого становятся люди, ничего не слышавшие
о независимости последовательных случайных событий. Второй из
этих способов состоит в широко распространенной вере в сущест-
вование полос удач и неприятностей. Мы можем охарактеризовать
это явление с помощью термина «теория полос». Можно проиллю-
стрировать оба типа отмеченных нами ошибок на примере ожида-
ний родителей относительно пола их очередного ребенка, если в
семье уже имеется то или иное число сыновей и дочерей. Соответ-
ствующие данные были любезно предоставлены в мое распоряже-
ние Г. Мак-Клелландом.
Мак-Клслланд описал различные но составу семьи (от семей,
где мальчиков насчитывалось в 3 раза больше, чем девочек, до
семей, где, наоборот, численность девочек в 3 раза превышала
численность мальчиков), приводя данные о соотношении между
мальчиками и девочками в каждой семье. Во время проведения
обследования Мак-Клслланд просил родителей дать оценку ве-
роятности того, что очередной их ребенок окажется мальчиком или
девочкой. По результатам этого опроса был рассчитан показатель,
отражающий процент семей (имеющих то или иное количество де-
тей), которые правильно ответили на заданный нм вопрос, сказав,
что соответствующие вероятности примерно равны. Из рис. 5.6,
на котором представлены полученные Мак-Клелландом данные,
111
следует, что верные ответы, как правило, давались в тех семьях,
где число мальчиков и девочек было одинаковым. И наоборот, чем
менее сбалансированным оказывался состав семьи, тем больше
было ошибочных ответов.
Сыновья и Зочери^же имеющиеся в семье
Рис. 5.6. Отсутствие пони-
мания независимости слу-
чайных событий. В дейст-
вительности вероятности то-
го, что очередной ребенок,
который должен родиться в
данной семье, окажется
мальчиком пли девочкой, со-
относятся приблизительно
как 50 : 50, независимо от
числа сыновей и дочерей,
уже имеющихся в- этой
семье. (Широко известен
факт, что вероятное!!, рож-
дения мальчиков несколько
выше, однако это превыше-
ние настолько незначитель-
но, что им вполне можно
пренебречь). Тем не менее
люди часто считают, что
это верно только в случае,
когда число мальчиков и
девочек в семье одинаково.
Логически ошибки, допускаемые при ответе на вопрос о поле
очередного ребенка, могут служить типичными примерами заблуж-
дений, охарактеризованных нами с помощью концепций самообма-
на азартного игрока и «теории полос». Если родители говорят, что
соответствующие вероятности не равны друг другу, то в своих
ответах они могут руководствоваться одним из следующих двух
альтернативных соображений: несбалансированность состава семьи
Рис. 5.7. Два типа непонимания
независимости случайных собы-
тий. Люди делятся на две при-
близительно одинаковые катего-
рии. Представители одной из них
считают, что после серии событий
одного рода в соответствии с
«законом средних» должно про-
изойти событие другого рода
(«самообман азартного игрока»).
Представители другой верят в су-
ществование полос удач и непри-
ятностей («теория полос»). Отме-
тим при этом, что уверенность
представителей каждой из этих
категорий в справедливости со-
ответствующей теории возрастает
при увеличении длины серин со-
бытий одного п того же рода
с рождением очередного ребенка усугубится еще больше («теория
полос») или несколько уменьшится (самообман азартного игрока).
В первом из этих двух случаев родители считают, что уж если
112
у пих стали рождаться, к примеру, одни мальчики, то так будет,
продолжаться и в дальнейшем. Во втором случае родители уве-
рены в том, что раз у пих родились два мальчика, то третьим ре-
бенком обязательно будет девочка. На рис. 5.7 данные (представ-
ленные на рис. 5.6) изображены с учетом этих двух различных
подходов. И все же очевидно, что независимо от типа ошибок, до-
пускаемых родителями при ответе на вопрос о поле их очередного
ребенка, вероятность ошибочного ответа возрастает при увеличе-
нии различий в числе братьев и сестер в семье. “
«Везучие» и «невезучие» люди. Подобный образ мышления под-
водит нас к проблемам, так сказать, общечеловеческого масшта-
ба. Представим, что распределение, подобное распределению, пред-
ставленному на рис. 5.5, характеризует не вероятность получения
того или иного числа правильных ответов, а вероятность совер-
шения хороших и плохих событий в жизни человека. Подобный
переход осуществить довольно просто, если отождествить хорошие
события, скажем, с решкой, а плохие — с орлом. О чем может
свидетельствовать форма подобного распределения? Из графика
следует, что всегда будут встречаться люди, к которым судьба
благоволит, и люди, с которыми жизнь. обходится круто. Харак-
теристики этих двух групп людей представлены в противополож-
ных хвостах изображенного распределения. Из нашего обсуждения
следует, что у этих людей пет оснований ожидать, что полоса хо-
роших или плохих событий будет продолжаться и дальше (при
условии, что эти события имеют действительно случайную приро-
ду). Жизненный опыт учит, что счастье и несчастье всегда идут
рука об руку. Или, как сказал один философ; если мы будем жить
достаточно долго, то все неприятности, которые случайно могут
произойти с нами, обязательно произойдут. Если же этого не слу-
чилось, то это значит, что человек умер слишком рано.
ВЕРА В «СВЕРХЪЕСТЕСТВЕННОЕ»
Концепция вероятности иногда используется для доказатель-
ства существования паранормальных явлений. Причем приводя-
щиеся при этом аргументы выглядят иногда довольно убедительно.
Предположим, мне приснилось, что мой друг погиб в автомобиль-
ной катастрофе, и через несколько дней это действительно проис-
ходит. Является ли это совпадение настолько маловероятным, что
я должен сделать вывод о наличии у меня дара предвидения или
предположить, что это бог решил заранее предупредить меня о
столь печальном событии? По очевидным причинам здесь можно
ответить только «нет». Во-первых, как мы уже имели возможность
убедиться, очень редкие события все же время от времени случа-
ются. Во-вторых, у пас пет надежного способа оценить вероят-
ность того, что сны могут предвосхищать реальные события.
В-третьих, говоря о таких совпадениях, обычно забывают о мно-
жестве противоположных случаев, когда «вещий» сон не сбылся.
В-четвертых, в случаях, когда удастся рассчитать вероятность
8—1778'
113
совпадения случайных событий, величина этой вероятности часто
оказывается гораздо выше, чем мы можем предполагать.
Рассмотрим один из самых популярных среди статистиков при-
меров. Предположим, что имеется группа, состоящая из 25 че-
ловек. Как вы думаете, какова вероятность того, что у двух чело-
век из этой группы совпадает день рождения? Один шанс на 25?
Один шанс на 10 000? Я привел здесь ответы двух моих знакомых,
которым я задал этот вопрос перед тем как написать данное
предложение. В действительности эти шансы несколько выше, чем
50 : 50. В табл. 5.2 приводятся соответствующие значения вероят-
ностей для различных по численности групп людей (/? — число лю-
дей в группе). Расчет этих значений основан на правиле сложения
вероятностей. Возможно, полученный при этом результат удивил
и поразил вас, но в нем нет ничего сверхъестественного, и я по-
стараюсь вам с помощью маленького примера это сейчас показать
(для больших групп соответствующие расчеты будут выглядеть
слишком громоздкими). Рассмотрим случай с группой в 5 человек
и выберем из этой группы одного. Если не принимать во вни-
мание, что кто-то из этих людей мог родиться в високосном году
Таблица 5.2
Вероятность того, что, по крайней мере,
у двух человек в группе совпадет день рождения
п р i п р
2 0,0027 25 0,57
3 0,0082 30 0,71
4 0,0165 35 0.-81
5 0,0275 40 0,89
10 0, 12 50 0,97
15 0,25 60 0,99
20 0,41
29 февраля, то вероятность того, что у кого-то из оставшихся че-
тырех человек день рождения совпадет с днем рождения выбран-
ного нами человека, равна: 1/365+1/365+1/365+1/365 = 0,0027+
+ 0,0027 + 0,0027 + 0,0027 = 0,0110. Выберем теперь одного, человека
из этой четверки и определим вероятность того, что у одного из ос-
тавшихся трех человек день рождения приходится па то же чис-
ло, что и у пего. Мы рассматриваем теперь только четырех че-
ловек, поскольку в предыдущих вычислениях все соответствующие
значения, относящиеся к первому выделенному нами человеку,
были учтены. Кроме того, нам уже не нужно уиитывать и день
рождения второго человека, поэтому вероятность того, что у од-
ного из оставшихся 3 человек день рождения придется па то же
число, что и у второго из выделенных нами, будет равна: 1/364 +
+ 1/364+1/364 = 0,0082. Выберем теперь третьего человека и, ис-
ключив еще один день рождения из общего числа дней в году,
114
определим значение вероятности очередного совпадения: 1/363 +
+ 1/363=0,0055. Наконец, перейдем к четвертому и пятому членам
пашей группы. Вероятность совпадения их дней рождения равна:
1/362 = 0,0028. Сложив теперь все значения вероятностей, получим:
0,0110 + 0,0082 + 0,0055 + 0,0028 = 0,0275; этот результат приведен в
таблице.
Статистика дегустации пива. Краскал, статистик из Чикаг-
ского университета, описал один случай, представляющий нам
возможность проанализировать небольшую, но интересную голо-
воломку. В примере рассматривается рекламное сообщение компа-
нии «.киллер Брюинг», состоявшее примерно в- следующем: «Мно-
гие «эксперты по пиву» не справились с тестом па определение
вкусовых качеств пива марки «Миллер хай лайф». Каждому из
«экспертов» было предложено попробовать пива этой марки из
трех стаканов. В одном из стаканов содержалось пиво, налитое
из бутылки, во втором — из бочки, а в третьем — баночное пиво.
«Эксперты» должны были определить, откуда было налито пиво
в каждый стакан. И ни один из них с поставленной задачей не
справился. Причина: содержимое всех трех стаканов имело вкус
знаменитого «Миллер хай л’айф»» [12, гл. 11].
Очевидно, что с помощью данной рекламы компания хотела
подчеркнуть, что способ храпения выпускаемого ею пива не вли-
яет на вкусовые качества напитка. Однако интересно, что чем
больше будет собрано материала, подтверждающего неспособность
любителей пива справиться с подобным тестом, тем определенней
можно утверждать, что данное утверждение ошибочно.
Рассмотрим ситуацию более внимательно. Имеется только 6
способов разлива различных сортов пива по 3 стаканам:
Стакан .1 Сгакан К Стакан С
ИЗ бочки ИЗ банки ИЗ бутылки
из бочки из бутылки ИЗ банки
из бутылки из банки из бочки
из бутылки из бочки из банки
из банки из бочки из бутылки
из банки из бутылки из бочки
Приведенный список определяет также 6 способов идентификации
экспертом содержимого-трех стаканов. Необходимо усвоить, что
даже если эксперт не может уловить никакой разницы между раз-
личными сортами пива данной марки, оп все же в Ve всех рас-
смотренных ситуаций случайным образом окажется прав. В ос-
тальных же ситуациях его ответы будут ошибочными.
Теперь, чтобы определить вероятность того, что эксперт 1
и эксперт 2, и эксперт 3, и, ..., и эксперт п ошибутся, можно
воспользоваться правилом умножения вероятностей. Эта вероят-
ность равна:
5/6 X 5/6 X 5/6 X ... X 5/6.
Далее приводятся значения вероятностей для групп, состоящих
из различного числа экспертов:
8:
115
1 5/6 = 0,83,
2 5/6 X 5/6 = 0,69,
5 5/6 X 5/6 и т. д. = 0,39,
10 5/6 X 5/6 и т.д. = 0,16,
20 5/6 X 5/6 и т. д. = 0,02,
30 5/6 X 5/6 и т. д. = 0,004.
Если вы еще раз внимательно познакомитесь с приведенной
выше рекламой, то обратите внимание на то, что в ней опущена
одна существенная деталь — точное число «экспертов», не спра-
вившихся с тестом. Если их было 5 или даже 10, то в полученных
результатах нет ничего уж слишком удивительного. Вероятность
того, что все 5 экспертов ошибутся, равна 39/100; для группы
в 10 человек соответствующее значение вероятности составляет
16/100. Если бы экспертов было 20 или 30, то очень маловероятно,
что все они будут ошибаться (соответствующие значения вероят-
ностей равны 2/100 и 4/1000).
Каков же вывод из сказанного? Он состоит в том, что в дейст-
вительности «эксперты» могли различить сорта пива марки «Мил-
лер хай лайф», однако почему-то этого не сделали. Объяснение
здесь может быть следующим. Если, например, эксперты улавли-
вают различия в сортах, однако бочковое пиво принимают за ба-
ночное, а баночное — за бочковое, то во всех случаях их ответы
будут ошибочными, поскольку, пробуя баночное пиво, они будут
уверены, что пьют бочковое, и наоборот.
Надеюсь, вы обратили внимание, что объяснение приведенно-
го примера фактически свелось к проверке нулевой гипотезы.
Мы спросили: если эксперты не могут отличить один сорт пива от
другого, то какова вероятность того, что все они не справятся
с соответствующшм тестом? Было показано, что для группы экспер-
тов в 20 человек и более величина этой вероятности очень мала.
Таким образом, при «=20 мы должны отвергнуть нулевую гипоте-
зу при уровне значимости 0,02, а при « = 30— при уровне значи-
мости 0,004, Вся ирония ситуации состоит в том, что нулевая ги-
потеза отвергается на базе накопления данных, которые, взятые
по отдельности, свидетельствовали в пользу принятия этой гипо-
тезы.
ОДНА НА БИЛЛИОН
М. Дж Морони [11] начинает обсуждение правила умножения
вероятностей так. Сейчас мы докажем, к немалому удовлетворе-
нию представительниц прекрасного пола, что каждая женщина яв-
ляется уникальной. Надеюсь, мужчины будут также довольны, по-
лучив в свое распоряжение научное доказательство для «борода-
того» комплимента. («Статистика говорит, моя дорогая, что такая,
как ты, всего одна на миллиард».) Читателю станет очевидно,
116
что чем более привередливыми будем мы в наших требованиях,
тем меньше вероятность того, что мы сможем их удовлетворить.
Рассмотрим пример с мужчиной, который хочет, чтобы молодая
леди обладала целым рядом достоинств, имеющих самую разно-
образную природу. Предположим, в число его требований вхо-
дят [здесь я отступаю от перечня достоинств, приведенного Моро-
ни, которые, как он считает, европейский джентльмен желает ви-
деть в своей избраннице]: искушенность в житейских делах, кули-
нарный талант, редкая красота и [вновь возвращаясь к Морони]
первоклассное знание статистики. Какова вероятность того, что
первая встреченная им па улице девушка заставит его призаду-
маться о женитьбе? Чтобы определить эту вероятность, мы долж-
ны знать значения вероятностей каждого из отмеченных досто-
инств в отдельности. Допустим, эти значения известны и равны:
вероятность искушенности в житейских делах 0,01
вероятность кулинарного таланта 0,01
вероятность редкой красоты 0,001
вероятность первоклассного знания статистики 0,00001
Перемножив между собой значения вероятностей, получим...
вероятность того, что первая встреченная им' на улице девуш-
ка... будет удовлетворять всем его требованиям, равна: р=
= 0,000000000001, или одна на биллион (в британской системе)*.
Вывод, который можно сделать из полученного результата, со-
стоит в том, что каждый человек при сопоставлении его качеств
с качествами, которыми обладают другие люди, представляет со-
бой неповторимую индивидуальность.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
Законы случайностей применяются к совокупностям случайных
событий. Концепция вероятности находит применение при исследо-
вании многих статистических вопросов. Мы уже неоднократно
* Между наименованиями чисел, превышающих 1000 000, в американской
и британской системах исчисления имеются существенные различия. Далее при-
водится сопоставление некоторых соответствующих друг другу наименований.
Наименования чисел более высокого порядка можно найти во многих толковых
словарях в статье, озаглавленной «Число».
Число Американская система Британская система
1 000 000 Миллион Миллиом
1 000 000 000 Биллион Миллиард
1 (12 нулей) Триллион Биллион
1 (15 нулей) Квадрильон Тысяча биллио-
ИОВ
1 (18 нулей) Квинтильон Триллион
(В русской системе исчисления приняты следующие наименования больших чи-
сел (в порядке возрастания): миллион, миллиард, триллион, квадрильон, квин-
тильон. — Примеч. пер).
117
сталкивались с этим понятием и будем постоянно иметь с ним
дело и в дальнейшем, особенно при рассмотрении выборочного ме-
тода. Случайная выборка представляет собой выборку, при кото-
рой каждый отдельный элемент совокупности и каждая комбина-
ция таких отдельных элементов имеют одинаковые шансы попасть
в осуществляемую выборку. Вторую часть этого определения, в ко-
торой речь идет о комбинациях отдельных элементов, попадающих
в выборку, можно сформулировать и по-другому, сказав, что от-
бор одного элемента не оказывает влияния на вероятность отбора
любого другого элемента совокупности, из которой осуществляет-
ся выборка. Другими словами, при случайном отборе отдельные
элементы выборки не зависят друг от друга. Идея независимости
является центральной для понимания принципов вероятности.
Вероятность. Числовое значение, получаемое при делении ко-
личества способов, которыми может быть получен данный резуль-
тат, на общее число всех возможных исходов.
Дихотомическое событие. Событие с двумя возможными исхо-
дами. Примером такого события является подбрасывание монеты.
При падении монеты возможно только два исхода: выпадение орла
или выпадение решки.
Случайное событие. Одно событие из некоторой совокупности
событий, имеющее такую же вероятность реализации, как и любое
другое событие, принадлежащее данной совокупности. Можно по-
дойти к определению этого понятия и с другой стороны: случайное
событие — это событие, являющееся результатом воздействия мно-
жества независимых причин.
Правило сложения вероятностей. Вероятность осуществления
какого-либо одного (любого) события из некоторой совокупности
несовместных друг с другом событий равна сумме индивидуальных
вероятностей реализации этих событий. Несовместными называ-
ются такие события, которые могут осуществляться только пооди-
ночке: монета не может упасть одновременно и лицевой, и оборот-
ной стороной вверх; сумма очков, выпавших на .двух костях, не
может одновременно равняться 7 и И и т. д. Сумма индивидуаль-
ных вероятностей всех возможных исходов всегда равна 1,0.
Правило умножения вероятностей. Вероятность осуществле-
ния заданного числа случайных событий равна произведению ин-
дивидуальных вероятностей этих событий. Если вероятность
того, что вы прочтете это предложение в четверг, равна ’/7, а ве-
роятность того, что любой день недели может оказаться пасмур-
ным и дождливым, равна !/3, то вероятность того, что вы прочтете
данное предложение после дождичка в четверг, равна 1/?Х1/5 =
==1/зг. = 0,03 (приблизительно).
Треугольник Паскаля. Числовая диаграмма для дихотомиче-
ских событий, характеризующая число сочетаний среди всех воз-
можных сочетаний, в которых может встретиться тот или иной
результат. Ниже приводится часть такого треугольника. Числа,
образующие треугольник, указывают количество сочетаний, в ко-
торых может встретиться тот или иной результат. В треугольни-
118
ке представлены соответствующие значения только для 1, 2 и 3
дихотомических событий:
1 1
12 1
13 3 1
В качестве таких событий можно рассматривать, например, выпа-
дение орла или решки при подбрасывании монеты. Так, при под-
брасывании двух монет возможно четыре (1+2+1) исхода. В двух
из, этих исходов будет получено по одной решке и одному орлу
(НТ и TH). Следовательно, вероятность того, что при подбрасы-
вании двух монет выпадет одна решка, равна: 2:4 = 0,50.
р— вероятность осуществления некоторого интересующего нас
события;
q — вероятность того, что данное интересующее нас событие
не осуществится: q 1 — р;
« — общее число всех.возможных событий.
Закон больших чисел. При стремлении п к бесконечности раз-
личие между фактически полученным и теоретическим значения-
ми р стремится к нулю. Позднее аналогичная идея будет рассмот-
рена при знакомстве с выборочным методом: чем больше объем
выборки, тем лучше полученное значение статистики будет харак-
теризовать соответствующий параметр исходной совокупности.
Самообман азартного игрока.' Непонимание того фактора, что -
случайные события являются независимыми; ошибочное предполо- ;
жение, что длинная серия случайных событий, имеющих одинако-
вую природу, увеличивает вероятность альтернативного исхода.
Примером здесь может служить широко распространенная вера
в «закон средних».
«Теория полос». Также связана с непониманием независимо-
сти последовательности случайных событий; ошибочная уверен-
ность в том, что длинная серия случайных событий, имеющих оди- .
наковый характер, скорее всего, будет продолжаться и в дальней-
шем.
6
НОРМАЛЬНАЯ КРИВАЯ
Для того чтобы от распределений случайных событий перей-
ти к кривой нормального распределения, нужно сделать лишь один
маленький шаг. Нормальная кривая фактически представляет со-
бой частотное распределение случайных событий, когда число
их очень велико. Нормальная кривая применяется для отражения
множества явлений природы, начиная от размеров листьев на
дереве и кончая коэффициентами умственного развития (коэффи-
циентами IQ) людей. Связь с распределениями случайных событий
означает, что величина соответствующих значений подобных яв-
лений определяется, как и для случайных событий, воздействием
многих независимых причин.
Необходимо также иметь в виду следующее. Показатели, о
которых шла речь в предыдущем абзаце (размер листьев, значе-
ния коэффициента IQ), являются непрерывными. Это означает,
что различия между отдельными значениями этих показателей мо-
гут быть сколь угодно малыми (пределом здесь будет степень
точности нашего измерительного инструмента). Совершенно дру-
гое мы наблюдаем при случайных событиях. Так, при подбрасыва-
нии монет полученные результаты всегда выражаются с помощью
целых чисел — столько-то орлов, столько-то решек, но никогда
не используются дробные показатели. Однако лист, например, мо-
жет иметь площадь 12,7001 или 13,161942 квадратных санти-
метра (впрочем, точность измерения здесь может быть увеличена).
Главный вывод, который можно сделать, состоит в том, что кри-
вая нормального распределения применяется для отражения не-
прерывных характеристик, в то время как при рассмотрении рас-
пределения случайных событий имеют дело с дискретными (пре-
рывными) характеристиками и дискретными событиями.
СКУЧЕННОСТЬ И РАЗБРОС
Прежде чем приступить к обсуждению основных особенностей
нормальной кривой, рассмотрим вначале некоторые важные ста-
тистические понятия, без которых невозможно обойтись при ра-
боте с частотными распределениями. Из гл. 3 нам известно, что
120
если изобразить частотное распределение графически, то,' как
правило, лишь в одной части графика будет наблюдаться концент-
рация значений, принадлежащих данному распределению. Этот
факт и определяет круг вопросов, с обсуждения которых мы и нач-
нем изложение материала настоящей главы. Сейчас будут рассмот-
рены показатели, характеризующие скученность и разброс наблю-
дений в ряду распределения: различные типы средних и диспер-
сия.
СРЕДНИЕ
Представленное на рис. 6.1 распределение 101 значения го-
дового дохода построено на основании фактических данных, взя-
тых на конец 70-х годов. На рисунке изображены также и сами
фактические значения, что поможет лучше понять смысл трех раз-
g
i
15
8,,’
8,6
10
"2,9
2,8
2,7
_ 2’6
_ 2-4
2,3
_ 2.2
_ 2,0
1,7
~ ?.6
5,5
5,1
4,6
4,4
4,0
4,0
3,7
3,4
3,1
11,7
'iM
M = 12,475 = ^7 2 475
Медиана = 10,5 = $ю 500
5 = 8,78715 =$87*7,15
7,9
•7,6
7,2
7,0
6,9
6,5
6,3
6,2
11,0
11,0
10,9
10,9 14,9
10,7 14,7-
14,5
10,3
10,0
10,0
9,9
14,5
14 0
13,6
13,2
17,9
!7,4\
17,0 \
21,0.
20,0
19,0 24,0'
’6,6
13,2
3,1
15,0
18,0 22,0 26,0 28,5 32,C 35,0 37,5 40,0 4^0
0-3 3-6 6-9 9-12 12-15 15-18 18-21 21-24 24-2727-3030-33 33-36 36-3939-42 42-45
Родадой dozed (тыс. долл.)
5
,3
9 5
Рис. 6.1. Приблизительное распределение доходов. Отметим несколько моментов.
Приведенное распределение асимметрично. В результате величина средней
превосходит значение медианы. Хотя'здесь и рассчитано стандартное отклонение
распределения, в дальнейшем вы узнаете, что S не является особенно полезным
показателем в случае асимметричных распределений. Тогда можно вернуться
к рассмотрению данного графика, чтобы еще раз убедиться в этом. Необходимо
иметь в виду, что значения величины дохода разделены на 1000, что привело к
уменьшению показателей Л1 и S в то же число раз
личных типов средних: моды (наиболее часто встречающегося зна-
чения), медианы (срединного значения) и средней арифметической
(показателя, который чаще всего имеется в виду, когда говорят
о средних).
Мода. Мода представляет собой наиболее часто встречающе-
еся значение распределения. Так, на рис. 6.1 мода расположена
121
в интервале уровня дохода 9000—12 000 дол. Однако если при
построении графика использовать более дробную интервальную
разбивку, то значение моды окажется равным 26 000 дол. Дело
в том, что в имеющихся данных представлены три таких наблюде-
ния, в то время как любое другое значение уровня дохода встре-
чается не более двух раз. Отсюда сразу же можно сделать вывод
о том, что мода не является очень хорошей характеристикой цент-
ральной тенденции, присущей наблюдениям ряда распределения.
Случайная концентрация значений па одном из «второстепенных»
участков распределения может существенно исказить действитель-
ный характер центральной тенденции наблюдений, принадлежащих
рассматриваемой совокупности данных.
Однако в ряде случаев мода дает довольно точную характе-
ристику рассматриваемому явлению. В качестве иллюстрации
можно привести получивший широкую известность пример с дан-
ными о частоте, с какой погибали кавалеристы от удара копытом
лошади. Соответствующие данные имеются за 20 лет по 10 кава-
лерийским полкам — итого 200 наблюдений (табл. 6.1). Оче-
видно, что равное нулю смертей модальное значение очень хо-
рошо характеризует скученность рассматриваемых данных. Также
хорошо показатель моды описывает типичную реакцию водителей
на сигнал светофора о прекращении движения (см. гл. 3, с. 59).
Медиана и перцентили. Ме-
диана представляет собой сре-
динное наблюдение в ряду рас-
пределения. Так, в примере с
данными о годовом доходе ме-
диана приходится на значение
пятьдесят первого наблюдения,
считая от начала или конца ряда
распределения (см. рис. 6.1), по-
скольку в этом ряду насчиты-
вается всего 101 наблюдение. Та-
ким образом, 50 значений уров-
ня дохода превосходят величи-
ну пятьдесят первого наблюдения
и 50 значений уровня дохода ока-
залось меньше этой величины.
Следовательно, медиана равна
10,5 тыс. дол.
Т а б л и ц а 6.1
Число погибших кавалеристов от
удара копытом лошади
Число погибших Число дет
0 109
1 65
9 22
3 3
4 1
5 (и более) 0
Итого 200
То же самое можно выразить и по-другому, сказав, что медиа-
на является пятидесятым перцентилем. Перцентиль представляет
собой процент наблюдений, значения которых равны данному на-
блюдению или меньше него. Руководствуясь этим определением,
можно указать значения уровней дохода, соответствующие другим
перцентилям. Возьмем для примера 65-й перцентиль. Поскольку
в рассматриваемой совокупности насчитывается 101 наблюдение,
то теоретически 65-му перцентилю соответствует 65,65-е значение
уровня дохода (101X0,65 = 65,65). Однако такого наблюдения в
122
рассматриваемом распределении, естественно, нет. С этой пробле-
мой довольно часто сталкиваются при расчете перцентилей. По-
этому условились, что в подобных случаях величина перцентиля
должна определяться пропорционально к расстоянию между со-
ответствующими наблюдениями. В нашем случае величина 65-го
перцентиля, таким образом, будет равна 0,65 от расстояния между
65-м и 66-м наблюдениями, которым соответствуют значения уров-
ня дохода 13 400 и 13 600 дол. Следовательно, 65-й перцентиль ра-
вен 13 530 дол.
Обратная задача будет состоять в отыскании перцентильного
ранга данного наблюдения. Так, попытаемся определить перцен-
тильный ранг дохода в 4400 дол. Подсчитав количество наблю-
дений, которые по своей величине не превосходят 4400 дол., мы
обнаружим, что из 101 наблюдения удовлетворяют сформулиро-
ванному нами критерию только 17. Таким образом, перцентиль-
ный ранг уровня дохода в 4400 дол. равен 16,8 (17: 10Г-=0,168Х
X 100= 16,8). Графический способ работы с перцентилями описы-
вается в приложении (см. с. 241).
Перцентили принадлежат к семейству показателей, к числу
которых относятся также децили, квинтили и квартили. Децили
делят распределение на 10 частей, квинтили — на пять, кварти-
ли--на четыре. На рис. 6.1 первый дециль (10-й перцентиль)
находится между десятым и одиннадцатым уровнями дохода (2900
и 3100 дол.); второй дециль — между двадцатым и двадцать пер-
вым уровнем дохода (5100 и 5500 дол.). Второй дециль (20-й
перцентиль) является также и первым квинтилем. Поскольку квар-
тили делят распределение на четыре части, первый квартиль (25-й
перцентиль) па рис. 6.1 попадает в интервал между уровнями
дохода в 6200 и 6300 дол. Третий квартиль (75-й перцентиль)
находится между уровнями дохода в 16 500 и 16 600 дол.
Средняя арифметическая. Следует запомнить, что при расчете
средней арифметической вначале осуществляется сложение всех
значений, усреднение которых мы собираемся произвести, а затем
полученная сумма делится на общее количество этих значений.
Проделаем эти операции для данных, представленных на рис. 6.1:
1,6+1,7 + 2,0 + ...+ 40,0 + 45,0=12 600: 101 = 12,475, или 12 475 дол.
Как видите, получилось довольно громоздкое выражение. Однако
то же самое может быть выражено посредством всего лишь не-
скольких математических символов!
Латинской буквой X принято обозначать отдельное наблюде-
ние. Аналогично с помощью греческой прописной буквы «сигма»
(S) обозначается процесс суммирования. Латинской прописной
буквой N обозначается общее число наблюдений. Воспользовав-
шись символической формой записи, можно представить процесс
нахождения средней арифметической (А4) в такой форме:
м = 2Л
N
Это маленькое уравнение показывает, что для нахождения сред-
ней арифметической (Л4) необходимо осуществить процедуру сум-
123
мирования (S) всех имеющихся значений (X) и разделить полу-^
ченпый результат на общее число наблюдений (N). Подставим’
в эту формулу соответствующие значения из нашего примера:
М = 12 600 = ] 2 475 = j 2 475 дул
101
Как видим, полученное значение оказалось существенно боль-
ше значения медианы, равного 10 500 дол. Подобные расхождения
типичны для асимметричных распределений. Наиболее высокие
значения годового дохода, расположенные в вытянувшемся вправо
хвосте распределения, привели к смещению показателя средней
арифметической вверх. Правосторонняя асимметрия рассматри-
вающегося распределения явилась причиной того, что значение
средней арифметической оказалось почти на 2000 дол. больше
значения медианы (12 475—10500=1975). Если бы распределение
имело левостороннюю асимметрию (хвост распределения вытянут
в сторону, где расположены более низкие значения); то величина
средней арифметической была бы меньше значения медианы.
Что означает значение средней арифметической. Предполо-
жим, что в нашем распоряжении имеется информация о 100 семьях
и что распределение числа детей, имеющихся в каждой семье, .
представлено в первых двух столбцах табл. 6.2. Шесть семей детей
не имеют; в девяти семьях имеется по 1 ребенку; в шестнадцати —
по 2 и т. д. вплоть до единственной семьи, в которой насчитыва-
ется 12 детей. Предположим теперь, что вы как человек, занимаю-
щийся вопросами планирования семьи в общенациональном мас-
штабе, решили, что семьи с небольшим числом детей обязаны
помогать многодетным семьям.
Таблица 6.2
Сумма отклонений от средней равна нулю
Число детей, X Число семей, f Число детей X X число семей, f.Y d (X — М) fd
0 6 0 —4,33 -25,98
1 9 9 —3,33 —29,97
2 16 32 —2,33 —37,28
3 14 42 -1,33 —18,62
4 13 52 —0,33 — 4,29
5 11 55 --0,67 + 7,37
6 9 ' 54 --1,67 + 15,03
7 7 49 --2,67 —18,69
8 о 40 --3,67 --18,35
9 4 36 --4,67 --18,68
10 3 30 —5,67 +17,0!
11 2 22 -6,67 + 13,34
12 1 12 —7,67 — 7,67
Итого 100 433 0,00
124
Вы считаете, что для достижения этой цели будет справедли-
вым, если небольшие семьи за каждого ребенка, которого им-
не хватает до среднего"для данной совокупности числа детей
в семье, будут выплачивать государству в виде специального на-
лога по 1 дол. В свою очередь большие семьи будут получать от
государства в виде пособия по 1 дол. за каждого ребенка сверх
среднего числа детей в семье.
Средняя арифметическая данного распределения равна 4,33
ребенка в одной семье'*. Таким образом, шесть бездетных семей
должны будут уплатить по 4,33 дол., поскольку до среднего числа
детей в семье им не хватает 4,33 ребенка. В сумме это составит
25,98 дол. Каждая из девяти семей, в которых имеется по 1 ре-
бенку (на 3,33 меньше среднего значения), уплатит по 3,33 дол.,
и, следовательно, эти девять семей вместе уплатят 29,97 дол. Об-
ратимся теперь к противоположному концу распределения, к семь-
ям, которые будут получать денежные пособия. Так, семья с
12 детьми (что на 7,67 больше среднего значения) . получит
7,67 дол., а две семьи, имеющие по 11 детей, получат по 6,67 дол.,
что в сумме составит 13,34 дол.
Теперь посмотрим, каким образом работает наша программа
перераспределения доходов. Необходимые для этого значения при-
водятся в последнем столбце таблицы. У шести бездетных семей
мы изъяли 25,98 дол. Из этой суммы мы можем выплатить
7,67 дол., причитающихся семье, имеющей 12 детей, и 13,34 дол.
двум семьям, имеющим по 11 детей, после чего у пас останется
4,97 дол.:
25,98 дол. — 7,67 дол. — 13,34 дол. = 4,97 дол.
Однако этой суммы не хватит для выплаты 17,01 дол., при-
читающихся семьям, имеющим по 10 детей, поэтому мы должны
добавить к ней 29,97 дол., уплаченных девятью семьями, в кото-
рых имеется по 1 ребенку, в результате чего получим:
4,97 дол. + 29,97 дол. = 34,94 дол.
Из этой суммы выплатим 17,01 дол. и у нас останется 17,93 дол.
Но этого будет недостаточно для выплаты 18,68 дол. семьям,
имеющим по 9 детей. Тогда мы добавим 37,28 дол., уплаченных
16 семьями, в которых имеется по 2 ребенка, и на мгновение пре-
вратимся в настоящих богачей:
17,93 дол. + 37,28 дол. = 55,21 дол.
Обладая этой суммой, можно выплатить семьям с "9 детьми
18,68 дол., а семьям с 8 детьми— 18,35 дол.:
55,2ф дол. — 18,68 дол. — 18,35 дол. = 18,18 дол.
* Поскольку представленные в таблице данные являются сгруппированны-
ми, расчет средней можно произвести с помощью упрощенной формулы /И =
= Х/А’/Л'==433/100= 4,33. В приложении этот пример рассматривается более де-
тально. Однако пользоваться этой формулой вовсе не обязательно.
Однако нам требуется 18,69 дол., чтобы выплатить пособия семьям,
имеющим по 7 детей. Для этого нам понадобятся деньги семей,
у которых имеется по 3 ребенка:
18,18 дол. + 18,62 дол. = 36,80 дол.
Теперь мы в состоянии выплатить пособия семьям с 7 и 6 детьми:
36,80 дол. — 18,69 дол. — 15,03 дол. — 3,08 дол.,
а собрав налог с семей с 4 детьми (4,29 дол.), будем иметь:
3,08 дол. 4- 4,29 дол. -= 7,37 дол.,
этого как раз хватит, чтобы выплатить пособие семьям с 5 детьми.
Проделанное нами небольшое, по довольно скучное упражнение
позволяет сформулировать одно из важнейших свойств средней
арифметической: средняя арифметическая является той точкой в
распределении, сумма отклонений от которой равна нулю. Други-
ми словами, если по отдельности сложить все представленные в
таблице отрицательные и положительные отклонения, то в резуль-
тате будут получены два одинаковых по абсолютной величине зна-
чения (—116,14 и +116,14), сумма которых равна нулю.
Средняя арифметическая — это единственная точка в распре-
делении, для которой справедливо сформулированное выше ут-
верждение. Покажем это с помощью следующего упрощенного
примера. Рассмотрим числа 1, 2, 3, 4, 5. Их сумма равна 15,0,
а средняя 3,0. В верхней части табл. 6.3 приведены значения
отклонений и суммы отклонений для каждой точки, представлен-
ной в данном распределении. Итоговый показатель равен нулю
только в случае суммирования отклонений от значения средней.
С помощью этого простого примера может быть продемонстриро-
Т а б л и ц а 6.3
Суммы отклонений и квадраты отклонений
Числа, X Отклонения от X Итого
X- 1 X — 2 X - 3 - ЛП Л —4 X - 5
1 0 —1 —2 —3 —4 • —10
2 -i-1 0 —1 •2 —3 — 5
3 „с 2 +1 0 — 1 —2 0
4 +3 +2 +1 0 —1 + 5
'5 + 4 +3 4-2 •н 0 -рю
Итого + 10 +5 0 —5 — 10
Квадраты отклонений от 1: 0 + 1 - -4 + 9+16 = 30
Квадраты отклонений от 2: 1+0+1+4+9=15 /
Квадраты отклонений от 3: 4+ 1 - 1-0 + 1+4=10
Квадраты отклонений от 4: 9 + 4+1 + 0+1 = 11
Квадраты отклонений от 5: 16+9+4 + 1+0=1 ю
126
вано еще одно очень важное свойство средней арифметической,
имеющее большое значение для изложения последующего материа-
ла. Средняя арифметическая является той точкой в распределе-
нии, сумма квадратов отклонений (d2) от которой минимальна.
В нижней части табл. 6.3 приведены суммы квадратов отклонений
для чисел 1, 2, 3, 4, 5.
ПОКАЗАТЕЛИ ВАРИАЦИИ
, В табл. 6.4 приводятся имена олимпийских чемпионов в беге
на 100 м, а также время их побёдных результатов (в секундах).
При знакомстве с этими результатами можно заметить, что они
не очень отличаются друг от друга. Соответствующий расчет по-
кажет, что их средняя арифметическая равна 10,6 с, причем сре-
ди них пет результатов больше 12,0 с и меньше 9,9 с — олимпий-
ского рекорда.
Разброс значений времени от 9,9 до 12,0 с называется диапа-
зоном вариации (вариационным размахом) результатов.' Данная
характеристика является одним . из показателей вариации зна-
чений рассматриваемого распределения. Правда, этот показатель
несет в себе мало содержательной информации, поскольку его ве-
личина полностью определяется индивидуальными значениями
двух наблюдений, расположенных в противоположных концах рас-
пределения. Так, в нашем примере максимальный результат, рав-
ный 12,0 с, довольно существенно отличается от основной массы
Таблица 6.4
Результаты олимпийских чемпионов на дистанции 100 м
Год Победитель Время, с
1806 Томас Бэрк (США) 12,0
» 1900 Фрэнсис Джервис (США) 10,8
1904 Арчи Хан (США) 11,0
1906 Арчи Хан 4США) 11,2
1908 Реджинальд Уолкер (Южная Африка) 10,8
1912 Ральф Крейг (США) 10,8
1920 Чарльз Пэддок (США) 10,8
1924 Харольд Абрахамс (Великобритания) 10,6
1928 Перси Уильямс (Канада) 10,8
1932 Эдди Тоулэн (США) 10,3
1936 Джесси Оуэнс (США) 10,3
1948 Харрисон Диллард (США) 10,3
1952 Лнидц Рсмиджино (США) 10,4
1956 Бобби Морроу (США) 10,5
1960 Армин Хари (ФРГ) 10,2
1964 Боб Хейес (США) 10,0
1968 Джим Хайнс (США) 9,9
1972 Валерий Борзов (СССР) 10,1
1976 Хазли Кроуфорд (Тринидад) 10,6
127
наблюдений (следующий за ним результат равен 11,2 с), поэтому
вариационный размах в данном случае нельзя рассматривать в ка-
честве достаточно репрезентативного показателя вариации резуль-
татов, показанных на стометровке. Здесь нужен более адекватный
показатель. Чтобы отыскать его, расположим данные в порядке
возрастания и определим некоторые их характеристики (табл. 6.5).
Во втором столбце табл. 6.5 приводятся значения разностей
(d) между каждым результатом и средним временем, равным
10,6 с. Показатель d может быть выражен с помощью рапсе вве-
денных нами символов: d=X — М.
Таблица 6.5
Отклонения и квадраты отклонений от средней арифметической
Время, с d d2 I Время, с d d*
9,9 —0,7 0,49 10,8 +0,2 0,04
10,0 -0,6 0,36 10,8 +0,2 .0,04
10,1 -0,5 0,25 10,8 0,2 0,04
10,2 —0,4 0,16 10,8 +0,2 0,04
10,3 —0,3 0,09 10,8 +0,2 0,04
10,3 —0,3 0,09 11,0 +0,4 0,16
10,3 --0,3 0,09 11,2 +0,6 0,36
10,4 —0,2 0,02 12,0 + 1,4 1,96
10,5 —0,1 0,01
10,6 0 0
10,6 0 0
6,8
Итого (без учета знака) 4,26
Если сложить значения разностей d (отклонений от средней),
не обращая внимания на знак, то их сумма составит 6,8 *, а сред-
нее абсолютное отклонение будет равно 0,36 с (6,8:19 = 0,36).
Этот показатель также может служить характеристикой вариации
значений в распределении, однако с большей пользой он может -
быть использован для расчета более содержательного показателя
вариации, который называется стандартным отклонением1.
Формула для расчета стандартного отклонения (S) выглядит
так**: S = yzd2/N. На всякий случай приведем также ее словес-
* Сумма отклонений с учетом знаков, как вам известно, равна нулю.
1 В советской литературе часто употребляется также термин среднее квад-
ратическое отклонение. — Примеч. пер.
** Замечание. Если вы когда-либо в прошлом знакомились с теоретически-
ми основами статистики, то вам, возможно, попадалась формула для вычисле-
ния S, в которой в делителе вместо N стояло N—1. Подобная формула ис-
пользуется при получении оценки стандартного отклонения исходной (генераль-
ной) совокупности наблюдений. Однако я считаю, что на данном этапе не стоит
чрезмерно усложнять изложение материала. Позднее, когда возникнет необхо-
димость в расчете стандартного отклонения для исходной совокупности, мы вос-
пользуемся формулой с делителем W—1, объяснив предварительно смысл дан-
ного выражения.
128 '
иую формулировку: стандартное отклонение равно корню квад-
ратному из среднего квадрата отклонений от средней арифмети-
ческой. Покажем, как «работает» данная формула, на примере.
В последнем столбце табл. 6.5 приведены квадраты отклонений,
сумма которых (2d2) равна 4,26. Разделив это значение на N= 19,
получим 0,22. Квадратный корень из 0,22 равен 0,47, что и соот-
ветствует величине стандартного отклонения данного распределе-
ния. Таким образом,
S = /4,26/19 = JЛ(/22 = 0,47 с.
Особую важность показателю стандартного отклонения прида-
ет его непосредственная связь с функцией нормального распреде-
ления. Эта связь будет охарактеризована несколько позднее, сей-
час же для пас главным является тот факт, что стандартное от-
клонение представляет собой показатель вариации значений рас-
пределения. Наиболее важное свойство этого показателя состоит
в том, что когда диапазон вариации значений распределения от-
носительно невелик, небольшой будет и величина стандартного
отклонения. При увеличении же разброса наблюдений будет воз-
растать и значение S. Проиллюстрируем это свойство показателя
стандартного отклонения на нескольких примерах.
Вес и объем бюста семнадцати «мисс Америка». Показатели
веса семнадцати девушек, победивших в различные годы на на-
циональных конкурсах красоты, составили: 114, 120, 116, 118,
115, 124, 124, 115, 116, 135, 125, НО, 121, 118, 120, 125 и 119 фун-
тов1 2. Средняя арифметическая этого распределения равна 119,71
фунта,, a S = 5,60 фунта. Далее приводятся показатели объема
бюста тех же девушек, выраженные в дюймах: 34,5; 36; 35; 35;
36; 35; 36; 36; 36; 36; 36,5; 36; 34; 36; 36; 36; 36 и 36. Очевидно,
вариация значений этого распределения меньше, чем в случае со
значениями веса: М = 35,65 дюйма, 5 = 0,66 дюйма2.
Вариация значений коэффициента IQ. Хорошо известно, что
среднее значение коэффициента умственного развития (коэффи-
циента IQ) американцев равно 100. Данный факт не случаен: уче-
ными была проделана существенная работа по «конструированию»
показателя, обладающего именно таким значением средней. Вели-
чина стандартного отклонения зависит отчасти от конкретного ти-
па теста, использованного для определения коэффициента IQ,
а также от возраста людей, подвергающихся обследованию. Од-
нако обычно значение стандартного отклонения этого коэффици-
ента оказывается близким к 15. Это число и будет использоваться
1 1 фунт-453,59 г.; 1 дюйм=2,54 см. — Примеч. пер.
2 С утверждением автора о том, что степень разброса значений, принадле-
жащих качественно различным совокупностям данных, может сравниваться по
величине стандартных отклонений этих совокупностей, согласиться нельзя. До-
статочно изменить масштаб единиц измерения в одной из совокупностей наблю-
дений (например, перейти от дюймов к миллиметрам) и соотношение между
значениями стандартных отклонений этих совокупностей может кардинальным
образом измениться. — Примеч.. пер.
9 I'?*
129
нами при рассмотрении нескольких примеров, приведенных в на-
стоящей главе. Диапазон вариации значений коэффициента IQ
составляет примерно 200 пунктов — от величины, близкой к нулю,
до значения, слегка превосходящего 200.
Возраст президентов. Самым молодым президентом в истории
США был Теодор Рузвельт, вступивший на этот пост в 42 года.
Самому старому президенту, Уильяму Генри Гаррисону, было
68 лет. Средний возраст президента составляет 54,53 года при
стандартном отклонении 5,75 года.
Возможно, этих примеров будет достаточно для подтверждения
высказанного нами раньше утверждения: величина стандартного
отклонения будет больше там, где велик диапазон вариации зна-
чений распределения, и наоборот: в случаях, когда диапазон ва-
риации невелик, величина стандартного отклонения будет ма-
ленькой. Можно также отметить, что если диапазон вариации
значений в двух распределениях примерно одинаков, то будет
примерно одинаковой и величина их стандартных отклонений. Диа-
пазон значений веса семнадцати «мисс Америка» составил 25 фун-
тов (5=5,60). Диапазон значений возраста президентов равен
26 годам (5 = 5,75).
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Если вы помните, в начале данной главы отмечалось, что нор-
мальная кривая представляет собой особый вид частотного рас-
пределения, используемого для характеристики распределений
большого числа непрерывных переменных, которые отражают яв-
ления, имеющие биологическую природу. Для выборочных данных
формула паилучшим образом подобранной нормальной кривой
' выглядит так:
у V
Г = —------е 2 Г Г / .
V2-.S-
Для подавляющего большинства людей данное уравнение мало
что говорит (исключение составляют разве что специалисты-мате-
матики да еще запрограммированные соответствующим образом
ЭВМ). Уж очень оно сложное. Я привел его только для того, что-
бы сделать два важных замечания. Во-первых, как и в случае с
любым другим уравнением, данная зависимость показывает, каким
образом будет изменяться Y при изменении значения X. В нашем
конкретном случае из уравнения следует, что значение У будет
наибольшим при X, равном величине средней арифметической, Л4,
и что при движении вправо или влево от этой точки величина У
будет непрерывно уменьшаться, стремясь к линии основания
графика, но никогда при этом не достигая ее. Во-вторых, если вы
внимательно посмотрите на это уравнение, то заметите, что кон-
кретный вид изменения У при изменении X зависит только от двух
элементов, М и S, значения которых для различных распределе-
ний могут быть различными. Все остальные выражения, присутст-
130
вующие в данном уравнении, или являются постоянными (напри-
мер, л и е), или представляют собой знаки арифметических дей-
ствий (например, У). Это означает, что если нам известны значе-
ния М и S данного нормального распределения, то мы фактически
располагаем о нем всеми необходимыми сведениями.
Чтобы данное утверждение выглядело не таким абстрактным,
предположим, что нам известны значения средней и стандартно-
го отклонения некоторого распределения: Л4 = 4,0 и 5=1,0. Пред-
положим далее, что, располагая этими значениями, мы решили
приведенное выше уравнение для Х=1, 2, 3, 4, 5, 6, 7 и получили
следующие результаты*:
0,004 0,054 0,242 0,399 0,242 0,054 0,004
Чтобы соотнести эти числа с соответствующими характеристи-
ками нормальной кривой, следует уточнить введенное нами в
гл. 2 понятие ординаты. До сих пор под ординатой подразуме-
валась ось Y графика. Теперь мы несколько обобщим концепцию
ординаты п будем считать ординатой расстояние от любой точки
па оси X до соответствующего ей значения У, расположенного на
графике функции. Это расстояние находится путем восстановле-
ния перпендикуляра из данной точки X до пересечения с графиком
функции. Отсюда следует, что в приведенной выше таблице содер-
жатся значения семи ординат. Пронумеровав эти значения в соот-
ветствии с величиной значений X, имеем: У1=0,004; /2=0,054;
...; У7 = 0,004.
Если сказанное кажется вам не очень понятным, обратитесь
к рис. 6.2. На этом рисунке изображено непрерывное нормаль-
ное распределение, причем из соответствующих точек на оси X
восстановлены перпендикуляры, пересекающиеся с представлен-
ной па графике кривой. Отрезок прямой от основания графика
до точки пересечения с нормальной кривой и характеризует ор-
динату точки X. Значения этих ординат также указаны на графи-
ке рядом с соответствующими им прямыми. Уравнение нормаль-
ной кривой позволяет нам определить ординату любой точки X.
Папомним, что функция нормального распределения применяется
для описания данных, имеющих непрерывную природу.
* Как осуществляется расчет. Хотя мы стараемся по возможности обойтись
без использования математических выкладок, в данном случае вычисление зна-
чения Y для X, равного средней, является столь простым, что я привожу его
полностью:
1_/4—4\ 2
V 2^Х12
Поскольку е°— 1, то
Vi- 3,1416.1 1^6,2832
9*
131.
Рис. 6.2. Значения ординат нор-
мальной кривой. Эти значения
получены в результате решения
уравнения нормальной кривой, в
котором показатели Y представ-
ляют собой ординаты, соответст-
вующие выделенным на графике
значениям X
ВЕЛИЧИНА ПЛОЩАДИ ПОД КРИВОЙ
Уравнение нормальной кривой позволяет совершить очень по-
лезную операцию — Определить площадь различных участков рас-
пределения. В результате мы получаем возможность оценивать
величину вероятности реализации тех или иных событий. Чтобы
узнать, как это делается, мы предварительно должны познако-
миться с концепцией Z-оцепок *.
Z-оценки. Формула Z-оценки выглядит так:
S
Смысл этого выражения состоит в следующем: Z-оценка любого
значения распределения показывает, на сколько единиц стандарт-
ных отклонений данное значение больше или меньше средней
арифметической распределения. Обратите внимание, что Z-оценка
может быть рассчитана для каждого значения распределения.
Чтобы глубже понять смысл Z-оценки, обратимся еще раз
к распределению коэффициентов IQ. Это распределение является
нормальным * со средней, равной 100, и стандартным отклонением,
1 В советской статистической литературе чаще употребляется термин нор-
мированное отклонение. — Примеч. пер.
* Это утверждение можно считать верным, если отвлечься от существова-
ния ряда факторов, противодействующих проявлению нормальных свойств дан-
ного распределения: 1) имеется группа умственно отсталых людей, чей низкий
уровень интеллекта может быть обусловлен, например, нервным расстройством,
родовой травмой и т. д. Включение этих людей в рассматриваемую совокупность
ведет к неоправданному увеличению числа низких значений коэффициента IQ;
2) как было показано при рассмотрении закона больших чисел (см. с. НО),
распределение фактических данных может отличаться от теоретически ожидае
мого; 3) поскольку отрицательных значений коэффициента IQ не существует,
распределение не будет иметь асимптотического характера в той части, где
расположены более низкие его значения. Однако всеми этими факторами в силу
ограниченного характера их проявления вполне можно пренебречь. Возможно,
некоторым из вас известно, что стандартное отклонение распределения коэффи-
циентов IQ равно 16. В данной книге, однако, чаще используется соответствую
щее значение, равное 15, поскольку с ним удобнее иметь дело при работе с ко-
эффициентами IQ, кратными 5 или 10, как в случае с данными, представленны-
ми в табл. 6.6.
132
примерно равным 15. Рассмотрим теперь данные, представленные
в табл. 6.6. С помощью этих данных будут подробно охарактеризо-
ваны свойства Z-оценок.
Таблица 6.6
Значения коэффициентов IQ, их Z-оценки и перцентильные ранги
Значения коэффи- циентов IQ Z-оценка Процент людей с более низким значением коэф- фициента IQ Значения коэффи- циентов IQ Z-оценка Процент людей с более низким значением коэф- фициента IQ
55 -3,00 0,1 но +0,67 75
60 —2,67 0,4 115 --1,00 84
70 —2,00 2 120 --1,33 91
80 —1,33 9 130 --2,00 98
85 —1,00 16 140 --2,67 99,6
' 90 —0,67 25 145 --3,00 99,9
100 —0,00 50 •»
1. Возможно, имеет смысл провести расчет одного или двух
значений Z-оценок, чтобы убедиться в том, что вы действительно
поняли, как это делается. В качестве примера рассчитаем значе-
ние Z-оценки, соответствующей коэффициенту IQ, равному 80:
Х — М _ 80— 100
S “ 15
+5
Рис. 6.3. Накопленные зна-
чения процентов площади
под нормальной кривой.
Фактически на данном
графике представлены пер-
центильные ранги из
табл. 6.6, соответствующие
тем или иным значениям
Z-оценок. Если бы вы по-
.пытались построить график
по числам, представленным
в последнем столбце
табл. 6.6 (начиная с самого
верхнего), считая, что со-
держащиеся в этом столбце
значения являются функци-
ей Z-оценок, то получили
__ бы точно такой же график
Полученный результат, а также значения, приведенные в таблице,
свидетельствуют о том, что коэффициентам, величина которых
меньше средней арифметической, соответствуют отрицательные
Z-оценки. И наоборот, коэффициентам, величина которых превы-
шает значение средней, соответствуют положительные Z-оценки.
133
2. Воспользуемся таблицей для того, чтобы выразить Z-оценки
в терминах, имеющих более содержательный смысл. Так, /-оцен-
ка, равная —0,67, означает, что соответствующее ей значение ко-
эффициента IQ на 0,67 стандартного отклонения меньше средней
арифметической. Коэффициент IQ, равный 130, на два стандарт-
ных отклонения больше средней (2=+2,0). Коэффициент IQ, рав-
ный 80 (расчет Z-оценки которого был только что воспроизведен),
на 1,33 стандартного отклонения меньше средней и т. д.
Рис. 6.4. Проценты площади каждого из двух хвостов нормального распределения
3. Было бы полезно выделить взаимосвязь между табличными
значениями Z-оценок и перцентилями. На рис. 6.3 эта взаимосвязь
представлена графически. По оси X графика отложены Z-оценки
представленных в таблице коэффициентов IQ по оси У— показа-
тели из третьего столбца таблицы, показывающие, какой процент
населения имеет коэффициент IQ ниже соответствующего таблич-
ного значения.
На рис. 6.4 показано, какая связь существует между соответ-
ствующими друг другу равными по абсолютной величине значе-
ниями Z-оценок. Для этой цели площадь распределения разбита
на отдельные симметричные по отношению к центральной оси гра-
фика участки.
Рис. 6.5 характеризует нормальное распределение несколько
по-другому. На этот раз на рисунке показано, какой процент на-
блюдений нормального распределения (характеризуемый пло-
щадью соответствующего участка графика) расположен между
симметрично расположенными положительными и отрицательными
оценками. Так, можно заметить, что на участке между /-оценка-
ми, равными —0,67 и +0,67, заключено 50% площади графика,
на участке от —1,0 до +1,0 68% площади, на участке от —2,0
до +2,0 95% площади, а на участке от —3,0 до +3,0 99% площа-
ди графика. Соответственно 1% площади графика расположен за
134
пределами участка, ограниченного значениями Z-оценок, равными
±3,0; 5%—за пределами участка, ограниченного значениями
±2,0 и т. д. На выделенные
особое внимание, поскольку
в методах проверки гипотез,
нормального распределения.
Наконец, из рис. 6.5 сле-
дует (для читателя это, по
всей вероятности, уже оче-
видно) , что Z-оцейки и свя-
занные с ними, значения со-
ответствующих показателей
площадей относятся к лю-
бому нормальному (и толь-
ко к нормальному!) рас-
пределению. Для доказа-
тельства этого утверждения
вновь использовались дан-
ное о значениях коэффи-
циента 1Q, оценки стандарт-
ного теста по выявлению
способностей (СТС), сред-
няя которых равна 500, а
стандартное отклонение- -
100, и собранные специаль-
но для этой цели сведения
о времени реакции (ВР) на
некоторый раздражитель (в
данном случае это время
реакции водителей на крас-
ный свет светофора). В по-
следнем случае, как нетруд-
но догадаться, величина по-
казателей средней и стан-
дартного отклонения будет
незначительной: для наших
значения процентов следует обратить
они находят широкое применение
основанных на использовании кривой
м = inn
IQ 55 70 85 100 115 130 /45 $ = 75
СТС 200 300 400 500 600 700 800
ЗР 0,14 0,17 0,20 0,23 0,26 0,23 0,32 $ = 0,03
м~ о
Z — 3 -2 -1 0 +1 + 2 +3 S^1O
Рис. 6.5. Площадь графика нормальной
кривой, заключенная между двумя симмет-
рично расположенными Z-оценками. Важно
понять, что приводящиеся значения площа-
дей являются одинаковыми для всех нор-
мальных кривых
данных они оказались равными 0,23 с и 0,03 с соответственно.
В нижней строке приводятся значения Z-оценок.
ilpn этом необходимо обратить внимание на следующие основ-
ные моменты:
1. Использование Z-оценок позволяет представить любую нор-
мально распределенную совокупность данных в одном и том же
масштабе единиц измерения. Так, коэффициент IQ, равный 115,
соответствует Z-оцепке +1; такую же Z-оцепку имеют равный 600
показатель СТС и время реакции 0,26 с. Когда мы приступим
к рассмотрению понятия корреляции, то увидим, что данное свой-
ство Z-оценок. позволяет выявлять наличие (или отсутствие) взаи-
мосвязи между теми или иными переменными. Например, можно
выяснить, имеется ли какая-либо связь между величиной коэффи-
135
циента IQ и скоростью реакции человека (ответ: практически ни-
какой).
2. Важное свойство распределения Z-оценок состоит в том, что
его стандартное отклонение равно 1,0. До сих пор мы считали,
что общая площадь графика равна 100%. Однако ее можно при-
равнять и к 1,0. По этой причине график распределения Z-оценок
получил название единичной нормальной кривой. Площадь графи-
ка этого распределения составляет 1,0, его средняя равна 0,0,
а стандартное отклонение 1,0. В табл. 6.6 приводится детальная
характеристика показателей площади графика единичного нор-
Площади нормальной кривой 1
Таблица 6.7
7.-- оценка Площадь боль- шей части - графика
ПлащаНо меж- ду средней и z рлещадь мень- шей части графика Площадь между ааложительнь:м 'й отрицательным значениями Z Площадь dSyz хЗос- тодгоа - ifsa-cz.
0,00 0,0000 0,5000 0,5000 0,0000 1,0000
0,10 0,0398 0,5398 0 .4602 0,0786 С ,9204
0,20 0.0793 0,5793 0 .4207 0,1586 0,8414
0,25 0.0987 0,5987 0,4013 0,1974 0,8026
0,30 0,1179 0,6179 0.3821 0,2356 0,7644
0,40 0,1154 0,6554 0 ,3446 0,3108 0,6892
0,50 0.1915 0,6915 0 ,3085 0,3830 0,6710
0,60 0,2257 0,7257 0 ,2743 0,4514 0,5486
0,70 0,2580 0,7580 0 ,2420 0,5160 0,4840
0,75 0,2734 0,7734 0,2266 0,5468 0,4532
0,80 0,2881 0,7881 0,2119 0,5762 0,4238
0,90 . 0,3159 0,8159 0,1841 0,6318 0,3682
1,00 0,3413 0,8413 0 ,1587 0,6826 0,3174
1,10 0,3643 0,8643 0,1357 0 .7286 0,2714
1,20 0,3849 0,8849 0 ,1151 0 ,7698 0,2302 '
1,25 0,3944 0,8944 0,1056 0 ,7888 0,2112
1,30 0,4032 0,9032 0,0968 0,8064 0,1936
1,40 0,4192 0,9192 0,0808 0,8384 0,1616
1,50 0,4332 0,9332 0,0668 0,8664 0,1336
1,60 0,4452 0,9452 0.0548 0,8904 0,1096
1,70 0,4554 0,9554 С,0446 0,9108 0,0892
1,75 0,4599 0,9599 0,0401 0,9198 0,0802
1,80 0,4641 0.9641 0 ,0359 0,9282 0,0713
1,90 0,4713 0,9713 0,0283 0,9426 0,0574
2,00 0,4772 0,9772 0,0228 0,9544 0,0456
2,10 0,4821 0,9821 0.0179 0,9642 0,0352
2,20 0,486! 0,9861 0,0139 0,9722 0,0273 '
2,25 0,4878 0,9878 0,0122 0 ,9756 0,0244
2.30 0,4893 0,9893 0,0107 0,9786 0,0214
2,40 0,4918 0,9918 0,0082 0 ,9836 0,0164
2,50 0,4938 0,9938 0,0062 0,9876 0,0124
2,60 0,4953 0,9953 0,0043 0,9906 0,0094
2,70 0 .4965 0,9965 0,0035 0,9930 0,0070
2,75 0,4970 0,9970 0,0030 - 0 ,9940 0,0060
2,80 0,4974 0,9974 0,0026 0,9948 0,0052
2,90 0,4981 0,9981 0,0019 0,9962 0 .0038
3,00 0,4987 0,9987 0,0013 0,9974 0 ,0026
г Рассматриваются как положительные, так и соответствующие им отрицав
тельные значения Z-оценок. — Примеч. пер.
136
мильного распределения, соответствующих различным значениям
/оценок. Эта таблица очень пригодится нам при обсуждении
вопросов, связанных с проверкой гипотез.
11з опыта я знаю, что многих будет интересовать, как полу-
чены значения, приведенные в табл. 6.7. Этот вопрос имеет мате-
матическую природу и в силу своей сложности редко подробно
рассматривается даже в специальных пособиях по статистике.
Однако общий смысл операций, осуществляемых при расчете зна-
чений площадей, понять довольно просто. Чтобы получить показа-
тели табл. 6.7, нужно проинтегрировать уравнение нормальной
кривой в пределах, определяемых соответствующими значениями
Z-оценок. Для читателей, не знакомых с высшей математикой,
поясним, что операция интегрирования до некоторой степени ана-
логична процессу сложения. Таким образом, можно считать, что
речь идет о суммарной площади, заключенного в определенных
границах.
И СТАРОЕ, И НОВОЕ, Й ВЗЯТОЕ ВЗАЙМЫ
Я начну со взятого взаймы. В качестве своеобразного введе-
ния в вопросы, связанные с использованием статистических харак-
теристик нормальной кривой в методах проверки гипотез,
рассмотрим историю, рассказанную в книге Р. Ларсена и Д. Строу-
па [9]. Постоянный автор статей на медицинские темы одной из.
газет Абигаль ван Верен получила однажды письмо следующего
содержания *:
«Дорогая Эбби! В одной из статей вы писали, что продол-
жительность беременности у женщины равна 266 дням. Откуда вы
это взяли? У меня беременность длилась десять месяцев и пять
дней, и в этом не может быть никакого сомнения. Мой муж служит
на флоте, и после того, как я узнала, что жду ребенка,_ он ушел
в плавание. Мы не виделись с ним до дня рождения нашего ма-
лыша. У мужа нет оснований сомневаться в моей верности, поэто-
му я прошу напечатать опровержение Вашего первоначального
сообщения, доставившего мне немало беспокойства. Читательница
из Сан-Диего».
Как пишут авторы книги, «ответ Эбби был вежливым и уте-
шительным, по со статистической точки зрения не очень дока-
зательным». «Дорогая читательница! Средняя продолжительность
беременности составляет 266 дней. Некоторые дети рождаются,
раньше, некоторые, как, например, ваш малыш, позже».
Статистика продолжительности беременности. Что же сказать
об описанной выше ситуации? Возможно, конечно, что письмо со-
чинили какие-нибудь шутники, например, славящиеся подобного
рода выходками студенты расположенного в Сан-Диего Калифор-
нийского университета. Однако практика показывает, что исто-
* Текст письма и ответ на него воспроизводятся с разрешения Абигаль ван
Берен.
137
рия читательницы из Сан-Диего нисколько не противоречит зако-
нам природы. Так, в Ьританской энциклопедии сообщается, что
период беременности обычно продолжается от 266 до 270 дней,
но имеются данные и о том, что полноценные дети могут рождать-
ся спустя лишь 214 дней после зачатия. В то же время один из
судов в Ныо-Иорке в целях установления законности рождения
ребенка, основываясь па медицинском заключении, признал, что
период беременности у истицы действительно продолжался
365 дней.
Доверимся авторитетному свидетельству Британской энцикло-
педии и примем, что средняя продолжительность периода бере-
менности равна 268 дням (середина указанного в энциклопедии
интервала). Прежде чем приступить ж статистическому исследо-
ванию интересующей нас проблемы, отметим вначале три момента:
(1) мы должны принять предположение о том, что распределение
сроков беременности является нормальным; (2) необходимо затем
рассчитать величину стандартного отклонения этого распределе-
ния; (3) следует также выразить в днях продолжительность
периода беременности у читательницы из Сан-Диего ( опа пишет
о 10 месяцах и 5 днях). Поскольку мы'имеем дело с биологическим
процессом, то предположение о нормальности рассматриваемого
распределения представляется вполне правдоподобным. Имеются
также данные о том, что стандартное отклонение этого распре-
деления составляет 14—16 дней. Возьмем, например, большее из
этих значений. Что касается продолжительности периода бере-
менности у читательницы из Сан-Диего, то она, скорее всего, рав-
на 308 дням: 365 дней (1 год) минус 1 месяц, состоящий из 31 дня,
и минус 26 дней еще одного месяца.
Сделав эти предположения, приступим к рассмотрению сле-
дующей проблемы: какова вероятность получения оценки 308 и
выше для распределения с характеристиками 'М—268 и S=16?
Воспользовавшись формулой определения Z-оценки, имеем:
7 308 — 268 40 о
Z =--------= — = 2,50.
16 16
Из табл. 6.7 следует, что площадь меньшего участка гра-
фика распределения приблизительно равна 0,0062. Другими сло-
вами, примерно в 6,2 случая на Ю00 период беременности име-
ет продолжительность 308 дней. Итак, повторим еще раз: если
средняя продолжительность беременности равна 268 дням, и если
распределение сроков беременности является нормальным, и если
стандартное отклонение этого распределения составляет 16 дней,
то вероятность периода беременности, имеющего продолжитель-
ность 308 дней, приблизительно равна 0,0062, или 6,2 случая
на 1000.
Статистический гуманизм. Значение вероятности 0,006 в обыч-
ных условиях ведет к отбрасыванию нулевой гипотезы. В по-
добных случаях мы делаем вывод, что данное значение вероят-
ности настолько мало, что возможность случайного получения»
138
интересующего нас результата практически исключается. Рассмат-
риваемый конкретный случай, однако, очень интересен в том от-
ношении, что с его помощью можно показать, что при осуществле-
.... тех или иных выводов во внимание должны приниматься не
только статистические аргументы.
1. В данном случае я склонен поверить рассказу читатель-
ницы из Сан-Диего, что равносильно принятию нулевой гипотезы.
Дело в том, что отбрасывание нулевой гипотезы здесь имело бы
очень тяжелые (по крайней мере, для автора письма) последст-
вия— обвинение в неверности, расторжение брака и т. д. Подоб-
ные соображения всегда необходимо принимать во внимание при
определении уровня доверия, достаточного для отбрасывания ну-
левой гипотезы. Естественно, что если последствия нашего реше-
ния имеют существенное значение, нужно устанавливать более
жесткий критерий, чем в случае, когда последствия такого реше-
ния экстраординарными не являются. В науке наиболее часто ис-
пользуются 1%-ный (0,01) и 5%-ный (0,05) уровни доверительной
вероятности1. Вообще говоря, чем более важное решение мы при-
нимаем, тем меньше следует брать значение уровня доверительной
вероятности.
2. Логика проверки статистических гипотез основывается на
строгом выполнении всех предположений (мы их вводили с по-
мощью слов если), сформулированных перед тем, как применить
статистический тест. Если же средняя продолжительность периода
беременности в действительности не будет равной 268 дням и если
распределение сроков беременности не является нормальным, или
если стандартное отклонение этого распределения не равно 16, то
•полученная оценка вероятности, равная 0,006, может существенно
отличаться от истинного значения.
В нашем примере наиболее сомнительным является предпо-
ложение о нормальности распределения, позволившее при реше-
нии интересующей нас проблемы воспользоваться нормальной кри-
вой. Напомним, однако, что при средней продолжительности пе-
риода беременности, равной 268 дням, наиболее короткий из заре-
гистрированных сроков нормальной беременности составил
214 дней (т. е. на 54 дня меньше средней продолжительности),
а наиболее длительный — 365 дней (на 97 дней больше средней
продолжительности). Значительная разница между 54 и 97 днями
говорит о том, что интересующее нас распределение в действи-
тельности имеет правостороннюю асимметрию (см. с. 59). £сли
подобное отклонение от нормальности существенно, то вероятность
более продолжительных сроков периода беременности увеличива-
’ В советской литературе доверительная вероятность определяется как раз-
ность между 100% и величиной вероятности случайного осуществления интере-
сующего исследователя события. Таким образом, в данном случае речь идет
о 99%-ном (100%—1%) и 95%-ном (100%—5%) уровнях доверительной вероят-
ности. Это нужно иметь в виду и тогда, когда автор говорит об уровне довери-
тельной вероятности. — Примеч. пер.
139
ется. Но еще более важным здесь является то, что в данных ус-
ловиях мы не можем воспользоваться для обоснования своих вы-
водов свойствами нормальной кривой.
Из сказанного необходимо усвоить, что проверка статистиче-
ских гипотез всегда связана с выдвижением ряда вспомогатель-
ных предположений. Если нулевая гипотеза отвергается, поскольку
статистическая проверка показала, что при данных предположе-
ниях интересующий исследователя результат в высшей степени
маловероятен, то важно иметь в виду, что получение низкого зна-
чения вероятности зачастую может быть обусловлено не какими-
либо действительными причинами, а тем, что выдвинутые при про-
верке нулевой гипотезы предположения оказались ошибочными.
И СТАРОЕ, И НОВОЕ
Наступил, по-видимому, удобный момент, чтобы остановить-
ся и повторить рассмотренный материал, а также немного расши-
рить свой статистический словарь. Только что было проделано
небольшое упражнение по проверке статистических гипотез. В дан-
ном конкретном случае проверке подвергалась нулевая гипотеза,
состоящая в предположении, что продолжительность периода бе-
ременности, равная 308 дням, не отличается от значения, которое
могло бы быть случайным образом получено в предположении о
нормальности кривой продолжительности беременности со средней,
равной 268 дням, и стандартным отклонением в 16 дней.
Статистическая проверка, использованная при оценке нулевой
гипотезы, потребовала расчета Z-оценки. По этой причине данную
проверку часто называют Z-критерием. Z-критерий является «пра-
дедушкой» всех других критериев этого типа. Первоначально в
статистической литературе он был известен под названием крити-
ческого отношения. Как будет показано позднее (см. с. 229),
Z-критерий можно использовать, не опасаясь получить смещенный
результат, только в случаях, когда известно стандартное отклоне-
ние исходной совокупности. В противном случае это значение дол-
жно быть каким-то образом рассчитано. Данное замечание не име-
ет существенного значения, когда исследователь имеет дело с вы-
борками достаточно большого объема. Если же объем выборки
невелик, то применяется более подходящий для этих целей /-кри-
терий, тесно связанный с Z-критерием. При увеличении объема
выборок значения показателей t и Z все более сближаются. Но
даже когда эти значения все же различаются, логика, на которой-
основывается использование этих двух критериев, остается одина-
ковой. Зная об этом, вы можете спокойно читать специальную ли-
тературу, в которой важную роль играют результаты, полученные
с помощью статистических тестов.
В подобной литературе часто встречаются, например, такие
выражения, обобщающие результаты проведения статистического
теста: / = 2,36; р<0,05. Данное выражение следует читать так: при
определении /-статистики было получено значение, равное 2,36. *
140
Вероятность (р) получения t, имеющего такое значение, мень-
ше 0,05. Нулевая гипотеза может быть отвергнута при уровне зна-
чимости 0,05. Менее часто встречается такая форма записи:
/ = 2,01; 0,05<р<0,10. Данное выражение означает, что значение t,
равное 2,01, может быть получено с вероятностью, заключенной
в интервале между 0,05 и 0,10, если нулевая гипотеза верна. Или,
говоря другими словами, уровень значимости, при котором нулевая
гипотеза может быть отвергнута, находится между 5 и 10%*.
Отсюда следует,’что концепция уровня значимости формально
может быть выражена несколькими способами. В то же время во
всех приведенных выше примерах значение р представлялось
одинаково. В литературе можно встретить также выражение аль-
фа-уровень или просто символ а (одна из букв греческого алфа-
вита). Эти выражения означают то же самое, что и выражение
уровень значимости. Вам может также попасться на глаза ссылка
на альфа-ошибку, которая в действительности есть не что иное,
как рассмотренная нами ранее ошибка I рода. Все эти термины
связаны с вероятностью случайного получения той или иной ста-
тистики при условии, что выдвинутое первоначально предположе-
ние является верным.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
Кривая нормального распределения представляет собой мате-
матическую функцию. Форма этой функции определяется двумя
характеристиками, которые могут иметь различные значения,—
средней и стандартным отклонением. С помощью нормальной кри-
вой описываются частотные распределения большого количества
разнообразных природных явлений. В статистике данная функция
часто применяется при проверке статистических гипотез. При этом
во всех случаях используется следующая логическая последова-
тельность аргументов: если рассматриваемое распределение явля-
ется нормальным с таким-то и таким-то значениями средней и
стандартного отклонения, то вероятность получения данного ре-
зультата оценивается так-то и так-то. Пример с читательницей из
Сан-Диего иллюстрирует применение описанной выше процедуры
в анализе конкретной ситуации.
Перечислим основные понятия, рассмотренные в данной главе.
Показатель, характеризующий степень скученности наблюде-
ний (центральной тенденции). Любой показатель, использующийся
* Часто в подобных сообщениях, независимо от того, касаются ли они /,
F, %2 или каких-либо других еще не известных вам показателей, приводятся
также обозначения, характеризующие степень свободы информации, использо-
ванной в расчете. Так, например, можно встретить следующие типы записи:
/зо = 2,О1, пли /=2,01; степ. св. = 30, после которых приводится значение вероят-
ности р. Концепция степеней свободы будет введена несколько позже (см.
с. 226). Сейчас же отмечу только, что эта концепция связана с числом наблю-
дений. В случае /-критерия показатель степени свободы равен ЛЧ+Мг — 2, где
ДЧ и ЛЧ могут указывать, например, на число людей в двух группах, участвую-
щих в проведении эксперимента.
141
для нахождения точки распределения, в окрестностях которой кон-
центрируются принадлежащие этому распределению наблюдения.
Примерами таких показателей служат средняя, медиана и мода.
Показатель, характеризующий степень разброса наблюдений.
Любой показатель, использующийся для характеристики разброса
или рассеяния наблюдений в распределении. Примерами таких
показателей служат среднее отклонение и вариационный размах.
Однако наиболее важными показателями этого рода являются
стандартное отклонение и дисперсия (см. далее).
Мода. Наиболее часто встречающееся в распределении наблю-
дение.
Медиана. Среднее наблюдение или пятидесятый перцентиль.
Средняя (М). Имеется несколько способов определения этого
показателя: 1) данный показатель является арифметической
средней; 2) точка распределения, сумма отклонений от которой
(с учетом знака) равна нулю; 3) точка распределения, сумма
квадратов отклонений от которой минимальна; 4) формула сред-
ней выглядит так:
где S означает операцию суммирования (в данном случае нс свя-
занного с умножением), X — значение наблюдения, принадлежа-
щего рассматриваемому распределению, N — число наблюдении.
Перцентильный ранг. Процент наблюдений, равных величине
данного наблюдения или превышающих се.
Стандартное отклонение (S). Корень квадратный из среднего
квадрата отклонений значений наблюдений от их средней:
где для каждого наблюдения d=X — М, т. е. разность между зна-
чением наблюдения и средней арифметической. Важным свойст-
вом стандартного отклонения является его связь с площадью нор-
мальной кривой.
Дисперсия (S2). В данной главе не рассматривалась. Пред-
ставляет собой квадрат стандартного отклонения:
^2 _ 5^
~ W
Позднее мы убедимся, что и показатель дисперсии обладает рядом
полезных свойств.
Z-оценка. Для любого наблюдения представляет собой расстоя-.
ние (положительное или отрицательное) между значением дан-
ного наблюдения и средней, выраженное в единицах стандартного
отклонения:
Z = х ~ м
S
142
Z-критерий. Критерий, использующийся при оценивании ста-
тистических гипотез, суть которого состоит в применении форму-
лы Z-оценки для расчета вероятности получения того или иного
результата при условии, что некоторая выдвинутая исследовате-
лем гипотеза (обычно нулевая) верна.
Критическое отношение. Z-критерий.
t-критерий. Критерий, аналогичный Z-критерию. Применяется,
когда неизвестно стандартное отклонение исходной совокупности.
Иногда говорят, хотя это и не совсем точно, что /-критерий пред-
почтительней Z-критерия в случаях, когда проверяемые гипотезы
основываются на данных небольших по объему выборок. Это ут-
верждение имеет основание, поскольку различия в результатах
применения /-критерия и Z-критерия достигают наибольшего зна-
чения при небольших по объему выборках. Более подробно эта
проблема будет рассмотрена в приложении.
p-значение. В данной главе это вероятность случайного полу-
чения некоторого результата при условии, что пулевая гипотеза
верна.
Уровень значимости. То же самое, что и р.
Альфа (а). То же самое, что и р. В статистическом обиходе
часто принято определять значение а или -«-уровень в качестве
характеристики значимости перед тем, как исследователь присту-
пает к анализу результатов. Выражения же «уровень значимости»,
«р» или «p-значение», как правило, используются после заверше-
ния анализа.
Альфа-ошибка. Ошибка I рода. Отбрасывание пулевой гипоте-
зы, когда она является верной. Как вы, возможно, уже догадались,
термин бета-ошибка иногда употребляется в качестве альтерна-
тивного способа для выражения ошибки II рода, т. е. принятия
нулевой гипотезы, когда она ошибочна.
7
ВЫБОРОЧНЫЙ МЕТОД
И ПОЗНАНИЕ МИРА
Каждый год компании, специализирующиеся на продаже по
почте женского готового платья, сталкиваются с проблемой вы-
бора стиля одежды, который окажется модным в предстоящем се-
зоне. В прошлом при решении данного вопроса полагались на
мнение «экспертов». К несчастью, как правило, эти советы были
недостаточно точными, и в ряде случаев приносили компаниям
«Одежда — почтой» огромные финансовые убытки. Эксперты нс
могли предсказать изменения, которые могут произойти в жен-
ском вкусе. Однажды одна из компаний попыталась применить
здесь другой, учитывающий настроения покупателей, метод. Она
подготовила предсезонный каталог, где были представлены не-
сколько типов одежды различного стиля. Этот предварительный
каталог разослали некоторой выборке потенциальных покупатель-
ниц. На основе заказов, полученных после осуществления данной
операции, был составлен основной каталог, содержащий модели
одежды, предпочтение которым было отдано большинством поку-
пательниц. Результаты оказались впечатляющими. Эти предвари-
тельные продажи предсказывали предстоящие изменения во вку-
сах покупательниц с такой точностью, о которой эксперты могли
только мечтать.
Приведенный только что пример показывает, каким образом
данные, полученные с помощью выборки, могут быть использованы
для оценки некоторых важных характеристик исходной генераль-
ной совокупности. Покупательницы, получившие предварительный
каталог, представляли собой выборку; генеральная же совокуп-
ность состояла из всех потенциальных покупателей, которые могли
обратиться к обычному каталогу данной фирмы, чтобы выбрать
интересующую их модель одежды. Прибегнув к более общей фор-
мулировке, мы можем определить генеральную совокупность как
все множество элементов, принадлежащих к некоторой большой
группе. Вы, видимо, и ожидали примерно это услышать. Соот-
ветственно выборка представляет собой некоторую менее обшир-
ную совокупность элементов, выделенных из этой группы. Реше-
ния, принимаемые при статистических выводах, обычно и явля-
144
ются не чем, иным,' как решениями относительно тех или иных
свойств генеральной совокупности, основанными на информации,
которая получена по результатам выборок.
ГЕНЕРАЛЬНЫЕ СОВОКУПНОСТИ И ВЫБОРКИ
Исходная совокупность может быть как конечной, так и беско-
нечно большой. Население некоторой страны, определяемое в ре-
зультате периодически проводимых переписей, может оказаться
очень большим, но, естественно, не бесконечным. Когда в гл. 5
мы говорили о распределении случайных событий за очень продол-
жительный период времени, мы, по существу, имели в виду бес-
конечно большие совокупности. Когда же при проведении перепи-
си будет зарегистрирован последний житель данной страны, учи-
тывать больше будет некого. В данном случае генеральная сово-
купность конечна. Напротив, подбрасывание монет или бросание
костей могут осуществляться неограниченно'долго. Совокупности
подобных событий являются бесконечными. Теория выборочного
метода,, которой посвящена настоящая глава, обычно имеет дело
с генеральными совокупностями бесконечного объема.
РЕПРЕЗЕНТАТИВНОСТЬ И СМЕЩЕННОСТЬ ОЦЕНОК
Информация, полученная в результате осуществления выбор-
ки, будет только тогда надежной основой для принятия решения
относительно тех или иных свойств исходной совокупности, когда
структура образующих выборку элементов будет аналогична
структуре элементов в генеральной совокупности.
Опрос, проведенный журналом «Literary Digest». Видимо,
самым ярким примером фиаско в истории применения выборочного
метода являются результаты опроса, проведенного в 1936 г._ жур-
налом «Literary Digest». Редакция журнала разослала 10 млн.
бюллетеней, в которых просила получивших их людей ответить,
за кого они будут голосовать на предстоящих выборах президен-
та—за кандидата республиканской партии А. Лэндона или за
демократа Ф. Рузвельта. Было возвращено более 2 млн. заполнен-
ных бюллетеней. Опубликованные в журнале результаты опроса
предсказывали, что президентом станет Альфред М. Лэндон. Од-
нако в ноябре1 оказалось, что с большим преимуществом победу
на выборах одержал Франклин Делано Рузвельт, за которого
проголосовало более 60% избирателей. Причина столь существен-
ной ошибки «Literary Digest» кроется в том, что полученная в ре-
зультате проведения опроса выборка, на данных которой основы-
вался прогноз, не была репрезентативной (представительной) вы-
боркой из генеральной совокупности избирателей. Бюллетени бы-
ли разосланы подписчикам журнала, людям, чьи фамилии и адре-
1 Традиционный месяц проведения президентских выборов в США. —
Примеч. пер.
10-1778
145
са были взяты из телефонных книг, а также владельцам автомо-
билей (сведения об этих лицах имеются в полиции). Следователь-
но, в выборке было слишком мало представлено менее состоятель-
ных людей, которые в своей массе собирались голосовать за
демократов.
Тайна исчезновения продукции. Компания, производящая из-
делия из пластмасс, обратилась однажды к консультативной
фирме, занимающейся проблемами психологии, с просьбой помочь
ей найти рабочего, который систематически похищал часть произ-
веденной продукции. Компания провела целую серию всевозмож-
ных обследований, однако преступник был неуловим. О наличии
краж свидетельствовали данные регулярных выборочных проверок,
проводимых компанией в начале каждого месяца после наладки и
смазки оборудования. В результате таких проверок устанавлива-
лось, какой объем готовой продукции может быть изготовлен из
данного количества сырья. Прогнозы выхода готовой продукции,
основанные па результатах этих предварительных обследований,
оказывались всегда довольно высокими, однако фактический вы-
ход ее оказывался меньше расчетного. Отсюда и делался вывод,
что часть месячной продукции похищается кем-то из служащих
компании.
Исследование, проведенное консультативной фирмой, привело
к совершенно иному выводу. Когда компания проводила свои еже-
месячные проверки, оборудование было только что вымыто, тща-
тельно налажено,, хорошо смазано, поэтому расход сырья и мате-
риалов на выпуск данного объема готовой продукции был относи-
тельно невысоким. Однако в дальнейшем,. вплоть до очередной
наладки, эффективность работы оборудования постепенно снижа-
лась. Соответственно уменьшался и выход готовой продукции по
сравнению с оценками, полученными по данным выборки. И в
этом случае смещенность оценки была обусловлена тем, что
использованная для обоснования прогноза выборка (проверка,
осуществляемая в начале каждого месяца), не являлась репрезен-
тативной по отношению к исходной совокупности, для которой
делался соответствующий прогноз (объем месячного производ-
ства).
СЛУЧАЙНОСТЬ ГАРАНТИРУЕТ НАДЕЖНОСТЬ
Нерепрезентативные выборки называются смещенными. Уяс-
няя себе понятие 'смещенной выборки, важно иметь в виду, что
чем больше объем такой выборки, тем с большей определенностью
полученные данные приведут исследователя к ошибочному выводу.
В этом смысле пример с опросом, проведенным журналом «Litera-
ry Digest», является очень показательным. Два миллиона ответов
образуют чрезвычайно большую по объему выборку. Однако чем
больше журнал получал ответов от людей, не являющихся репре-
зентативными представителями генеральной совокупности, тем
с большей определенностью его предсказание о победе кандидата
146
республиканской партии должно было оказаться ошибочным.
Нельзя обеспечить точность прогнозов, застраховавшись посредст-
вом больших чисел, в случаях, когда мы имеем дело с выборками,
имеющими смещенный характер. В действительности эффект от
увеличения объема подобных выборок будет прямо противополож-
ным желаемому.
Случайность. Проще всего добиться, чтобы выборка была пред-
ставительной, с помощью случайного отбора входящих в эту
выборку элементов. Случайная выборка представляет собой вы-
борку, при которой каждый отдельный элемент и каждая комбина-
ция. отдельных элементов, принадлежащих исходной совокупности,
имеет одинаковые шансы попасть в выборку. Получить случайную
выборку сложнее, чем может показаться после прочтения приве-
денного определения. Покажем это с помощью нескольких приме-
ров.
1. При осуществлении выборки из некоторой генеральной со-
вокупности людей всегда может найтись некоторое количество
индивидуумов, которые хотели бы минимизировать вероятность
попасть в эту выборку. Среди таких людей можно, например,
указать преступников, лиц, скрывающихся от кредиторов (а мо-
жет быть, от мужа или от жены).
2. Некоторых людей трудно застать дома, например разъезд-
ных торговых агентов, тех, кто уехал в отпуск, работающих ма-
терей и т. д. В связи с этим уменьшается вероятность того, что
эти люди могут попасть в выборку.
3. Иногда невозможно заранее определить, принадлежит ли
тот или иной индивидуум к интересующей исследователя гене-
ральной совокупности людей. Так, например, при изучении пред-
почтений избирателей генеральной совокупностью является все
множество избирателей, которые примут участие в выборах.
Однако до тех пор, пока данный человек не заполнит- свой из-
бирательный бюллетень (а может быть, он откажется принимать
участие в выборах), невозможно определить, является ли он чле-
ном интересующей нас генеральной совокупности. Данный факт —
один из основных источников ошибок в опросах, которые прово-
дятся с целью предсказания результатов выборов. Однако стоит
отметить, что, несмотря на эти, а также другие трудности, с ко-
торыми сталкиваются при подобных опросах, их результаты яв-
ляются довольно точными. Так, прогнозы исхода выборов, сделан-
ные институтом Гэллапа, обычно оказываются точными в пределах
нескольких процентных пунктов. И все же, хотя предсказание
победы республиканской партии над демократической с соотноше-
нием голосов избирателей 51%/49°/0 и может оказаться довольно
точным, при фактическом соотношении 49%/51 % общие результа-
ты выборов будут означать, что прогноз оказался полностью
ошибочным.
4. В ряде случаев, хотя это встречается и не так уж часто,
могут быть допущены ошибки при определении единиц выборки.
Предположим, исследователь собирается оценить среднее число
10*
147
детей в семьях, которые проживают в некотором районе, приле-
жащем к одной из школ. С этой целью он начинает опрашивать
детей из различных классов о том, сколько у них братьев и сес-
тер. Основываясь на полученных ответах, исследователь приходит
к выводу, что среднее число детей в семье равно 4,1. Однако эта
оценка выглядит подозрительно высокой. Что же могло исказить
результаты исследования? В данном случае мы можем указать,
по крайней мере, на два источника ошибок: (1) Большие семьи
имеют более высокие шансы быть представленными в расчетах
именно в силу своей величины. Если в день проведения исследова-
ния в школе не оказалось заболевшего ученика, не имеющего боль-
ше братьев и сестер, то эта семья вообще не будет учтена в расче-
тах. Если же заболевший ученик окажется из большой семьи, о ее
существовании все равно сообщат его братья и сестры. (2) Более
важное значение, однако, имеет тот факт, что при описанной
процедуре проведения исследования каждая большая семья будет
учитываться, вообще говоря, столько раз, сколько детей из этой
семьи обучается в данной школе. Так, если в семье имеется 13 де-
тей школьного возраста, то эта семья будет учтена 13 раз, хотя
в действительности ее следует учесть лишь однажды.
В приведенном примере важно понять, что ошибка, обусловив-
шая неправильный результат, была допущена в самом начале
исследования. Она связана с широко распространенным (но не
во всех случаях верным) представлением о том’, что при изуче-
нии различных совокупностей людей в качестве единицы выбор-
ки должен обязательно рассматриваться отдельный человек. Вот
и в нашем примере ошибочный выбор единиц совокупности наблю-
дений привел к тому, что вместо случайной выборки семей была
произведена случайная выборка школьников.
СТАТИСТИКИ И ПАРАМЕТРЫ
Прежде чем приступить к изложению последующего материа-
ла, полезно было бы провести некоторые различия между опре-
делениями понятий, относящихся к выборкам и исходным гене-
ральным совокупностям. Показатели, полученные для выборки,
обычно называются статистиками- аналогичные показатели, рас-
считанные для генеральной совокупности,, называются парамет-
рами. Таким образом, средняя и стандартное отклонение выборки
являются статистиками: эти же показател^, полученные для гене-
ральной совокупности, представляют собой параметры. Для обо-
значения статистик принято использовать прописные буквы латин-
ского алфавита, а для обозначения параметров — строчные гре-
ческие буквы. В соответствии с этим правилом мы взяли буквы
М и S для обозначения соответствующих статистик, полученных
по данным выборок. Теперь же для обозначения аналогичных
показателей, оцененных для генеральных совокупностей наблюде-
ний, мы будем использовать буквы р, и о. В каждом исследова-
нии обычно стремятся к нахождению значений генеральной сово-
148
купности, однако, как правило, мы оказываемся в состоянии по-
лучить лишь тот или иной набор статистик. Важная часть раз-
дела статистики, связанного с получением статистических выво-
дов, как раз и состоит в оценке параметров по значениям стати-
стик. И прежде всего нам, видимо, следует обратиться к оценке
показателей ц и <у.
ОЦЕНКА Ц ПО ЗНАЧЕНИЮ М
Если выборка осуществлялась случайным образом, то ее сред-
няя и является несмещенной оценкой ц. Однако насколько хоро-
ша эта оценка? Идея, лежащая в основе ответа на этот вопрос,
хорошо знакома: в соответствии с законом больших чисел качест-
во оценки будет определяться объемом выборки, по данным кото-
рой она получена. По мере того как объем выборки приближается
к объему генеральной совокупности, М становится все более точ-
ной оценкой ц так же, как и в случае, когда доля фактически
происшедших событий (например, выпадений орла при подбрасы-
вании монеты) приближается к теоретически ожидаемому значе-
нию (см. с. 110).
ОЦЕНКА о ПО ЗНАЧЕНИЮ S,
Оказывается, имеется тенденция к недооценке <у по величи-
не показателя S. На причинах этого явления, как мне ка-
жется, следует, хотя бы кратко, остановиться. При изложении
первой части объяснения удобнее будет работать в терминах S2
и о2, а не S и o'. Символы S2 и о2 используются для обозначения
дисперсии распределения (этот показатель будет иметь большое
значение при изложении материала следующей главы). Поскольку
формула стандартного отклонения выборки выглядит так:
Формула дисперсии выборки будет иметь следующий вид:
S2 =
N ’
где d представляет собой разность между значениями каждого
отдельного наблюдения и средней, т. е. d=X— М. Таким образом,
альтернативная формула выборочной дисперсии имеет вид
N '
Формула дисперсии генеральной совокупности (о2), т. е. показа-
теля, который мы и хотели бы оценить, несколько иная:
с2 _
N
где N — число элементов в генеральной совокупности1, а X — у,—
1 В приведенных формулах дисперсии и стандартного отклонения для вы-'
борок N характеризует число элементов в выборке. — Лримеч. пер.
149
разность между значениями каждого из этих наблюдений и сред-
ней генеральной совокупности.
Как нам только что стало известно, М является несмещенной
оценкой ц, однако в данном случае следует подчеркнуть, что почти
наверняка значение М не равно точно значению ц; значение AI
содержит в себе некоторую неизвестную величину ошибки, равной
М—ц. В среднем это означает, что величина X — М в формуле
для вычисления S меньше величины X — it в формуле для опреде-
ления <т на величину разности между М и ц. Формально это можно
записать так: X — (Х+М) + (М — ii). Именно этим и объясня-
ется, почему показатель S2 недооценивает величину о2. То же
самое можно выразить и по-другому: поскольку М представляет
собой точку распределения, для которой сумма квадратов откло-
нения минимальна, 2d2 обычно будет меньше суммы квадратов
отклонений от и..
Доказано [10, с. 48—50], что величина, на которую S2 недооце-
нивает о2, может быть определена с помощью следующего выра-
жения. В среднем
S2=4Lsl1o2.
N
Относительно этой формулы сделаем два замечания: 1) легко
увидеть, что по мере возрастания N величина '(/V— 1)/Л/ все боль-
ше приближается к единице, а это означает, что S2 становится
все более точной оценкой а2; 2) поскольку известно точное выра-
жение величины недооценки о2, посредством показателя S2 (эта
величина определяется значением множителя (N— 1)/-'V) можно
осуществить корректировку полученной оценки с помощью умне-
Л
жения величины S2 на N/(N— 1). Обозначив символом S2 скор-
ректированную оценку, имеем:
Л'— i ' -
Подставив в эту формулу приведенное выше выражение S2, полу-
чаем:
С2 _ A _ 3d2
N — 1 N ~ N — 1 •
Квадратный корень из этого выражения и представляет собой
л
скорректированную, или несмещенную, оценку a(S):
ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ
Сделаем теперь одно, возможно, очевидное для вас, но тем
не менее очень важное замечание: поскольку М и S являются
оценками ц и <т, основанными на выборочных данных, различные
150
выборки.обычно будут давать нам и различные значения этих
оценок. Проиллюстрируем некоторые важные последствия этого
утверждения на примере с письмом читательницы из Сан-Диего
(см. гл. 6). Предположим, что по каким-то причинам вы захотели
сами получить оценку средней продолжительности беременности.
Допустим, вам удалось собрать соответствующие данные о 21 слу-
чае. Расположив эти данные в порядке возрастания, вы получили
следующий ряд наблюдений (в днях): 220, 230, 264, 265, 265, 265,
266, 266, 266, 267, 267, 267, 267, 268, 268, 268, 272, 278, 279, 280, 301.
Средняя и стандартное отклонение этих данных соответственно
л
равны 266,14 и 15,74. Величина S составляет 16,13.
Возможно, однако, что полученные результаты удовлетвори-
ли вас не полностью. Вы неоднократно слышали, что продолжи-
тельность периода беременности равна 9 месяцам и, следователь-
но, ожидали получить значение, равное не 266,14 дня, а показа-
тель, близкий к 270 дням. Кроме того, ваша уверенность в том, что
биологическим процессам присуща строгая периодичность, а так-
же доверие к точности положений медицины наводят на мысль,
что полученная оценка стандартного отклонения исходной сово-
купности, равная 16,13, слишком уж велика. Обуреваемый сомне-
ниями, вы решаетесь осуществить еще одну выборку, состоящую
из 21 наблюдения, чтобы проверить ранее полученные результаты.
л
Предположим, что на этот раз значения М и S соответственно
составили 271,8 и 17,2 дня. Однако и этот результат не удовлет-
воряет вас, и вы еще раз повторяете исследование. Данный про-
цесс может продолжаться (если хватит терпения) до тех пор, пока
не будет получен устраивающий вас результат.
Как указывалось в начале настоящего параграфа, значения
М и S в различных выборках могут быть различными. Если из
значений средних и стандартных отклонений различных выборок
сформировать Соответствующие частотные распределения, то они
будут называться выборочными распределениями этих двух стати-
стик. Выборочное распределение некоторой статистики представ-
ляет собой теоретическое частотное распределение этой статистики,
которое могло бы быть получено в результате осуществления очень
большого (практически бесконечного) числа выборок.
Чтобы конкретизировать только что сформулированное опреде-
ление, предположим, что у вас хватило терпения собрать данные
для 100 выборок, каждая из которых состоит из 21 наблюдения.
Вы рассчитали для всех выборок значения средних и сформиро-
вали выборочное распределение полученных показателей. Это рас-
пределение может быть похоже на эмпирическое выборочное рас-
пределение средних, представленное на рис. 7.1. Данное распреде-
ление по форме напоминает нормальное распределение. Его сред-
няя (средняя средних) равна 265,84 при стандартном отклоне-
нии 3,82. Последнее значение представляет собой стандартную
ошибку средней (SM). Этот показатель будет подробно охаракте-
ризован в следующем параграфе.
151
!-1 = 255,Si
Средняя прсЗолжиспельноепь Зерекечнвети
Рис. 7.1. Эмпирическое выборочное распределение средних. В действительности
представленные на графике числа получены в результате менее впечатляющей
операции, чем описано в тексте. В нашем примере средняя продолжительность
периода беременности оказалась равной 266,14 дня. Позднее мы покажем, что
стандартная ошибка этой средней равна 3,54. Чтобы получить представленные
на графике значения, я воспользовался программируемым калькулятором. В его
памяти была сформирована нормально распределенная совокупность средних,
средняя которого Л! = 266,14, а 5=3,54. Затем случайным образом были отобраны
из него 100 средних и полученные результаты нанесены на график. Как видите,
ни М, ни 5 в выборочном распределении средних не совпадают со значениями
генеральной совокупности Л1 = 266,14 и 5=3,54. Это характерное свойство выбо-
рочного метода
КАК МОЖНО САМОГО СЕБЯ ВЫТАЩИТЬ ЗА ВОЛОСЫ ИЗ БОЛОТА
Очевидно, что приведенный выше пример нереалистичен. На
практике обычно невозможно осуществить целую серию выборок
для того, чтобы получить выборочное распределение средней.
Чаще в распоряжении исследователя имеется значение средней,
рассчитанное по данным одной единственной выборки, и именно
с этим значением ему и приходится работать. Образно говоря,
в данной ситуации исследователь, следуя примеру барона Мюнх-
гаузена, должен вытащить самого себя за волосы из болота. Пока
вы хорошо помните ситуацию, в которой оказалась читательница
из Сап-Диего, воспользуемся еще раз этим примером для обсуж-
дения стоящих перед нами проблем.
Краткий обзор. Напомним, что средняя продолжительность
периода беременности для первой выборки, состоящей из 21 слу-
чая, оказалась равной 266,14 дня. Это значение является несме-
щенной оценкой средней генеральной совокупности (р). При об-
суждении дальнейшего материала важно не упустить из виду,
что величина 266,14 представляет собой всего лишь одну из воз-
можных оценок. Другие выборки дали бы другие оценки, а неко-
торое множество таких выборок позволило бы сформировать вы-
борочное распределение средних. Рассмотрим способ оценки стан-
дартного отклонения выборочного распределения средних.
Стандартное отклонение первой выборки данных о продолжи-
тельности беременности составило 15,74 дня, однако это значение
152 ' .
не является несмещенной оценкой о. Чтобы получить такую оцен-
ку, нужно сделать поправку на величину ошибки. При этом удоб-
нее будет работать с показателем дисперсии (S2). Квадрат S
(15,74)2 равен 247,75. Умножим это значение на поправочный ко-
эффициент N/(N—1), равный 21/20=1,05. Таким образом,
л
247,75X1,05 = 260,14, что соответствует S2. Корень квадратный из
260,14 равен 16,13. Это и есть несмещенная оценка (S) стандарт-
ного отклонения (о) генеральной совокупности.
Стандартная ошибка средней. Величина, которая в дальней-
шем будет использоваться нами в самых различных целях, пред-
ставляет собой стандартное отклонение выборочного распределе-
ния средних, SM. В силу причин, на которых я здесь останавли-
ваться не буду, формула для определения Sm выглядит так:
V N
Значение а не известно, однако в нашем распоряжении имеется
л
оценка этого показателя, К.‘ Таким образом, рабочая формула
для вычисления Км может быть представлена в следующем виде:
с _____ S
о .и =---------
Г' У
Поскольку объем н^шей выборки равен 21 наблюдению, а величи-
на К= 16,13, то
с 16,13
о .и — —zzz
V 21
= 3,54.
4,58
Запомним, что это значение является оцененным стандартным от-
клонением выборочного распределения средних. Этот показатель
интерпретируется точно так же, как и любое другое стандартное
отклонение. Единственное отличие заключается в том, что он рас-
считывается для значений средних. Этот показатель называется
также стандартной ошибкой средней*-. Когда бы вы ни услы-
шали выражение «стандартная ошибка...», смысл его будет всег-
да один и тот же. «Стандартная ошибка...» представляет собой
стандартное отклонение выборочного распределения значений той
статистики, о которой будет сказано в заключительной части это-
го выражения. В данной книге мы будем иметь дело со стандарт-
ной ошибкой средней, стандартной ошибкой разности и стандарт-
ной ошибкой оценки. Соответственно эти показатели представля-
ют собой стандартные отклонения выборочных распределений сред-
них, разностей, а также значений, оцененных на базе коэффициен-
тов корреляции.
1 В советской литературе этот показатель называется также среднеквадра-
тическим отклонением. — Примеч. пер.
153
ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ
Напомним, что в нашем гипотетическом 'примере средняя вы-
борки, состоящей из 21 наблюдения, равна 266,14. Как известно,
она является оценкой генеральной совокупности. Однако насколь-
ко хороша эта оценка? Наша уверенность в том, что средняя ге-
неральной совокупности не равна точно 266,14, основывается,
в частности, на результатах второй гипотетической выборки, дав-
шей нам другое значение этой оценки. Указанный факт наво-
дит на мысль о том, что имеется другой способ рассмотрения
стоящей перед нами проблемы. Можно задаться вопросом о диа-
Средкяя проЗснжи'чельмстпь Г:ериоЗа беременности (дни)
Рис. 7.2. Теоретическое вы-
борочное распределение
средних. По форме эго
просто нормальная кривая
с М — 2666,14 и S, которое
есть S« — 3,54. Па графике
также показаны 50%-, 95%-
и 99%-ные доверительные
интервалы для средней.
Они были рассчитаны сле-
дующим образом: (1) гра-
ницы 50%-кого доверитель-
ного интервала определяют-
ся так: 266 + 0,6745(3,54);
(2) границы 95%-ного до-
верительного интервала оп-
ределяются следующим об-
разом: 266,14+1,96(3,54);
(3) границы 95%-ного дове-
рительного интервала нахо-
дятся так: 266,14.-г-2,58(3,54).
Два из использованных на-
ми значений объяснений не
требуют (это 44=266,14 и 5 = 3,54). Другие числа ( + 0.6745; + 1,96; + 2.58)
представляют собой симметричные друг другу Z-оценки, между которыми
расположено соответственно 50, 95 и 99% площади нормального распределения.
Так, например, 50% этой площади заключено в интервале, границами которого
являются значения 7 =—0,6745 и Z = 0,6745
пазопс значений, внутри которого, возможно, и содержится инте-
ресующая нас средняя, а также определить степень доверия к
предположению о том, что значение средней попадает в выделен-
ный нами интервал. С помощью таких инструментов статистиче-
ского анализа, как оценка средней (266,14), оценка стандартной
ошибки средней (3,54), а также предположения о том, что рас-
пределение средних нормально, мы приступаем к решению стоя-
щей перед нами проблемы.
Как вы, возможно, уже убедились, наиболее информативным
способом объяснения является графический. На рис. 7.2 представ-
лено выборочное распределение средних, оцененное по данным
первой и единственной выборки. Средняя этого распределения
равна 266,14, а стандартное отклонение (SM) составляет 3,54. Но
более важно то, что график позволяет определить диапазон, в гра-
154
ницы которого, как ожидается, попадет полученное значение сред-
ней в 50% всех случаев, в 95% всех случаев, в 99% всех случаев.
Приведенные значения' характеризуют соответственно 50%-,
95%- и 99%-ные доверительные границы для показателя средней.
Отмеченные интервалы могут быть получены исходя из из-.
вестных свойств нормального распределения. Доверительные гра-
ницы определяются значениями лежащих по обе стороны от оценки
средней наблюдений, между которыми заключен тот или иной про-,
цент площади графика распределения. Чтобы проверить, насколь-
ко хорошо вы поняли смысл сказанного, можно обратиться к
табл. 6.7 (см. с. 136). Так, 50%-ный доверительный интервал оп-
ределяется значением средней плюс — минус 0,6745x3,54 (5Л/).
Границы 95%-ного доверительного интервала определяются из вы-
ражения: средняя ± 1,965м; границы 99%-ного доверительного
интервала — из выражения: средняя ±2,58SM'.
ПРОВЕРКА ГИПОТЕЗ
Очень сходные с изложенными выше идеи позволяют нам осу-
ществить проверку некоторых специфических гипотез о величине
показателя средней. Поскольку по большей части это повторение
пройденного материала, я не буду подробно останавливаться на
деталях процедуры, к описанию которой мы приступаем. Предпо-
ложим, что проверке подвергается гипотеза о том, что средняя
продолжительность периода беременности составляет 270 дней.
В нашем распоряжении имеются все необходимые для проверки
этой гипотезы данные. Вопрос состоит в следующем: если истинное
значение средней равно 270 дням, то какова вероятность получе-
ния средней, величина которой составляет 266,14 дня? В предпо-
ложении о нормальности распределения средних можно воспользо-
ваться методом проверки, связанным с расчетом Z-оценок:
Z. — 27() —266.14 = 3,86 = од
~~ 3,54 3,54 ’ '
Сверившись с последним столбцом табл. 6.7, можно убедиться,
что вероятность получения Z-оценки, лежащей за пределами ин-
тересующего нас интервала, равна примерно 0,31. Данный резуль-
тат свидетельствует о том, что достаточно веских причин для от-
брасывания нулевой гипотезы у пас нет. Однако, как известно,
подобное заключение связано с опасностью допустить ошибку
II рода — принять нулевую гипотезу в случае, когда она ошибоч-
на. Накопленные за долгое время данные о продолжительности
При нахождении доверительных границ автор пользуется формулой опре-
деления Z-оценки
(Z=
А'-М
8
). Значения Z-оцепок содержатся в первом столбце
табл. 6.7, а соответствующие им значения площадей — в пятом; оценка показа-
теля 8, которая в данном случае равняется S.w, у нас есть. Следовательно,
чтобы получить гоаннцы интервала, содержащего интересующую нас величину
площади графика распределения, необходимо значение Z-оценки умножить
на Зм. — Примеч. пер.
155
периодов беременности у миллионов женщин свидетельствуют
о том, что истинное значение средней меньше 270 дней.
ПРЕДПОЛОЖЕНИЯ
Настало время, когда мы можем более точно сформулировать
некоторые идеи и проблемы, мимоходом затронутые в предыдущем
изложении. Осуществление статистических выводов на базе не-
скольких числовых значений представляет собой процесс построе-
ния некоторой последовательности логических аргументов. Дан-
ный статистический вариант цепочки логических умозаключений
имеет следующий вид: если то-то и то-то является верным, то от-
сюда следует то-то и то-то. Вернувшись немного назад, мы об-
наружим, что наши статистические аргументы основываются на
двух предположениях.
Первое предположение связано с допущением о случайном
характере отбора отдельных элементов в выборке. Данное пред-
положение гарантирует, что М будет несмещенной оценкой пока-
зателя [1. В принципе лицо, проводящее выборку, в состоянии оп-
ределить, выполняется ли данное предположение па практике.
Однако сказанное не является верным по отношению ко второму
предположению, состоящему в том, что выборочное распределение
средних представляет собой нормальное распределение с некото-
рым значением оценки стандартного отклонения (стандартной
ошибки). Суждения о границах доверительного интервала для
средней или уровне значимости, при котором отвергается нулевая
гипотеза, базируются па показателях площади кривой нормаль-
ного распределения. Следовательно, в случаях, когда рассматри-
ваемое распределение в действительности не является нормаль-
ным, эти суждения становятся необоснованными.
ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
Второе из этих предположений подводит нас к одной из наи-
более важных концепций в области методов статистической про-
верки гипотез — центральной предельной теореме. Центральная
предельная теорема состоит в том, что суммарные (а следова-
тельно, и средние) значения случайных выборок будут нормаль-
но распределены независимо от типа распределения наблюдений,
принадлежащих исходной совокупности (единственное условие, ко-
торое при этом должно выполняться, состоит в том, чтобы объем
выборок был достаточно большим). Вместо теоретического дока-
зательства этой теоремы попытаемся обосновать справедливость
ее положений с помощью примера. В табл. 7.1 содержатся 900
случайных чисел. Подобные таблицы в настоящее время получают
с помощью ЭВМ. Существенная характеристика случайных чисел
состоит в том, что каждая цифра от 0 до. 9 имеет одинаковую
вероятность появиться в любом месте любой части таблицы.
Как вы думаете, какую форму примет частотное распределе- _
156
ние появлений в таблице каждого из чисел от 0 до 9, если на-
нести его на график? Поскольку вероятность появления каж-
дого числа равна Vio, можно предположить, что это распреде-
ление будет иметь прямоугольную форму (рис. 7.3). Однако вы
должны при этом иметь в виду, что фактическое распределе-
ние будет несколько отличаться от теоретически ожидаемого.
Как и в случае с другими распределениями случайных событий,
§ 3,3 •
* 01 -
i _ l
0123456789
Случайные числа.
Рис. 7.3. Прямоугольное распределение.
Поскольку вероятность появления любо-
го числа равна 0,1 и для всех чисел
одинакова, выборка данного объема
теоретически будет содержать все эти
числа, причем они будут встречаться в
ней с одинаковой частотой. Закон боль-
ших чисел говорит нам, что данное ут-
верждение будет истинным только по
отношению к выборкам бесконечно
большого объема. В соответствии с
центральной предельной теоремой в ре-
зультате извлечения из этой совокупнос-
ти выборок достаточно большого объема
будет получено нормальное распределе-
ние средних z
форма фактического распределения может быть аппроксимирована
с помощью соответствующего теоретического распределения толь-
ко тогда, когда число случайных событий неограниченно велико.
Средняя этого теоретически ожидаемого распределения нахо-
дится легко: 9 + 8+...+1+0 = 45/10 = 4,5. Что касается стандарт-
ного отклонения, то вы можете поверить мне на слово, что его
величина равна 2,87. Впрочем, все необходимые расчеты приво-
дятся в табл. 7.2. Полученное значение соответствует теоретиче-
ски ожидаемому, поскольку мною была выделена одна выборка
из 10 чисел, являющаяся как бы точным репрезентативным слеп-
ком с бесконечной исходной совокупности наблюдений. До тех пор
пока число нулей, единиц, двоек и т. д. в рамках каждой отдель-
ной выборки будет оставаться одинаковым, величина S будет
равной 2,87.
Важной особенностью рассматриваемой ситуации является то,
что нам известны значения параметров исходной совокупности.
Цель же осуществления выборок состоит в получении оценок зна-
чений параметров. Поскольку в нашем распоряжении этих оценок
пока нет, можно на практике осуществить процесс оценивания и
посмотреть, в какой степени полученные значения оценок будут
соответствовать истинным, известным нам значениям параметров.
В табл. 7.3 представлены результаты 25 фактически произведен-
ных выборок по 10 наблюдений, взятых из таблицы случайных чи-
сел. Первая выборка состоит из чисел 9005202750. В столбцах,
расположенных справа от этих чисел, представлены соответствую-
л
щие рассчитанные для выборок значения М, S и S.
Из табл. 7.3 видно, что значения статистик меняются при пе-
157
Таблица 7.1
Си
00
900 случайных чисел
1 2 3 4 5 6 7 1 8 9 10 11! 19 j 13! 14 | 15 | 18 1 17 13 19 20 21 22 23 24 25 26 27 28 29' 30
1 0 3 4 7 4 3 7 3 8 6 3 6 в 1 4 6 9 8 6 3 7 1 6 2 3 3 2 6 1 6
2 9 7 7 4 2 4 G 7 6 2 4 2 8 ' 1 1 4 5 7 2 0 4 2 5 3 3 2 3 7 3 1
3 1 6 7 6 6 2 2 7 0 6 6 6 5 0 2 6 7 1 0 7 3 2 9 0 7 9 7 8 5 3
4 1 2 5 6 8 5 9 9 2 6 9 6 9 6 'б 8 2 7 3 1 0 5 0 3 7 2 9 3 1 5
• 5 5 5 5 9 5 6 3 5 6 4 1 8 0 4 8 2 4 6 2 3 3 1 6 2 4 3 9 0 9 0
6 1 6 2 2 7 7 9 4 3 9 4 9 5 4 4 3 5 4, 8 2 1 7 3 7 9 3 о 3 7 8
7 8 4 4 2 1 7 5 3 3 1 5 7 2 4 5 5 0 G 8 8 7 7 0 4 7 7 4 7 6 7
8 6 3 0 1 6 3 7 8 5 9 1 6 9 5 о 5 5 7 1 9 9 8 1 0 О 0 7 1 7 5
9 3 3 2 1 1 2 3 4 2 9 7 8 G 4 5 6 0 7 8 2 5 2 4 2 4 4 3 8 1 5
10 5 7 6 0 8 6 3 2 4 4 0 9 4 7 2 7 9 6 5 4 4 9 1 7 4 G 0 9 6 2
11 1 8 1 8 0 7 9 2 4 6 4 4 1 7 1 6 5 8 0 7 9 9 8. 3 8 G 1 9 6 2
12 2 6 6 2 3 8 9 7 7 5 8 4 П 6 0 7 4 4 9 9 8 3 1 1 4 6 3 2' 2 4
13 2 3 4 2 4 0 6 4 7 4 8 2 9 7 7 7 7 7 8 1 0 7 4 5 3 2 1 4 0 8
14 3 2 9 8 9 4 0 7 7 2 5 2 3 6 2 8 1 9 9 5 5 0 9 2 2 6 1 1 9 7
_15 0 0 5 6 7 6 3 1 3 8 8 0 2 2 0 2 5 3 5 3 4 5 5 1 5 9 2 1 5 3
23 ' 24 25 26 27 I 28
159
Таблица 7.2
Расчет S для чисел от 0 до 9
X d d?
0 1 2 3 4 5 6 7 8 9 —4,5 —3,5 —2,5 ' —1,5 —0,5 +0,5 +1.5 +2,5 +7,5 +4,5 20,25* 4,5 12,25 3,5 2.5 2,25 . 1,5 /82,50 0,25 = | ~/0~= °'5 0,25 0,5 „ =/8,25 = 2,25 r 1,5 6,25 „ 2,5 = 2,87 12,25 3;.5 20,25 4,5
Итого Средняя 4,5 4,5 82,50 8,25
* Существует маленькое правило, которое в ряде случаев может ока-
заться полезным: квадрат любого числа, имеющего десятичную дробную
часть, равную 0,5, находится путем умножения целой части этого -числа на
значение следующего за ним по порядку целого числа с последующим добав-
лением к полученному результату 0,25. Например, (3,5)2-=ЗХ4 + 0,25=12,25;
(50,5)2=50Х514-0.25 = 2550.25. Это же правило остается в силе и при работе
с целыми числами: (75)2=7Х8 = 56 «+> 25=5625; (45)2 = 2025 и т. д.
реходе от одной выборки к другой *. На рис. 7.4 представлено
частотное распределение средних значений 25 выборок с нало-
женной на него кривой нормального распределения. Это распре-
деление средних является фактическим эмпирически полученным
выборочным распределением средних (так же, как и распределе-
ние, представленное па рис. 7.1).
Вас, видимо, не нужно убеждать в том, что распределение
средних по форме довольно сильно напоминает нормальное рас-
пределение. Этот факт иллюстрирует справедливость положений
центральной предельной теоремы. Центральная предельная теоре-
ма, как вы помните, гласит, что распределение суммарных значе-
ний (а следовательно, и средних) случайных выборок, осуществ-
ленных из любой совокупности наблюдений, будет нормальным,
причем единственное условие, которое при этом должно выпол-
* Данные в табл. 7.3 представляют собой фактические значения, получен-
ные с помощью таблиц случайных чисел (аналогичных таблице, приведенной в
пашей книге) или таблиц случайных нормализованных чисел. Подобный способ
изложения материала, возможно, для вас несколько необычен, однако его су-
щественное преимущество состоит в том, что выдвигаемые положения получают
конкретную и наглядную количественную интерпретацию.
160
Таблица 7.3
Значения М, S и S для выборок случайных чисел
Выборка Числа S /’ S
W=50
1 9005202750 3,00 ' 3,13 3,30 М=4,36
2 8271827982 5,40 3,04 3,20 S=2,62
3 8934482877 6,00 2,37 2,49 3 = 2,65
4 4444061944 4,00 2,32 2,45
’5 6610586843 4,70 2,57 2,71 Л'= 100
6 1746779969 6,50 2,38 2,51 44=4,25
7 6767637401 4,70 2,45 2,58 S=2,83
8 5029046941 4,00 3,16 3,33 3 = 2,84
9 7887019046 5,00 3,32 3,50
10 9403874214 4,20 2,82 2,97 N=250
11 6012213542 2,60 1,80 1,90 44 = 4,46
12 2909802527 4,40 3,44 3,63 3 = 2,83
13 6705303497 4,40 2,84 . 2,99 Л 3 = 2,84
14 0076459007 3,80 3,34 3,52
15 5431659097 4,90 2,88 3,03 Л'= 300
16 0523871302 3,10 2,62 2,77 44 = 4,5'6
17 3644527181 4,10 2,30 2,42 3 = 2,86
18 9424935572 5,00 2,45. 2,58 3 = 2,86
19 6376375478 5,60 1,69 1,78
20 2432774597 5,00 2,28 2,40 Л7=350
21 5265192644 4,40 2,24 2,37 44=4,49
22 6073282781 4,40 2,94 3,10 3 = 2,88
23 3325177045 3,70 2,24 2,36 3=2,88
24 3324954613 4,00 2,14 2,26
25 Средняя 7624099180 4,60 3,47 3,66 W=400 44=4,42
4,46 2,64 .2,79 3 = 2,90 3=2,90
П-1778
161
пяться, состоит в том, чтобы объем выборок был достаточно боль-
шим. В нашем примере исходная совокупность прямоугольно рас-
пределена, однако распределение средних, полученное в резуль-
тате осуществления из этой совокупности всего лишь 25 выборок,
является приблизительно нормальным. Попутно мы случайно об-
наружили, что выборка, состоящая из 10 наблюдений, по-видимо-
му, вполне удовлетворяет требованию, которое содержится в фор-
мулировке центральной предельной теоремы: объем выборки дол-
жен быть «достаточно большим».
Рис. 7.4. Выборочное распределение средних 10 отобранных наугад случайных
чисел. Данные взяты из табл. 7.3. В этой таблице показано, что средняя равна
4,46. Значение 5=0,88 рассчитано для этих средних. Представленная на графике
гладкая кривая является нормальной кривой, характеризующейся только что
приведенными значениями параметров. Важно отметить, что, хотя исходная со-
вокупность данных была прямоугольной (см. рис. 7.3), полученное распределе-
ние средних близко к нормальному. Этот результат подтверждает центральную
предельную теорему
Л
5, ОЦЕНКА о
Если посмотреть па значения средних, приводящиеся в ниж-
ней части табл. 7.3, то можно заметить следующие два важных
момента: (1) средняя средних (4,46) очень близка к известному
нам значению истинной средней, однако при этом (2) величина
средней S (2,64) слишком мала. При внимательном рассмотрении
индивидуальных значений показателя S обнаруживается, что око-
ло двух третей этих значений меньше величины известного нам
показателя, равного 2,87.
В основе этого явления лежат три причины. Первая из них,
как отмечалось, связана с тем, что средняя представляет собой
точку в распределении, сумма квадратов отклонений от которой
минимальна. Известно, что при оценке значения ст осуществля-
ется корректировка показателя выборочного стандартного откло-
нения: с этой целью в формуле стандартного отклонения вместо
делителя N используется (N—1). Рассчитанные подобным обра-
Л
зом для 25 выборок оценки дисперсии представлены в столбце S
таблицы. Изучая этот столбец, можно заметить, что средняя скор-
ректированная оценка по-прежнему ниже (хотя и в меньшей сте-
пени, но все еще достаточно ощутимо) истинного значения а
(2,79 против 2,87). Это позволяет нам сформулировать вторую из
162
упоминавшихся причин, в силу которых можно ожидать появле-
ния слишком низкого значения оценки о. Исходное распределе-
ние имеет прямоугольную форму. Интуиция, возможно, вам под-
сказывает, что при отсутствии экстремальных по величине значе-
ний (аналогичных тем, которые встречаются, скажем, в хвостах
нормального распределения) проявляется тенденция к занижению
значений S, а следовательно, и величины оценки о. Третья при-
чина имеет особенно важное значение. Объем выборок, на резуль-
татах которых основывались эти оценки, был невелик (7V=10).
Данный факт проявляется, в частности, в необходимости исполь-
зования при небольшом объеме выборок /-критерия вместо 2-кри-
терия. /-критерий будет подробно рассмотрен в приложении (см.
с. 252).
В правой части табл. 7.3 можно увидеть, что случится со зна-
чениями интересующих нас показателей при единичных выбор-
ках большего объема из таблицы случайных чисел. Очевидно, что
величины S и S остаются относительно небольшими, пока объем
' Л
выборки не превышает 100 наблюдений. При У=100 оценка Х на
0,03 меньше истинного значения соответствующего параметра ис-
ходной совокупности. Затем при увеличении объема выборки ве-
личина этой оценки становится близкой к значению 2,87.
ЗНАЧИМОСТЬ РАЗЛИЧИЙ
Шаг, который нужно сделать, чтобы перейти от изучения рас-
пределения выборочных средних к рассмотрению аналогичных
проблем, связанных с анализом различий, столь незначителен,
что вы можете даже не заметить изменение предмета нашего об-
суждения. Однако этот шаг имеет принципиально важное значе-
ние. поскольку он поможет лучше понять суть анализа результатов
экспериментов наиболее простого типа из гл. 3.
В работе «Принципы психологии» Уильям Джеймс при обсуж-
дении вкусовой чувствительности отмечал, что ему были извест-
ны люди, которые могли распознать по вкусу, из какой части
бутылки палит в стакан выдержанный бордосский кларет (сорт
красного вина). В силу причин, о которых будет сказано чуть
позже, эти люди также утверждали, что вино из нижней части
бутылки По вкусу лучше. При всем моем уважении к У. Джеймсу,
я отношусь к подобному утверждению скептически. Способность,
о которой он говорит, вероятно, и существует, однако она не
имеет никакого отношения к дегустаторским способностям того
или иного человека. Здесь могут быть рассмотрены две альтер-
нативные возможности. Одна из них состоит в том, что к «дегу-
стации» содержимого второй половины бутылки люди приступали
уже в состоянии некоторого опьянения, поэтому их утверждение о
более высоких вкусовых качествах вина из этой части бутылки
следует отнести на счет того приподнятого настроения, в кото-
ром они пребывали. Однако я отвергаю эту гипотезу как несостоя-
тельную в силу довольно низкого содержания алкоголя (пример-
11* , . 163
но 12%) в бордосском вине. Если в верхней части бутылки по-
мещается 12,5 унций1 вина, то содержание алкоголя в этом вине
не превышает 1,5 унции. Столько же алкоголя содержится в двух
маленьких рюмках виски, крепость которого равна 100 градусам * *.
И все же если бы обладающие утонченными вкусовыми способ-
ностями знакомые Джеймса в одиночку выпивали половину бу-
тылки вина, то выдвинутое выше объяснение имело бы под собой
какие-то основания. Однако в том обществе, к которому принад-
лежал Джеймс, подобные привычки кажутся немыслимыми. Бу-
тылка вина обычно распивается на троих или четверых. Рассмот-
рим лучше второе из упомянутых альтернативных объяснений.
Это объяснение связано с тем фактом, что у многих вин,
в особенности бордосских сортов, улучшаются вкусовые качества,
если дать им немного «подышать», т. е. оставить на некоторое
время в незакупоренной бутылке. По этой причине подобные на-
питки имеет смысл распечатывать за 0,5—3 часа до их употребле-
ния. Поскольку па распитие половины бутылки вина и требуется
примерно полчаса, проверяемая гипотеза о существовании разли-
чий в качестве вина, наливаемого из одной и той же бутылки,
может быть обоснована с помощью феномена «дыхания» вина.
Предположим, что кто-нибудь захочет проверить данную ги-
потезу экспериментально. Имеется несколько способов проделать
это. Мы опишем четыре из них и назовем еще один. Это позволит
нам сделать ряд важных выводов. Во всех случаях будут исполь-
зоваться одни и те же значения для более глубокого понимания
полученных результатов.
СЛУЧАЙНАЯ ПЕРЕМЕННАЯ —ДЕГУСТАТОРЫ ВИНА. МЕЖГРУППОВАЯ ВЕРСИЯ
Наиболее очевидный способ проведения эксперимента состоит
в случайном отборе 20 человек из некоторой совокупности людей,
имеющих достаточный опыт дегустации вин. (Дегустация обычно
осуществляется на базе 20-баллыюй шкалы оценок, в соответствии
с которой вино, получившее оценку ниже 10 баллов, к употребле-
нию практически непригодно. Совершенному по вкусовым каче-
ствам напитку соответствуют 20 баллов.) При проведении экспе-
римента дегустаторы должны быть случайным образом разбиты
на две группы; одна из этих групп будет иметь дело Двином из
только что откупоренных бутылок, второй группе будет пред-
ложено «подышавшее» некоторое время вино.
На втором шаге необходимо отобрать марку вина с достаточ-
1 1 унция —28,3 г. — Примеч. пер.
* «Градусы» напитка (в принятой на западе системе измерения крепости ал-
когольных напитков. — Примеч. пер.) соответствуют удвоенному проценту со-
держащегося в этом напитке алкоголя. Крепость многих напитков равна 86 гра-
дусам, что соответствует 43% алкоголя. По закону крепость напитков в Велико-
британии ограничивается 80 градусами, или 40% алкоголя. В виски крепостью
100 градусов содержится 50% алкоголя. В рюмке помещается 1,5 унции напит-
ка, отсюда и'вывод о том, что содержимое верхней половины ' бутылки вина
эквивалентно по опьяняющему действию двум рюмкам виски.
164
но высокими вкусовыми качествами. При этом не следует, однако,
брать вино столь высокого качества, в соответствии с которым оно
сразу после откупоривания бутылки будет неизменно получать
оценку в 19 или 20 баллов. Иначе мы столкнемся с так называе-
мым «эффектом потолка»: при любых условиях оценки будут та-
кими высокими, что с их помошью невозможно обнаружить имею-
щиеся различия. Улучшение свойств вина очень высокого качества
в результате «воздушной ванны» будет практически незаметным.
В самой процедуре проведения эксперимента нет ничего необыч-
ного: эксперты в двух группах будут дегустировать вино и при-
сваивать ему оценки. Допустим, при проведении эксперимента
были получены показатели, приведенные в табл. 7.4.
Таблица 7.4
Гипотетические результаты эксперимента по дегустации вина
Группа 4
Дегустация вина саазу после
откупоривания бугылкп
Дегустация
Группа В
«подышавшего» вица !
Дегустатор I Оценка
I
Дегустатор !
Оценка
1
2
3
4
5
6
7
8 '
9
Ю
Средняя
S
Л
S
S уг
16,0
9,5
15,0
15,5
13,0
10,5
14,5
17,0
12,0
17,5
14,65
2,37
2,49
______0,79
11*
12
13
11
15
16
17
18
19
20
16,0
12,0
15,5
15,0
14,0
18,5
18,0
13,0
17,5
17,0
15,65
2,06
2,17
0,69
* Подобный порядок нумерации дегустаторов выбран нами в связи с воп- -ч
росами, которые будут обсуждаться в следующем параграфе.
Из таблицы следует, что средние оценки различаются меж-
ду собой на один балл. Вопрос состоит в том, существенно ли
данное различие. Ответить на этот вопрос можно с помощью не-
однократно нами применявшегося метода. Мы должны выяснить,
используя для этого соответствующий критерий значимости, како-
ва вероятность получения различия в один балл, если истинное
различие ,в действительности составляет 0 баллов? При осуществ-
лении такой проверки необходимо оцепить величину стандартно-
го отклонения выборочного распределения разностей, стандартную
ошибку разности (Spasu), а затем сопоставить полученное в экспе-
рименте значение разности, равное 1,0, с величиной стандартной
165
ошибки разности. Соответствующие вычисления приводятся в при-
ложении. Полученные результаты свидетельствуют о том, что
различие в один балл незначимо*.
СЛУЧАЙНАЯ ПЕРЕМЕННАЯ —ДЕГУСТАТОРЫ ВИНА.
ВНУТРИГРУППОВАЯ ВЕРСИЯ
При знакомстве с таблицей, в которой представлены только
что описанные результаты, бросается в глаза существенный раз-
нобой в оценках качества вина. У вас могут возникнуть сомнения
относительно возможностей выделения с помощью предложенной
экспериментальной схемы воздействия «воздушной ванны» на ка-
чество вина (даже если такой эффект в. действительности при-
сутствует). И такие соображения будут вполне обоснованными.
Поэтому имеет смысл попытаться как-то уменьшить вариацию оце-
нок дегустаторов. Выход из создавшейся ситуации может состоять
в следующем: необходимо, чтобы в обеих экспериментальных груп-
пах были одни и те же люди. Реализация этой идеи на практике
связана с организацией проведения эксперимента по внутригруп-
повой схеме.
Такой эксперимент провести несколько сложнее, чем при меж-
групповом плане организации исследования, поскольку в дан-
ном случае мы столкнемся с необходимостью решить еще одну
проблему. Эта проблема связана с тем порядком, в котором дегу-
статоры должны будут оценивать качество вина. Некоторые из
них вначале будут пробовать вино из только что откупоренной бу-
тылки, другие — из бутылки с «подышавшим» некоторое время
вином. Было бы неправильно, например, открыть бутылку и по-
просить участников эксперимента оценить вкус содержащегося
в ней вина, а затем через некоторое,, заранее определенное время,
процедуру оценивания этого же вина повторить. Приняв такую
схему проведения эксперимента, мы допустили бы две ошибки:
(1) если бы дегустаторы знали о воздействии эффекта «дыхания»
на вкусовые качества вина, то эта информация и связанные с ней
ожидания (предвосхищающие оценки, см. с. 90) могли бы ока-
зать воздействие на величину оценок; (2) в случае, когда дегуста-
торы ничего нс знают об эффекте «дыхания» вина, возможно
смешение эффекта порядка дегустации . с эффектом «дыхания».
Любое полученное в эксперименте различие в оценках может быть
с одинаковым успехом отнесено как на счет порядка дегустации,
так и на счет эффекта «дыхания».
Однако с этими проблемами, раз уж мы признали реальность
их существования, справиться довольно легко. Предположим те-
* Замечание, адресованное, тем, кого подобный способ доказательства не
удовлетворяет. Материал, изложенный в данном параграфе, а также в одном-
двух параграфах гл. 8, содержит много технических подробностей. Пожалуйста,
не пропускайте их. Если у нас не хватит терпения, можно ограничиться хотя бы
беглым просмотром арифметических вычислений, поверив мне па слово, что они
проделаны верно, и обратив внимание лишь на порядок операций. Это облег-
чит вам понимание гл. 9.
166
перь, что эксперимент проведен по всем правилам. Отобраны 10
человек, имеющих такую же квалификацию, что и 20 участников
описанного эксперимента. Каждый из них дважды пробует вино
из одной и той же бутылки:.первый раз сразу после ее откупори-
вания, а второй — через некоторый, заранее определенный, проме-
жуток времени. Допустим, что при этом получены приведенные
в табл. 7.5 результаты, которые, как можно заметить при внима-
тельном рассмотрении, состоят из значений, совпадающих с оцен-
ками, полученными при межгрупповой схеме проведения экспери-
мента1. На этот раз, однако, для каждого дегустатора мы имеем
по две оценки качества вина, а также значение разности между
ними. Данный фактор позволяет нам оценить полученные резуль-
таты с помощью слегка модифицированного (по сравнению с ис-
пользовавшимся ранее) способа применения статистических харак-
теристик нормальной кривой. Представим каждое значение разно-
сти как оценку каждого участника эксперимента, а затем продела-
ем следующие вычисления: (1) Получим стандартное отклонение
этих оценок. Из таблицы следует, что оно равно 0,63. (2) Оценим
величину стандартного отклонения генеральной совокупности. По-
Л
лучим 5 = 0,67 (табл. 7.5). Использовав эту величину для опреде-
ления оценки стандартной ошибки средней (также приведенной
в таблице), получим, что она равна 0,21:
5и^Л- = -^=^==0,21.
J N I Ю 3, 1G
Отметим, что эта оценка представляет собой стандартную ошибку
средней разности, 5раз11. Следовательно, мы можем использовать
ес в /-критерии при оценивании гипотезы о том, что истинное
значение средней разности равно нулю, в то время как фактически
полученное значение составило 1,0:
Z =, JJkJL 4 76
0,21 ’
Заглянув в табл. 6.7, можно убедиться в том, что столь высокое
значение Z-оцепки случайным образом может быть получено
чрезвычайно редко. Таким образом, мы должны будем отверг-
нуть гипотезу о том, что истинное значение разностей равно нулю,
и принять гипотезу, в соответствии с которой выделенные нами
дегустаторы в состоянии определить различие между «подышав-
шим» вином и вином из только что откупоренной бутылки.
Результаты, полученные при данной схеме проведения экс-
перимента, имеют существенно более высокий уровень значимос-
ти, чем результаты эксперимента по межгрупповой схеме. Это до-
стигнуто благодаря тому, что внутригрупповой план проведения
эксперимента -уменьшает дисперсию индивидуальных оценок дегу-
статоров, которая затрудняет проверку разностей. Смысл данного
1 Однако порядок их расположения в каждом из столбцов таблицы изме-
нен. — Примеч. пер.
167
Таблица 7.5
Внутригрупповая схема проведения эксперимента
по определению вкусовых качеств вина
Дегус- та гор Дегустация вина сразу noiле откупо- ривания бутылки Де! у ста- ция «по- дышав- uiei о» вика Раз- ' ность Дегус- татор i Дегустация вина сра«у после откупо- ривания буты тки Делега- ция «по- Д1.Ш13В- шего» вина Раз- ность
1 17,0 18,5 4-1,5 1 8 13,0 14,0 4-1,0
2 17,5 18,0 ~|~0,5 9 12,0 13,0 4-1,0 -j-2,5
3 16,0 17,5 4-1,5 10 9,5 12,0
4 16,5 17,0 4-0,5 Средняя 14,65 15,65 4-1,0
5 15,5 16,0 4-0,5 4-0,5 S 2,37 2,06 0,63
6 15,0 15,5 5 2,49 . 2,17 0,67
7 14,5 15,0 4-0,5 S.v 0,79 0,69 0,2!
утверждения в полной мере можно понять только после того, как
вы познакомитесь с материалом гл. 8 и 10.
, СЛУЧАЙНАЯ ПЕРЕМЕННАЯ —МАРКА ВИНА
Описанный эксперимент может быть проведен и по другой
схеме. При использовании этой схемы выделяется всего один че-
ловек из группы людей, которые, как утверждает Уильям Джеймс,
обладают способностью улавливать различия во вкусе вина, нали-
того из верхней или нижней половины бутылки, и осуществляет-
ся случайная выборка бутылок этого вина различных марок. Экс-
перимент может проводиться по межгрупповому или внутригруппо-
вому плану. Но в любом случае осуществить его будет нелегко
и он будет довольно дорогостоящим, поскольку для единственно-
го участника эксперимента придется закупить 20 бутылок вина,
в то время как при проведении экспериментов, в которых в ка-
честве случайной переменной выступали сами дегустаторы, доста-
точно было всего одной бутылки вина (участники эксперимента
делали лишь один маленький глоток).
Процедура проведения эксперимента по межгрупповой схеме
состоит в следующем: (1) осуществляем выборку 20 бутылок бор-
досского кларета различных марок (аналогично выборке 20 чело-
век при проведении эксперимента по межгрупповой схеме, когда
в качестве случайной переменной выступали дегустаторы); (2) де-
лим. эту совокупность бутылок на две группы. Бутылки в одной
из этих групп распечатываем и даем вину некоторое время «по-
дышать»; (3) предлагаем нашему единственному эксперту попро-
бовать и оценить вкусовые качества вина из двух групп бутылок;
(4) оцениваем значения разностей полученных показателей с по-
мощью 5Рази- Если данные эксперимента совпадут с показателя-
ми табл. 7.4 (единственное отличие при этом будет состоять
в том, что номера в таблице соответствуют не отдельным дегу-
статорам, а бутылкам кларета различных марок), то значение раз-
ности, равное 1, не будет существенным.
168
Эксперимент по внутригрупповой схеме должен проводиться
так: (1) осуществляем случайную выборку 10 различных марок
вина и покупаем по две бутылки вина каждой из этих марок;
(2) вино из одной бутылки наш единственный дегустатор пробует
и оценивает сразу после ее распечатывания, а из второй — после
того как находящееся в ней вино некоторое время «подышит». Та-
ким образом, каждая из 10 марок вина получит по две оценки;
(3) производим оценку разностей этих показателей. Если полу-
ченные данные совпадут с показателями табл. 7.5, то результат
нашего эксперимента (оценка эффекта «подышавшего» вина) со
статистической точки зрения будет иметь очень высокую степень
значимости.
СТЕПЕНЬ ОБЩНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ РЕЗУЛЬТАТОВ
Причина, по которой столько внимания уделялось описанию
нашего мысленного эксперимента, проводившегося двумя различ-
ными способами (в одно?л из них в качестве случайной переменной
выступали дегустаторы, в другом — марки вина), связана со стрем-
лением показать, что эти два метода приводят к получению ре-
зультатов, смысл которых в каждом из этих двух случаев интер-
претируется по-разному. Когда исследователь изучает какую-ни-
будь проблему, он надеется, что полученные им результаты отра-
жают объективную реальность окружающего мира. В этом смысле
наука сродни драматическому искусству. Как сказал Шекспир,
цель театра во все времена была и будет «держать, так сказать,
зеркало перед природой»1. Оказывается, однако, что конкретный
образ природы, отражающийся в зеркале научного поиска, опре-
деляется особенностями выбранного исследователем участка на-
блюдений.
Другими словами, совокупность, на которую могут быть рас-
пространены полученные в исследовании результаты, определяется
тем, из какой совокупности была осуществлена изучавшаяся пред-
ставительная выборка наблюдений. В экспериментах, где в каче-
стве случайной переменной выступали дегустаторы, результаты,
если они оказывались значимыми, указывали на то, что эксперты
генеральной совокупности, представителями которых являлись
участники эксперимента, также смогут отличить вино, налитое
из только что откупоренной бутылки, от вина, которому дали
некоторое время «подышать». Однако этот вывод будет справед-
лив только для вина topi марки, которая использовалась при про-
ведении эксперимента.
Если в качестве случайной переменной при проведении экс-
перимента рассматривалась марка вина, интерпретация получен-
ного результата будет состоять в следующем: выделенный нами
единственный участник эксперимента может уловить интересую-
щие нас различия в рамках генеральной совокупности всех марок,
1 Шекспир В. Гамлет. Акт III, сцена 2. — Примеч. пер.
169
репрезентативным представителем которой является выборка вин,
использовавшихся при проведении эксперимента. Однако это, во-
обще говоря, справедливо только по отношению к тому единст-
венному человеку, который принимал участие в эксперименте, и
у нас нет оснований распространить данный вывод на всю сово-
купность дегустаторов вина.
ДИСПЕРСИОННЫЙ АНАЛИЗ
Очевидно, что полученные результаты, в силу их довольно
ограниченной степени- общности, нельзя признать удовлетвори-
тельными. Настоящий ученый должен стремиться к тому, чтобы
результаты исследования можно было обобщить на обе генераль-
ные совокупности — на совокупность дегустаторов и на совокуп-
ность марок вина. Для достижения этой цели необходимо, видимо,
провести эксперимент, планом которого предусматривалось бы осу-
ществление некоторых выборок из двух генеральных совокупно-
стей. Следовало бы отобрать несколько человек и обязать каждо-
го из них продегустировать несколько марок вина в различных
экспериментальных условиях (сразу после раскупоривания бутыл-
ки и после того, как вино некоторое время «подышало»). Подоб-
ная схема проведения эксперимента представляет собой факторный
план (см. с. 80), в котором регулируемой переменной являет-
ся состояние вина («подышавшее» или пет), а второй независимой
выделяемой переменной — марка вина. Метод анализа, применяе-
мый для оценки результатов подобных исследований, называется
дисперсионным анализом. После того как вы изучите главы, по-
священные корреляции, мы познакомимся с существом этого важ-
ного метода статистических исследований (см. гл. 10).
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
В данной главе фактически продолжалось изложение мате-
риала гл. 6, в которой большое внимание было уделено провер-
ке статистических гипотез. Метод проверки гипотез во всех слу-
чаях имеет дело с рассмотрением следующего вопроса: если вы-
борочное распределение статистики, полученной при осуществле-
нии некоторой выборки, удовлетворяет критерию, формулировка
которого связана с необходимостью выполнения некоторой сис-
темы предположений, то какова вероятность случайного получе-
ния данной статистики в процессе осуществления случайной вы-
борки? Ответ на этот вопрос связан с нахождением уровня зна-
чимости, при котором может быть отвергнута пулевая гипотеза.
В этой главе мы обсудили некоторые новые технические концеп-
ции, а с общей логикой изложения вы уже хорошо знакомы. Ха-
рактеристика новых, а также ряда старых понятий приводится
далее.
Генеральная совокупность. Полное множество некоторых еди-
ниц, которые обладают теми или иными общими свойствами, су-
170
щественными для их характеристики. Часто такая совокупности
может состоять из людей, принадлежащих к той или иной катего-
рии населения.
Выборка. Некоторая подгруппа единиц, выделенных из гене-
ральной совокупности.
Репрезентативная выборка. Выборка, состав и структура ко-
торой по своим существенным характеристикам соответствуют
составу и структуре исходной (генеральной) совокупности.
Смещенная выборка. Выборка, которая не является случай-
ной.
Случайная выборка. Выборка, при которой каждый отдельный
элемент и каждая комбинация элементов генеральной совокуп-
ности имеют одинаковую вероятность быть отобранными. Отбор
одного элемента не влияет на вероятность отбора любого дру-
гого элемента генеральной совокупности. Процедуры отбора яв-
ляются независимыми.
Статистика. Показатель, полученный по результатам выборки.
Параметр. Показатель генеральной совокупности.
Обозначения:
М — выборочная средняя (статистика);
[х — средняя генеральной совокупности (параметр);
S — выборочное стандартное отклонение (статистика);
о — стандартное отклонение генеральной совокупности (пара-
метр) ;
л, д
S — оценка S, полученная по выборочным данным: S =
V (N-l)’
Выборочное распределение. Частотное распределение статис-
тики, которое теоретически может быть получено при определе-
нии значений этой статистики по результатам бесконечно боль-
шого числа выборок.
Стандартная ошибка. Стандартнре отклонение выборочного рас-
пределения статистики.
Обозначения:
SM —стандартная ошибка средней. Другими словами, стан-
дартное отклонение выборочного распределения средней;
5Разн — стандартная ошибка выборочного распределения разно-
стей средних.
Доверительные границы. Диапазон значений, в который пока-
затель генеральной совокупности (параметр) попадает с некото-
рой вероятностью, величина которой, как правило, устанав-
ливается равной 95 или 99%. В настоящей главе, например, до-
верительные границы для средней ц определяются полученным
значением выборочной средней плюс — минус значение, рассчи-
танное на основе характеристик кривой нормального распределе-
ния (Z-оцепок). Так, 50%-пые доверительные границы для ц рав-
ны: M±0,6745SM, 95%-ные: Л4±1,965м, 99%-ные: Л1±2,585м.
17!
Гипотезы, на которых базируется применение статистических,
тестов. Условия, при выполнении которых приобретают силу ста-
тистические выводы. Применение статистических тестов, описан-
ных в настоящей главе, основывается на следующих гипотезах:
1. Гипотеза случайности, состоящая в том, что при проведении
исследования соответствующие экспериментальные группы форми-
руются с помощью случайных выборок.
2. Гипотеза нормальности, состоящая в том, что выборочное
распределение оцениваемой статистики представляет собой нор-
мальное распределение, имеющее некоторое конкретное значение
стандартного отклонения. Данное предположение необходимо для
оценивания статистических гипотез в показателях площади под
кривой нормального распределения.
Центральная предельная теорема. Обеспечивает выполнение
второй из приведенных выше гипотез. В соответствии с этой тео-
ремой распределение суммарных значений (и, следовательно, сред-
них) случайных выборок, осуществленных из любой генеральной
совокупности, является нормальным (при условии, что выборки
будут иметь достаточно большой объем).
Межгрупповой эксперимент. Эксперимент, при котором раз-
личные группы участвующих в нем людей имеют дело с различ:
ными значениями независимой переменной.
Внутригрупповой эксперимент. Эксперимент, при проведении
которого выделяется единственная группа людей и каждый входя-
щий в нее человек имеет дело-со всеми значениями независимой
переменной.
Z-критерий. Статистический критерий для оценки гипотез от-
носительно средней и средней разностей. В основе его лежит
расчет значений Z-оценок, которые соотносятся с показателями
таблицы площадей нормальной кривой.
Критическое отношение. Z-критерий. Назван так много лет
назад в связи с тем, что равное 3,0 значение Z использовалось
в качестве критерия для отбрасывания нулевой гипотезы. Соот-
ветствует уровню значимости 0,0026. В настоящее время к значи-
мости статистических показателей предъявляются менее жесткие
требования.
t-критерий. Статистический критерий, аналогичный Z-критерию.
Единственное отличие состоит в том, что значение t соотносится
с распределением, несколько отличающимся от нормального. Бо-
лее подробно об этом будет сказано в гл. 10 и в приложении.
8 КОРРЕЛЯЦИЯ
Допустим, что вы только что женились (вышли замуж), и
перед вашей молодой семьей стоит следующая проблема: вам
очень хочется иметь ребенка, однако в то же время вы озабочены
проблемами демографического взрыва, ростом безработицы, не-
хваткой жилья. Как вы поступите в этом случае: постараетесь
удовлетворить собственное желание или же откажетесь от своих
намерений. Если есть уверенность, что в будущем, по истечении
некоторого более или менее продолжительного периода времени,
наш мир станет лучше благодаря самоотвёрженным усилиям ва-
шего, находящегося пока еще только в проекте, отпрыска, то у вас
будут все основания для того, чтобы подарить ему жизнь; в про-
тивном случае лучше остаться бездетными. Какими же качествами
должен обладать человек, который сможет каким-то образом
улучшить наш мир? Почти каждый в состоянии дать ответ на этот
вопрос: такой человек должен быть честным, добрым, дружелюб-
ным, вежливым, дисциплинированным, энергичным, смелым, ум-
ным и т. д.
Но можно ли предсказать, что всеми этими качествами будет
обладать еще не рожденный ребенок? Если ваш коэффициент умст-
венного развития IQ равен 125, а вашей жены (мужа) 135, то
значит ли это, что ваш будущий ребенок вырастет смышленым
и его коэффициент IQ составит 130 (среднее из двух коэффици-
ентов)? Если вы проконсультируетесь у проживающего в сосед-
ней квартире статистика, то он вам объяснит, что ситуация в дей-
ствительности несколько сложнее, чем вам кажется. Да, имеется
положительная корреляция (ее значение равно примерно +0,60)
между средней величиной показателя IQ родителей и значением
этого же показателя их ребенка, откуда следует, что ваш ребенок,
возможно, будет обладать интеллектуальными способностями,
превышающими средний уровень. Однако необходимо рассмот-
реть еще целый ряд моментов: регрессию к средней, выбо-
рочное распределение прогнозируемых значений IQ и стандартную
ошибку любого вашего прогноза. Ободренные и в то же время не-
сколько обескураженные таким ответом, вы решаетесь сделать
следующее: во-первых, предпринять все необходимые усилия, что-
173
бы все-таки иметь ребенка, и, во-вторых, прочесть оставшуюся
часть настоящей главы, чтобы снять налет таинственности с тер-
минологии, которой пользуется ваш сосед-статистик.
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Если две какие-либо характеристики, полученные для одного
и того же «объекта», имеют тенденцию изменяться совместно,
так что создается возможность предсказать величину одной из
них по значению другой, то говорят, что эти характеристики кор-
релируют друг с другом. Подобный пример нами уже рассмот-
рен — корреляция между средним показателем IQ родителей и
средней величиной этого же показателя у их детей. . «Объект»
в данном случае представляет собой некоторую единицу, которую
образуют двое родителей и их дети. Это означает, что существует
возможность предсказать величину коэффициента IQ детей по
значению этого показателя у их родителей.
Таким образом, наблюдается тенденция, в соответствии с ко-'
торой у родителей, имеющих высокий показатель IQ, будут
рождаться дети также с высоким уровнем этого показателя, и,
наоборот, родители с низким IQ будут иметь детей с уровнем
интеллекта ниже среднего. Обобщенно говоря, величина детских
показателей IQ имеет тенденцию соответствовать значениям ко-
эффициентов умственного развития их родителей. В какой степени
соответствовать — это зависит от величины коэффициента корре-
ляции данной взаимосвязи.
Коэффициент корреляции представляет собой число, знак и
величина которого характеризуют направление и силу подобной
взаимосвязи. Имеется довольно много различных типов коэффици-
ентов корреляции, однако в настоящее время на практике наиболее
часто используется коэффициент корреляции произведения момен-
тов Пирсона, обозначаемый буквой г. В настоящей главе при об-
суждении вопросов, связанных с коэффициентом корреляции, мы
также будем пользоваться этим символом *.
Значения коэффициента корреляции могут изменяться от —1,0
до +1,0 (включая значение 0,0). Знак коэффициента указывает
на направление — прямое или обратное — взаимосвязи между дву-
мя переменными. Абсолютное значение коэффициента (без учета
знака) характеризует силу, или тесноту, рассматриваемой взаи-
мосвязш Коэффициент корреляции, равный плюс или минус 1,0,
указывает па наличие строгой функциональной взаимосвязи. Зна-
чение коэффициента 0,0 говорит об отсутствии какой бы то пи
было взаимосвязи между рассматриваемыми переменными.
ПОЛОЖИТЕЛЬНАЯ И ОТРИЦАТЕЛЬНАЯ КОРРЕЛЯЦИЯ
В случае когда высоким значениям одной переменной соответ-
ствуют высокие значения другой переменной, а низким зпачени-
* В приложении (см. с. 260) описывается еще один тип коэффициента,
q («ро»), основанный па использовании понятия ранга.
174
ям — низкие, то корреляция между этими переменными положи-
тельная. Далее приводится несколько примеров.
1. Как уже отмечалось, существует положительная корреляция
между коэффициентами IQ родителей и их детей.
2. Еще более сильная положительная корреляционная взаимо-
связь имеется между коэффициентами IQ близнецов; иными сло-
вами, значения коэффициентов IQ близнецов обычно оказываются
почти равными друг другу.
3. Данные по различным штатам свидетельствуют о сущест-
вовании положительной корреляции между средней величиной до-
хода и числом преступлений против собственности и имущества
граждан и организаций. Этот факт противоречит теоретическим
представлениям некоторых социологов, утверждающих, что уро-
вень бедности и уровень преступности изменяются в одном и том
же направлении.
4. Имеется сильная положительная корреляция между вкусо-
выми качествами выдержанных вин и их ценой. В общем случае
чем выше оценивается качество вина дегустатором, тем выше цена.
Отрицательная корреляция имеет место там, где высоким зна-
чениям одной переменной сответствуют низкие значения другой
переменной. И снова приведем несколько примеров.
1. Для начала сошлюсь на выражение моей матери, которое
она часто употребляла, когда говорила о моих поступках или
намерениях, которые ей не очень нравились: «Чем больше я об
этом думаю, тем меньше тебя понимаю».
2. В качестве более формального примера отметим отрица-
тельную связь между скоростью и точностью выполнения многих
заданий. Чем быстрее человек выполняет задание, тем ниже точ-
ность его действий, и наоборот, чем меньше скорость, тем выше
точность выполнения задания.
3. Имеется отрицательная корреляция между числом домо-
владений и числом больших семей, проживающих в одном и том
же районе. Большие семьи чаще имеют низкий уровень дохода и,
следовательно, не обладают средствами, достаточными для приоб-
ретения собственного дома.
4. Пример, имеющий отношение к географии. Данные об ад-
министративном делении Великобритании свидетельствуют о су-
ществовании отрицательной корреляционной взаимосвязи между
площадью садово-парковой зоны района и долей несчастных слу-
чаев в этом районе, приходящихся на детей. Чем больше площадь
садово-парковой зоны, тем меньше доля несчастных случаев, при-
ходящаяся в этом районе на детей.
СИЛЬНАЯ И СЛАБАЯ КОРРЕЛЯЦИЯ
Абсолютное значение коэффициента корреляции характеризует
тесноту взаимосвязи. Коэффициенты корреляции в некоторых из
примеров соответственно равны: между уровнем дохода и уров-
нем преступности +0,50; между качеством вин и их цепами +0,85;
175
между числом больших семей и числом домовладений —0,65; меж-
ду площадью садово-парковой зоны и числом несчастных случаев
—0,86. Из приведенных коэффициентов наибольшим является по-
следний. Таким образом, теснота взаимосвязи определяется абсо-
лютной величиной коэффициента корреляции.
РЕЗЮМЕ
Коэффициенты корреляции рассчитываются для определения
тесноты взаимосвязи между двумя какими-либо характеристиками
одного и того же «объекта». Этот коэффициент часто рассчиты-
вается для отдельного человека, однако его можно найти, на-
пример, и для пар близнецов, бутылок вина, административных
районов. Сам коэффициент корреляции может иметь значение от
—1,0 до +1,0. Знак коэффициента корреляции характеризует на-
правление взаимосвязи. Если высоким значениям одной перемен-
ной соответствуют высокие значения другой переменной, а низким
значениям — низкие, то корреляция положительная. Если же вы-
соким значениям одной переменной соответствуют низкие значе-
ния другой переменной, а низким значениям — высокие, то имеет
место отрицательная корреляция. Величина коэффициента кор-
реляции (без учета знака) характеризует степень тесноты рас-
сматриваемой взаимосвязи. Смысл этого утверждения станет бо-
лее понятным после знакомства с материалом следующего пара-
графа.
ДИАГРАММА РАССЕЯНИЯ . '
Проще всего смысл концепции корреляции можно объяснить
графически, с помощью так называемой диаграммы рассеяния1.
При построении этого графика по оси X откладываются значения
одной из коррелирующих между собой характеристик, а по оси
У— значения другой характеристики.
Еще раз вернемся к примеру с корреляцией между средним
значением коэффициента IQ родителей и коэффициентом IQ
их ребенка. Предположим, что молодая супружеская пара решила
проверить ответ их соседа-статистика и, опросив 10 других пар,
уже имеющих детей, собрала данные, представленные в табл. 8.1.
Взглянув на чертеж, сразу же можно убедиться в том, что
наблюдается некоторая тенденция, в соответствии с кото-
рой средние показатели IQ для детей оказываются, как пра-
вило, сходными со значениями коэффициентов умственного раз-
вития их родителей, однако эта взаимосвязь не является абсо-
лютно точной. Представленная па рис. 8.1 диаграмма рассеяния
требует некоторых пояснений. В качестве первого шага в этом
направлении коротко остановимся на способе построения данно- -
го графика.
1 В советской статистической литературе употребляется термин корреляци-
онное поле. — Примеч. пер.
176
Табл ii ц а 8. ?
Гипотетические данные о средней для родителей значении коэффициента 1Q
и среднем коэффициенте IQ их детей
Супруже- ские пары Среднее для родителей значение ко- эффициен- та IQ Среднее зна- чение коэф- фициента IQ их детей Супруже- ские пары Среднее для родителей значение ко- эффициен- та IQ Среднее зна- чение коэф- фициента IQ их детей
1 125 по 6 95 105
2 120 105 7 95 - . 75
3 i 10 95 8 90 95
4 105 125 9 80 90
5 105 120 10 /а 80
Основные этапы процедуры построения диаграммы рассеяния
можно рассмотреть на примере восьмой супружеской пары
(рис. 8.1). На графике точка для этой пары находится на пере-
Рис. 8.1. Диаграмма рас-
сеяния. На графике приво-
дятся гипотетические дан-
ные о значениях коэффи-
циентов IQ десяти пар ро-
дителей и их детей. Обрати-
те внимание на следующие
моменты: (1) средний для
родителей коэффициент IQ
представляет собой сред-
нюю арифметическую пока-
зателей IQ обоих родите-
лей; (2) то, что средние по-
казателей родителей откла-
дываются по оси /V, а их
детей — по оси У, имеет
произвольный характер и не
говорит о том, что одна из
этих переменных является
независимой, а другая —
зависимой; (3) числа, рас-
положенные возле каждой
точки, взяты из первого
столбца табл. 8.1 (если у
вас при рассмотрении этого
графика возникли какие-ли-
бо неясности, попробуйте
сами нанести на него несколько точек из табл. 8.1); (4) форма эллипса, описан-
ного вокруг нанесенных на график точек, зависит от силы корреляции — чем уже
эллипс, тем вцше значение корреляции, чем он шире, тем значение корреляции ниже
сечении двух перпендикуляров, восстановленных из расположен-
ных на оси X и на оси У точек, соответствующих средним для
восьмой пары значениям коэффициентов IQ родителей и их
детей. Каждая точка на графике помечена номером, указывающим
на то, какую из супружеских пар данная точка представляет (при
практическом построении диаграмм рассеяния точки обычно не
нумеруют). При желании вы можете, обратившись к данным таб-
12-1778
177
лицы 8.1, повторить процедуру нанесения на график нескольких
других точек.
Коэффициент корреляции данных, представленных па диа-
грамме рассеяния, равен +0,59. В следующем параграфе мы уз-
наем, каким образом было получено это значение. Сейчас же от-
метим только, что представленные на графике данные могут быть
Z = + 0,33
1,0 -
'l+j—_.......................' Г t IM I.
3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0
Душевой ЗохоЗ (тыс. долл.)
Рис. 8.3. Диаграмма рассеяния, на которой
представлена взаимосвязь между уровнем до-
ходов и уровнем преступности (по данным
о 50 штатах США)
Рис. 8.2. Схематическое представление силы
и направления корреляции. Изменение величи-
ны коэффициента корреляции от 0 до ±1 воз-
действует на ширину эллипса; направление
корреляционной взаимосвязи (от — до-I-) ха-
рактеризуется ориентацией эллипса на пло-
скости
вписаны в геометрическую фигуру, имеющую форму эллипса.
Большая ось этого эллипса ориентирована в направлении с юго-
запада на северо-восток, что свидетельствует о положительном
значении корреляции, однако форма эллипса указывает на то, что
величина этой корреляции относительно невелика. В общем случае
чем уже эллипс (т. е. чем меньше его малая ось при одной и той
же величине большой оси), тем выше значение корреляции. В од-
ном из крайних своих положений (когда большая ось эллипса
оказывается равной его малой оси) эллипс превращается в ок-
ружность, что свидетельствует о равенстве нулю коэффициента
корреляции. В другом крайнем положении (когда малая ось эл-
липса оказывается равной нулю) эллипс вырождается в прямую
линию, и в этом случае величина корреляции равняется плюс пли
минус 1,0. Все эти случаи представлены на рис. 8.2. На рис. 8.3,
178
8.4 и 8.5 показаны диаграммы рассеяния для некоторых примеров
корреляционных зависимостей, рассмотренных в начале настоящей
главы.
Рис. 8.4. Покупая бутылки вина,
вы получаете действительно то,
за что платите. Отметим, что на-
личие корреляции позволяет
делать прогнозы в любом из
двух направлений: (1) если вы
предпочитаете вина, качество ко-
торых оценивается в 15 и выше
баллов, то будете платить за них
более 3 дол.; (2) если вы будете
тратить на вино не более 3 дол.,
S
Z = +
го оценка качества купленного
вами вина не превысит 14 бал-
лов. Эти данные были онублико-
» I I I -.। > I I ... 1
И /2 75 « 75 16 17 18
Оценка качества
ваны в американском журнале «Travel and Leisure» за 1976 г. Перед тем, как
рассчитать г, было произведено усреднение цен, приведенных в журнале для за-
падного и восточного районов, а также осуществлен перевод этих цен в цены за
0,5 галлона вина
Рис. 8.5. Диаграмма рассеяния
отрицательной корреляции.
Источник: [11]
J___!____:___i_____
/2 15 18 21 24
’’роцент саМо-парковых зон
I
27
ФОРМУЛА СРЕДНЕГО ПРОИЗВЕДЕНИЯ Z-ОЦЕНОК
Одна из формул для вычисления коэффициента корреляции ,
произведения моментов Пирсона выглядит так:
S (Zx • Zy)
rN ’
где х представляет одну из двух коррелирующих между собой '
характеристик, у — вторую из этих характеристик, a Z, 2 и N
имеют обычный смысл. Словесная интерпретация этого варианта
следующая: г является «средним произведения Z-оценок». Чтобы
получить г с помощью этой формулы, необходимо найти Z-оценки
для всех значений X и Y по всем единицам, для которых опреде-
ляется величина корреляции, для каждой из этих единиц перемно-
жить соответствующие друг другу Z-оценки и для полученных ре-
12*
179
зультатов рассчитать значение средней. Описанная процедура
скучна и утомительна, па практике она может быть осуществлена
разве что только в педагогических целях •*.
Эта формула все же обладает преимуществом, которое состо-
ит в том, что с ее помощью можно наглядно продемонстрировать
процесс расчета коэффициента корреляции. Покажем этр на при-
мере данных, использованных при построении графика, представ-
ленного на рис. 8.1. Совокупности значений средних коэффициен-
тов IQ родителей и их детей приведены в табл. 8.2. На этот раз,
однако, в таблицу включены также некоторые другие показатели,
необходимые для расчета коэффициента корреляции.
Возможно, вы уже обратили внимание, что значения коэффи-
циента IQ подобраны таким образом, чтобы имеющаяся в нашем
распоряжении «выборка» этих значений была более или менее ре-
презентативной относительно генеральной совокупности коэффи-
циентов IQ. Средние двух наборов коэффициентов IQ равны 100 —
известному заранее значению средней для генеральной совокуп?
Таблица 8.2
Расчет коэффициента корреляции между средними значениями
коэффициента IQ родителей и их детей
Средние для обоих родителей Дети 11рои.з веде- ние 7. оце- нок
коэффициент IQ Z-оценка коэффи- циент IQ Z-оценка
125 4-1,63 но -Ь0,65 1,06
120 ' -41,30 105 +0,33 0,43
ПО +0,65 95 —0,33 —0,21
105 +0,33 125 —1,63 0,54
105 +0,33 120 —1,30 0,43
95 —0,33 105 --0,33 —0,11
95 —0,33 75 —1,63 0,54
• 90 —0,65 95 —0,33 0,21
80 — 1,30 90 —0,65 0,85
75 —1,63 80 . -1,30 2,12
Средняя 100 0,00 100 0,00 0,586=0,59
S 15,33 1,00 15,33 1,00 г =0,59
ности. Стандартные отклонения в обоих случаях равны 15,33, что
также примерно совпадает со знанием соответствующего показа-
теля для генеральной совокупности. Значения «срсднеродитель-
ских» коэффициентов IQ, а также соответствующие значения ко-
эффициентов IQ их детей переводятся в табл. 8.2 в Z-оценки.
В крайнем правом столбце этой таблицы приведены значения про-
изведений соответствующих друг другу Z-оценок, а также их
* Более общая формула для расчета коэффициента корреляции приводится
в приложении (см. с. 260). Возможно, вы обратите внимание на то, что хотя
эта формула самих Z-оценок в явном виде пе содержит, в ней имеются все эле-
менты, из которых эти Z-оценки состоят. •
180
средняя. Эта равная +0,59 средняя 10 произведений и является
коэффициентом корреляции. Таким образом, в таблице фактиче-
ски проделаны все операции, предписываемые формулой вычисле-
ния коэффициента корреляции:
(ZxZy)
[(+1,6+• (+0,65)] + [( + 1,ЗЭ) .(+0,33)] !-...+
+1(— 1.63) • (-1,39)]
10
И ВНОВЬ ДИАГРАММА РАССЕЯНИЯ
Для более глубокого постижения концепции корреляции будет
полезно, если в расчетах вместо исходных значений будут исполь-
зоваться их Z-оценки. Смысл использования Z-оценок состоит в
приведении значений двух коррелирующих между собой характе-
ристик к единому масштабу измерения. В новом масштабе их
средняя равна нулю, а стандартное отклонение 1,0. Сказанное
справедливо даже для случая, когда исходные переменные .суще-
ственно различаются.
Таблица 8.3
Корреляция между ценами и оценками вкусовых качеств вин
! Марка вина Оценка (X) Цена, долл. (Г) Zx
1 2 • 3 4 5 6 7 8 9 10 . 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Средняя S 11 11 11 и 11 12 - 13 12 14 15 15 . 14 17 • . 15 15 16 14 17 18 17 16 16 16 15 14,25 2,20 1,57 1,65 1,75 2,49 ' 2,49 2,51 2,70 2,70 2,96 3,15 3,15 3,18 3,29 3,32 3,37 3,37 3,39 3,57 3,59 3,69 3,89 3,99 "4,04 4,26 3,09 0,72 — 1,48 —1,48 1,75 —1,48 —1,48 —1,02 —0, 57 —1,02 —0,11 +0,34 -1 0,34 - -0,11 + 1.25 +0,34 -1-0,34 +0,80 —0,11 +1.25 1,70 +1,25 4-0,80 +0,80 +0,80 +0,34 0,00 1,00 —2,1 Г —2,00 . —1,48 —0,83 —0,83 —0,81 —0, 54 —0,54 —0,18 +0,08 +0,08 +0,13 +0,28 +0,32 - +0,39 +0,39 +0,42 +0,67 —0,69 -т-0,83 + 1,11 +1.25 +1,32 + 1,63 0,00 1,00 +3,12 +2,96 —2,75 + 1,23 + 1,23 +0,83 •+0,31 +0,55 +0,02 +-о,оз +0,03 —0,01 +0,3-э +0,11 +0,13 +0,31 —0,05 +0,84 + 1,17 + 1,04 +0,89 + 1,00 + 1,06 4-0,55 +0,85
Возьмем для примера совокупность данных о ценах различ-
ных марок вин и оценках их вкусовых качеств (см. табл. 8.3, эти
же данные представлены графически на рис. 8.4). Для повторения
181
полезно рассмотреть также информацию, необходимую для рас-
чета коэффициента корреляции по формуле среднего произведения
Z-оценок. В данном случае г=0,85.
Рис. 8.6. Диаграмма рассеяния
Z-оцснок показателей взаимо-
связи между ценами и оцен-
ками качества вин. Отметим
следующие моменты: (1) в слу-
чаях, когда корреляция по-
ложительная в формуле г —
= S(ZxZa)/W будут суммиро-
ваться в основном положи-
тельные значения произведе-
ний; (2) коэффициент корре-
ляции в случае, когда исход-
ные значения представлены па
диаграмме рассеяния своими
Z-оиенками, характеризуется
углом наклона прямой линии,
подогнанной паилучшим обра-
зом к нанесенным на график
точкам
На рис. 8.6 представлена диаграмма рассеяния совокупности
данных о ценах и оценках вкусовых качеств вин, выраженных в
соответствующих значениях Z-оценок. Положительная корре-
ляция между двумя переменными очевидна. Обратите внимание,
что пунктирные линии, представляющие собой перпендикуляры,
восстановленные из нулевых точек, расположенных па осях
X и У, делят диаграмму рассеяния на четыре квадранта. Этот факт
имеет важное значение. Если двигаться по часовой стрелке, начи-
ная с верхнего левого квадранта, то знаки расположенных в этих
квадрантах значений чередуются в следующей последовательно-
сти: — +, + + , + —, — —, где — и -р указывают, выше или
ниже средней расположены значения оценок качества вина и со-
ответствующих им цен. Напомним теперь, что r--=S (Zx-Zy)/N. Если
внимательно изучить характер размещения индивидуальных на-
блюдений па рис. 8.6, то можно легко заметить, что большинство
из пих (21 из 24) расположено в квадрантах — — и + -р. По-
скольку произведения вида (—)Х(—) и ( + )Х( + ) имеют поло-
жительные знаки, формула нахождения г па базе суммирования
произведений Z-оценок дает нам положительный результат (на-
пример, г-0,85). Дело в том, что большинство слагаемых, входя-
щих в сумму произведений Z-оценок S(Zx-Zy), в основном будут
иметь положительные знаки, и, следовательно, общий результат
также окажется положительным *.
1 Данное утверждение автора пе является строгим. В принципе наличие
даже одного отрицательного слагаемого может привести к получению отрица-
тельного значения суммы, если это слагаемое окажется достаточно большим по
своей абсолютной величине. — Примеч. пер.
182
На рис. 8.7 приведена диаграмма рассеяния (исходные зна-
чения представлены Z-оценками) для данных о площади садово-
парковой зоны и доле несчастных случаев с детьми (между этими
показателями имеется отрицательная корреляционная взаимо-
связь). В этом случае, напротив, большинство точек расположено
в квадрантах----р и -|- —, в которых произведение соответствую-
щих друг другу значений дает отрицательный знак. А это озна-
чает, что при расчете коэффициента корреляции по формуле,
основанной па суммировании произведений Z-оцснок, полученный
результат будет отрицательным (например, г=—0,86).
Рис. 8.7. Диаграмма рассеяния
Z-оценок показателей отрицатель-
ной корреляционной взаимосвязи
между площадью садово-парко-
вой зоны и долей несчастных слу-
чаев с детьми
-3 -2 -1 U +! -i-2 +J
РЕГРЕССИЯ И ПРОГНОЗ
Располагая коэффициентом корреляции, мы можем по вели-
чине одной из коррелирующих между собой переменных предска-
зать соответствующее ей значение другой переменной: по величине
коэффициента 1Q родителей — значение коэффициента IQ их детей;
по значению оценки вкусовых качеств вина-—его цену; по площа- 1
ди садово-парковой зоны — относительную частоту несчастных
случаев с детьми и т. д. Уравнение для прогноза Y по величине X
(в случае, когда значения переменных представлены их Z-оценка- •
ми) выглядит так:
Чтобы продемонстрировать, как «работает» это регрессионное1
уравнение, попробуем с его помощью ответить на вопрос нашей
молодой супружеской пары о величине коэффициента 1Q их пока
1 Термин регрессия более 100 лет назад был пведен английским статистиком-''
Ф. Гальтоном при изучении наследственных признаков. Смысл, вкладываемый им
в это понятие, выражал характер связи между ростом родителей и их детей,
состоящей в «возврате» (регрессии) к среднему росту. Подробнее об этом будет
сказано в гл. 9. — Примеч. пер.
183
еще не родившегося ребенка. Напомним, что среднее значение
показателя IQ наших молодых супругов равно 130. Поскольку
стандартное отклонение распределения коэффициентов IQ рав-
но 15, значению коэффициента, равному 130, соответствует
Z-оценка 2,0:
7 130 100 9П
^iqoo =----—-----=
1 о
Напомним, далее, что коэффициент корреляции 'между средним
для родителей значением показателя IQ (х) и соответствующим
показателем для их детей (у) равен +0,60. Таким образом,
Zv + 0,60 • 2 = + 1,2.
Полученная оценка означает, что прогнозная величина детского
коэффициента IQ на 1,2 стандартного отклонения превосходит
среднее значение IQ (т. е. на 1,2X15=18 пунктов) и, следова-
тельно, равна 118.
Рассмотренный пример также может помочь вам понять одну
важную особенность прогнозов, получаемых на основе использо-
вания корреляционных зависимостей. За исключением случая, ког-
да коэффициент корреляции равен ±1,0, оценка результирующей
(прогнозируемой) переменной всегда оказывается ближе к значе-
нию средней, чем оценка исходной переменной, по величине кото-
рой осуществляется прогноз. Причина данного явления, получив-
шего название регрессия к средней, становится понятной, если об-
ратиться к уравнению Zy=r-Zx. Поскольку г никогда не превос-
ходит 1,0, результирующее значение Zv всегда будет составлять
некоторую долю (равную г) от Zx. Таким образом, мера проявле-
ния регрессии 'к средней определяется величиной коэффициента
корреляции. Если г=1,0, то регрессия к средней отсутствует.
В данном случае значение результирующей переменной Zy будет
точно таким же, как и значение исходной переменной Zx. Если же
г = 0,0, то регрессия будет полной1. Значение результирующей пе-
ременной Zy всегда будет равняться 0,0, т. е. средней распределе-
ния. Как мы знаем, средняя всегда является наилучши.м из всех
возможных прогнозов в условиях, когда отсутствует какая-либо
дополнительная информация, поскольку в этом случае ошибки
прогнозирования будут минимальными.
УЧЕТ ДИСПЕРСИИ
К интерпретации концепции корреляции можно подойти и с
другой стороны. Дело в том, что наличие корреляции между дву-
мя переменными позволяет разделить дисперсию каждой из них
на два составляющих компонента. Первый из этих компонентов
1 Рассуждения автора применимы, вообще говоря, только к ситуации, когда
значение коэффициента корреляции не известно (поскольку прогноз при г=0 не
имеет смысла). В этом случае исследователь при осуществлении прогноза может
условно приравнять значение г нулю. — Примеч. пер.
184
часто называют объясняемой дисперсией. Его величина равна
квадрату стандартного отклонения значений результирующей пе-
ременной. Второй компонент часто называется остаточной дис-
персией. Его величина, в свою очередь, равна квадрату стандарт-
ного отклонения ошибки прогноза (определение этого показателя
буДет введено несколько позднее, см. определение стандартной
ошибки оценки).
Чтобы представить сказанное в более наглядной форме, сно-
ва обратимся к нашему гипотетическому примеру с коэффициен-
том IQ родителей и их детей. Исходные данные воспроизводятся
в первом и пятом столбцах табл. 8.4. В последующем изложении
будут затронуты не только те новые вопросы, о которых шла речь
в предыдущем абзаце, но будет также дан обзор большей части
материала, рассмотренного в настоящей главе.
Таблица 8/Т
Прогноз и ошибки прогнозов, сделанных на основе корреляционных зависимостей
Среднее для роди гелей значение ко- эффициента 1Q = X / Прогноз 11рогноз коэфф 14 циента IQ-F Фактическое значение ко- эффициента IQ Ошиб- ка Ошибка, выражен- ная в еди- ницах Z-оцснок
125 120 ' 110 105 105 • 95 95 90 80 75 Средняя 100 .S’2 235 S 15,33 + 1,63 +1,30 +0,65 --0,33 +0,33 —0,33 —0,33 —0,65 —1,30 —1,63 0,00 1,00 1,00 +0,96 +0,77 +0,38 --0,20 —0,20 —0,20 —0,20 —0, 38 —0,77 —0,96 0,00 0,35 0,59 114,72 111,80 105,83 103,07 103,07 96,93 96,93 94,17 88,20 85,28 100,00 81,75 9,04 110 105 95 125 120 105 75 95 90 80 100 235 15,33 -Г-0,65 -1-0,33 0,33 +1,63 +1,30 +0,33 —1,63 —0,33 —0,65 —1,30 0,00 1,00 1,00 - 4,72 + 6,80 + 10,83 —21,93 — 16,93 — 8,07 -1-21,93 - 0,83 — 1,80 + 5,28 0,00 153,12 12,37 +0,31 -0,44 +0,71 —1,43 1,10 —0,53 + 1,43 - -0,05 —0,12 +0,34 0,00 0,65 0,81
ПРОГНОЗ Y ПО ВЕЛИЧИНЕ X
Формула для прогноза У по величине X, записанная с помощью
показателей Z-оценок, имеет вид Zv = rZx. Таким образом, первое,
что нужно сделать при осуществлении прогноза на базе коэффи-
циента корреляции, это перевести каждое значение исходной пе-
ременной в соответствующие Z-оценки. Во втором столбце табл. 8.4
показаны эти значения Z-оценок, полученные с помощью формулы
7— -X — 1°0
15,33 ’
Показатели средней и стандартного отклонения, приведенные в
нижних строках этого столбца, напоминают нам о том, что рас-
185
-пределспис Z-оценок. характеризуется единичной кривой нормаль-
ного распределения, средняя которого равна нулю, а стандартное
отклонение 1,00.
В третьем столбце табл. 8.4 приводятся выраженные с помощью
Z-оценок прогнозные значения переменной У. Эти значения нахо-
дят путем умножения 0,59 на соответствующий показатель Zx.
Другими словами, в данном столбце содержатся результаты при-
менения формулы, по которой осуществлялся прогноз Zv=rZx.
Прежде всего следует отметить, что во всех случаях значения ре-
зультирующей переменной Zv существенно меньше соответствую-
щих им значений исходной переменной. Данное явление, как уже
отмечалось, носит название регрессия к средней.
Обобщающие характеристики, приведенные в нижних строках
третьего столбца, предоставляют в наше распоряжение очень со-
держательную информацию. Прежде всего отметим, что стандарт-
ное отклонение прогнозных значений Z-оценок равно 0,59, т. е.
величине коэффициента корреляции между переменными X и У.
И это не случайное совпадение. Несколько ранее, при объясне-
нии концепции стандартного отклонения (см. с 128), мы отме-
чали, что при умножении всех значений, принадлежащих не-
которому распределению, на одну и ту же константу величина
стандартного отклонения этого распределения также изменяется
в то же число раз. Стандартное отклонение значений Zx рав-
няется 1,0. Следовательно, в результате умножения каждого по-
казателя Zx па 0,59 будет получено новое распределение со стан-
дартным отклонением, равным 0,59.
Однако в данном случае больший интерес представляет для
нас другое число, а именно равное 0,35 значение дисперсии ре-
зультирующей переменной Zy, которое может быть охарактери-
зовано двумя способами: (1) оно представляет собой квадрат
стандартного отклонения соответствующих значений Zv (что ни-
чем не отличается от обычного определения показателя диспер-
сии); (2) в пашем случае это к тому же еще и г2 ( 0,592 = 0,35),
поскольку г равен стандартному отклонению прогнозных значе-
ний Zy. Эта величина имеет особый смысл. Она характеризует
долю дисперсии значений У, объясняемую наличием корреляции
между X и У. То же самое можно выразить, сказав, что доля дис-
персии значений У*, объясняемая корреляцией между X и Y,
равна г2.
В четвертом столбце табл. 8.4 содержится информация, кото-
рая поможет несколько прояснить смысл только что приведенного
утверждения. Представленные в этом столбце показатели явля-
ются прогнозными средними значениями коэффициентов IQ, по-
* Для максимального упрощения изложения речь шла только об объясне-
нии дисперсии в значениях У,-Однако корреляционная взаимосвязь имеет дву-
сторонний характер. Следовательно, аналогичная аргументация может быть
использована также по отношению к переменной X, и, следовательно, значение
среднего для родителей коэффициента IQ может быть предсказано по величине
показателя IQ: их детей.
186
лученными для каждой пары родителей. Поясним еще раз смысл
каждого значения. Прогнозное значение коэффициента IQ детей
для первой пары родителей равно +0,96, и, следовательно, этот
показатель на 0,96 стандартного отклонения превосходит вели-
чину средней. Если выразить это число непосредственно в еди-
ницах измерения коэффициента JQ (в этом случае 5=15,33), то
полученный для первой пары результат будет означать, что про-
гнозное значение IQ па 0,96X15,33=14,72 единицы превосходит
величину средней и, следовательно, этот показатель равен 114,72.
Принятая нами относительно высокая степень точности (два зна-
ка после запятой) необходима для того, чтобы результаты после-
дующих вычислений существенно не отличались от теоретически
ожидаемых значений, что, естественно, сделает наши рассуждения
более убедительными.
Обратив внимание на нижнюю часть четвертого столбца, вы
обнаружите, что дисперсия содержащихся в нем значений равна
81,75. Напомним, что общая величина дисперсии значений У со-
ставляет 235,00. Очевидно, что доля дисперсии У, объясняемая
наличием корреляции, равна: 81,75:235,00 = 0,35, т. е. значе-
нию г2.
Ошибки прогноза. Анализ данных табл. 8.4 свидетельствует
о том, что для рассмотренной выборки показателей IQ во всех
случаях прогнозные и соответствующие им фактические значения
1Q в той или иной степени отличаются друг от друга. Величина
допущенных ошибок характеризуется в седьмом столбце таблицы
(4,72; 6,80; ...; 5,28). И вновь наше внимание должны привлечь
показатели, расположенные в нижней части рассматриваемого
столбца. Стандартное отклонение содержащихся в этом столбце
значений (12,37) представляет собой стандартную ошибку оценки
или стандартную ошибку прогноза У по величине X, которую мы
обозначим через Квадрат этого выражения, 52г/.ж, представ-
ляет собой дисперсию, а именно остаточную дисперсию значе-
ний У, которая не может быть объяснена наличием корреляции,
равной +0,59, между X и У.
Остаточная дисперсия равна 153,12. Здесь следует остановить-
ся на нескольких моментах. Во-первых, если выразить это зна-
чение как долю от общей дисперсии, то величина остаточной дис-
персии составит 153,12:235,00 = 0,65. Поскольку мы только что
видели, что 0,35 общей дисперсии объяснялось наличием корре-
ляции, становится понятным и смысл величины остаточной диспер-
сии. Таким образом, можно сделать очень важный вывод о том,
что объясняемая дисперсия и остаточная дисперсия дополняют
друг друга и имеют аддитивный характер. Для проверки, под-
тверждающей сделанный вывод, сложим значения объясняемой и
остаточной дисперсий У: 81,75 +135,12 = 234,87. Полученная ве-
* Принятое нами обозначение не имеет отношения к операции умножения.
Выражение в целом следует читать так: стандартное отклонение (S) значе-
ний У для данного (•) значения X.
187
личина несколько отличается от ожидаемого значения общей дис-
персии, равного 235,- лишь из-за ошибок округления.
В заключение отметим, что перевод ошибок прогноза в Z-оцен-
ки дает нам (см. последний столбец таблицы) совокупность зна-
чений (например, 4,72: 15,33 = 0,31), дисперсия которых равна.0,65,
а стандартное отклонение 0,81. Первое из этих значений представ-
ляет-собой долю остаточной дисперсии. Поскольку, как было по-
казано, доля объясняемой дисперсии (г2) равна 0,35, доля оста-
точной дисперсии должна составить 1 —г2=0,65, что действительно
и было получено. Нам необходимо запомнить, что доля остаточ-
ной дисперсии равна 1—г2.
Поскольку 1 — г2 представляет собой дисперсию, квадратный
корень из этого выражения является стандартным отклонением.
В нашем случае ]/1—г2 = /0,65=0,81. Полученное значение может
быть переведено в исходные показатели посредством умножения
на стандартное отклонение исходной совокупности данных, равное
15,33. Более точно {/0,65 = 0,8062. Умножив это значение на 15,33,
получим 12,3594, что из-за округления отличается от равного 12,37
показателя, рассчитанного непосредственно по ошибкам прогноза.
Приведенный пример может быть легко обобщен с помощью фор-'
мулы стандартной ошибки оценки:
- S
ЗАКЛЮЧЕНИЕ
Познакомившись с изложенным материалом, вы наверняка об-
ратили внимание на элегантность применявшихся математических
формул и изящность вычислений. Учитывая важность рассмотрен-
ных вопросов, имеет смысл еще раз в обобщенном виде повто-
рить основные этапы наших рассуждений. Обратимся снова к мо-
лодой паре и занимающей ее проблеме. Напомним, что парамет-
рами (значения которых па этот раз нам известны заранее) в
пашем примере являются: равная 100 единицам средняя арифме-
тическая коэффициента 1Q для совокупностей показателей IQ
родителей и их детей; равное 15 единицам (для обеих совокупно-
стей) стандартное отклонение; равный +0,60 коэффициент кор-
реляции между двумя переменными. Значения этих показателей
не очень отличаются от показателей, использовавшихся в преды-
дущем примере. Однако выбранные нами частные значения су-
щественно упрощают задачу.
В табл. 8.5 показано, как осуществляется процесс прогнози-
рования коэффициентов IQ детей для некоторой совокупности
средних показателей IQ родителей. Эти значения отстоят друг
от друга на 15 единиц (1 стандартное отклонение). Повторим еще
раз основные этапы операции прогнозирования: (1) перевод сред-
них значений IQ родителей в Z-оценки; (2) умножение этих
Z-оценок на г=+0,60, в результате чего получаем величину Zv;
(3) умножение Zv на 15 (стандартное отклонение распределения
188
значений IQ), что дает величину 1У, выраженную в единицах от-
клонений от средней; (4) прибавление к величине этого отклонения
100 единиц (средней данного распределения коэффициентов IQ),
в результате чего мы и получаем искомое прогнозное значение
коэффициента IQ *. При рассмотрении данного примера можно
еще раз убедиться, что в прогнозных значениях (независимо от то-
го, выражены они в Z-оценках или в единицах IQ) проявляется
регрессия к средней, тенденция к усреднению.
Стандартная ошибка оценки в нашем примере равняется 12,0
единицы IQ. Ее значение получено следующим образом:
Sy.x==.SVl —г2= 15/1 —Д0,60)2 = 15 У I -0,36=-. 15/0,64 =
= 15 • 0,8 = 12,0.
Таблиц а 8.5
Коэффициент 1Q + ’+ -1-100
145 -1-3 +2 -j- 1,8 27 127 ’
130 Н-1,2 18 118
' 115 + 1 +0,6 9 109 .
100 0 0,0 0 100 .. '
85 — 1 —0,6 — 9 91
70 . —2 —1,2 — 18 82
55 —3 — 1,8 —27 73
* Среднее для родителей значение IQ=-¥; прогнозное значение IQ ре-
бенка---У. *
Все сказанное проиллюстрировано графически на рис. 8.8.
Наклонная прямая линия представляет собой линию регрессии,
связывающую друг с другом прогнозные значения IQ, получен-
ные для каждого исходного значения этого показателя. Мини-
атюрные нормальные распределения, изображенные около каждого
из прогнозных значений, указывают на то, что фактические зна-
чения коэффициентов IQ детей в действительности будут в той
или иной мере отличаться от значений, полученных с помощью
прогноза.
На практике распределение фактических значений будет иметь
нормальную форму со средней, равной прогнозной величине У,
и стандартным отклонением Sy.x. Следовательно, все, что нам
известно о нормальных распределениях, может быть использовано
при характеристике распределений фактических значений. Для
* Смысл сказанного станет более понятным, если прибегнуть к помощи
элементарных алгебраических выражений. Формула Z-оценки выглядит так:
Z=(X — M}!S. Следовательно, Х — М есть Z-S и X=(Z-S)+M. Полученное
выражение дает наглядное представление о смысле двух последних этапов
осуществления прогноза (см. табл. 8.5).
189
нашей супружеской пары, средняя величина IQ которой равна 130,
среднее и наиболее часто встречающееся значение IQ их ребенка
(представителя бесконечной совокупности детей, которые могли
бы теоретически появиться у этой пары) составляет 118 единиц.
Однако можно утверждать, что с вероятностью 68/100 это значе-
ние попадет в интервал между 106 и 130 (прогнозное значение ко-
эффициента IQ±lSy.x). На рис. 8.8 приводится иллюстрация это-
Рис. 8.8. Коэффициенты IQ детей, предсказанные по среднему для их родителей
значению показателя IQ. Жирные точки, расположенные на наклонной прямой
линии, соответствуют прогнозным значениям IQ. С помощью м.ийиатюрных рас-
пределений, изображенных возле каждой такой точки, характеризуется рассеяние
фактических значений коэффициентов IQ детей. Таким образом, с их помощью
отражается распределение ошибок (правильным прогнозом является такой про-
гноз, при котором ошибка равна нулю). Стандартное отклонение каждого из
этих миниатюрных распределений равно 12
го утверждения для распределения детских коэффициентов IQ,
соответствующих среднему для родителей значению IQ, равно-
му 130. Аналогичные рассуждения приведут пас к выводу, что с
шансами 50:50 значение коэффициента IQ ребенка, у родителей
которого среднее значение коэффициента умственного развития
составляет 130 единиц, попадет в интервал между НО и 126.
Группа этого интервала определяется следующим образом: про-
гнозное значение IQ (118) плюс — минус величина 0,6745, умно-
женная на 12 (стандартная ошибка оценки)1. И почти в 95 случа-
ях из 100 значение детского IQ окажется в интервале между 94
и 142 (118±2Sy.K).
1 Значению ±0,6745 соответствуют Z-оцепки, между которыми заключе-
но 50% площади графика кривой нормального распределения. — Примеч. пер.
190
КРАТКИЙ ОБЗОР ОСНОВНЫХ понятий
Те или иные характеристики коррелируют между собой, когда
они «взаимосвязаны», или изменяются совместно. Соответственно в
статистике корреляция выражает степень взаимосвязи между дву-
мя характеристиками, полученными для одного и того же «объ-
екта». Количественно эта степень взаимосвязи выражается с по-
мощью коэффициента корреляции.
Коэффициент корреляции позволяет людям, понимающим
смысл этого показателя, (1) предсказать значение одной перемен-
ной по известной величине другой и (2) определить величину ва-
риации в значениях одной переменной, объясняемой вариацией
значений другой переменной.
Прогноз, осуществляемый с помощью коэффициента корреля-
ции, представляет собой среднее значение всех значений одной
переменной, теоретически соответствующих конкретному отдель-
ному значению другой переменной. Как следует из этого утверж-
дения, в значениях одной переменной, которая изменяется сов-
местно с точными значениями другой переменной, имеется неко-
торая вариация. Степень этой вариации уменьшается при увели-
чении силы корреляционной взаимосвязи.
Определенная таким образом вариация представляет собой
остаточную дисперсию. Ту же мысль можно выразить, сказав, что
эта дисперсия представляет собой дисперсию ошибок, допускае-
мых исследователем при прогнозировании значения одной пере-
менной по величине другой. В этом контексте прогнозируе-
мое среднее значение представляет собой объясняемую диспер-
сию. Сказанное в обобщенном виде характеризует представление
о корреляции как об объясняемой дисперсии. В этой связи необхо-
димо понимать значение и смысл следующих понятий.
Коэффициент корреляции. Любой из семейства отличающихся
друг от друга показателей, характеризующий степень, а в неко-
торых случаях и направление взаимосвязи между двумя перемен-
ными. Коэффициент корреляции произведения моментов Пирсона
(единственный из семейства этих показателей, рассмотренный
в настоящей главе) указывает и направление, и силу такой взаи-
мосвязи.
г. Коэффициент корреляции произведения моментов Пирсона.
Значения этого показателя могут изменяться от +1,0 (полная
положительная корреляция) через 0,0 (отсутствие корреляции) до
—1,0 (полная отрицательная корреляция). Единственная форму-
ла г, приведенная в настоящей главе, определяет г как «среднее
произведение Z-оценок», т. е.
2(Zv-Z.v)
Г — ------1—
N '
Положительная корреляция. При совместном изменении двух
переменных высоким значениям одной переменной (х) соответст-
191
вуют высокие значения другой переменной (у), а низким значени-
ям х — низкие значения у.
Отрицательная корреляция. При совместном изменении двух
переменных высоким значениям х соответствуют низкие значе-
ния у, и наоборот.
Диаграмма рассеяния. Графическое представление корреляци-
онной взаимосвязи между двумя переменными. Значения х откла-
дываются на оси абсцисс, значения у — на оси ординат. Разбро-
санные по полю графика точки находятся на пересечении перпен-
дикуляров, восстановленных из соответствующих друг другу точек
х и у, расположенных на осях координат.
Регрессионное уравнение. Уравнение, используемое для прогно-
зирования у по величине х, или, наоборот, х по величине у. В на-
стоящей главе мы имели дело лишь с прогнозами у по величине х
(соответствующее уравнение имеет вид Zy--rZx). Для перевода
прогнозной Z-оценки в единицы измерения исходных показателей
необходимо: (1) умножить прогнозное значение Zy на Sy и (2) к
полученному значению прибавить среднюю у.
Объясняемая дисперсия. Дисперсия значений у, прогнозируе-
мых по величине х (или, наоборот, х по величине у) с помощью
регрессионного уравнения. Относительная величина этой диспер-
сии равна г2.
Остаточная дисперсия. Дисперсия ошибок в значениях у, про-
гнозируемых по величине х (или, наоборот, х по величине у) с по-
мощью регрессионного уравнения. Относительная величина этой
дисперсии равна 1 — г2.
Стандартная ошибка оценки. Стандартное отклонение совокуп-
ности прогнозных значений у, полученных для одного значения х.
Это стандартное отклонение представляет собой корень квадрат-
ный из показателя остаточной дисперсии. Относительная величина
стандартной ошибки оценки равна: S^.x=Vl —г2.
9 ДЕЙСТВИТЕЛЬНЫЕ
И МНИМЫЕ
КОРРЕЛЯЦИОННЫЕ СВЯЗИ
В окружающем нас мире существенная роль принадлежит кор-
реляционным взаимосвязям. В настоящей главе будет рассмотрено
большое количество примеров, когда выявление и учет подобных
взаимосвязей углубляет наше представление о механизмах проте-
кания изучаемых явлений. Мы обсудим также неоправданное ис-
пользование понятия корреляции, что во многих случаях приво-
дит к ошибочной интерпретации результатов, полученных в про-
цессе исследования.
«ПРОЦЕНТ ВЗАИМОСВЯЗИ»
Первый пример довольно тривиален. Чтобы понять его, вам
не потребуется каких-либо особых интеллектуальных усилий.
Иногда можно услышать, что корреляция характеризует «процент
взаимосвязи» между двумя переменными. Данное утверждение,
как будет показано в дальней-
шем, бессмысленно, однако у че-
ловека, незнакомого с существом
понятия корреляции, оно порож-
дает ложное доверие к результа-
там, в основе которых лежит ко-
личественная определенность
упомянутого выше показателя.
Подобная интерпретация понятия
корреляции имеет смысл только
в том случае, если мы говорим
о доле объясняемой дисперсии,
которая равна г2. Если нам изве-
стен этот факт, то большинство
корреляционных зависимостей, с
которыми сталкиваются при изу-
чении того или иного вопроса,
не кажутся такими уж впечат-
ляющими, как это часто бывает
г
Рис. 9.1. Значение г не является
«процентом взаимосвязи», хотя
г2-100 представляет собой процент
объясняемой диспепсии
13-1778
193
на первый взгляд. Так, коэффициент корреляции, равный ±0,80,
объясняет только 64% дисперсии; коэффициент корреляции, рав-
ный ±0,70, — только 49% дисперсии-и т. д. Па рис. 9.1 представ-
лено графическое изображение зависимости между коэффициентом
корреляции и долей объясняемой дисперсии.
СОПОСТАВЛЕНИЕ КОРРЕЛЯЦИИ С БАЗОВЫМИ ОЦЕНКАМИ
В конце 1976 г. федеральное правительство развернуло широ-
кую кампанию по проведению противогриппозной вакцинации
населения США. Однако эта программа была вначале приоста-
новлена, а затем и вовсе отменена. Причиной приостановки
программы послужило то, что около 100 пожилых людей вскоре
после прохождения вакцинации умерли. Окончательная же отмена
этой программы связана с тем, что приблизительно у такого же
количества прошедших вакцинацию людей впоследствии прояви-
лись симптомы болезни Гильепа-Баррэ, приводящей к частичному,
а иногда и к полному параличу и смерти. В обоих случаях в основе
решений правительства лежало предположение о наличии корре-
ляции (и соответственно причинно-следственной взаимосвязи)
между прохождением вакцинации и последующими трагическими
последствиями.
Однако необходимо задаться вопросом: а существует ли по-
добная корреляционная взаимосвязь в действительности? В пер-
вом случае можно легко убедиться в том, что, скорее всего, такой
взаимосвязи нет. Коэффициент смертности пожилых людей,
прошедших вакцинацию, практически не отличается от соответст-
вующего показателя для людей этого же возраста, которые вак-
цинацию не проходили. Оценить данные по болезни Гильепа-Баррэ
несколько труднее. Анализ имеющихся статистических данных по-
казывает, что частота, с которой встречается это заболевание
у лиц, прошедших вакцинацию, составила примерно 1—3 случая
на миллион человек и около половины или одной трети от вели-
чины этого показателя у лиц, не проходивших вакцинацию. Та-
ким образом, возможно, в этом случае имеет место статистически
значимая взаимосвязь • между прохождением противогриппозной
вакцинации и развитием симптомов опасной болезни.
Проблема, с которой мы столкнулись при рассмотрении этих
двух случаев, связана с принятием решения о том, являются ли
относительные показатели частоты смертей пожилых людей и за-
болеваний болезнью Гильена-Баррэ у людей, прошедших вакцина-
цию, выше, чем можно было бы ожидать в соответствии с реально
существующими базовыми оценками этих показателей. В первом
случае статистические данные свидетельствуют о том, что такого
превышения не было. Во втором случае с уверенностью это ут-
верждать нельзя. Тем не менее имеющиеся расхождения столь не-
значительны и соответствующие им показатели вероятности на-
столько низки, что не очень понятно, как можно было па их основе
194
принимать решение о прекращении программы вакцинации насе-
ления.
КОРРЕЛЯЦИОННАЯ ВЗАИМОСВЯЗЬ НЕ ЯВЛЯЕТСЯ ПРИЧИННО-СЛЕДСТВЕННОЙ
Но даже если между рассмотренными в предыдущем параграфе
явлениями и имеется корреляция, этот факт не доказывает, что
именно вакцинация населения стала причиной описанных в преды-
дущем параграфе печальных событий. Возможно, в силу ряда при-
чин люди, решившие пройти противогриппозную вакцинацию, в
большей мере оказались восприимчивыми к воздействию некото-
рых факторов, влияющих на состояние здоровья человека, чем
вся совокупность населения. Лица, прошедшие вакцинацию, могут
отличаться от тех, кто ей не подвергался, по полу, возрасту, расе,
уровню дохода, месту проживания и т. д. Например, если
жизнь в городе, с ее суетой и стрессами, способствует повыше-
нию смертности лиц пожилого возраста (что вполне возможно)
или развитию симптомов болезни Гильена-Баррэ (что не доказа-
но) и если вакцинацию прошло большее число горожан, чем лиц,,
проживающих в сельской местности (что также вполне возможно),,
то именно этот факт мог обусловить совпадение вакцинации с
увеличением частоты заболеваний болезнью Гильена-Баррэ.
Вообще говоря, наличие корреляции между двумя событиями
еще не означает, что одно из них является причиной другого.
Так, например, имеется положительная корреляция между числом
гнезд, которые вьют каждый год аисты в Голландии, и коэффи-
циентом рождаемости в этой стране, однако данный факт нельзя
рассматривать в качестве доказательства правдивости истории
о том, что детей в семью приносят аисты. Более правдоподобным
представляется, скорее, как раз противоположное направление
причинно-следственной связи. Увеличение числа детей часто свя-
зано с образованием новых семей, которые, как правило, на-
чинают совместную жизнь в новом доме. А чем больше домов, тем
больше дымоходных труб, на которых так любят устраивать свои
гнезда аисты.
Смысл сказанного станет вам еще более понятным после рас-
смотрения следующего примера. Известно, что имеется сильная
положительная корреляционная взаимосвязь между числом пожар-
ных машин в различных районах Нью-Йорка и числом пожаров в
этих районах. В данном случае очевидно, что различия в коли-
честве противопожарного оборудования обусловлены различиями
в числе пожаров. Никто не станет утверждать, что пожарные
машины вызывают пожары, и поэтому чем больше машин, тем
больше пожаров. В этом последнем примере имеет место явная
причинно-следственная взаимосвязь. Тем не менее он поможет нам
сделать один важный дополнительный вывод: само по себе нали-
чие корреляции ничего не говорит о направлении причинно-след-
ственной связи.
13*
195
При дальнейшем рассмотрении взаимосвязи между корреля-
цией и причинностью мы сталкиваемся с новыми трудностями.
В некоторых случаях наличие корреляции обусловлено воздейст-
вием третьего фактора, являющегося истинной причиной двух кор-
релирующих между собой событий. Например, имеется (или, ско-
рее, имелась) отрицательная корреляция между числом ослов в
штатах США и числом докторов наук. Количественная определен-
ность каждой из этих двух переменных обусловлена характером
. экономического развития штата: в сельскохозяйственных штатах,
где в основном и использовались упомянутые ослы, как правило,
меньше университетов, а также тех отраслей промышленности, в
которых занят высококвалифицированный научный персонал. Ана-
логично при рассмотрении отрицательной корреляции между сте-
пенью твердости асфальтовых покрытий, и числом съедаемых в
различные дни порций мороженого мы вправе утверждать, что ве-
личина обеих переменных определяется воздействием третьего
фактора — температуры воздуха. Еще пример. Имеется положи-
тельная корреляция между длиной брюк мальчиков и качеством
их почерка. В данном случае важное значение имеет третья пере-
менная — возраст.
Обратимся к менее тривиальному примеру. Так, существует
сильная корреляционная взаимосвязь между количеством лет, за-
траченных человеком на образование, и величиной его будущих
доходов. Однако это не означает, что причиной высокого дохода
является высокий уровень образования человека. Во-первых, хо-
рошо обеспеченные люди, которые, как правило, и отправляют
своих детей в колледжи и университеты, располагают также и
более широкими возможностями для трудоустройства их после по-
лучения высшего образования. Во-вторых, отмеченная связь ха-
рактеризует, скорее, процесс отбора, а нс причинно-следственную
зависимость. Чтобы получить тот или иной уровень образова-
ния, человек должен преодолеть целый ряд трудностей, связан-
ных с усвоением материала, сдачей экзаменов и т. д. Причем с
каждым годом учебы эти трудности усугубляются. Тот, кто пе-
рестает с ними справляться, выбывает из соревнований. Если
предположить, что человеческие' качества, необходимые для по-
лучения того или иного уровня образования, оказываются полез-
ными и с точки зрения достижения успехов в дальнейшей работе
по избранной специальности, то следует признать, что лица,
имеющие более высокий уровень образования, лучше подготовле-
ны и для практической деятельности, не связанной с процессом
формального обучения. А это означает, что с точки зрения дохо-
дов роль образования заключается не столько в обучении той или
иной профессии, сколько в отборе наиболее энергичных и трудо-
способных индивидуумов.
Наконец, стоит отметить, что отсутствие зависимости, иногда
используемое для доказательства отсутствия связи между
двумя переменными, может порождать аналогичные проблемы.
Один из наиболее, освященных веками аргументов против приме-
196
нения высшей меры наказания приписывают Сэмюэлю Джонсону,
который заметил, что публичное вздергивание на висилице карман-
ных воров явно не оказывает никакого устрашающего воздействия
на их «коллег», находящихся на свободе. Джонсон свидетельство-
вал, что карманники занимались своим ремеслом с особым усерди-
ем как раз во время публичных казней их менее удачливых това-
рищей. Слабое место в аргументации такого рода состоит в том,
что в действительности число обчищенных карманов во время
публичных казней может оказаться меньше, чем во время какой-
либо другой церемонии такого же масштаба. Если так обстояло
дело в действительности, то, вообще говоря, применение подобной
аргументации было бы ошибочным.
В случаях, когда корреляция действительно свидетельству-
ет о наличии причинно-следственных отношений, всегда возни-
кает вопрос о направлении причинно-следственной связи. Так,
например, засухи, которые за последние годы несколько раз по-
ражали западные районы страны, привлекли внимание к корреля-
ции между появлением пятен на солнце и уменьшением влажности
климата на земле. В данном случае, возможно, имеется причинно-
следственная связь, обусловленная изменениями в интенсивности
солнечного ветра, происходящими при появлении солнечных пятен.
Однако с появлением пятен па солнце коррелирует также и боль-
шое число других явлений: цена акций па бирже, производство
автомобилей, длина женских юбок и даже интенсивность «бит-
ломании», т. е. степень популярности музыки широко известной
группы «Битлз». Данный феномен может быть объяснен с помощью
длинной цепочки причинно-следственных взаимосвязей. Например,
засуха приводит к разорению фермеров; фермеры перестают поку-
пать автомобили; в результате свертывается производство в ав-
томобильной промышленности; это ведет к падению курса акций
на бирже и изменению настроений общественности, что воздейст-
вует па вкусы и предпочтения людей в области музыки и покроя
женских юбок. Все это, конечно, не более чем предположение.
Подобная причинно-следственная связь здесь, возможно, и су-
ществует, однако вам необходимо уяснить, что корреляция не
доказывает наличия причинно-следственной связи, и если таковая
все же имеется, то ее наличие обусловлено воздействием некото-
рого третьего фактора.
ЧАСТНАЯ КОРРЕЛЯЦИЯ •
В некоторых случаях с помощью статистических методов уда-
ется изолировать и исключить воздействие третьего фактора,
определяющего корреляцию между рассматриваемыми переменны-
ми. Вальтер Кинтш однажды пояснил эту мысль с помощью сле-
дующего примера. Было установлено,,что имеется сильная поло-
жительная корреляция между числом баров и числом церквей в
городах штата Монтана. Однако это не означает, что церкви строи-
лись там для того, чтобы горожане могли легко и быстро замолить
197
в них грехи, совершенные только что в баре неподалеку. Не озна-
чает это также, что бар является тем местом, где люди могут
забыть о смертных муках, которыми их стращают в церкви раз
в неделю на воскресной проповеди. Обнаруженный в этом иссле-
довании факт свидетельствует о том, что в больших городах име-
ется много церквей и много баров, а в маленьких городах заведе-
ний того и другого рода — соответственно меньше.
С помощью специальных методов, связанных с нахождением
частных коэффициентов корреляции, удается устранить эффект
воздействия размера города на взаимосвязь между числом баров
и числом церквей. Однако гораздо проще можно добиться этого
посредством нормирования показателей числа баров и числа церк-
вей, рассчитав, сколько баров и сколько церквей приходится,
скажем, па тысячу человек населения города. Преобразовав по-
добным образом исходные показатели, мы обнаружим, что корре-
ляция между ними близка к пулю.
В предыдущей главе приводился еще один пример, позволяю-
щий продемонстрировать эффект от нормирования исходных пока-
зателей. Речь идет об отрицательном (равном —0,86) коэффи-
циенте корреляции между долями несчастных случаев с детьми (в
общем числе несчастных случаев) и площадью садово-парковой
зоны. Нормирование показателя числа несчастных случаев с деть-
ми путем расчета соответствующих значений долей позволяет ис-
ключить воздействие па рассматриваемую взаимосвязь такого
важного фактора, способствующего увеличению значения корреля-
ции, как плотность населения. Дело в том, что районы, в кото-
рых нет обширных садово-парковых зон, как правило, имеют
высокую плотность населения. Высокая плотность населения, в
свою очередь, способствует увеличению общего числа несчастных
случаев (в том числе и несчастных случаев с детьми). Демонст-
рация же отрицательной корреляции между долями несчастных
случаев с детьми и величиной площади садово-парковой зоны сви-
детельствует о том, что предоставление в распоряжение детей
больших территорий, где они могли бы играть, действительно спо-
собствует снижению детского травматизма.
Аналогичным образом дело обстоит и в случае с увеличением
числа жертв дорожно-транспортных происшествий по воскресным
п праздничным дням. Из года в год Американская автомобильная
ассоциация накануне таких дней предупреждает население об
опасности увеличения числа жертв дорожно-транспортных проис-
шествий. И эти зловещие прогнозы часто сбываются. Из этого
факта можно было бы сделать вывод о том, что вероятность по-
гибнуть в автомобильной катастрофе по воскресным и празднич-
ным дням существенно возрастает, поэтому имеет смысл оставать-
ся в эти дни дома и нс выводить свою машину из гаража. Однако
данный вывод вовсе не следует из приведенных выше предпосы-
лок. Какая-то часть увеличения числа жертв дорожно-транспорт-
ных происшествий по воскресным и праздничным дням (а впол-
не может быть и все это увеличение) является результатом рос-
198
та интенсивности движения в эти дни. Количество же жертв ав-
томобильных катастроф в расчете на одного водителя во всех
случаях будет одним и тем же.
РАСЧЕТ «ПОКАЗАТЕЛЯ НАСЛЕДСТВЕННОСТИ»
В своем знаменитом исследовании о «наследовании гениаль-
ности», проведенном в прошлом веке, сэр Фрэнсис Гальтон от-
мечал, что очень большие таланты имеют тенденцию концентри-
роваться в отдельных семьях. Процедура, использованная Галь-
тоном при проведении этого исследования, состояла в следую-
щем. Вначале он выделил ряд выдающихся англичан — ученых,
государственных деятелен, юристов, поэтов и т. д. — и затем по-
пытался выяснить, нс имеется ли среди их родственников других
выдающихся личностей. И он не только обнаружил таких выдаю-
щихся родственников, но также установил, что их процент изменя-
ется прямо пропорционально степени тесноты родства. Часть полу-
ченных Гальтоном данных воспроизведена в табл. 9.1.
Проводившиеся в последнее время исследования корреляции
между коэффициентами IQ людей, обладающих различной сте-
пенью родства, привели к аналогичным выводам. Некоторые из
данных, полученных в этих исследованиях, приводятся в табл. 9.2.
Очевидно, что чем более тесными узами родства связаны между
собой люди, тем более сходными коэффициентами IQ они обла-
дают.
Таблица 9.1
Родство и выдающиеся
родственники
Стелен, родства
Отец — сын
Братья
Дядя — племян-
ник
Дед — внук
40
41
Таблица 9.2
Процент
выдаю-
щихся
Родст-
венников
Родство и коэффициенты корреляции
между показателями 1Q
Степень родства
Идентичные (однояйцевые) близнецы О; 90
Разнояйцевые, близнецы 0,65
Братья и сестры, не являющиеся
близнецами 0,50
Любой из родителей и ребенок 0,50
Дед (бабка) и внук (внучка) 0, 15
Первое, что приходит на ум после ознакомления с данными
табл. 9.1 и 9.2, это то, что величина коэффициента IQ передается
по наследству. Однако затем вы, очевидно, подумали, что пер-
вый вывод был слишком уж поспешным. Тесно связанные друг
с другом люди живут, как правило, в одинаковых условиях'.
И по-видимому, именно фактор окружающей среды является един-
ственной причиной существования взаимосвязи между родством и
199
близостью уровней развития интеллекта. В течение многих лет
приведенное только что объяснение рассмотренного феномена, по
существу, признавалось единственно возможным.
Однако проведенные в последнее время исследования показа-
ли, что уровень показателя IQ определяется как факторами воз-
действия окружающей среды, так и наследственностью. При по-
добной интерпретации часть дисперсии значений коэффициента IQ
фактически приписывается факторам воздействия окружающей
среды и часть — фактору наследственности. Вам, очевидно, уже
понятно, что данное утверждение предполагает расчет значений
коэффициентов корреляции.
При определении доли дисперсии, обусловленной воздействи-
ем каждой из отмеченных выше групп факторов, решающую роль
играет сравнение между идентичными (однояйцевыми) близнеца-
ми, которые развиваются из одного оплодотворенного яйца, и
двухъяйцевыми близнецами, развивающимися из двух различных
яиц. Однояйцевые близнецы с точки зрения наследственных фак-
торов являются полностью идентичными. Они наследуют 100% од-
них и тех же генов. Двухъяйцевые близнецы обладают в среднем
50% одинаковых генов. С точки зрения факторов воздействия
окружающей среды оба типа близнецов развиваются, как правило,
в одинаковых условиях, особенно если двухъяйцевые близнецы
имеют один и тот же пол.
Из сказанного может быть сделан вывод, что доля дисперсии
значений коэффициента IQ, обусловленная воздействием фактора
наследственности, представляет собой некоторую функцию разно-
сти коэффициентов корреляции, г4 и г2, рассчитанных соответст-
венно для однояйцевых и двухъяйцевых близнецов. Различные
исследователи предлагали различные виды подобных функций.
Одной из самых простых для понимания и в то же время наиболее
широко применяющейся на практике является следующая фор-
мула, связывающая долю дисперсии, обусловленную воздействием
фактора наследственности /г2, со значениями коэффициентов кор-
реляции:
h2 = 2 (г, — г2).
Подставляя в эту формулу данные из табл. 9.2, получаем:
h2 = 2 • (0,90 — 0,65) = 2 • (0,25) = 0,50.
Как видите, значение /г2 в полном соответствии со сформулиро-
ванным выше предположением определяется разностью между
коэффициентами корреляции, рассчитанными для однояйцевых и
двухъяйцевых близнецов. Умножение на 2 обусловлено тем фак-
том, что однояйцевые близнецы по сравнению с двухъяйцевыми
обладают в два раза большим количеством одинаковых генов. По-
лученная величина /г2=0,50 находится в нижней части диапазона
вариации значений К2, расчет которых проводился в различных
исследованиях.
. 200
НАДЕЖНОСТЬ И ОБОСНОВАННОСТЬ ИЗМЕРЕНИЯ
Одним из наиболее важных направлений применения методов
корреляции, особенно в области общественных наук, является
стандартизация показателей, главным образом, статистических
критериев. Любой полезный в практической работе показатель
характеризуется двумя важными свойствами — надежностью и
обоснованностью. Коэффициенты корреляции, которые с этой точ-
ки зрения могут быть названы также коэффициентами надежнос-
ти и обоснованности1, представляют собой инструмент, с помощью
которого удается определить ту меру, в какой статистические по-
казатели обладают указанными свойствами.
НАДЕЖНОСТЬ
Понятие надежности связано с характеристикой меры совмест-
ности результатов, полученных при проведении того или иного
теста. В качестве примера падежного измерительного инструмен-
та можно привести обычный метр, соответственно примером не-
надежного измерительного инструмента служит часто упоминае-
мый в живой народной речи «резиновый» метр.
Наиболее простой способ определения степени надежности лю-
бого измерительного инструмента состоит в двукратном измере-
нии с помощью этого инструмента какой-либо одной характерис-
тики с последующим сопоставлением полученных результатов. По-
скольку коэффициент корреляции по определению является ин-
дексом соответствия между двумя характеристиками, полученными
для одного и того же объекта, этот показатель может быть легко
использован при проведении количественных сопоставлений. От-
сюда вы можете сделать вывод, что коэффициенты надежности
имеют значения, заключенные между 0,0 и 1,0, и чем больше ве-
личина- этого коэффициента, тем более падежным будет соответ-
ствующий тест.
Большинство психологических тестов обладают надежностью
порядка 0,70—0,90. Основываясь па приобретенных при чтении
этой книги знаниях о корреляции и прогнозе, вы можете дать как
общую, так и индивидуальную интерпретацию этих значений. Осо-
бо стоит остановиться еще раз на анализе точности прогнозов,,
основанных на применении коэффициентов корреляции. В дан-
ном случае под прогнозом имеется в виду предсказание значения
оценки, которая будет получена при проведении некоторого теста,
по величине оценки, полученной по этому тесту в прошлом. На-
помним, что величина ошибки в подобных прогнозах находит от-
ражение в значении стандартной ошибки оценки, Sy.x.
В табл. 9.3 показано, как проводится анализ надежности тес-
тов по определению коэффициентов IQ. При этом рассматривает-
ся гипотетическая совокупность коэффициентов надежности, зна-
чения которых заключены в диапазоне 0,00—0,999. Детальное
1 Приведенные термины не являются общепринятыми. — Примеч. пер.
201
изучение данных этой таблицы позволяет нам, во-первых, повто-
рить уже знакомый материал и, во-вторых, познакомиться с не-
которой новой полезной информацией. Повторение включает рас-
чет стандартной ошибки прогноза У по величине X, выраженной
в долях дисперсии, а также в фактических единицах этого пока-
зателя. Обратимся для примера к строке таблицы, в начале кото-
рой представлен коэффициент надежности, равный 0,90, что
приблизительно соответствует наилучшему результату, показанно-
му в тестах по выявлению связи между показателями IQ (см.
табл. 9.2). Второй элемент в этой строке приводится просто в ка-
честве напоминания о том, что расчет величины интересующего
нас показателя Sy.x включает нахождение корпя квадратного из
остаточной дисперсии, ф1—г2. Результат вычисления по этой фор-
муле приводится в следующем столбце таблицы (0,44). О его ин-
терпретации мы уже говорили. В случае, когда коэффициент
надежности равен 0,90, стандартная ошибка оценки будет равнять-
ся стандартному отклонению прогнозируемого показателя, умно-
женному на 0,44, что вытекает из формулы
sy.x = svri-r2.
Из следующего столбца табл. 9.3 видим, что в пашем конкрет-
ном случае (т. е. при работе со значениями показателя IQ) вели-
чина стандартной ошибки оценки равна 6,54 (это значение полу-
чено путем умножения 0,44 на величину стандартного отклонения
распределения коэффициентов IQ, равную 154).
Надежность и точность измерения
Т а б л и ц а 9.3
Надежность 1 - г2 s У-Х (в долях) Д-Х (в единицах IQ) (в единицах IQ|
0,00 1—0,00 1,00 15,00 10,12
0,50 1 - 0,25 0,87 12,99 8,76
0,60 1-0,36 0,80 12,00 8,09
0,70 1—0,49 0,71 10,71 , 7 22
0,80 1—0,64 0,60 9,00 ’ 6,97
0,90 1—0,81 0,44 6,54 4,41
0,95 1-0,90 0,32 4,74 3,20
0,98 1—0,96 0,20 3,00 2,02
0,99 1—0,98 0,14 2 12 1,43
0,995 0,99 0,10 1,50 1,01
0,999 0,998 0,05 0,75 0,51
Данный результат позволяет нам лучше «почувствовать» ис-
тинное значение того факта, что величина коэффициента надеж-
ности того или иного показателя равна 0,90. Возможно, смысл
данного факта станет еще более очевидным, если рассмотреть
вероятную ошибку (отклонение) оценки, РЕУ.Х, значения которой
1 В действительности при расчете автором использовалось не 0,44 а более
точное значение ]'1—г'1, равное 0,4359.— Примеч. пер.
202
представлены в последнем столбце таблицы. Вероятная ошибка
оценки представляет собой интервал, центром которого слу-
жит значение имеющейся в нашем распоряжении оценки. В него,
как предполагается, попадает 50% значений прогнозных оценок.
Величина вероятной ошибки для любого нормального распределе-
ния равна 0,6745 S, в чем вы можете убедиться, сверившись с по-
казателями табл. 6.7 (см. с. 136). Таким образом, вероятная
ошибка оценки равняется 0,6745
Для теста на определение показателя IQ при коэффициен-
те надежности, равном 0,90, величина РЕИ.Ж составляет 4,41 пунк-
та. Полученный результат представляет собой статистическое
обоснование общего вывода о том, что оценка коэффициента IQ
имеет ошибку, равную примерно 5 пунктам. В связи с этим пси-
хологи, занимающиеся проведением данного теста, очень не любят
говорить о точном значении коэффициента IQ того или иного
человека. К несчастью, концепцию о неразрывности связи между
значением показателя и его ошибкой многие понимают плохо.
Люди склонны излишне доверять точным числам. На этой основе
зачастую делаются потенциально опасные и даже жестокие вы-
воды типа «моя Мэри находчива и остроумна, а ваш Джимми глуп,
поскольку у Мэри значение показателя IQ, равное 101, превыша-
ет средний уровень, а у Джимми этот показатель равен 99, что
ниже среднего уровня».
Одна из причин, по которой в табл. 9.3 включены очень высо-
кие значения коэффициента надежности, связана со стремлением
показать, что измерения, проводящиеся даже с помощью лучших
из имеющихся в нашем распоряжении тестов, далеко не такие уж
точные, как, возможно, представляется читателю. Если вы обрати-
тесь к данным табл. 9.3, то обнаружите, что даже в тесте с коэф-
фициентом надежности 0,995 вероятная ошибка оценки IQ состав-
ляет один пункт. Сравнения типа «Мэри- - Джимми» будут обла-
дать статистическим смыслом только в контексте связи между
значением рассматриваемого показателя и его ошибкой.
ОБОСНОВАННОСТЬ
Под обоснованностью имеется в виду та мера, в которой с
помощью того пли иного показателя удается предсказать некото-
рые важные характеристики измеряемого объекта. Такие физи-
ческие характеристики, как ширина и длина стола, обоснованны не
столько потому, что с их помощью мы узнаем, какими размерами
обладает данный стол, сколько в силу того, что на основе этих
показателей можно сделать вывод, скажем, о возможности пронес-
ти этот стол через тс или иные двери, посадить за него восемь
человек или накрыть его скатертью, которую вам подарили в
день рождения. Физические характеристики являются обоснован-
ными, поскольку они позволяют делать точные прогнозы подоб-
ного рода.'
203
Другие показатели обоснованны в той мере, в какой они
позволяют делать такие прогнозы. Значения коэффициента IQ
позволяют, например, предсказать, как будут учиться в школе тс
или иные ученики, в какого рода деятельности может преуспеть
данный человек и т. д. И вновь точность подобных прогнозов уда-
ется оценить с помощью коэффициента корреляции. Значения IQ
являются наиболее обоснованными показателями при прогнози-
ровании успеваемости в школе — в данном случае коэффициент
обоснованности равен примерно +0,60. Такое низкое значение
корреляции (величина объясняемой дисперсии значений школьных
оценок составляет только 36%) объясняется тремя причинами.
1. Тесты по определению величины коэффициента IQ, как мы
уже видели, недостаточно надежны. Это, в свою очередь, огра-
ничивает величину коэффициента обоснованности, который не мо-
жет превосходить значения коэффициента надежности.
2. Школьные отметки — еще менее надежный показатель, чем
оценки теста по выявлению умственных способностей. Данная >
проблема становится наиболее серьезной при определении обосно-
ванности тестов. Дело в том, что характеристику, которую
мы собираемся прогнозировать (ее часто называют критерием) и
с которой коррелируют оценки теста, в большинстве случаев из-
мерить не так-то просто. Наиболее типичен в этом смысле при-
мер с определением пригодности того или иного человека к конк-
ретному виду деятельности. Суждения о том, справляется ли дан-
ный человек с порученной ему работой хорошо, удовлетворитель-
но или плохо, обычно очень субъективны. А ведь зачастую на их
основе принимаются важные решения о продвижении человека по
службе или о его увольнении. Из сказанного следует запомнить,
что коэффициент обоснованности не может превзойти надежность
критерия.
3. Успеваемость в школе (как и любой другой сложный вид
деятельности) определяется не только уровнем интеллектуальных
способностей, которым человек обладает от рождения, но также и
целым комплексом других факторов — трудолюбием, целеустрем-
ленностью, склонностью к тому или иному предмету и т. д. Отсюда
можно заключить, что при рассмотрении подобных проблем непло-
хо было бы иметь в своем распоряжении метод, с помощью кото-
рого удалось бы при осуществлении прогноза учесть воздействие
всех этих факторов. Подобные методы существуют, их называют
часто методами множественной корреляции. Хотя описание этих
методов выходит за рамки настоящей книги, будет полезно дать
•им краткую характеристику. С помощью методов множественной
корреляции удается учесть воздействие на результирующий при-
знак одновременно нескольких переменных. При этом вначале оп-
ределяют прогнозные значения этих переменных, а затем, объеди-
нив полученные результаты в рамках одного уравнения, осуществ-
ляют прогноз интересующей нас характеристики, который, как пра-
вило, оказывается лучше любого другого прогноза, сделанного
па базе лишь одной независимой переменной.
204
ОБОСНОВАННОСТЬ И ЧЕЛОВЕЧЕСКАЯ СПРАВЕДЛИВОСТЬ
Предположим, что вы являетесь одним из руководителей
предприятия и занимаетесь кадровыми вопросами. Допустим так-
же, что в вашем распоряжении имеется производственная харак-
теристика сотрудника фирмы, полученная от его непосредственного
начальника. В этой характеристике, в частности, говорится:
«По 10-балльной шкале я бы поставил м-ру X за его деловые ка-
чества, проявленные за время работы у нас, среднюю оценку».
Предположим, наконец, что одной из целей руководства являет-
ся повышение уровня квалификации персонала фирмы. В соответ-
ствии с этим критерием вы должны увеличить долю сотрудников,
деловые качества которых превосходят средний уровень. Сможете
ли вы, основываясь лишь на характеристике, данной сотруднику
его непосредственным начальником, принять решение об увольне-
нии этого сотрудника?
Если вы посоветуетесь со статистиком, то получите пример-
но такой ответ: «О связи между оценками начальства и последую-
щими успехами в работе я могу сказать следующее. Известно,
что коэффициент корреляции между оценкой непосредственного на-
чальника и оценкой работы сотрудника, которую руководство фир-
мы выставит ему в дальнейшем, равен +0,50. К сожалению, ко-
эффициент корреляции, равный 0,50, настолько низок, что любой
прогноз, сделанный на его основе, будет очень ненадежным. У вас
есть некоторые основания для утверждения, что данный сотруд-
ник проявит в будущем средние способности, однако при этом вы
можете легко ошибиться. Он может добиться огромных успехов в
своей работе, но может и завалить все дело. Во всяком случае
вы должны отдавать себе отчет в том, что у подобных проблем
нет однозначных решений. Любая стратегия, которой вы станете
придерживаться па протяжении того или иного периода времени,
окажется несправедливой и ошибочной в течение какой-то части
этого периода либо по отношению к незаслуженно уволенному че-
ловеку, либо по отношению к организации, в" штате сотрудников
которой будет оставлен ничем пе выделяющийся заурядный работ-
ник. Итак, я не могу предложить универсального и простого спо-
соба решения данной проблемы. Положитесь лучше на свою ин-
туицию».
Графическая иллюстрация пессимистического ответа статис-
тика приведена на рис. 9.2. Познакомившись с этим рисунком,
вы поймете, почему управляющий фирмой находится в безвыход-
ном положении. На рис. 9.2 показано, как может выглядеть диа-
грамма рассеяния оценок управляющего фирмой относительно сде-
ланных ранее оценок непосредственного начальника в случае,
когда коэффициент корреляции между этими двумя совокупностя-
ми значений равен + 0,50. Изображенная на этом рисунке фигура
имеет форму овала.
Приведенный график обладает одной важной особенностью,
в силу которой часть представленных на нем значений имеет вооб-
. 205
ражаемый, гипотетический, характер. Дело в том, что нанесение
данных на диаграмму рассеяния фактически означает, что все со-
трудники фирмы, независимо от оценки, выставленной им непо-
средственным начальством, были оставлены на работе и через
некоторое время их деятельность получила оценку руководителей
фирмы. Очевидно, что с точки зрения начальства такая политика
Оценка непосредственного начальника.
Рис. 9.2. Справедливость и несправедливость решений обусловлены несовершен-
ством характеристик обоснованности. Понять необходимо следующее: принятие
решений о формировании коллективов всегда осуществляется в ситуации, подоб-
ной топ, которая была только что рассмотрена. Тот факт, что эти решения осно-
вываются на субъективных впечатлениях руководителей фирмы, еще больше
усугубляет положение дел
представляется неразумной и поэтому на практике никогда не
осуществляется. Тот факт, что подобных данных в природе факти-
чески не существует, служит главным препятствием при получе-
нии удовлетворительных оценок обоснованности информации отно-
сительно индивидуальной деятельности людей. Имеются здесь и
некоторые другие последствия, на которых мы остановимся более
подробно в следующем параграфе. Л пока важно не упустить из
виду, что представленные па рис. 9.2 данные получены в резуль-
тате идеального мысленного эксперимента, который вряд ли когда-
либо будет (пли был) осуществлен на практике.
Вертикальная пунктирная линия, выходящая из точки 5,5, ко-
торая расположена на горизонтальной оси, представляет собой гра-
фическое изображение топ средней оценки (по 10-балльной шка-
ле), которую дал непосредственный начальник м-ру X по итогам
его деятельности. Для простоты изложения предположим, что кри-
терием (или критической оценкой), в соответствии с которым со-
206
трудник фирмы может быть оставлен на работе, является получе-
ние им, по крайней мере, средней оценки, выставленной непосред-
ственным начальством. Это означает, что все сотрудники фирмы,
получившие оценку, значение которой расположено слева от вер-
тикальной линии, должны быть уволены; если же значение оценки
расположено справа, то получивший эту оценку сотрудник уволь-
нению не подлежит. Горизонтальная пунктирная линия, выходящая
из расположенной на вертикальной оси точки 5,5, соответствует
критерию успешной деятельности, установленному управляющим
фирмой. Деятельность сотрудников, получивших оценку, располо-
женную выше этой линии, считается успешной; если же значение
оценки находится ниже горизонтальной линии, то, с точки зрения
управляющего фирмой, данный сотрудник слабо справляется со
своими обязанностями.
Легко можно увидеть, что эти две линии, пересекаясь, делят
представленную на рис. 9.2 совокупность наблюдений па четыре
части. Значения, расположенные в правом верхнем и левом ниж-
нем квадрантах, соответствуют правильным решениям, принятым
руководством относительно тех или иных сотрудников фирмы.
В правый верхний квадрант попали характеристики сотрудников,
добившихся успехов в работе, которые и раньше достаточно высо-
ко оценивались непосредственным начальством. В левом нижнем
квадранте представлены характеристики людей, деятельность ко-
торых оценивается низко как руководством фирмы, так и их непо-
средственным начальством, с точки зрения которого этих людей
следовало бы уволить. Данные, представленные в оставшихся двух
квадрантах, соответствуют ошибочной кадровой политике. Значе-
ния, расположенные в верхнем левом квадранте, характеризуют
тех сотрудников, деятельность которых оценивалась руководством
фирмы как успешная, однако эти же_ сотрудники в соответствии
с оценками их непосредственного начальства должны быть уволе-
ны.' В этом случае по отношению к незаслуженно уволенным со-
трудникам была бы допущена явная несправедливость. В правом
нижнем квадранте содержатся характеристики сотрудников, не
справляющихся со своими обязанностями, но оставленными на ра-
боте благодаря высоким оценкам, данным их непосредственным
начальством. В этом случае ущерб наносится фирме в целом.
Что же можно сказать о только что рассмотренном примере?
Прежде всего следует отметить, что описанная ситуация типич-
на для случаев, связанных с принятием субъективных решений о
личных качествах тех или иных работников (независимо от того,
оценивается ли их деятельность в баллах или с помощью какого-
то менее формального способа). Графический способ представле-
ния данных позволил нам дать более наглядную характеристику
существа рассматриваемой проблемы. Поскольку базу, па которой
осуществляется прогноз, надежной назвать нельзя, всегда будут
случаи увольнения хороших работников и сохранения в штате фир-
мы бездарных посредственностей, которые впоследствии неизбеж-
но превращаются в бесполезный «балласт».
207
Частота этих двух типов ошибок зависит от величины выбран-
ных значений критической оценки и критерия успеха. Перемеще-
ние значения критической оценки влево (т. е. обеспечение сотруд-
никам фирмы возможностей сохранить за собой рабочее место) при
неизменности величины критерия успеха приводит к уменьшению
числа несправедливых увольнений, но одновременно способствует
увеличению потенциального «балласта».
Ужесточение требований к сотрудникам фирмы, оставленным
на работе (т. е. перемещение критической точки вправо), приводит
к уменьшению числа работников, не справляющихся со своими
обязанностями, но одновременно способствует увеличению числа
несправедливых увольнений. Если вы все же попытаетесь решить
стоящую перед руководством фирмы проблему с помощью различ-
ных комбинаций перемещения вдоль осей графика значений кри-
терия успеха и критической точки, то обнаружите, что ни'один из
рассмотренных вариантов нс может быть признан удовлетвори-
тельным. Попытки избежать несправедливости по отношению к от-
дельным людям будут вести к нанесению ущерба интересам фир-
мы в целом, и наоборот.
Имеется ли способ решения этой задачи? Нет, поскольку, как
мы уже видели, оценки способностей человека являются далеко
не совершенными показателями. Вообще говоря, рассмотренная
ситуация может быть улучшена в результате увеличения значе-
ния коэффициента корреляции между оценками руководителей
фирмы степени успешности практической деятельности того или
иного сотрудника и показателями, использованными для прогноза
этих оценок. Для достижения этого, как и в случае с обоснован-
ностью оценок коэффициента IQ, необходимо увеличить надеж-
ность того и другого показателя. Последнее, вероятно, невозможно
без привлечения обширной и разнообразной информации, на базе
которой осуществляется оценка значений этих двух показателей.
К несчастью, если при осуществлении прогноза используется
большое количество значений различных показателей, а эти пока-
затели, в свою очередь, подвергаются детальному статистическо-
му анализу, то процесс решения проблемы типа «оставить в шта-
те— уволить» становится слишком уж сложным и оказывается
под силу разве что компьютеру. Многие люди сочтут такую перс-
пективу, в соответствии с которой судьба человека будет зависеть
от решения бездушной машины, неприемлемой. Фактически же
преимущество объективных методов, связанных с количественной
обработкой имеющихся данных, перед субъективными методами,
основанными на человеческой интуиции, неоднократно подтверж-
далось точностью получаемых с их помощью прогнозов. Таким
образом, если говорить о последствиях применения этих методов
для людей, чья судьба зависит от принятия того или иного реше-
ния, то «холодные» формальные методы оказываются в действи-
тельности более «человечными», чем «теплые», учитывающие все
нюансы конкретной ситуации интуитивные методы, более широко
распространенные в практике предприятий в настоящее время.
208
ПРОГНОЗЫ НА БАЗЕ УСЕЧЕННЫХ РАСПРЕДЕЛЕНИЙ
Предположим, что методы предсказания степени успешности
деятельности того или иного человека на некотором предприятии
обладают достаточно высоким уровнем обоснованности (как, на-
пример, в случае с тестом по выявлению склонностей к обучению).
Как поступит тогда заведующий отделом кадров данного пред-
приятия? Почти наверняка он решит испол!>зовать эту информацию
для улучшения подбора кадров. В нашем конкретном случае это
Рис. 9.3. Прогнозирование по усеченным
распределениям. Использование все бо-
лее высоких значений критических оце-
нок приводит ко все более значительно-
му уменьшению показателя г. Данный
факт не означает, что применяемый
тест, как иногда утверждают, плохой.
Подобный результат является следстви-
ем регрессионного эффекта, имеющим
чисто статистическую природу
фактически означает фиксирование величины критической оценки.
Кадровая политика будет, следовательно, состоять в том, что на
работу будут приниматься только люди, получившие при прохож-
дении специального селективного теста оценки, превышающие по'
величине критическое значение. На каком уровне заведующий от-
делом кадров зафиксирует величину критической оценки, зависит
от ряда факторов. Некоторые из этих факторов нами будут оха-
рактеризованы.
Предположим, что коэффициент обоснованности теста равен
примерно +0,60. Диаграмма рассеяния, на которой представлена
подобная корреляционная взаимосвязь, может выглядеть, как на
рис. 9.3. С помощью этого рисунка показано, к какому резуль-
тату приводит фиксирование значения критической оценки на
трех различных уровнях А, В и С. Соответствующие этим оцен-
кам линии пересекают горизонтальную ось графика в трех точ-
ках. В дополнение к этому на график нанесена горизонтальная
линия, определяющая границу между успешной и неудачной дея-
тельностью принятого на работу сотрудника.
Обратимся теперь к анализу результатов фиксирования зна-
чений критических оценок. Очевидно, что критическая оценка,
обозначенная, через А, в действительности таковой не является,
поскольку все желающие поступить на работу в данную органи-
зацию будут приняты. Коэффициент корреляции между значения-
’/214-1778 . ' . 209
ми, полученными при прохождении селективного теста, и оценками
деятельности человека после его принятия на работу равен +0,60.
Анализ рис. 9.3 показывает, что площадь графика под прямой
линией (границей между успешной и неудачной деятельностью
человека, принятого на работу) превосходит площадь графика,
расположенную над этой линией. Следовательно, большая часть
людей, принятых на работу, успехов в своей деятельности не
добьется.
Фиксирование критической оценки на уровне, указанном на
рис. 9.3 с помощью линии В, позволяет сделать два вывода:
(1) поскольку после прохождения селективного теста потенциаль-
но посредственных работников отсеивается больше, чем хороших
(см. часть графика, расположенную слева от линии В), это сви-
детельствует об улучшении характеристик процесса отбора: люди,
получившие оценку, величина которой превышает критическое
значение, впоследствии в большинстве случаев работают хорошо;
(2) как вы, возможно, уже заметили, форма части графика, ос-
тавшейся после исключения оценок, величина которых оказалась
меньше критического значения, свидетельствует об уменьшении
корреляции между оценками селективного теста и оценками по-
следующих успехов в работе. И действительно, если рассчитать
соответствующий коэффициент корреляции для лиц, принятых на
работу, мы обнаружим, что величина этого коэффициента умень-
шилась с -|-0,60 до +0,30. Главный вывод из сказанного состоит
в том, что уменьшение диапазона вариации значений любой из
двух коррелирующих между собой переменных приводит к сниже-
нию коэффициента корреляции. На статистическом языке этот фе-
номен называется эффектом определения корреляции по усеченным
распределениям. Под усеченным подразумевается распределение, в
котором диапазон вариации значений принадлежащих ему наблю-
дений каким-то образом уменьшен. Важная особенность этого фе-
номена состоит в том, что уменьшение коэффициента корреляции
в данном случае вовсе не свидетельствует о непригодности селек-
тивного теста. Как раз наоборот: применение данного теста ока-
залось достаточно успешным, хотя формальные характеристики
его использования ухудшились.
Нечто подобное наблюдается и при применении упоминавшего-
ся, теста по выявлению склонностей к обучению. Если исходная со-
вокупность юношей и девушек, подвергнутых этому тесту, имеет
произвольный, случайный характер, то коэффициент корреляции
между полученными при его прохождении оценками и успевае-
мостью (измеренной в баллах) в колледже достигает обычно зна-
чения + 0,60. Однако известно, что различные колледжи предъяв-
ляют различные требования к абитуриентам, устанавливая тот или
иной уровень критической оценки. А это, в свою очередь, оказы-
вает влияние на контингент поступающих в данный колледж аби-
туриентов. Соответственно, чем выше уровень критической оценки,
тем ниже значение коэффициента корреляции. Это обстоятельство
позволило некоторым не очень сведущим в статистике президен-
210
гам наших самых престижных колледжей сделать безответствен-
ные заявления о бесполезности применения этого теста на прием-
ных экзаменах. Однако если последовать их рекомендациям и от-
менить данный тест, то достаточно будет всего лишь года-двух,
чтобы убедиться в ошибочности принятого решения.
МЫШЛЕНИЕ, ОСНОВАННОЕ НА СОИЗМЕРЕНИИ РИСКА
С ПОЛЕЗНЫМ ЭФФЕКТОМ
Через весь материал, представленный в настоящей главе,
красной нитью проходит мысль о сложности реального (равно как
и статистического) мира. Подавляющее большинство решений,
принимаемых человеком в течение его жизни, имеют как положи-
тельные, так и отрицательные последствия. Любой результат со-
вершенных вами действий как функция принятого конкретного
решения представляет собой некоторую комбинацию полезных и
отрицательных последствий, и нет способа, с помощью которого
можно было бы отыскать решение, приводящее к получению толь-
ко положительных результатов.
Если человеку сделана прививка против кори (или против
какого-либо другого заболевания), то полезный эффект ее заклю-
чается в предотвращении заболевания данной болезнью. Однако
при этом имеется некоторый риск (правда, весьма незначительный),
состоящий в том, что прививка может спровоцировать другое за-
болевание. Администратор, желающий использовать информацию
о корреляционной взаимосвязи между некоторой характеристикой
и качеством работы служащего фирмы, прежде чем остановиться
на тех или иных принципах кадровой политики, должен сопоста-
вить последствия несправедливого увольнения части рабочих с вре-
дом, который может быть нанесен фирме в целом. Чем сильнее
этот администратор будет отстаивать интересы фирмы, тем чаще
он будет поступать несправедливо по отношению к конкретным
людям. Если он, к примеру, зафиксирует уровень критерия се-
лективного теста на такой высоте, что фирма сможет избавить-
ся практически от всех потенциально плохих работников, то при
этом будет отсеяно и большое число потенциально хороших ра-
ботников. Справедлива ли такая политика? Да и возможна ли
она на практике?
Эти рассуждения подводят нас, наконец, к рассмотрению кри-
терия С (см. рис. 9.3). Как следует из рисунка, этот критерий
зафиксирован на таком высоком уровне, что оценки лишь не-
скольких заведомо хороших работников превосходят его по ве-
личине. Предположим, что мы добиваемся именно этой цели и нам
удалось правильно зафиксировать значение соответствующей кри-
тической оценки. В результате лишь 5% людей, подвергнутых се-
лективному тесту, получили оценки, превышающие критическое
значение. Если нам нужно отобрать таким образом 1000 человек,
которые наверняка окажутся хорошими работниками, мы должны
будем с помощью селективного теста обследовать 200 000 человек.
7г 14*
211
Очевидно, что подобная программа обошлась бы нам очень неде-
шево. Можно ли представить себе какие-либо условия, в которых
подобные затраты оказались бы оправданными?
Заведомо положительный ответ на этот вопрос может быть
дан, по крайней мере, для одной ситуации — когда наш случай-
ный неудачный выбор может привести к гибели принятого на
работу человека или каких-либо других людей. Так, например,
исходя из таких соображений в военное время отбор курсантов
в летные училища осуществляется с помощью тестов, имеющих
довольно низкую прогнозную обоснованность. Имея в наличии
практически неограниченный контингент молодых людей, желаю-
щих стать военными летчиками, вполне можно отобрать небольшое
число кандидатов, которые почти наверняка станут настоящими
воздушными асами. Наверняка значительная часть отсеянных
претендентов ни в чем не уступает тем, кто был в конечном сче-
те зачислен в летное училище. Однако если бы мы захотели ис-
править эту несправедливость, понизив уровень критической оцен-
ки, то поплатились бы за это тысячами долларов, напрасно потра-
ченными на обучение посредственных пилотов, миллионами дол-
ларов, потерянными в авиационных катастрофах и воздушных
боях, а также многими жизнями, стоимость которых в деньгах
оценить нельзя.
НЕМОНОТОННЫЕ И КРИВОЛИНЕЙНЫЕ РЕГРЕССИИ
Имеются данные о том, что связь между значениями коэффи-
циента 1Q и способностью овладеть некоторыми специальностями
(такими, например, как водитель такси, кассир в бакалейном ма-
газине и т. д.) является немонотонной. Иными словами, способность
овладеть какой-либо профессией возрастает. по мерс увеличения
уровня интеллектуального развития лишь до некоторой определен-
ной точки, после прохождения которой рассматриваемая взаимо-
связь становится убывающей. Причина этого явления, возможно,
кроется в том, что люди, у которых коэффициент IQ превышает
некоторое оптимальное значение, обладают относительно менее
устойчивой психикой. Если бы отмеченная взаимосвязь имела стро-
гий и однозначный характер, то соответствующая ей диаграмма
рассеяния выглядела бы примерно так, как показано па рис. 9.4.
Расположение точек на этом рисунке свидетельствует о том, что
уровень способностей к овладению данной специальностью может
быть абсолютно точно предсказан по величине коэффициента IQ.
В описанной ситуации фактически мы имеем дело с немонотон-
ной1 корреляцией «эта», величина которой равна 1,0. Однако зна-
чение коэффициента корреляции «эта», рассчитанное на основании
1 В советской литературе коэффициент корреляции, характеризующий тесно-
ту криволинейной связи между двумя переменными, называется корреляцион-
ным отношением или индексом корреляции. Применяемый автором термин кор-
реляция «эта» связан, видимо, с использованием для обозначения данного
коэффициента корреляции греческой'буквы ц («эта»). — Примеч. пер.
212
данных, представленных на рис. 9.4, равно 0,0. Если мы восполь-
зуемся регрессионным уравнением, основанным на этом коэффи-
циенте корреляции, для прогнозирования способностей к овладе-
нию той или иной специальностью, то независимо от величины ко-
эффициента IQ получим среднюю оценку, равную 18,64 балла.
25-
Рис. 9.4. Полная немонотонная
корреляция, при которой г=0.
Альтернативный коэффициент
корреляции «эта», применяю-
щийся в подобных ситуациях,
имеет значение, равное 1,0
।______' । ।
120 140 150 ISO
Коэффициент Щ
В предыдущем примере описан крайний случай. На рис. 9.5
представлена другая ситуация, когда взаимосвязь между X и У
строго монотонная, по имеет криволинейный характер. В этом слу-
чае коэффициент г имеет довольно высокое значение ( + 0,83),
J : Д__L___I__L_I__I____L
0 1 2 3 4 5 6 7 8 9 10
Фазовая характеристика
Рис. 9.5. Полная криволи-
нейная корреляция, при ко-
торой г=+0,83, а коэффи-
циент корреляции «эта» =
= 1,0. Довольно высокий
коэффициент корреляции,
равный +0,83, может быть
получен и в том случае,
когда использование корре-
ляционной связи будет при-
водить к получению неточ-
ных прогнозов
однако, очевидно, что и он недооценивает тесноту взаимосвязи
между представленными па рис. 9.5 показателями. Данный пример
особенно поучителен в том смысле, что с его помощью удается
показать, как далеко от истинных могут отклоняться прогнозные
значения У, когда их оценка осуществляется на базе такого коэф-
фициента корреляции.
ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА г
Познакомившись с последним примером, вы, возможно, ста-
ли понимать, насколько далек от совершенства показатель кор-
реляции даже в случае, когда его величина оказывается доволь-
15—1778
213 -
но высокой. Мы сталкивались с этим феноменом при обсуждении
понятия надежности. Новые аргументы, подтверждающие справед-
ливость сформулированного выше вывода, мы сможем привести
после рассмотрения следующего числового примера. Возьмем па-
ры значений показателей X и У:
X I 1 2 .3 4 5 6 7 8 9 10 11
Y | 4 8 10 1 И 7 2 3 4 6 9
Корреляция между этими оценками, как следует из этой табли-
цы, близка к нулю и составляет —0,03. Однако попробуем те-
перь заменить первое значение оценки У на —40 или же на +40.
В результате величина коэффициента г станет равной +0,46 в
первом случае и —0,52 во втором. Вывод, который может быть
сделан, состоит в том, что коэффициенты корреляции, особенно
когда они основываются па небольшом количестве наблюдений,
оказываются очень чувствительными к наличию небольшого числа
исключительных по величине наблюдений. Подобные корреляци-
онные взаимосвязи очень ненадежны и не должны восприниматься
буквально. Одна из областей, где данные соображения имеют
очень важное значение, связана с расчетом коэффициентов на-
следственности, о которых мы говорили несколько ранее. Посколь-
ку коэффициент г является таким чувствительным показателем,
можно ожидать, что различные наборы исходных данных будут
приводить к получению совершенно различных оценок степени
наследования тех или иных характеристик.
РЕГРЕССИОННАЯ ОШИБКА
Явление регрессии к средней было известно Фрэнсису Галь-
тону еще более 100 лет назад. Он называл его «регрессией (воз-
в'ратом) к среднему состоянию», «регрессией к посредственности».
Гальтоп обнаружил, что у высоких родителей дети, как правило,
тоже оказываются высокорослыми, по при этом их рост в среднем
был все же ниже роста их родителей. Более конкретно это озна-
чает: если рост одного из родителей выше среднего, то на каждый
дюйм такого превышения у их детей приходится только полдюйма.
Что же касается роста среднего для обоих родителей, то на каж-
дый дюйм превышения среднего роста человека у их детей при-
ходится четыре пятых дюйма. Как нам уже известно, вывод о су-
ществовании данного феномена может быть сделан из рассмотре-
ния уравнения регрессии Zv = rZx (если нс принимать во внимание
довольно редкую ситуацию, когда г= + 1,0). .
Наиболее часто встречающиеся при интерпретации регрессион-
ных уравнений ошибки связаны с попытками приписать феномену
регрессии несвойственный ему причинно-следственный характер.
Остановимся на этом более подробно. Обратимся еще раз к приме-
ру, которым начиналась предыдущая глава, о молодой супруже-
ской паре, обладающей средним коэффициентом IQ, равным 130.
214
Прогнозное значение коэффициента IQ для их ребенка оказалось
равным 118. Предположим, у наших молодоженов родился ребе-
нок, у которого коэффициент IQ, действительно, составил ров-
но 118. Вполне может случиться, что родители при этом испытают
некоторое чувство разочарования и даже вины, считая себя в ка-
кой-то степени ответственными за то, что показатель IQ ребенка
ниже, чем у них-самих. Подобный образ мышления — типичный
пример совершения регрессионной ошибки1: явлению, имеющему
чисто статистическую прифоду, дается объяснение, носящее при-
чинно-следственный характер.
Приведем еще один пример, па этот раз взятый из реальной
жизни. Однажды в одном из летных училищ было решено испытать
на практике рекомендованную специалистами-психологами систе-
му обучения, основанную па поощрении и наказании соответствен-
ным образом проявивших себя -в процессе обучения курсантов * *,
Инструкторы стали награждать своих учеников всякий раз,
когда воздушный маневр был удачным, и наказывать после не-
брежного выполнения полетного задания. Однако, вопреки ожи-
даниям, у инструкторов сложилось впечатление, что после полу-
чения награды курсанты выполняли очередной полет несколько
хуже. Наказанные же курсанты обычно начинали летать лучше.
Полученные результаты могут быть интерпретированы так:
только наказания оказались эффективным инструментом при фор-
мировании летных навыков у курсантов. Однако подобная интер-
претация была бы ошибочной. Эти результаты являются просто
следствием наличия регрессионного эффекта. Освоение премудро-
стей профессии летчика происходит медленно, причем корреля-
ция между качеством выполнения последовательных полетов не-
высока. Поэтому вполне можно ожидать, что после особенно удач-
ного полета последует менее удачный (регрессия от хорошего
полета к среднему). Как отмечают Канеман и Тверски, регресси-
онный эффект имеет практически всеобщий характер. Все мы
живем в мире, где наши попытки улучшить поведение того или
иного человека с помощью поощрения приводят к обратным ре-
зультатам, от которых мы же еще и страдаем. В то же время по-
пытки исправить поведение человека, наказывая его, зачастую ока-
зываются успешными.
С явлением регрессии к средней мы сталкиваемся постоянно.
Дети выдающихся родителей часто обладают средними способно-
стями. Студент, блестяще отвечавший на первом экзамене, часто
не проявляет столь высоких знаний на следующем экзамене. В то
же время самый слабый студент редко заваливает два экзамена
подряд. Деятельность компании, получившей в прошлом году наи-
’ Термин регрессионная ошибка в том смысле, в котором его употреб-
ляет автор, не является общепринятым. — Примеч. пер.
* Этот пример взят из статьи Д. Канемана и А. Тверски [8]. Читателю
будет полезно познакомиться с этой' статьей, в которой рассматриваются и дру-
гие случаи ошибочной интерпретации статистических данных. Если при чтении
настоящей книги у вас до сих пор нс возникало никаких серьезных затрудЕгений,
связанных с пониманием излагаемого материала, эта статья вам будет по силам.
15*
215
больший объем прибыли, в следующем году может оказаться не
такой успешной. Лучший футболист прошлого сезона редко при-
знается таковым в следующем сезоне. И так далее. Каждый из
приведенных только что примеров как бы «приглашает» вас дать
объяснение описанным изменениям. Однако в действительности___
это приглашение совершить регрессионную ошибку. И его следует
отвергнуть.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
Коэффициенты корреляции характеризуют степень тесноты
и направление взаимосвязи между переменными. Они ничего не
говорят о природе этой взаимосвязи. Более точно, коэффициент
корреляции не является характеристикой причинно-следственной
связи: по его величине нельзя судить, имеется такая связь или же
она отсутствует. Интерпретация причинно-следственной связи оп-
ределяется в первую очередь соображениями, не имеющими ста-
тистического характера. И наиболее важное из них, несомненно,
то, как мы определяем категорию причинности, природу этого
философского понятия. Поскольку философы до сих пор эту про-
блему решить не могут, говорить о причинах, основываясь лишь
на выявленных корреляционных взаимосвязях, — дело чрезвычай-
но рискованное.
С риском связано и использование коэффициентов корреля-
ции для получения прогнозов (а это главная область их прак-
тического применения). Мы неоднократно имели возможность убе-
диться, что найденный коэффициент корреляции (г) позволяет
объяснить лишь некотрую часть (г2) общей величины дисперсии
прогнозируемой переменной. А это значит, что прогнозы, получен-
ные на основе коэффициентов корреляции, могут оказаться чрез-
вычайно неточными, если величина соответствующего коэффици-
ента корреляции будет не очень большой.
Интерпретация коэффициентов корреляции связана также с
опасностью совершить ряд других, более специфических ошибок.
Большая часть таких ошибок, а также некоторые полезные свой-
ства корреляции характеризуются с помощью следующих понятий
и определений.
Базовая оценка.. Частота, с которой встречается данное явле-
ние в реальной действительности. Базовые оценки приобретают
существенное значение в случаях, когда они должны быть приня-
ты во внимание при принятии решения о существовании корреля-
ции между двумя переменными.
Частный коэффициент корреляции. Тип коэффициента корре-
ляции, с помощью которого измеряется теснота взаимосвязи меж-
ду (обычно) двумя переменными, когда значение связанной с ни-
ми третьей переменной сохраняется постоянным.
Наследственность. Доля дисперсии некоторого признака сово-
купности биологических объектов (последнее очень важно), обу-
словленная воздействием генетических факторов.
216
Надежность. Степень совместности результатов, получаемых
в процессе измерения данного показателя; степень, в которой
два измерения одной и той же характеристики с помощью одного
ц того же измерительного инструмента дают нам совместные друг
с другом результаты.
Обоснованность. Степень, в которой данный показатель позво-
ляет прогнозировать некоторые интересующие исследователя ха-
рактеристики измеряемого с помощью этого показателя объекта.
Критерий. В рамках концепции обоснованности — свойство,
прогнозируемое с помощью данного показателя.
Критическая оценка. Фиксируемое в качестве минимальной
оценки значение, при достижении которого принимается решение
о принятии данной программы, ее продолжении или каких-либо
других действиях, связанных с подбором и расстановкой кадров,
на базе ожидаемых оценок степени успешности деятельности при-
нятых па работу людей.
Стандартная ошибка оценки. Стандартное отклонение распре-
деления прогнозируемого показателя в случаях, когда прогноз осу-
ществляется на базе концепции корреляции:
Sv.x = svrr^A
Усеченное распределение. Распределение с ограниченным диа-
пазоном вариации входящих в него наблюдений (например, полу-
ченных в результате использования критической оценки). Усече-
ние распределения приводит к уменьшению коэффициента корре-
ляции при прогнозировании показателя.
Немонотонная регрессия. Кривая, связывающая средние зна-
чения Y (зависимой переменной) со значениями X и представляю-
щая собой немонотонную функцию.
Коэффициент корреляции «эта». Коэффициент корреляции, ко-
торый может быть использован, когда регрессия имеет криволи-
нейный или немонотонный вид.
Криволинейная регрессия. Кривая, связывающая средние зна-
чения Y (зависимой переменной) со значениями X. В подобных
ситуациях коэффициент г не характеризует действительную сте-
пень тесноты взаимосвязи, поскольку его использование предпола-
гает наличие линейной регрессии.
Регрессия к средней. За исключением случая, когда г= 1,0,
применение регрессионного уравнения для прогноза всегда дает
прогнозные значения Zv, в меньшей степени отличающиеся от зна-
чения средней по сравнению с показателями Zx, по величине ко-
торых осуществляется прогноз.
Регрессионное уравнение. При выражении с помощью показа-
телей Z-оценок — это уравнение вида Zy — rZx.
Регрессионная ошибка. Использование концепции причиннос-
ти при интерпретации явления регрессии к средней.
10
ANOVA’
Имеется довольно много свидетельств того, что стрессовые
ситуации оказывают самое непосредственное воздействие на со-
стояние здоровья человека. Для оценки силы этого воздействия
должны применяться специальные методы. Такие методы в на-
стоящее время имеются, и их практическое использование привело
к разработке упорядоченных перечней некоторых наиболее важ-
ных человеческих проблем. Эти методы получили название мето-
дов относительного шкалирования. При составлении шкалы оценок
событий человеческой жизни смерть супруга рассматривается в ка-
честве наиболее сильной из всех возможных стрессовых ситуаций.
Этому стрессу обычно присваивается максимальное значение, рав-
ное, например, 100 единицам. Все другие стрессы могут быть оце-
нены в процентах к этому максимальному значению. Подобные
оценки можно рассмотреть в качестве характеристик силы стрес-
сового воздействия на человека тех или иных событий в его жиз-
ни. Оказывается, что почти любое изменение в условиях жизни
человека связано со стрессовыми потрясениями различной силы.
В табл. 10.1 представлены оценки стрессов, вызываемых теми или
иными событиями. Следует отметить, что даже «положительные»
изменения в условиях жизни человека приводят к стрессам. По-
добные события в таблице отмечены звездочкой. Таким образом,
и самые приятные события не проходят бесследно для нашего здо-
ровья.
Одно из лучших исследований воздействия стрессов на здо-
ровье человека было проведено врачом-психиатром Ричардом Ра-
хе [15]. Рахе обследовал большую совокупность служащих воен-
но-морского флота, обладающих приблизительно одинаковым уров-
нем развития и имеющих примерно один и тот же возраст. Он по-
лучил общие оценки стрессов почти для 3000 военных моряков и
затем исследовал их индивидуальные реакции в условиях учеб-
ного плавания, т. е. в условиях, когда можно было легко органи-
зовать контроль за их поведением. Зависимой переменной в дан-
ном исследовании служило число посещений врача каждым из
1 Аббревиатура английского выражения Analysis of Variance (дисперсион-
ный анализ). — Примеч. пер.
218
моряков. Независимая переменная была представлена четырьмя
различными уровнями суммарных значений стрессовых единиц,
«набранных» за шесть месяцев плавания. Отметим, что проведен-
ное Рахе исследование представляет собой мультивалентный экс-
перимент, причем независимая переменная является выделяемой
независимой переменной. В исследовании фактически применялся
квазиэкспериментальный метод, основанный па использовании
косвенных характеристик.
Результаты исследования продемонстрировали связь между
уровнем стрессов и частотой, с которой моряки обращались к
врачу. Четыре средних для каждого уровня значения стресса оп-
та б л и ц а 10.1
Изменения, происходящие в жизни человека
Единицы силы стресса Единицы силы стресса
Семья Смерть супруга (супруги) Развод ’ Крупная размолвка супругов Смерть близкого родственника * Женитьба * Примирение после крупной ссоры Серьезное изменение в отно- шениях членов семьи * Беременность * Рождение ребенка Серьезное изменение в отно- шении к жене Сын или дочь покидают отчий кров Трудности в отношениях с род- ственниками жены или мужа Жена поступает па работу или заканчивает работать Серьезные изменения в отно- шениях с общими друзьями Человек Заключение в тюрьму Серьезная рана млн болезнь Смерть близкого друга * Выдающийся личный успех * Начало или завершение учебы Серьезные изменения в j-сло- виях жизни Серьезный пересмотр личных привычек 100 73 65 63 50 45 44 40 39 35 29 29 26 15 63 53 37 28 26 25 24 Переход в новую школу Изменение места жительства Серьезное изменение в харак- тере развлечений Серьезное изменение в отно- шении к исполнению религиоз- ных предписаний Серьезное нарушение привыч- ного распорядка дня Серьезное изменение в харак- тере питания * Отпуск * Новогодние праздники Незначительные нарушения за- кона Работа Увольнение с работы Уход на пенсию Серьезные изменения состоя- ния дел па работе Изменение вида деятельности * Повышение ио службе Трудности в отношениях с на- чальством Серьезные изменения в усло- виях работы Финансовые вопросы Серьезные изменения финансо- вого состояния Заклад имущества на сумму более 10 000 долл. Лишение права выкупа за- кладной Заклад имущества или займ на сумму менее 10 000 долл. 20 20 19 19 16 15 13 12 И 47 45 39 36 29 23 20 38 31 30 17
219
ределялись как: очень слабый стресс, оцениваемый в 1,4 едини-
цы, слабый стресс, оцениваемый в 1,6 единицы, сильный стресс,
оцениваемый в 1,7 единицы, очень сильный стресс, оцениваемый
в 2,1 единицы. Теперь мы должны ответить на вопрос, существен-
ны ли полученные различия.
ДИСПЕРСИОННЫЙ АНАЛИЗ ОДНОФАКТОРНОГО КОМПЛЕКСА
Из того, что мы до сих пор обсуждали в настоящей книге,
следует, что определить значимость различий между средними
показателями четырех выделенных групп можно единственным
образом: использовать критерий для сравнения средней группы 1
со средними групп 2, 3 и 4, средней группы 2 — со средними
групп 3 и 4, средней группы 3 — со средней группы 4. Однако
применение этого метода было бы ошибочным в силу довольно
очевидной причины. Предположим, что из-за ошибок выборки
средняя одной из выборок (например, группы 3) оказалась су-
щественно выше или существенно ниже значения средней для со-
вокупности в целом. В силу этого вы отвергаете нулевую гипо-
тезу в первом из сравнений, между группами 1 и 3, допуская тем
самым ошибку I рода. Поскольку средняя группы 3 участвует
и в других сравнениях, та же ошибка будет допущена и в них,
что последовательно приведет к ошибочной интерпретации полу-
ченных результатов. Иными словами, в данном случае проведен-
ные сравнения не будут независимыми друг от друга. Следова-
тельно, для работы с подобными данными необходим другой ме-
тод. Одним из таких методов является дисперсионный анализ,»
или ANOVA.
ЛОГИКА ДИСПЕРСИОННОГО АНАЛИЗА
В дисперсионном анализе при исследовании сформулированной
выше проблемы применяется подход, при котором значимость
различий между несколькими показателями средних оценивается
одновременно для всех возможных случаев. Используемый в этих
методах /•’-критерий, или /•’-отношение, позволяет ответить на во-
прос: не слишком ли высока дисперсия средних, полученных в дан-
ном исследовании, чтобы -можно было утверждать, что все они
являются средними случайных выборок из одной и той же сово-
купности? Нулевая гипотеза состоит в предположении, что диспер-
сия значений средних не столь высокая. Если нулевая гипотеза
будет отвергнута, то это означает, что независимые переменные
в проводящемся нами эксперименте в действительности формиру-
ют различные совокупности наблюдений, для которых и были по-
лучены эти выборочные средние. Методы дисперсионного анализа
основываются на идеях, очень близких к тем, которые обсужда-
лись в гл. 8.
220
РАЗЛОЖЕНИЕ ДИСПЕРСИИ
В гл. 8 было показано, что знание величины коэффициента
корреляции между двумя показателями позволяет разделить дис-
персию каждого из этих показателей на два компонента. Один из
этих компонентов представляет собой дисперсию набора средних,
прогнозируемых с помощью регрессионного уравнения. Другой
компонент является дисперсией распределения оценок внутри
групп наблюдений, для которых рассчитаны эти прогнозные зна-
чения средних. Если обозначить общую дисперсию через S2T, дис-
персию средних — через S2M, а дисперсию наблюдений внутри со-
ответствующих групп — через S2vtg, то
<?2 _ С2 I Q 2
° Г ~ ° WG-
Напоминаю, элемент Szm в данном уравнении представляет
собой квадрат стандартной ошибки средней, a S2wg—квадрат
стандартного отклонения выборки (S2). Если вы вспомните (см.
с. 153), что
V N
л
С2 А
И ЧТО
N — 1 ’
то вам станет ясно, что оба этих показателя позволяют получить
А
оценку дисперсии генеральной совокупности, S2. Эти оценки —
главные ингредиенты ANOVA. Говоря упрощенно, с помощью дис-
персионного анализа выясняется, являются ли они оценками дис-
персии одной и той же генеральной совокупности.
РАЗЛОЖЕНИЕ СУММ КВАДРАТОВ
Хотя приведенные выше уравнения и могут быть использованы
для получения оценок дисперсии генеральной совокупности, вхо-
дящих в /-’-отношение, они не очень подходят для этой цели. Фор-
мула для оценки дисперсии генеральной совокупности, которую
мы применяли раньше, выглядит так:
S==w^T-
Наиболее простой способ получить все необходимые показатели
состоит в следующем. Вначале производится расчет общей суммы
квадратов (Sd2T), а затем осуществляется разбиение общей сум-
221
мы на сумму квадратов межгрупповых отклонений (2d2BG) и сум-
му квадратов внутригрупповых отклонений (Xdzwa). "Xd2BG позво-
ляет получить оценку дисперсии генеральной совокупности по по-
казателям средних. позволяет получить более традиционную
оценку, основанную на показателе выборочной дисперсии. Здесь
мы снова сталкиваемся с материалом, рассмотренным рапсе в
связи с понятием корреляции.
В гл. 8 давалась характеристика методам прогнозирования Y
по величине X с помощью регрессионного уравнения Zy = rZx. В од-
ном из примеров в этой главе прогнозировалась величина коэф-
фициента IQ ребенка, родившегося у родителей, средний показа-
тель IQ у которых составлял 145 пунктов. Этот средний коэффи-
циент на три стандартных отклонения превышает величину сред-
ней для генеральной совокупности. Поскольку коэффициент кор-
реляции между средним для родителей показателем IQ и показа-
телем IQ у их детей равен +0,60, при подстановке соответствую-
щих значений в регрессионное уравнение получаем: 2г/=+0,6()Х
Х3=1,8. Перевод в единицы коэффициента IQ дает нам значе-
ние 127, т. е. показатель IQ, па 1,8 стандартного отклонения пре-
вышающий среднюю для генеральной совокупности. Данное про-
гнозное значение IQ представляет собой средний показатель, точ-
ку, расположенную в центре нормального распределения индиви-
дуальных значений этого показателя у детей. Предположим те-
перь, что в этой семье родился ребенок, у которого коэффициент
IQ составил 103 пункта. Воспользуемся данным примером для то-
го, чтобы ввести некоторые понятия, необходимые для расчета
показателя F в дисперсионном анализе.
Этот ребенок входит в группу детей, чей средний показатель
IQ на 27 пунктов превышает среднюю генеральной совокупности
(127—100-=27). С другой стороны, показатель IQ данного ребен-
ка оказался на 24 пункта ниже среднего значения IQ группы де-
тей, к которой он принадлежит (103—127 = —24). Таким образом,
равное 3 пунктам отличие коэффициента IQ этого ребенка от сред-
ней для генеральной совокупности (103—100) образуется из рав-
ного +27 пунктам отличия среднего показателя группы от сред-
ней для генеральной совокупности плюс равное —24 пунктам от-
личие коэффициента данного ребенка от среднего значения IQ для
его группы (внутригрупповое отличие): 27—24 = 3.
Как следует из примера, разность (d) между любой индиви-
дуальной оценкой и общей средней для некоторой совокупности
оценок, состоящей из нескольких подгрупп наблюдений, представ-
ляет собой сумму межгрупповой разности (dBG) между средней
для соответствующей группы и общей средней оценкой и внутри
групповой разности (dWG) между значением индивидуальной оцен
ки и средней оценкой данной группы:
d — dBa + dwa.
Если вы согласны с этим уравнением, то, возможно, у вас не
222
вызовет удивления, что справедливо и такое равенство (доказа-
тельство приводится в приложении):
ПРИМЕР: СТРЕССОВЫЕ СИТУАЦИИ И СОСТОЯНИЕ ЗДОРОВЬЯ
От показателей сумм квадратов (2d2) всего лишь один шаг
к получению показателя дисперсии. Однако чтобы исключить здесь
всякую возможность недопонимания, обратимся еще раз к нашему
примеру со стрессами и состоянием здоровья людей. Исследование
этого примера с помощью методов дисперсионного анализа пока-
зало, что феномен увеличения заболеваемости людей при возра-
стании силы перенесенных ими стрессов является существенным
при довольно высоком уровне значимости (р<0,01). Однако мы
не будем повторять здесь анализ, проведенный Р. Рахе при прак-
тическом исследовании данной проблемы. Вместо этого мы
рассмотрим более простую совокупность данных, что поможет
сделать более наглядными выводы, полезные для последующего
изложения. Эти данные приводятся в табл. 10.2.
Показатели табл. 10.2, расположенные в столбцах X, пред-
ставляют собой гипотетические данные о числе обращений к вра-
чу 40 человек, разбитых па четыре группы (по 10 человек в каж-
дой) в соответствии с уровнем перенесенных стрессов. Значения
средних и дисперсий этих групп, а также всей совокупности в це-
лом приводятся в нижних строках таблицы. В основной части
таблицы для каждой оценки определяются три показателя откло-
нения: dT—-общее отклонение X от средней (X — М), с1ва— раз-
ность между каждой из четырех групповых средних (1,0; 2,0; 3,0
и 4,0) и общей средней (2,5) и dWG — разность между каждой
оценкой и средней группы, к которой данная оценка принадлежит.
Если вы попытаетесь проверить для каких-либо значений таблицы
справедливость равенства d'r = dBGA-dWG, то обнаружите, что оно
во всех случаях выполняется. Располагая этими данными, можно
легко и быстро проделать следующее: (1) продемонстрировать
справедливость двух приведенных ранее уравнений:
S^S^ + S^,
и (2) перейти непосредственно к рассмотрению методов диспер-
сионного анализа.
Компоненты дисперсии. Общая дисперсия оценок, содержащих-
ся в табл. 10.2, равна 1,95. Чтобы показать, каким образом общая
дисперсия может быть разложена па два составляющих ее ком-
понента, рассмотрим вначале простые вычисления, представленные
в табл. 10.3. В этих вычислениях значения средних из табл. 10.2
рассматриваются в качестве обычных оценок и рассчитывается
показатель дисперсии этих оценок с помощью формулы
223
Таблица 10.2
Число обращений к- врачу людей, разбитых на четыре группы в соответствии с уровнем перенесенных стрессов
X dT dw G Л' dT <+ а dwG X dT ^BG W G ! X rf-j. G dyv G Совокуп- ность в целом
0 -2,5 —1,5 -1,0 1 —1,5 —0,5 — 1,0 2 —0,5 +0, 5 -1,0 2 —0,5 + 1,5 —2,0
0 —2,5 — 1,5 -1,0 1 -1,5 -0,5 —1.0 2 —0,5 +0,5 — 1,0 3 +0,5 + 1,5 -1,0
0 —2,5 —1,5 —1,0 2 —0,5 —0,5 0,0 2 —0,5 +0,5 —1,0 3 +0,5 +1,5 —1,0
1 — 1,5 -1,5 0,0 2 —0,5 —0,5 0,0 3 +0,5 +0,5 0,0 4 + 1,5 + 1,5 0,0
1 — 1,5 — 1,5 0,0 2 —0,5 —0,5 0,0 3 +0,5 +0,5 0,0 4 + 1,5 +1,5 0,0
1 — 1.5 — 1,5 0,0 2 —0,5 —0,5 0,0 3 -|-0,5 +0,5 0,0 4 + 1,5 +1,5 0,0
1 — 1 >5 — 1,5 0,0 2 —0,5 —0,5 0,0 3 +0,5 +0,5 0,0 4 + 1 > a +1,5 0,0
2 —0,5 — 1,5 +1,0 2 -0,5 —0,5 0,0 4 + 1 , о +0,5 +1,0 5 +2,5 +1,5 + 1,0
2 —0,5 -1,5 + 1,0 3 +0,5 -0,5 +1»о 4 + 1 ,5 +0,5 + l ,0 5 +2,5 + 1,5 + 1 ,c
2 Средняя 1,0 S2 0,60 —0,5 —1,5 +1,0 3 2,0 0,40 +0,5 —0,5 + 1,0 4 3,0 0,60 + 1,5 +0,5 +1,0 6 4,0 1,20 +3,5 +1,5 +2,0 2,50 1,95
£2 _
— N ’
где S2 в действительности является S2M, поскольку исходные оцен-
ки— средние значения. Величина этой дисперсии равна 1,25.
Второй частью общей дисперсии является внутригрупповая
дисперсия, среднее значение S2, рассчитанное по показателям че-
тырех отдельных групп наблюдений, представленных в табл. 10.2:
0,6+ 0,4+ 0,6+1,2 = 2,8 : 4=-^0,70. Сложение внутригрупповой дис-
персии с дисперсией групповых средних дает 0,70+1,25=1,95, т. е.
значение общей дисперсии. Таким образом, еще раз показано, что
£2 = ^ +Ме-
Таблица 10.3
Расчет 82м
Групповая средняя d tP
1,0 2,0 3,0 4,0 Сумма 10,0 Средняя 2,50 —1,5 —0,5 +0,5 + 1,5 0,0 0,0 2,25 0,25 0,25 2,25 5,0 1,25—
новым для читателя здесь является лишь тот факт, что S2wg —
это средняя дисперсия, рассчитанная по соответствующим показа-
телям выделенных групп.
Разложение значений
сумм квадратов. Особой не-
обходимости в этом нет, но
если хотите, то можете са-
мостоятельно убедиться,
рассчитав Sd2T по показате-
лям табл. 10.2 (—2,52 +
+ (—2,5)2+. . .+ 2,52 + 3,52),
что сумма квадратов откло-
нений значений оценок от
общей средней равна 78.
Расчет [—1,52+
+ (—1,5)2+. . .+1,52+ 1,52]
дает значение суммы, рав-
ное 50. Аналогичный расчет 2.d2wa(.—1,02+1,02+... + 1,52+ 1,52), в
свою очередь, дает значение, равное 28. В результате мы получили
возможность на практике подтвердить справедливость соотношения
78 = 50 + 28.
Прежде чем завершить изложение материала, содержащегося
в настоящем параграфе, сделаем еще одно, заключительное, заме-
чание. Существует очень простая связь между показателями дис-
персии, рассчитанными в предыдущем параграфе, и суммами квад-
ратов, найденными в настоящем параграфе. В каждом случае вы-
полняется соотношение 2d2=A7S2. Таким образом,
NS?f — Zd2r, 40 • 1,95 = 78;
NS2 = 2d2 40 • 0,70 = 28;
MS2 =2d2 40 • 1,25 = 50.
IV <7 V, и» 9
225
Если вы поразмыслите над этими вычислениями, то, возможно,
поймете, что'данный результат — следствие того, что прямо или
косвенно все 40 оценок участвуют в определении значения каждо-
го из приводившихся выше выражений.
/’-критерий. Располагая значениями ScPbg и введем
понятие /-’-отношения, статистики, рассчитываемой в дисперсион-
ном анализе. Напомним, что /’-критерий связан со сравнением
оценки дисперсии, обусловленной вариацией межгрупповых сред-
них, с другой оценкой, обусловленной (средней) вариацией зна-
чений внутри отдельных групп. Первая из этих оценок рассчиты-
вается по формуле
о 2 __
где К — число групп, выделенных при проведении исследования.
Вторая оценка рассчитывается с помощью формулы
Л V//2
С2 _
1VG iV —/<’
Формула для определения F выглядит так:
Л9
с2
г
Степени сйободы. Прежде чем приступить к дальнейшей ин-
терпретации показателя F, мы должны будем уделить внимание
одному из наиболее важных понятий статистики — понятию степе-
ней свободы. Этот вопрос достаточно труден для понимания, по-
этому мы ограничимся здесь лишь упрощенной трактовкой, в со-
ответствии с которой для рассматриваемой совокупности наблю-
дений число степеней свободы совпадает с числом независящих
друг от друга наблюдений. Предположим, вам известно, что сум-
ма десяти чисел равна 27. Первые 9 из этих 10 чисел могут быть
любыми, например 30, 35, 40, 45, 50, 55, 60, 65 и 70, что в сумме
даст 450. Однако это означает, что последнее, десятое, число обя-
зательно должно равняться —423, в противном случае мы не полу-
чим известного нам суммарного значения, равного 27. Это послед-
нее, десятое, число уже не является независимым. Следовательно,
в данном примере имеется 9 степеней свободы — на единицу мень-
ше общего количества рассмотренных десяти чисел.
С понятием степеней свободы мы уже сталкивались в настоя-
щей книге, хотя, возможно, в то время вовсе не обязательно
было привлекать внимание читателя к столь малоприятному пред-
мету. Речь идет о расчете несмещенной оценки о (см. с. 149),
при котором значение 'ZdF делится на N—1 (число степеней
свободы), а не на N. Как оказалось, понятие степеней свободы
играет в ANOVA аналогичную роль, поскольку /’-критерий факти-
226
чески сводится к сравнению оценок дисперсии исходной совокуп-
ности.
Чтобы проиллюстрировать данное утверждение, вернемся к ис-
следованию связи между стрессами и заболеваниями. В нашем
гипотетическом эксперименте участвовало 40 человек. Общее чис-
ло их визитов к врачу составило 100. По тем же причинам, что
и в примере с десятью числами, сумма которых равняется 27,
наличие этого суммарного значения 100 также говорит о том, что
число степеней свободы, имеющихся в нашем распоряжении дан-
ных, составляет (.V—1), или 40—1=39; и тогда несмещенная
оценка дисперсии совокупности составит 2</2т/39.
Дисперсионный анализ включает оценку дисперсии исходной
совокупности на базе средних показателей К = 4 подгрупп. И снова
при получении значения оценки мы теряем одну степень свободы,
следовательно, найденная оценка (межгрупповая дисперсия) осно-
вывается на 1(— 1=3 степенях свободы.
Из первоначально имевшихся 39 степеней свободы осталось
только 36 (39—3). Следует также иметь в виду, что данное .зна-
чение совпадает с N—К=40—4, числом степеней свободы для по-
казателя внутригрупповой дисперсии. Каждая из 4 подгрупп, со-
стоящих из 10 человек, теряет одну степень свободы, поскольку
у каждой из них имеется свое суммарное значение. Поэтому дан-
ные в каждой группе обладают 9 степенями свободы, а всего их
9Х4 --36. Таким образом, другая оценка общей дисперсии, осно-
ванная на показателе дисперсии внутри отдельных выборок, будет
иметь 36 степеней свободы.
Вот теперь, наконец, мы располагаем всем необходимым для
расчета /-’-отношения для гипотетических данных о силе стрессов
и заболеваемости людей. Данный расчет осуществляется в три
этапа:
51; _ 16, 6_7 =
0,78
Г
Л WG
Нам будет удобнее работать с имеющимися данными, если
мы представим их в виде таблицы. Табл. 10.4 содержит всю не-
обходимую для расчета /-’-отношения информацию. В столбце (1)
указаны компоненты, в разрезе которых осуществляется анализ
общей дисперсии; в столбце (2) для каждого из этих компонен-
тов приводятся показатели числа степеней свободы; в столбце (3)
содержится значение 2d2; в столбце (4) приводятся оценки общей
л
дисперсии (S2), полученные по формуле 2d2/(число степеней сво-
227
боды); в столбце (5) содержится значение /-’-статистики; в столб-
це (6) указывается уровень значимости, при котором нулевая ги-
потеза может быть отвергнута.
Таблица 10.4
Типичная таблица
(1) Вид дисперсии (2) Степени свободы (3) (4) Л S2 (3) F (6) р
Межгрупповая Внутригрупповая Общая 3 36 39 ДО 28 78 16,67 0,78 21,37 <0,01
Поясним смысл показателей, содержащихся в двух, последних
столбцах. Значение F представляет собой отношение оценки общей
дисперсии исходной совокупности, которая (дисперсия) обуслов-
лена воздействием какого-либо общего для всей совокупности
фактора, к дисперсии, обусловленной вариацией наблюдений внут-
ри отдельных групп (ее еще называют остаточной дисперсией),
которая также является оценкой общей дисперсии генеральной
совокупности. Эта остаточная дисперсия в определенном смысле
аналогична показателям Sm и Spa3u (см. с. 152—168), которые ис-
пользовались при проверке гипотез с помощью Z-критерия. Оцени-
вание значения F также в существенной мере сходно с процессом
оценивания значения Z: имеются соответствующие таблицы, в ко-
торых приводятся значения вероятности получения данного зна-
чения F для случая, когда нулевая гипотеза верна. Другими сло-
вами, с помощью этих таблиц исследователь определяет вероят-
ность получения данного значения F путем сопоставления этого
значения с соответствующим выборочным распределением F-зна-
чений.
В отличие от распределения значений Z F-распределение для
различных степеней свободы выглядит по-разному. Более того,
в каждом конкретном случае следует принимать во внимание два
показателя степени свободы — число степеней свободы как чис-
лителя F-отношения, так и его знаменателя. Фрагмент таблицы
значений F приводится в табл. 10.5. Чтобы воспользоваться этой
таблицей, необходимо в каждом конкретном случае вначале оты-
скать соответствующий столбец, в заголовке которого указывается
число степеней свободы числителя F-отношения. Так, в рассмот-
ренном примере имеется 4 группы наблюдений, различающихся
по силе стрессов. По средним значениям этих групп находится
л
межгрупповая оценка дисперсии исходной совокупности (S2BG).
Поскольку расчет производится по данным четырех групп, полу-
ченная оценка имеет 3 степени свободы.
После того как вы отыскали соответствующий столбец, необ-
ходимо найти строку таблицы, в начале которой указывается чис-
ло степеней свободы знаменателя (остаточной дисперсии) данно-
л
го значения отношения F. В нашем случае это S2wg, которая об-
228
.падает 36 степенями свободы. В табл. 10.5 приводятся соответст-
вующие значения для 3 и 36 степеней свободы: величина F, рав-
ная 2,86, является значимой при /? = 0,05; величина F, равная 4,38,
значима при 1°/о:ном уровне значимости. Величина равная 21,37,
которую мы получили для примера со стрессами и заболевае-
мостью моряков (см. табл. 10.4), существенно превосходит любое
из приведенных выше значений. Следовательно, можно сделать
вывод, что полученный результат обладает очень высокой степенью
значимости.
Таблица 10.5
Таблица /-отношений для уровней значимости р=0,05 и р — 0,01
Число степеней свободы числнтеля
Число степенен свободы знаменателя 1 2 3 4 5
1 р=0,05 161 200 216 225 230
р = 0,01 4052 4999 5625 5625 5764
5 /7=0,05 6,61 5,79 5,41 5,19 5,05
р = 0,01 16,26 13,27 12,06 11,39 10,97
10 р —0,05 4,96 4,10 3,71 3,48 3,33
р-0,01 0,04 7,56 6,55 5,99 5,64
20 р=0,05 4,35 3,49 .3,10 2,87 2,71
р=0,01 8,10 5,85 4,94 4,43 4, 10
30 р=0,05 4,17 3,32 2,92 2,69 2,5.3
р = 0,01 7,56 5,39 4,51 4,02 3,70
36 р=0,05 4,11 .3,26 2,86 2,63 2,48
р=0,01 7,39 5,25 4,38 3,89 3,58
50 р=0,05 4,03 3,18 3,79 2,56 2,41
р-0,01 7,17 5,06 4,20 3,74 3,42
100 р—0,05 3,94 3,09 2,70 2,46 2,30
р=0,01 6,90 9,82 3,98 3,51 '3,20
<х> р = 0,05 3,84 2,99 2,60 2,37 2,21
р=0,01 . 6,64 4,60 3,78 3,32 3,02
/КРИТЕРИЙ
Простейший эксперимент описанного выше типа может быть
осуществлен, когда из участников его формируется только две
группы. Хотя результаты такого бивалентного эксперимента обыч-
но оцениваются с помощью статистики, называющейся /-критери-
ем, их можно обработать также посредством ANOVA. В этом слу-
чае число степеней свободы для S2ua всегда равно 1, поскольку
в эксперименте выделено только две группы участников. Степень
свободы остаточной дисперсии равна общему числу участников
эксперимента минус 2, т. е. N — К.
Порядок вычислений, которые необходимо осуществить при
нахождении значения /, описывается в приложении (см. с. 255).
Здесь же отметим только, что особых трудностей при вычислении
значения t не возникает, поскольку показатели t и F связаны меж-
ду собой довольно простым соотношением вида F = F и t = yF.
229
Кроме того, когда число степеней свободы равно бесконечности,
показатель / становится эквивалентным Z. Табл. 10.5 позволяет
проверить это утверждение. Если вы извлечете квадратный корень
из чисел, стоящих на пересечении первого столбца и последних
двух строк (соответствующих одной и бесконечному числу степе-
ней свободы), то получите соответственно 1,96 и 2,58, т. е. как раз
тс значения Z, при которых пулевая гипотеза отвергается при
5%-ном и 1%-ном уровнях значимости.
ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ
Излагавшиеся до сих пор методы часто называют методами
дисперсионного анализа однофакторного' комплекса, поскольку
с их помощью оценивается эффект от воздействия одной незави-
симой переменной, например эффект от воздействия стрессов на
состояние здоровья человека. Когда эти методы применяются при
исследовании более сложных ситуаций, характеризующихся нали-
чием нескольких независимых переменных, они, по существу, ста-
новятся методами анализа «многофакторных комплексов». В на-
стоящей книге мы ограничимся рассмотрением методов дисперси-
онного анализа двухфакторного комплекса, применяющихся в ис-
следовании факторных экспериментов, описанных нами в гл. 4.
ПЛАН ЭКСПЕРИМЕНТА
Для начала нам будет полезно повторить материал гл. 4, в ко-
торой излагаются основные идеи, лежащие в основе методов
планирования факторных экспериментов (см. с. 80—85). При этом
вы можете проверить, насколько прочно этот материал закре-
пился в вашей памяти. Итак, (1) в факторном эксперименте име-
ется две или большее количество независимых переменных, при-
чем в плане этого эксперимента каждое значение каждой из
этих переменных пересекается с каждым отдельным значением
всех остальных переменных; (2) в этих экспериментах определя-
ется: (а) главный эффект каждой независимой переменной и (б)
взаимодействие между этими независимыми переменными. Данный
параграф посвящен описанию факторных экспериментов и их ана-
лизу. Чтобы познакомиться с тем, как осуществляется подобный
анализ, мы четыре раза обратимся к исследованию одного и того
же набора данных. В каждом из этих случаев будем считать, что
четыре подгруппы, выделяемые в исходных данных, обладают раз-
личным смыслом.
ПРИМЕР
Предположим, вы занимаетесь изданием и распространением
«Космической энциклопедии» (КЭ), которая главным образом по-
ступает в библиотеки средних школ и колледжей. Допустим, так-
230
же, что вы собираетесь предпринять новое издание К.Э и вас на-
чинают беспокоить проблемы ее продвижения на книжный рынок.
В одном из районов страны отдел сбыта вашей фирмы представ-
лен 4 группами сотрудников по 10 человек в каждой группе. Дан-
ные, характеризующие работу отдела сбыта в последний годрпро-
дажи предыдущего издания КЭ, приводятся в табл. 10.6. Пред-
ставленные в таблице значения показывают, сколько экземпляров
КЭ продано каждым торговым агентом, принадлежащим к тон или
иной группе сотрудников. Данные имеют гипотетический характер
и подобраны таким образом, чтобы облегчить последующие вы-
числения.
Таблиц;) 10.6
Продажа КЭ четырьмя группами сотрудников
Г руппа Отдел в целом
Л в с г>
20 40 40 20
20 40 40 20
20 40 40 20
30 50 50 30
30 50 50 30
30 50 50 30
30 50 50 30
40 60 60 40
40 60 60 40
40 60 60 40
Средняя 30 50 50 30 40
60 60 60 60 160,00
600 600 600 600 6400,00
По величине средних (30, 50, 50, 30) мы можем сделать'вывод
о наличии различий между показателями продаж для четырех
групп. Вопрос заключается в том, являются эти различия следст-
вием случайной вариации данных или же в них отражается воз-
действие какого-то реально существующего фактора. Ответ на не-
го может быть получен с. помощью методов ANOVA. Применяя
этот способ анализа, мы еще раз повторим материал, рассмотрен-
ный в первой части настоящей главы. Однако это не просто по-
вторение ради повторения: с анализа однофакторного комплекса
начинается дисперсионный анализ факторных экспериментов.
ANOVA однофакторного комплекса. Чтобы провести анализ
однофакторного комплекса данных из табл. 10.6, мы должны рас-
считать значения двух оценок общей дисперсии: S2Ba, характсрп-
л
зующую вариацию средних значений групп, и №WG, характери-
зующую вариацию значений внутри отдельных групп. Первая из
этих оценок рассчитывается по формуле
..2
г>Вц—-~----
231
где К —число групп. Поскольку —Л',8'2М, Для получения зна-
чения этой суммы можно вначале рассчитать показатель диспер-
сии средних, а затем умножить его на М = 40. Таким образом,
S 2 - <30 — 40>2 т (до — 40)2 + <50 ~ 4°)2 + <33 — 4°)2 _ 400 = юо
11 4 4
Srf2 = 40 . 100 - 4 000.
DU
Внутригрупповая дисперсия Siw<; представляет собой среднюю
дисперсий всех выделенных групп. Поскольку все эти дисперсии
одинаковы и равны 60, этому же значению равна и величина S2VV<;,
следовательно,
Sd2 - 40 • 60 = 2 400.
И (}
Теперь в пашем распоряжении имеется все необходимое для
получения оценок общей дисперсии совокупности:
s'jr! = 1.222 = 1 ззз.зз,
о
2 400
£>\\-а ~ ~ о6,Ь7
„ 1333,33
Г =---------“ — ZU.
66,67
Сверившись с табл. 10.5, можно сделать вывод, что полученное
значение F является значимым при уровне доверительно^ вероят-
ности, существенно превышающем (100% —1%)=99%.
ДИСПЕРСИОННЫЙ АНАЛИЗ ДВУХФАКТОРНОГО КОМПЛЕКСА
Правление вашей фирмы решает изучить полученные резуль-
таты, надеясь извлечь из них информацию, которую можно было
бы с пользой использовать при организации и проведении кампа-
нии по распространению нового издания 1\Э. Предположим, что
две группы торговых агентов из четырех сконцентрировали свои
усилия на библиотеках средних школ, а оставшиеся две группы -
на библиотеках колледжей. Допустим, также, что в двух группах
были одни мужчины и в двух -одни женщины. Отсюда следует,
что полученные различия могут быть следствием воздействия од-
ного или обоих этих факторов. Я преднамеренно не указываю, ка-
кие результаты соотносятся с какими переменными, поскольку хо-
чу еще раз проанализировать имеющиеся в нашем распоряжении
данные с учетом всех различных возможностей.
Для начала рассмотрим некоторые из этих возможных сочета-
нии: (1) группы, состоящие из одних женщин, работают эффек-
тивнее мужских групп, или наоборот, в этом случае имеется глав-
ный эффект пола; (2) средние школы покупают большее число
энциклопедий, чем колледжи, или наоборот: здесь имеется глав-
232
цый эффект типа учебного заведения; (3) мужские (или женские)
группы работают более эффективно в колледжах (школах), или
наоборот: в данном случае имеется взаимодействие между полом
и типом учебного заведения; (4) некоторая комбинация указанных
эффектов: например, женские группы в целом работают более эф-
фективно, чем мужские (главный эффект), однако это различие
в эффективности слабее проявляется для средних школ, чем для
колледжей (взаимодействие).
Более глубоко понять сказанное поможет следующее наблюде-
ние. Средние для четырех групп торговых агентов соответственно
равны 30, 50, 50, 30. В дисперсии этих показателей должны прояв-
ляться различия, обусловленные полом, типом учебного заведения
и/или взаимодействием этих факторов. Короче, в межгрупповой
дисперсии как бы «аккумулируется» воздействие всех этих факто-
ров. Иными словами, анализ межгрупповой .дисперсии может осу-
ществляться с помощью ее дальнейшего разложения на составляю-
щие компоненты, каждый из которых соотносится с воздействием
перечисленных факторов. Если проделать это, то в результате мо-
гут быть получены оценки общей дисперсии, и эти оценки, в свою
очередь, могут быть сопоставлены с внутригрупповой оценкой, как
и в первоначально описанной схеме анализа. Рассмотрим теперь
несколько примеров.
Каждый из этих примеров построен по факторной схеме 2x2
для средних различных групп торговых агентов. И в каждом от-
дельном случае данные будем располагать в таблице, аналогичной
табл. 10.7, где приводится первая комбинация средних значений
четырех групп (они обозначены соответствующими буквами, взя-
тыми из табл. 10.6).
Таблица 10.7
Тип учебного заведения Пол Средняя
мужской женский
Колледж Средняя шко- ла А 30 в 50 40 40
D 30 С 50
Средняя 30 50
В табл. 10.7 показано, что группы А и D состбят из одних муж-
чин, группы В и С — из одних женщин, группы А и В работали
в колледжах, а группы С и D — в средних школах. Из этих дан-
ных следует, что женщины оказались более удачливыми продав-
цами, чем мужчины (соответствующие средние равны 50 и 30),
причем тип учебного заведения не оказал никакого воздействия
на эффективность их работы (соответствующие значения средних
равны 40 и 40). Таким образом, диспёрсия, обусловленная воздей-
16-1778
233
ствием фактора «тип учебного заведения», в данном случае равна
нулю. Однако рассчитаем теперь дисперсию для фактора «пол».
Общая средняя для мужчин и женщин равна 40. Следовательно,
2d2 _ (30 — 40)2 + (50 — 40)2 _ —Ю2 + 102 = 100+ 100 =
N ~ 2 “ 2 ~ 2 ~
Если мы вернемся немного назад, то обнаружим, что значение
S2M, рассчитанное при анализе однофакторного комплекса, также
равнялось 100. В данном случае межгрупповая дисперсия пред-
ставляет собой дисперсию, обусловленную воздействием фактора
«пол». Вдумайтесь в это утверждение, не забывая о том, что меж-
групповая дисперсия является «дисперсией-аккумулятором». По-
скольку одна из переменных не участвует в формировании мсж-
групповой дисперсии, то вся величина этой дисперсии обусловлена
воздействием второй переменной.
Рассмотрим теперь еще один вариант расположения данных
(табл. 10.8). Очевидно, что при такой схеме размещения средних
величина межгрупповой дисперсии полностью определяется воз-
действием фактора «тип учебного заведения». Расчет значения этой
дисперсии в точности совпадает с расчетом, проделанным для пре-
дыдущего случая, и, следовательно, дисперсия для переменной
«тип учебного заведения» также равняется 100.
Таблица 10.8
Тип учебного заведения Пол Средняя
мужской . женский
Колледж А 30 D 30 30
Средняя шко- ла В 50 С 50 50
Средняя 40 40
Чтобы рассчитать F-отношение для любой из рассмотренных
нами ситуаций, мы должны возвратиться несколько назад к соот-
ношению 2cPbg = MS2m=40-100 = 4 000. В данном случае имеется
только одна степень свободы (2 группы минус 1), и, следовательно,
Л
S211G также равно 4000. Это значение должно быть соотнесено с
л
S2WG, величина которой уже определялась выше:
Л,
Р = = 4 000 = 60
$2 66,67
•-> WG
Наконец, предположим, что средние четырех групп располо-
жились так, как показано в табл. 10.9. В этом случае будет от-
сутствовать главный эффект переменной «пол», а также главный
234
эффект переменной «тип учебного заведения», однако между эти-
ми переменными будет наблюдаться сильное взаимодействие: дея-
тельность мужчин принесет лучшие результаты в средних школах;
деятельность женщин окажется более эффективной в колледжах.
Таблица 10.9
Тип учебного заведения Пол Средняя
мужской женский
Колледж л 30 в 50 40
Средняя шко- ла с 50 D 30 40
Средняя 40 40
Проще всего получить значение дисперсии, обусловленной
взаимодействием между переменными, с помощью вычисления
сумм квадратов, соответствующих выделенным в эксперименте
факторами. Это позволит нам также еще раз коротко повторить
материал, рассмотренный ранее. Напомним, что
Межгрупповая сумма квадратов «аккумулирует» суммы квадра-
тов, соответствующие выделенным в эксперименте факторам, а так-
же их взаимодействий. Таким образом, в нашем случае межгруп-
повая сумма квадратов складывается из следующих трех компо-
нентов:
2^, = ^?ип +2^ + 4™--
учеб. действие
завед.
Отсюда может быть получено значение суммы квадратов для фак-
тора взаимодействия:
SC...™-
действие учеб,
завел.
Вспомним, что 2d2BG равняется 4000 и что в данном случае значе-
ния двух показателей сумм квадратов для главных эффектов рав-
ны нулю, поэтому
SrfUMo-=4 000 - 0 - 0 = 4 000.
действие
Таким образом, оценка дисперсии, основанная на учете фактора
взаимодействия, представляет собой сумму квадратов, деленную
на число степеней свободы, равное 1:
1G:
235
Л2 _ 4 000 _ 4 QQQ
°взаимо- — —' — vvu
действие 1
и, следовательно,
Л =
1222 = 60
66,67
Здесь имеет смысл остановиться еще па одном моменте, представ-
. ляющем определенный практический интерес. С этой целью по-
строена табл. 10.10.
Таблица 10.10
Источник вариации Степени свободы Оценен- ное зна- чение а2 F р
Пол 1 0 0
Тип учебного заведения ПолХтип учебного заведе- 1 0 0
НИЯ 1 4 000 60 <0,01
Внутри групп 36 66,67
Мы хотели бы подчеркнуть, что при анализе межгрупповой
дисперсии, состоящей из трех компонентов, число степеней сво-
боды также разделяется на 3 составляющих элемента. Сформули-
руем утверждение для общего случая. Число степеней свободы
в исходной совокупности данных равно N—1. Когда анализ свя-
зан с расчетом межгрупповой и внутригрупповой дисперсий, число
степеней свободы межгрупповой дисперсии равно К—-1, а для
внутригрупповой дисперсии N—К. Когда рассматривается фак-
торный эксперимент, при котором осуществляется разбиение меж-
групповой дисперсии па составляющие ее компоненты, число сте-
пеней свободы для первой переменной равно А—1, для второй
переменной В—1, для их взаимодействия (А—1)Х(5—1).
Кроме того, А — 1 + В — 1 + (А — 1) X (В — 1) = К — I1.
КРАТКИЙ ОБЗОР ОСНОВНЫХ ПОНЯТИЙ
В экспериментах, связанных с рассмотрением более чем двух
наборов наблюдений, анализ существенно усложняется. Методы,
основанные на сравнении только двух индивидуальных значений
средних, здесь работают плохо, поскольку подобные сравнения не
будут иметь независимого характера. В методах дисперсионного
анализа эта проблема решается посредством проверки нулевой
гипотезы о том, что дисперсия средних различных групп наблюде-
ний, принадлежащих исходной совокупности данных, не очень от-
личается от оценки дисперсии этой совокупности, полученной с
1 Через А и В обозначено число групп наблюдений, соотносящихся с пер-
вой (А) и второй (В) переменными. В рассмотренном примере Л — В—2.—
Примеч. пер.
236
помощью расчета средней внутригрупповых дисперсий. Дисперси-
онный анализ начинается с разложения' общей дисперсии на два
или большее количество составляющих ее компонентов, на основе
которых определяются различные оценки общей дисперсии сово-
купности. Повторим еще раз, что нулевая гипотеза, проверяемая
в дисперсионном анализе, состоит в предположении об отсутствии
различий между этими оценками. Ключевые концепции и понятия,
введенные в настоящей главе, приводятся ниже.
ANOVA. Аббревиатура (сокращенное написание) выражения
Analysis of Variance (дисперсионный анализ).
Дисперсионный анализ однофакторного комплекса. Метод дис-
персионного анализа, применяющийся к исследованию результатов
мультивалентных экспериментов, схема осуществления которых
связана с исследованием воздействия единственной независимой
переменной.
Дисперсионный анализ двухфакторного комплекса. Метод дис-
персионного анализа, с помощью которого осуществляется анализ
результатов факторного эксперимента с двумя или большим чис-
лом независимых переменных.
t-критерий. Статистический тест, применяемый при проведении
эксперимента с двумя группами. Значение t связано с F соотноше-
нием вида t2-=F.
F-критерий. Его называют также Е-отношением. Статистиче-
ский тест, используемый в дисперсионном анализе. При проведе-
нии этого теста оценка, характеризующая главный эффект или
взаимодействие (см. далее), делится на соответствующее значение
остаточной дисперсии (внутригрупповой дисперсии). Полученный
при этом результат сравнивается с данными таблицы вероятнос-
тей получения значений F. Нулевая гипотеза отвергается, если
рассчитанное значение F превосходит соответствующее табличное
значение и, следовательно, вероятность его получения достаточно
мала; >
Главный эффект. Эффект вариации значений одной из неза-
висимых переменных при проведении факторного эксперимента,
обобщенный по всем значениям других независимых переменных.
Взаимодействие. Влияние изменения значений одной независи-
мой переменной на величину эффекта, обусловленного воздействи-
ем другой независимой переменной.
Степени свободы. Число участвующих в расчете не зависящих
друг от друга элементов.
Межгрупповая дисперсия. Оценка дисперсии генеральной сово-
купности (общей дисперсии), в которой отражается вариация зна-
чений групповых средних.
Внутригрупповая дисперсия. Оценка дисперсии генеральной
совокупности, учитывающая среднюю вариацию значений внутри
выделенных групп. В настоящей главе она называется также оста-
точной дисперсией.
ПРИЛОЖЕНИЕ
Основные мои усилия при написании этой книги были направ-
лены на то, чтобы показать читателю, что усвоение статистических
идей и концепций может происходить легко и безболезненно. Если
я выполнил поставленную перед собой задачу хотя бы наполови-
ну, то, на мой взгляд, это удалось сделать, главным образом, по-
тому, что употребление формул и проведение механических расче-
тов было сведено в этой книге к минимуму.
Теперь мы приступаем к рассмотрению очень краткого описа-
ния основных процедур статистического анализа и к выводу неко-
торых формул и соотношений. Держу пари, что этот материал
покажется очень простым, поскольку вам уже известен смысл ос-
новных понятий, использующихся при различных статистических
преобразованиях.
ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Вначале мне бы хотелось перечислить основные статистические
термины и понятия. По этой причине я буду предельно краток.
СРЕДНЯЯ
Обозначим через X каждое индивидуальное наблюдение, через
N — число таких наблюдений. Символ 2 обозначает процесс сум-
мирования. В соответствии с этим формула для вычисления сред-
ней, М, будет выглядеть так:
М = —. (1)
/V
Если наблюдения сгруппированы, как это было, скажем, в
примере со средним числом детей в 100 семьях, рассмотренном
в гл. 6, то формула для расчета средней будет выглядеть не-
сколько по-иному:
М = (2)
N
где f — частота наблюдений в каждой из выделенных групп.
В табл. А.1 данные из этого примера воспроизводятся еще раз.
В середине таблицы наглядно показано, что выражение [X
238
жвивалснтно сложению наблюдений, принадлежащих соответст-
вующей группе, и, следовательно, формула (2), по существу, нс
отличается от формулы (1).
Таблица А.1
Число
детей,
Число семей, }
о
1
2
3
4
5
6
7
8
9
10
11
12
6
9
16
14
13
11
9
7
5
4
3
2
1
100=W
о+о-НЧ-о+о+о
1
8+8+84-8+8
9+9+9+Э
10+10+10
11+11
О
9
32
42
52
55
54
49
40
36
30
22
12
433=S/A
Всего
ZfX 433 „
М~ N ~ 100 -4,33
ДОКАЗАТЕЛЬСТВО ТОГО, ЧТО 2’а'=0
В основном тексте мне пришлось долго убеждать вас, что если
учитывать знак d, то сумма отклонений от средней будет равна
нулю. Математическая иллюстрация этого факта занимает гораз-
до меньше времени
d = X^M,
Srf = SX — 2А4 = (так как М — константа) =
= 2Х — NM = (так как М = SX/X) =
= SX — N = (сокращением N) = SX — SX = 0.
ПЕРЦЕНТИЛЬНЫЙ РАНГ
Пусть выражение 2/ означает накопленную частоту, т. е. полу-
ченную в результате последовательного сложения всех частот на-
блюдений данного распределения, начиная с наименьшего. Тогда
Перцентильный ранг= 100 —(3)
В табл. А.2 показано, как производится расчет всех необхо-
димых для нахождения перцентильного ранга значений для случая,
когда Х=50 наблюдениям, величина которых измеряется целыми
числами от 1 до 10. Перцентильные ранги каждого из 50 наблю-
239
дений приведены в крайнем правом столбце таблицы. Из расчетов
(и соответственно из приведенной выше формулы) следует, что
перцентильный ранг наблюдения равен проценту наблюдений, ве-
личина которых превышается значением данного наблюдения или
равна ему.
Таблица А.2
Наблюдение f 2/ X//JV (2f/N)-100
10 4 50 1,00 100
9 6 46 0,92 92
8 5 40 0,80 80
7 8 35 0,70 70
6 9 27 0,54 54
5 6 18 0,36 36
4 5 12 0,24 24
3 3 7 0,14 14
2 2 4 0,08 8
1 2 2 0,04 4
РАСПРЕДЕЛЕНИЕ НАКОПЛЕННЫХ ЧАСТОТ
Если нанести на график значения, содержащиеся в столбце 2f,
отложив по оси X значения наблюдений, то будет получено рас-
пределение накопленных частот, которое иногда используется при
графическом исследовании некоторых статистических проблем. На
рис. А.1 представлено распределение накопленных частот данных,
Рис. А.1. Распределение накопленных
частот. На графике изображены дан-
ные, приведенные в табличной форме
в тексте
рассмотренных в предыду-
щем параграфе. С помощью
двух примеров будет пока-
зано, для каких целей мо-
жет применяться подобный
график. Первый из этих при-
меров (рис. А.1) мы рас-
смотрим сейчас, а второй —
в следующем параграфе.
Чтобы определить перцен-
тильный ранг наблюдения,
значение которого равно 7,
нужно из точки 7, располо-
женной на оси X, восстано-
вить перпендикуляр до пе-'
ресечения с кривой распре-
деления накопленных частот
и затем из точки пересече-
ния опустить перпендикуляр
на расположенную справа
ось, где отложены значения
перцентилей. В результате
240
получим, что перцентильный ранг наблюдения, значение которого
равно 7, составляет 70. Сверившись с табл. А.2, можно убедиться,
что данный результат является правильным.
НАХОЖДЕНИЕ ЗНАЧЕНИЯ ОЦЕНКИ ПО ПЕРЦЕНТИЛЬНОМУ РАНГУ
Рассмотрим теперь обратную к сформулированной выше зада-
чу. В этом случае мы должны будем отыскать значение, соответст-
вующее данному перцентильному рангу. Однако при этом можно
столкнуться со следующим небольшим затруднением. Дело в том,,
что в распределении накопленных частот может не оказаться на-
блюдения, значение которого точно соответствует данному пер-
центильному рангу. Так, если вы хотите определить значение, ко-
торое соответствует в нашем примере 25-му перцентилю, то обна-
ружите, что ни одно из наблюдений данного распределения не об-
ладает значением, точно соответствующим этому перцентильному
рангу. Наблюдение, значение которого равно 4, является 24-м пер-
центилем, а следующее за ним наблюдение, значение которого рав-
но 5, представляет собой уже 36-й перцентиль. Таким образом,
25-му перцентилю должно соответствовать значение, чуть-чуть пре-
вышающее 4. Очевидно, ответ в этом случае будет «четыре с не-
большим». -
Определить, сколько же в действительности составляет это
«четыре с небольшим», можно, в частности, с помощью распреде-
ления накопленных частот, что и показано на рис. А.1. Если про-
вести из соответствующей точки на расположенной в правой части
графика вертикальной оси горизонтальную линию до пересечения
с кривой распределения накопленных частот и из точки пересече-
ния опустить перпендикуляр на ось X, то мы обнаружим, что ин-
тересующее нас значение равно примерно 4,1.
На подобный вопрос можно ответить и с помощью другого спо-
соба. Он состоит в следующем. Поскольку перцентильный ранг
4 равен 24, а перцентильный ранг 5 равен 36, то интересующее
нас значение составит 4+(1/12 от расстояния между 4 и 5), или
4,08=4,1.
Существуют формулы, с помощью которых можно получить бо-
лее точный ответ на вопрос о величине значения, соответствующе-
го данному перцентильному рангу. В них учитываются такие
понятия, как, например, действительные границы интервалов, в ко-
торые сгруппированы наблюдения, но все подобные формулы пред-
ставляются мне необыкновенно скучными и громоздкими. По-мо-
ему, точность двух описанных только что процедур вполне доста-
точна. Тем более что на практике перцентили наиболее часто ис-
пользуются при получении довольно грубых, приблизительных
оценок.
МЕДИАНА
Поскольку медиана представляет собой среднее значение, т. е.
50-й перцентиль, процедура ее определения полностью аналогична
241
расчету значения наблюдения, соответствующего тому или иному
перцентильному рангу. Вы можете попробовать определить медиа-
ну для данных из рассмотренного выше примера с помощью гра-
фического метода и с помощью только что описанного метода ин-
терполяции. В обоих случаях мною было получено одно и то же
значение, равное примерно 5,8.
СТАНДАРТНОЕ ОТКЛОНЕНИЕ (S)
Обозначим через d отклонение значения наблюдения от сред-
ней распределения, X — М. Для каждого X будет свое значение d.
Формула стандартного отклонения выглядит так:
s = (4)
ДИСПЕРСИЯ (S2)
Дисперсия представляет собой квадрат стандартного отклоне-
ния, поэтому
S2 = —. (5)
N ’
-РАСЧЕТНЫЕ ФОРМУЛЫ ДЛЯ S И S2
Расчет S и S2 с помощью формул (4) и (5) довольно сложен
и громоздок. Эти формулы очень полезны с теоретической точки
зрения, поскольку в них наглядно отражается смысл' соответст-
вующих показателей, однако в практических расчетах они почти
никогда не используются. Вывод расчетных формул этих показа-
телей довольно прост:
242
1) 52=~^~и d—X — М, следовательно, d2= (X— М)2,
2) d2=(X — М)2=Х2 — 2ХМ+М2,
2d2 2Х2 2ZXM
3) = __ +Af2
7 N Л N
„ Ч2Х 22X44
8а) — =Л1, следовательно, ~ = 2М-М=2М2,
2d2 2Х2
4)7Г= ТГ~2Л42+Л42’
2d2 2Ха
5)~ = ~ —Л!2, следовательно,
242
6) S* = — —Ж, (6)
7) 5=]/^-Ж (7)
В гл. 6 говорилось, что стандартное отклонение семнадцати
«мисс Америка» равнялось 5,60. Воспользуемся этим примером
для иллюстрации вычислений при определении стандартного от-
клонения и попутно я сообщу вам о некоторых приемах, которые
иногда позволяют существенно облегчить практические расчеты.
Так, например, прибавление какого-либо постоянного числа
к значению каждого наблюдения, принадлежащего данному рас-
пределению, или вычитание этого числа из пего не оказывает ни-
какого влияния на величину стандартного отклонения или диспер-
сии. В то же время эта операция соответственно увеличивает или
уменьшает значение средней па величину константы, которая до-
бавлялась к значению каждого наблюдения или вычиталась из
пего.
Деление значения каждого наблюдения, принадлежащего дан-
ному распределению, па некоторое постоянное число, уменьшает
величину средней и стандартного отклонения в такое же число
раз. Умножение на константу дает обратный эффект.
Применение методов преобразования исходных значений иног-
да оказывается очень полезным, поскольку позволяет в ряде слу-
чаев существенно упростить вычисления.
Рассмотрим вначале два первых столбца табл. А.З, в которых
приводятся значения X (вес) и квадраты этих значений. В нижних
Таблица А.З
Вес, ,¥ У 2 X - 100 (X — 100) =
114 12 996 14 196
120 14 400 20 400
116 13 456 16 256
118 13 924 18 324
115 13 225 15 225
124 15 376 24 576
124 15 376 24 576
115 13 225 15 225
116 13 456 16 256
135 18 225 35 1 225
125 = 5 625 25 625
НО 12 100 10 100
121 14 641 21 441
118 13 924 18 324
120 14 400 20 400
125 15 625 25 625
119 14 161 19 361
Итого 2 035 244 135 335 7 135
Средняя 119,706 14360,882 19,706 419,706
243
строках табл. А.З указаны средние значения этих показателей,
входящие в состав следующего уравнения:
S = рЛМ* = |/" 244^35- (119,706)2 =
= V14360,882 — 14329,526 = ]/31,356 = 5,600.
Проделаем теперь те же вычисления для чисел из третьего
и четвертого столбцов таблицы, полученных в результате вычи-
тания 100 фунтов из каждого значения веса, приведенного в пер-
вом столбце:
— (19,706)2 =
= (419,706 — 388,326 = г 31,380 = 5,602.
Очевидно, что и в первом, и во втором расчете получено прак-
тически одно и то же число. Таким образом, прибавление постоян-
ного числа к каждому значению, принадлежащему некоторой со-
вокупности наблюдений, или вычитание этого числа из него дейст-
вительно, как мы только что убедились, приводит к уменьшению
средней для совокупности на величину этой же константы, однако
никак не сказывается на величине дисперсии или стандартного
отклонения. Тот факт, что были получены значения, которые все
же слегка отличаются друг от друга (<S‘Z==31,356 и 31,380; 5 = 5,600
и 5,602), объясняется просто различным воздействием эффекта ок-
ругления на большие и маленькие числа.
Имеется также пара других альтернативных формул для рас-
чета показателей дисперсии и стандартного отклонения. Будет
полезно, если мы выведем эти формулы, поскольку они пригодятся
нам как сейчас, так и в дальнейшем при обсуждении дисперсион-
ного анализа. Их вывод включает получение выражения 2d2 на
втором этапе преобразований:
2d2 ^Х2
1)"л/~ = Умножение на N’ дает:
У2И2 №Х2
2) ~—-NM2, следовательно,
3) 2d2=2X2 —ЛШ2 и
5) 5= / (9)
Зачастую более полезной в практических расчетах оказывается
формула, в которой (2Х)2/Л^ заменено на NM2:
244
1) NMZ=N( -ц • -^r) —по определению,
2) и так как
3) Я2=?*^и ,
4) S2= W-&X)*/N ,
5) s= ySE
(10)
(11)
(12)
ОЦЕНКИ о И о2
Л Л
Напомним, что S и S2 являются символами оценок о и о2 соот-
ветственно. Ранее формулы этих отклонений использовались нами
для получения указанных оценок:
Л У//'2
^ = Дт’ (13)
<14>
Применяя результаты, полученные в предыдущих параграфах, лег-
ко сделать вывод, что соответствующие расчетные формулы будут
выглядеть так:
с» 2Х2 —УЛ42 5 tf-l или (15)
_SX2 —(SX)W N — 1 (16)
А 1/ SX2 — NM'1 S — У или г ЛГ —1 (17)
= ~|/SX2—(SX)2/V ' 1 (18)
Здесь, может быть, имеет смысл еще раз обратить внимание
на равное 5,60 значение S, рассчитанное для показателей веса
семнадцати «мисс Америка». В данном случае для получения оце-
нок стандартного отклонения или дисперсии генеральной совокуп-
ности «мисс Америка», избиравшихся в прошлом, не нужно будет
прибегать к только что приведенным формулам, у которых в зна-
менателе стоит N — 1. Дело в том, что полученное ранее для сем-
надцати женщин значение как раз и является показателем о, по-
скольку именно эти семнадцать женщин и представляют собой ге-
245
неральпую совокупность. Если же вы хотите использовать эти
данные для оценки вариации показателей веса всех «мисс Амери-
ка», включая и тех, которые еще только станут победительницами
конкурса в будущем, и предполагаете, что вкусы людей, входящих
в состав жюри, существенным образом не изменятся (довольно
рискованное предположение), что могло бы повлиять на характер
вариации показателей веса, то можете применить формулу (16).
Вся необходимая для расчетов информация содержится в табл. А.З:
к2 SX2 — (SX)2//V
N— Г
_ 244 135 — <2 °35)2/17 ___ 244 135—4 14} 225/17 533,53 __ 33 35
“ 16 ' 16 1G ’ ’
5 - ]/33j5 - 5,77,
Получив эти значения, можно показать также, как используются
А Л
некоторые другие формулы для нахождения опенок 5г и 5:
-S’, (19)
S _ . S. (20)
Напомним, что 5 = 5,6021, а 52 = 31,3841 (мы взяли более точное
значение стандартного отклонения с четырьмя десятичными знака-
ми после запятой, чтобы по возможности уменьшить эффект ок-
ругления). Итак,
Л 17
52 = - . 31,3841 = 10625 • 31 3841 33,3456, •
5 = /3^3456 5,77.
Аналогично
5 |/ И . 5,6021 = /1^625 • 5,6021 = 1,0308 . 5,6021 = 5,77.
СТАТИСТИЧЕСКИЕ ВЫВОДЫ
Все статистические процедуры полезно разделить на две до-
вольно широкие категории — процедуры, основанные на измерении,
и процедуры, основанные на статистических выводах. С этой точ-
Л Л
ки зрения приведенные в приложении показатели М, S, S, S2 и 52
связаны с измерением соответствующих характеристик рассматри-
ваемой совокупности наблюдений. Медиана и другие перцентили
246
имеют отношение к процедуре статистических выводов Сюда же
относятся статистические показатели, использование которых ба-
зируется на теории вероятностей. В данном параграфе мы не-
сколько расширим имеющееся у пас представление о категории
вероятности, а также познакомимся с одним из наиболее важных
статистических критериев — критерием хи-квадрат.
ВЕРОЯТНОСТЬ
Обозначим через р вероятность совершения интересующего нас
события, через q ( = 1—р) —вероятность того, что это событие не
совершится, и через N — общее число рассматриваемых событий.
Тогда вероятности выпадения решки и орла соответственно равны
р = 0,5 и 7 = 0,5. При подбрасывании хорошо сбалансированной мо-
неты ожидаемое число выпадений решки при 100 повторениях опы-
та определяется по формуле для средней:
М = Np, (21)
100 • 0,5 = 50.
При достаточно большом N кривая случайных исходов при-
ближается к нормальной кривой, поэтому имеет смысл рассчитать
стандартное отклонение для числа выпавших решек по формуле
S= V"Npq = ГГОО • 0,5 • 0,5 = V100.0,25 = j/25 = 5,0. (22)
Поскольку мы располагаем формулой для определения S, могут
быть рассчитаны значения Z-оценок, с помощью которых произ-
водится оценка вероятности получения некоторого результата в
сравнении с имеющимися ожиданиями. Подобная процедура ис-
пользовалась нами в гл. 1 для оценки вероятности свиданий нере-
шительного влюбленного. Напомним, что всего состоялось 30 сви-
даний, причем 21 раз он встретился с одной девушкой и 9 раз
с другой, в то время как теоретически ожидаемое соотношение
между этими показателями составляет 15: 15. Проведем соответст-
вующие расчеты для Х=21:
М = Np = 30 • 0,5 = 15,
S= VNpq = ИЗО • 0,5 -0,5 = |/ 7Д) = 2,74,
Вероятность получения этого значения меньше 0,05. Возможно,
имеет смысл обратить внимание читателя на то, что и расчеты,
и полученный при этом результат будут теми же (за исключением
знака), что и в случае, когда Х=9.
1 В том смысле, что по величине перцентиля может быть определено соот-
ветствующее значение наблюдения, принадлежащего к любому распределению. —
Примеч. пер.
247
Вероятность того, что служащий бостонского районного суда
случайным образом отберет только 90 женщин в групйу потенци-
альных кандидатов в присяжные, состоящую из 300 человек, также
может быть оценена с помощью подобного подхода. Допустим, что
справедливо довольно сомнительное предположение о том, что чис-
ло женщин, проживающих в Бостоне, примерно равно числу про-
живающих там мужчин, поэтому вероятность выбора. женщины
равна 0,5. Тогда ожидаемое число женщин равно:
М = Np = 300 • 0,5= 150.
Стандартное-отклонение в этом случае составит:
S = V^lpq = /300 • 0,25 =’/75 = 8,66;
Рассчитаем теперь значение Z-отношения:
,, 90 — 150 —60
Z=---------=----= —b.93.
8,66 8,66
Как сказано на с. 64, вероятность случайного получения та-
кого большого по абсолютной величине значения Z исчезающе
мала.
КРИТЕРИЙ ЗНАКОВ
Логика применения только что описанного критерия практиче-
ски совпадает с логикой применения другого критерия, который
может быть использован в любом случае, когда исследуемые дан-
ные могут быть классифицированы в качестве положительных ( + )
и отрицательных (—) исходов тех или иных событий. Предполо-
жим, что какой-нибудь политический деятель во время избиратель-
ной кампании хотел бы оценить эффективность своей речи, в ко-
торой он ратует за либерализацию конкретного закона. Перед
тем, как применить соответствующий статистический критерий, с
помощью которого удалось бы оцепить эффект, произведенный на
слушателей данной речью, агентство по проведению обследований
общественного мнения выделяет 100 человек, которые, по их сло-
вам, в этом вопросе придерживаются нейтральной позиции, но со-
бираются послушать телевизионную дискуссию по данной пробле-
ме. Затем наш кандидат, в порядке эксперимента, произносит свою
речь, а агентство опрашивает 100 выделенных ранее телезрителей,
стараясь выяснить, оказала ли эта речь какое-либо влияние па
их отношение к предмету телевизионной дискуссии. Десять рес-
пондентов 1 ответили, что они не смотрели этой передачи или что
прослушанная ими речь не оказала на них никакого воздействия;
55 человек сказали, что речь им понравилась ( + ), и 35 — что речь
оказала на них отрицательное воздействие (—). Именно потому,
что исходы интересующих исследователя событий могут быть оха-
1 Респондент — опрашиваемое лицо при переписи или обследовании. —
Примеч. пер. J
248
растеризованы посредством соответствующих знаков, этот крите-
рий иногда называют критерием знаков. Прежде чем приступить
к анализу полученных результатов, мы должны решить, что же
делать с теми 10 телезрителями, иа которых речь кандидата не
оказала по тем или иным причинам никакого воздействия. В соот-
ветствии справилами применения данного критерия ответы этих
зрителей рассматриваются как «наблюдения, не несущие в себе
никакой информации», и исключаются из дальнейших вычислений.
В результате значение N уменьшается до 90. Если знак воздейст-
вия речи во всех 90 случаях определялся случайным образом, то
число людей, положительно прореагировавших на речь кандидата,
составит:
М = Np = 90 • 0,5 = 45.
Стандартное отклонение в этом случае будет равно:
S= VNpq = ]/ 90 • 0,5 • 0,5 = /22J50 = 4,74.
Далее, применяя тот же критерий, что и раньше, получаем:
__X — Л4 _ 55 — 45 _ 2Ц
~ S 4,74 ~ ’
Такое большое значение Z случайным образом может быть
получено менее, чем в 5% случаев. Основываясь на этом резуль-
тате, кандидат может отвергнуть нулевую гипотезу в пользу гипо-
тезы о том, что его речь оказывает положительное воздействие
на слушателей, и может произносить ее и в дальнейшем. Однако
ему следует при этом проявить некоторую осторожность. Возмож-
но, данный результат получен в силу того, что участвовавшим в об-
следовании людям польстило то, что их мнением интересуется та-
кой известный человек, и они отреагировали на это именно так,
как, по. их мнению, ему хотелось. В этом случае на результатах
исследования сказалось бы воздействие предвосхищающих оценок.
КРИТЕРИЙ ХИ-КВАДРАТ
Логика применения статистических критериев, аналогичных
критерию знаков, состоит в следующем. Применяя такой критерий,
мы сравниваем полученную частоту реализации некоторого инте-
ресующего нас события с ожидаемой (теоретической) частотой. При
использовании критерия хи-квадрат осуществляется эта же опера-
ция, однако она производится для нескольких категорий сразу.
Приведем пример. Часть информации, полученной при проведении
эксперимента по выявлению экстрасенсорных способностей, опи-
санного на с. 108, состояла из данных о числе решек, предсказан-
ных каждым из 100 студентов, участвовавших в эксперименте, при
5 подбрасываниях монеты. Ожидаемые частоты этих событий, рас-
считанные с помощью разложения бинома, приводятся в третьем
столбце табл. А.4. Фактически полученные значения частот содер-
17- -1778
249
жатся во втором столбце. Формула для вычисления критерия хи-
квадрат выглядит так:
.,2_
где х2 — хи-квадрат, f0— фактическая частота каждого исхода,
k
fe — ожидаемая частота каждого исхода, 2 означает суммирование
по k категориям: в данном случае их 6 (0, 1, 2, 3, 4 и 5 решек).
Таблица А.4
Число решек Фактическое число студентов, предска- завших данный ре- зультат, /о Ожидаемое число студентов, fe (Го-U2 (Го- U2
0 0 3 9 3,00
1 13 16 9 0,56
2 33 31 4 0,13
3 44 31 169 5,45
4 9 16 49 3,06
fj 1 3 4 1,33
Итого 100 100 Х2= 13.53
В двух последних столбцах таблицы приводятся результату
промежуточных вычислений, которые необходимо проделать для
получения значения критерия хи-квадрат. Это значение находится
суммированием показателей последнего столбца таблицы. Значи-
мость х2 оценивается с учетом числа степеней свободы, равного
k— 1 (следовательно, в нашем случае число степеней свободы рав-
но 5). Заглянув в соответствующие специальные таблицы, мы об-
наружим, что полученное значение х2 существенно при уровне
значимости, заключенном между 1 и 2%. Отсюда следует, что
эмпирически полученное распределение предсказаний студентов
отличается от того, которое можно было бы ожидать в случае,
если бы эти предсказания имели случайный характер.
Проведенный только что анализ не совсем точен, поскольку
в соответствии с условиями применения данного метода значение
fe в каждой из выделенных категорий должно равняться, по край-
ней мере, 5. Мы забежали несколько вперед, поторопившись ис-
пользовать данный метод на практике, по это произошло вовсе
не из-за того, что автор хотел ввести вас в заблуждение. В дан-
ном случае спешка объясняется стремлением дать наглядную ил-
люстрацию процедуры практического использования рассматри-
ваемого метода. В следующем примере, в котором сформулиро-
ванное выше условие соблюдается, уровень значимости при ответе
на вопрос о характере распределения предсказаний студентов,
250
как мы сейчас убедимся, несколько возрастет и станет больше 1%
(что и отмечалось на с. 108).
Второй пример, который мы сейчас рассмотрим, связан с оп-
ределением правильности предсказаний при проведении экспери-
мента по выявлению экстрасенсорных способностей. Эти данные
приводятся в табл. А.5, в которой осуществляется также расчет
значения %1 2. Сопоставление со стандартной таблицей значений %2
показывает, что данный результат в соответствии с обычно приме-
няющимися стандартами не является существенным. Этот вывод
можно в краткой форме выразить с помощью выражения 0,20>
>р>0,10, которое означает, что при 6 степенях свободы значе-
ние х3, равное 10,20, существенно при уровне значимости, заклю-
ченном между 10 и 20% *•
Таблица Л.5
Число правиль- ных предска- заний fo fe"
%
0 0
1 (1) 0 э 4 3,20
о 1
3 5 12 7 4,08
4 26 20 6 1,80
5 29 25 4 0,64
6 22 20 2 0,20
7 И 12 1 0,08
8 3
9 (6) 3 5 1 0,20
10 0
100 99* /_2=10,20
* Объединение значений частот приводит к тому, что их общий итог ока-
зывается меньше 100.
ПРОВЕРКА ГИПОТЕЗ ДЛЯ СЛУЧАЯ
НЕПРЕРЫВНЫХ ПЕРЕМЕННЫХ
В данном параграфе мы рассмотрим статистическую провер-
ку гипотез о данных, имеющих непрерывную природу. Но прежде
чем приступить к обсуждению этого вопроса, следует сделать
1 В данном случае мы объединили категории 0, 1, 2 и 8, 9, 10, чтобы
получить значение fe, равное, по крайней мере, 5 для каждой категории. В ре-
зультате число степеней свободы уменьшается с 10 до 6 (7 категорий—1).
Суммарное значение уменьшается со 100 до 99 в результате округления.
Не пытайтесь усмотреть какой-либо мистический смысл в том, что значение %2,
равное 10,20, оказалось существенным при значениях р, заключенных между
0,10 и 0,20. Это просто случайное совпадение.
17*
251
одно важное замечание. До сих пор мы широко использовали по-
казатели Z-оценок. Это объясняется тем, что автору было удоб-
нее проиллюстрировать логику проверки гипотез с помощью зна-
комого читателю показателя. Однако здесь имеется одна слож-
ность, игнорировать которую больше нельзя. Дело в том, что, как
отмечалось в гл. 6 (см. с. 140), Z-оценки могут быть адекватным
образом интерпретированы только тогда, когда они соотносятся
с нормально распределенной совокупностью значений.
Рис. А.2. Графики выборочных
распределений Z и t. Необхо-
димо отметить следующее: (1)
в отличие от нормального рас-
пределения (Z) в <-распрёде-
лении содержится относитель-
но меньшее число низких зна-
чений и относительно большее
число высоких. Это означает,
что если любое значение t, су-
щественное при некотором дан-
ном уровне значимости, пред-
ставить в виде Z-оценки нор-
(Х-М'1/S ' маЛьного распределения, то
оно станет менее существен-
ным. Смысл этого утверждения более детально можно понять, обратившись
к рис. А.З. (2) .Степень проявления данного эффекта уменьшается по мере воз-
растания числа степеней свободы
Однако это условие не выполняется, например, в случае вы-
борочных распределений средних и разностей, параметры которых
оцениваются на базе выборок небольшого объема. Проблема
здесь состоит в том, что даже при использовании несмещенной
оценки о в распределении Z-оценок будет слишком большое ко-
личество значений, расположенных в хвостах распределения. Дан-
ная ситуация иллюстрируется с помощью рис. А.2 и А.З. Из этих
рисунков можно сделать два следующих вывода: (1) как уже от-
мечалось, расчет показателей (X — Af)/S дает более высокие раз-
ностные значения, чем можно было бы ожидать на базе нормаль-
ной- кривой; (2) сила проявления этого эффекта уменьшается при
увеличении числа наблюдений или степеней свободы.
Чтобы решить стоящую перед нами проблему, нет необходи-
мости искать какой-либо альтернативы расчету показателя
(X—M)/S. Вместо этого полученное значение (X — M)/S можно
соотнести с выборочным распределением, обладающим соответст-
вующим числом степеней свободы, которое действительно встре-
чается на практике. Полученный в результате данной операции
критерий называется /-критерием. Отныне вместо Z-критерия мы
будем пользоваться /-критерием, хотя вы понимаете, что процеду-
ра нахождения значения / полностью совпадает с процедурой рас-
чета показателя Z. Единственное отличие при этом состоит в том,
что полученные значения / будут соотноситься с таблицей /-значе-
ний, а не с таблицей Z-оценок. Кроме того, как отмечалось в
252
гл. 10, когда число степеней свободы достаточно велико, значе-
ния Z и t практически не отличаются друг от друга, а при беско-
нечно большом числе степеней свободы они становятся одинако-
выми.
Рис. А.З. Значимость t как
функции числа степеней свобо-
ды. Принадлежащие нормаль-
ному распределению значения
Z, равные 1,96 и 2,58, суще-
ственны при уровнях значимо-
сти 0,05 и 0,01. В случае
t-распределения существен-
ность этих значений зависит
от числа степеней свободы.
Следует отметить, что когда
показатель степеней свободы
равен примерно 20 единицам,
угол наклона кривых на гра-
фике, представляющих соот-
ветствующие функции, опреде-
лить практически невозможно.
Однако по мере возрастания
числа степеней свободы от 1
до оо они асимптотически стре-
мятся к пределам, равным 0,05 и 0,01. Если же число степеней свободы не очень
существенно отличается от 20, добавление некоторого количества наблюдений
мало способствует увеличению мощности критерия, поскольку данный процесс
происходит очень медленно. По этой причине при проведении экспериментальных
исследований в выделяемых группах чаще всего по 10—30 наблюдений. По-
скольку в случае t-распределения число степеней свободы равно «1+«2—2, до-
бавление новых наблюдений не очень существенно повышает надежность резуль-
татов эксперимента
ГИПОТЕЗЫ О СРЕДНЕЙ
Предположим, у вас есть основания считать, что среднее зна-
чение коэффициента IQ жителей вашего района превышает рав-
ный 100 пунктам средний уровень этого показателя генеральной
совокупности. Вы собираете данные о коэффициентах IQ 100 своих
соседей и получаете, что для этой выборки он равен 105 пунктам,
а стандартное отклонение составляет 17 пунктов. Чтобы осущест-
вить статистическую проверку полученных результатов, вы долж-
ны поступить следующим образом:
1. Рассчитать несмещенную оценку стандартного отклонения
генеральной совокупности или по исходным данным с помощью
приведенных ранее формул (14), (17), (18), или с помощью фор-
мулы (20):
S = j/'S = . 17 = 1,005 • 17 = 17,2. (20)
2. Рассчитать стандартную ошибку средней по формуле
253
Sm=-^^ = -^7 = —= 1,72. (25)
l N K100 10
Полученное число представляет собой стандартное отклонение
выборочного распределения средних. Зададимся теперь вопросом:
если средняя совокупности значений IQ для вашего района в це-
лом (ц)1 в действительности равна 100, т. е. значению генеральной
совокупности, то какова вероятность получения среднего значения,
равного 105? На следующем шаге мы рассчитаем значение Пкри-
тсрия:
. ль, - ми .
* =---9---’
где Мо -- фактически получен.чое значение средней; Ми— гипоте-
тическое среднее значение исходной совокупности, равное 100.
Таким образом,
/=105-100 = 5л00 = 287
1,74 :, 74 ’
В данном случае число степеней свободы равно: N— 1 = 100—1 =
= 99.
ОДНОСТОРОННИЙ И ДВУСТОРОННИЙ КРИТЕРИЙ
Очевидно, вы собираетесь отвергнуть нулевую гипотезу о том,
что Л1н=Л4о, однако при каком уровне? Обратившись к данным
табл. А.6, можно обнаружить, что при 99 степенях свободы зна-
чение /, равное 2.87, встречается реже, чем в одном случае из 100
(0,01), если принять во внимание площадь, расположенную
в обоих хвостах распределения. Таким образом, вы могли бы за-
фиксировать это значение в качестве соответствующего уровня
значимости. Однако вы можете с этим предложением не согла-
ситься (некоторые люди так и поступают), поскольку ваша гипо-
теза состояла в том, что среднее значение коэффициента IQ жи-
телей вашего района превосходит средний уровень соответствую-
щего показателя совокупности в целом. Возможно тогда, что мы
поступим более справедливо по отношению к жителям вашего рай-
она, если примем во внимание только площадь одного из хвостов
распределения и отвергнем нулевую гипотезу при уровне значимо-
сти 0,005.
Ту же мысль можно выразить и по-другому, указав, что по-
скольку предсказанное среднее значение IQ превышает 100, сле-
дует оценивать вероятность получения именно такого результа-
та и не принимать во внимание вероятность получения среднего
значения IQ, которое на те же 5 пунктов оказалось бы меньше
100. В этом и состоит выбор между односторонним и двусторон-
ним критериями. В соответствии с логикой данного выбора исполь-
1 До сих пор рассматривалась выборка коэффициентов IQ из этой совокуп-
ности. — Примеч. пер.
254
зование одностороннего критерия часто обосновывается тем, что
этот критерий является более адекватным в случаях, когда в про-
водимом исследовании проверяется гипотеза о возможном направ-
лении полученных отклонений.
Таблица А.6
Фрагмент таблицы /-значений
Сте- ’ пень сво- боды р * Сте- пень сво- боды 1 р *
0,0005 0.001 0,0! 0.05 j 0,0005 0,001 0,01 0,05
1 1237,24 636,62 63,66 12,71 9 5,29 4,78 3,25 2,62
2 44,70 31,60 9,92 4,30 I 10 5,05 4,59 3,17 2,23
3 16,33 12,92 5,84 3,18 । 20 4,15 3,85 2,85 2,09
4 10,31 8,61 4,60 2,78 1 30 3,90 3,65 2,75 2,04
5 7,98 6,87 4,03 2,57 60 3,68 3,46 2,66 2,00
6 6,79 5,96 3,71 2,45 100 3,60 3,39 2,63 1,98
7 8 6,08 5,62 5,41 5,04 3,50 3,36 2,36 2,31 оо 3,48 3,29 2,58 1,96
* Рассматриваются оба хвоста ^-распределения.
Вероятно, в данном вопросе я окажусь в меньшинстве, но я
предпочитаю пользоваться двусторонними критериями. Хотя бы
потому, что всегда возможны какие-либо альтернативные гипоте-
зы относительно изучаемого явления. Например, кто-нибудь из
ваших соседей может выдвинуть гипотезу о том, что жители рас-
сматриваемого района имеют уровень умственного развития ниже
среднего, считая, что уже сам факт проведения специального об-
следования (задуманного вами, кстати, совершенно с противопо-
ложной целью) свидетельствует об озабоченности общественности
данной проблемой. В этом случае ваш сосед может также предло-
жить использовать для проверки его гипотезы односторонний кри-
терий, однако па этот раз во внимание должен быть принят дру-
гой хвост ’распределения. При использовании двустороннего кри-
терия следует учитывать отклонения и в том и в другом направ-
лении. Вторая причина, по которой я предпочитаю двусторонний
критерий одностороннему, связана с тем, что использование более
«консервативного» двустороннего критерия несколько повышает
надежность ваших выводов в случае, когда предположения, лежа-
щие в основе применения /-критерия, выполняются не совсем
точно.
ГИПОТЕЗЫ О РАЗНОСТЯХ СРЕДНИХ
Все тесты, применяемые для проверки статистических гипо-
тез, имеют одну и ту же логическую схему: с их помощью оцени-
вается вероятность получения данного фактического значения не-
которой статистики, если величина параметра генеральной сово-
купности такова, как предполагается в нулевой гипотезе. Тесты
для проверки гипотез о разности между двумя средними также
255
строятся на этих же принципах. С их помощью определяется веро-
ятность получения данного значения разности, если соответствую-
щее значение генеральной совокупности равно некоторому кон-
кретному числу, обычно нулю. Основные этапы применения данно-
го теста состоят в следующем:
1. Рассчитывается разность средних. Можно указать две ос-
новные ситуации, в которых это можно сделать. Мы будем иметь
дело с первой из них, когда значение разности представляет со-
бой разность между средними двух различных выборок1.
2. Для каждой из этих средних определяется стандартная
ошибка по формуле (25).
3. Рассчитывается стандартная ошибка разности с помощью
формулы
Spa- = ]^S^+S^, (27)
где Sai, и Sa —стандартные ошибки средних для выборок 1 и 2.
Эти показатели, как, впрочем, и все стандартные ошибки, пред-
ставляют собой S выборочного распределения, в данном случае —
выборочного распределения разностей.
4. В соответствии с обычной нулевой гипотезой о том, что
разность между средними значениями генеральной совокупности
равна нулю, рассчитываем отношение
_ разность да)
Spasii
5. Величина полученного показателя оценивается с помощью
таблицы /-значений (с учетом числа степеней свободы). Нулевая
гипотеза об отсутствии различий отвергается, если величина по-
лученного значения t достаточно велика.
В качестве примера рассмотрим предположение о том, что
разность между значениями процентов женщин в выборках, осу-
ществленных судьей, который вел процесс доктора Спока, и в
выборках, проводившихся другими бостонскими судьями, имеет,
скорее всего, случайное происхождение. Соответствующие данные
приводятся в следующей таблице:
Выборки судьи, который вел про- цесс доктора Спока Выборки других судей
N 9 37
Средний процент. жен-
щин 14,67 29,14
S 5,08 7,40-
Л
S 5,39 7,51
Sm 1,80 ~ 1,23
1 Вторая из отмеченных автором ситуаций связана с нахождением разности
средних для одной и той же выборки .наблюдений. В этом случае соответствую-
щие значения средних могут быть рассчитаны для отдельных подгрупп наблю-
дений, выделяемых в выборке, которой располагает исследователь. — Примеч.
пер.
256
Приступим теперь к вычислениям:
Зразн = У1,8°2+ 1,23й = Г 3,24 + 1,51 = ]/"4J5 = 2,18,
t 29,14- 14,67 = 14j_47_ g
' 2,18 |2,18 ’ ‘
Число степеней свободы, когда /-критерий применяется при про-
верке гипотез о разности средних, равно: /ii + /i2—2 = 9 + 37—2 =
= 46—2 = 44. Сверившись с табл. А.6, мы обнаружим, что в данном
случае значение р<0,0005.
Между прочим, одна из наиболее примечательных черт прове-
денного анализа связана с особенностями конкретной интерпрета-
ции рассмотренной ситуации. Проверяемая нами гипотеза соооит
в следующем. Если 9 выборок, осуществленных судьей, который
вел процесс Спока, являются (1) случайными выборками из (2)
’одной и той же совокупности, и если (3) распределение разностей,
характеризуемое показателем Зразн, представляет собой /-распре-
деление, то значение t, равное или превосходящее по величине 6,64,
может встретиться только в 5 случаях из 10 000. Основываясь на
этом результате, мы отвергаем данную гипотезу.
Однако отметим, что отвергнутая гипотеза является сложной
гипотезой, состоящей из нескольких более частных гипотез. Здесь
важно понять, что значение t может оказаться существенным,
если любая из этих частных гипотез окажется ошибочной. Обычно
исследователь заинтересован в опровержении той части сложной
гипотезы, в которой предполагается, что рассматриваемые два
значения получены из одной и той же совокупности. Однако мы
имеем дело с почти уникальной ситуацией, когда нам известно,
что имеющиеся в нашем распоряжении выборки действительно
получены из одной и той же совокупности, а именно из совокупно-
сти потенциальных кандидатов в состав присяжных. В силу совер-
шенно других причин, имеющих математическую природу, мы мо-
жем быть вполне уверены, что интересующее нас распределение
представляет собой /-распределение. Следовательно, ошибочной
будет частная гипотеза о случайном характере выборок.
f-КРИТЕРИЙ ДЛЯ КОРРЕЛИРУЮЩИХ МЕЖДУ СОБОЙ ПОКАЗАТЕЛЕЙ
При обсуждении в гл. 7 экспериментов с дегустацией вин, ког-
да наше гипотетическое исследование проводилось по внутригруп-
повой схеме, мною приводились данные, воспроизведенные в
табл. А.7. В нижних строках этой таблицы содержатся данные,
необходимые для расчета значения / с помощью методов, опи-
санных выше.
, разность _ 1,0
5ра:ш 8рази
5рази = / (0,79)2 + (0,69)2 = V0,62 + 0,48 = КЦО = 1,05,
/ = -^ = 0,95.
1,05
257
Таблица А.7
Дегус- татор Оценка (в баллах) Дегус- татор Оценка (в баллах)
Дегустация сразу после раскупори- вания бу- тылки п Дегус- тация «поды- шавшего» вина Раз- ность Дегустация сразу после раскупори- вания бу- тылки Дегус- тация «поды- шавшего» вина Раз- ность
1 2 3 4 5 6 7 17,0 17,5 16,0 16,5 15,5 15,0 14,5 18,5 18,0 17,5 17,0 16,0 15,5 15,0 +1,5 +0,5 + 1,5 +0,5 +0,5 +0,5 +0,5 8 9 10 Средняя S S S м 13,0 12,0 9,5 14,65 2,37 2,49 0,79 14,0 13,0 12,0 15,65 2,06 2,17 0,69 +1,0 + 1,0 +2,5 + 1,0 +0,63 +0,67 +0,21
В данном случае разность средних незначима. Однако в дейст-
вительности это не так. Обратите внимание на тот факт, что каж-
дый отдельный дегустатор поставил «подышавшему» вину более
высокую оценку, что указывает на существование определенной
взаимосвязи между выставляемыми оценками. Поэтому у вас мо-
гут возникнуть сомнения в адекватности только что использован-
ного метода анализа.
Действительно, из таблицы следует, что между двумя оценка-
ми каждого дегустатора имеется сильная корреляционная взаимо-
связь. При расчете значения t этот факт не принимался во вни-
мание. Несколько позже данные табл. А.7 будут использованы
для иллюстрации расчета коэффициента корреляции, который в
данном случае окажется равным +0,97. t — тест, в котором учи-
тывается факт наличия корреляции между анализируемыми дан-
ными, включает расчет показателя Зразп с помощью формулы
5раз„ = - 2rSMlS^ =
= ]/0,792 + 0,692 — 2 I (0,97) (0,79) (0,69) | = |/1,100 — 1,057 =
= р 0,043 = 0,207 = 0,21.
(29)
Если мы рассчитаем /-значение теперь, то получим результат,
существенно отличающийся от результата, найденного без по-
правки на существование корреляции:
t = = 4,76.
0,21
Число степеней свободы для этого теста равно числу корре-
лирующих между собой пар значений минус 1, или 10—1=9. Из
табл. А.6 следует, что полученный результат значим при р=0,001.
Таким образом, вероятность совершить ошибку I рода составляет
примерно 1/1000, что не очень отличается от 1/1024, т. е. от веро-
258
ятности того, что все значения разностей будут с одинаковым зна-
ком *.
ПРЯМОЙ МЕТОД ПОЛУЧЕНИЯ S
Напомним, что значение 5разн, полученное с помощью форму-
лы, учитывающей наличие корреляции з исследуемых данных,
равно 0,21. Еще раз внимательно досмотрим на последний столбец
табл. А.7, где приводятся значения разностей, по которым осуще-
ствляется расчет. Как видим, содержащееся в нем значение
также равно 0,21. Напоминаю, что показатели в этом столбце
представляют собой разности между соответствующими значения-
ми оценок. Таким образом, значение 0.21 является стандартной
ошибкой разности средних, т. е. 5оазн. Следовательно, в случае,
когда оцениваемые показатели представляют собой разности соот-
ветствующих значений,
л
Spain
(30)
Чаще всего подобный прямой метод нахождения 5разн гораздо
более удобен, чем эквивалентный ему метод, связанный с необхо-
димостью расчета показателя г.
КОРРЕЛЯЦИЯ
В гл. 8 была введена формула определения г на основе по-
казателей Z-оценок. Там же отмечалось, что производить прак-
тические расчеты по этой формуле очень неудобно. Выглядит эта
формула так:
2(z„r -Zy)
(31)
В зависимости от характера представления исходных данных для
определения коэффициента корреляции может быть использована
также одна из приведенных далее расчетных формул,
2 (XY)/N MxMv /от
г =------SA------<32)
Вам знакомы все составляющие элементы данной формулы, за ис-
ключением 2ХУ — так обозначается сумма произведений соответ-
ствующих друг другу пар значений X и Y (аналогично тому, как
1 Вероятность того, что данное значение разности, будет иметь положитель-
ный (отрицательный) знак, равна */2. Вероятность того, что К значений разно-
сти будут иметь одинаковый знак в соответствии с правилами умножений
вероятностей (см. с. 104) равна ('/2) • (’/г) ... (Уг) = (Уг)к. Поскольку в нашем
случае К= 10, то (’/2) 10= 1/1024.— Примеч. пер.
259
это делалось в формуле определения коэффициента корреляции
на базе Z-оценок). Поскольку в знаменателе этой формулы стоит
выражение SKSy, мы можем воспользоваться расчетными форму*
лами для определения S и получить ряд других уравнений. Одно
из таких уравнений имеет следующий вид:
г =
SXT
МхМу
2Х2 „ \ /2V2 \
(33)
Применение формулы (32) к анализу данных о дегустации вин ил-
люстрируется с помощью табл. А.8.
Таблица А.8
Дегус- татор Дегустация сразу после раскупори- вания бутыл- ки, X Дегуста- ция «по- ды шав- шего» вина, У XY Дегус- татор- Дегустация сразу после раскупори- вания бутыл- ки, X Дегуста- ция «по- дышав- шего» вина, У ХУ
1 17,0 18,5 314,50 8 13,0 14,0 182,00
2 17,5 18,5 315,00 9 12,0 13,0 156,00
3 16,0 17,5 280,00 10 9,5 12,0 114,00
4 16,5 17,0 280,00 Итого 146,5 156,5 2340,00
5 15,5 16,0 248,00 Средняя 14,65 15,65 234,00
6 15,0 15,5 232,50 S 2,37 2,06
7 14,5 15,0 217,50
Подставляя данные этой таблицы в формулу (32), получаем:
2340,00
---—: _ (14,54 15,65)
10 ’ 234,00 — 229,27 4,73 п П7
Г --------:------------------- =--------------- =-----= 0,97.
2,37 - 2,06 2,37 - 2,06 4,88
МЕТОД РАЗНОСТИ РАНГОВ
Строго говоря, коэффициент г может быть адекватным обра-
зом использован только в случае, когда анализируемые данные
выражены в абсолютных или относительных единицах измерения.
При порядковой шкале измерения для вычисления коэффициента
корреляции применяется формула рангового коэффициента кор-
реляции р (читается «ро»)1:
, 6SD2
о = 1 —,----------
N (N2 — 1)
где D — разность рангов наблюдений X и У, a N— число пар та-
ких наблюдений.
1 Имеется в виду ранговый коэффициент корреляции Спирмэна. Сущест-
вуют и другие типы ранговых коэффициентов корреляции. — Примеч. пер.
260
В доме одного из моих знакомых имеется лице приводятся данные об их размерах пять картин. В таб- и продажной цене.
- Размер, дюймы Цена, дол. -
10X12 18X24 26X20 30X36 52X80 10 80 15 475 900
Если прорапжировать эти значения, начиная получим следующие результаты: с наименьших, то
ч Ранг размеров картин Ранг цен D о2
1 2 3 4 1 3 2 4 0 1 1 0 0 1 1 0
Значение р, таким образом, равняется:
J-----6SZ^--= !_612= J2_ J __01 _ +0 90
ЛЦ№ — 1) 5 (24) 120 ’ -
ДИСПЕРСИОННЫЙ АНАЛИЗ
Чтобы понимать суть ANOVA, необходимо знать следующее:
(1) анализ дисперсии может осуществляться путем разложения
этого показателя на составляющие его компоненты и (2) оценки
дисперсии генеральной совокупности могут быть получены на базе
этих компонентов. В гл. 10 я пытался последовательно проводить
эти идеи, не прибегая к каким-либо техническим средствам. На
мой взгляд, только такой способ изложения материала может при-
носить удовлетворительные результаты. В данном параграфе бу-
дут приведены формальные доказательства некоторых важных
свойств. Я подозреваю, что некоторые из вас, подобно автору на-
стоящей книги, после демонстрации всех выкладок почувствуют
некоторое моральное удовлетворение.
ОПРЕДЕЛЕНИЯ
1) п — число человек в каждой из выделенных групп, -
2) k — число групп, следовательно,
3) kn=N — общее число человек во всех группах,
4) X — любое наблюдение,
5) М — среднее значение отдельной группы,
6) GM— общая средняя; средняя всех N наблюдений (а также
средняя средних показателей групп),
7) dr — общее (Т) отклонение (d) значения наблюдения от об-
щей средней=А— GM,
261
8) dwG — отклонение значения наблюдения от среднего показа-
теля группы, к которой данное наблюдение принадлежит=Х — М,
9) dBG — разность между выборочной средней и общей сред-
ней =М — GM.
ДОКАЗАТЕЛЬСТВО ТОГО, ЧТО dT=dWG+dBG
1. dT = X— GM — по определению 7.
2. dwa + dn.j^X — М + М—GM (в силу определений 8 и 9) =
GM.
3. dт ~ а?не-
ДОКАЗАТЕЛЬСТВО ТОГО, ЧТО Sd2T = Sd2w а + £42ва
1. dT = dwG~rdBG-
2. d2T= (,dwG-}~dBG)2~d2wG-\-2(dwG-dBG) +d2BG-
3. Просуммируем по всем наблюдениям любой из выделенных
групп:
%d2r = 2Л2\\--(; + 2 (Zdwi- •
4. Поскольку SdwG = 0 (в действительности ^dBG также рав-
но 0), средний из элементов в полученном только что выражении
можно исключить и, следовательно,
2d2z- = 2d2iTO + 2d2BG. (35)
5. С другой стороны, поскольку а'вс = М — GM представляет
собой для каждой группы величину постоянную, то
2d2r = 2d21>-o \-nd2Bti. (36)
6. На языке дисперсионного анализа принято любой показа-
тель вида 2d2 называть «суммой .квадратов», поэтому для его обо-
значения часто используется аббревиатура SS с соответствующи-
ми подстрочными значками1. Таким образом,
SSt = SSwaSSbg. (37)
РАЗЛОЖЕНИЕ ДИСПЕРСИИ НА СОСТАВЛЯЮЩИЕ ЕЕ КОМПОНЕНТЫ
1. Из формулы (36) следует, что для любой группы выполня-
ется следующее соотношение:
2d2r = 2d2VfG 4- nd2Ba-
2. Просуммировав левые и правые части этих выражений по
всем k группам, получаем
2 (2d2г) = 2 (2d2lTO) -t- n2d2BG • (38)
Нам важно в дальнейшем не забыть, что показатель SSr точно
1 Первые буквы английского выражения «сумма квадратов» (sum of squa-
res) . — Примеч. пер.
262
таким же образом может быть разложен па составляющие его
компоненты.
3. Понимая под 2d2r суммарный показатель по всем группам
и разделив левую и правую части выражения (38) на N = kn, по-
лучаем:
idj. S(SdlszG) n^dgQ
----=-------------д----------
N kn kn
(39)
Данное выражение можно записать и в таком альтернативном
виде:
Sd2
N
I
П
1 v
— Z I ----- 1
k \ n /
(40)
В первом слагаемом выражения, стоящего в правой части
этого соотношения, можно узнать среднюю k внутригрупповых
дисперсий. Формальная запись этого элемента означает, что мы
должны вначале сложить все эти дисперсии 2(2d2WG/ra), а затем
разделить полученный результат на k. Второе слагаемое в этом
выражении представляет собой дисперсию средних. Таким обра-
зом, мы теоретически обосновали проделанное в гл. 10 разложе-
ние общей дисперсии на два показателя дисперсии.
ОТ ДИСПЕРСИИ ОБРАТНО К Id2
В гл. 10 S2 было умножено на N, чтобы получить 2d2. Форму-
ла (39) помогает понять, почему мы так поступили. Это, напри-
мер, можно просто продемонстрировать для показателя общей
дисперсии: так как
Sd2
£2. = —, то MS2 = 2d2 (41)
Аналогично для показателя внутригрупповой дисперсии: так как
„2 _ S(Sd^,G) Sdfvo
wo~ kn
(под знаком 2 понимается суммирование по всем группам), то
AZS2,/0 = 2d2,.G. (42)
Для межгрупповой дисперсии до исключения п из формулы
(39):
3'»=”ТГ~ = —-Ц~'
(«)
263
ОЦЕНИВАНИЕ ДИСПЕРСИИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
Полученные компоненты общей дисперсии не являются несме-
щенными оценками дисперсии всей совокупности наблюдений. Од-
нако получить такие оценки можно довольно просто.
Внутригрупповая оценка. Для любой из k групп наилучшая
оценка дисперсии генеральной совокупности выглядит так:
eg _
П-1 ’
Средняя этих оценок аккумулирует в себе их лучшие свой-
СТВа' 1 \ ) 2(2Иг ) ss
W(J k \п— 1 } k{n—V) kn — k N~k' 1 '
Межгрупповая оценка. Данная оценка определяется тем фак-
том, что межгрупповая сумма квадратов позволяет оценить S2M.
*Для каждой из k выборок оценка дисперсии генеральной совокуп-
ности может быть получена следующим образом:
S2 ==- и nS*=S2.
М п Л1
Наилучшая оценка дисперсии совокупности средних, состоящей
из k имеющихся средних, выглядит так:
Таким образом, умножая на п, получаем:
nS2=S2 =-------
м ва Й_1 1 .
л SSR<
S2bc.= ^T- ' . (45)
Разложение числа степеней свободы. Вывод компонентов об-
щей дисперсии приводит и к соответствующему разложению на со-
ставные части показателя числа степеней свободы. Для всех N
наблюдений имеется N—1 степеней свободы. Внутригрупповая
оценка совокупности дисперсии обладает N — k степенями свобо-
ды, а межгрупповая оценка k—1 степенями свободы. Следова-
тельно,
(V — k) + (k — 1) == N — k + k 1 = N 1.
РАСЧЕТНЫЕ ФОРМУЛЫ
Через некоторое время мы приступим к исследованию с по-
мощью методов ANOVA результатов факторного эксперимента ти-
па 4X4. Однако я считаю, что предварительно вам было бы полез-
264
по познакомиться с материалом, в котором дается обзор основных
счетных процедур, основанных на использовании показателей сумм
квадратов.
Воспроизведем еще раз формулу (37):
SS у — SS iro + SSbq.
- Из нее автоматически следует, что
SSVTO--SSr- SSbg. (46)
Знание этого факта нам очень пригодится в дальнейшем, посколь-
ку расчет показателя SSvkg довольно скучен и утомителен. То, что
этот показатель можно получить как разность двух других показа-
телей, сбережет нам уйму времени.
Эксперимент, который предстоит проанализировать, представ-
ляет собой факторный эксперимент типа 4X4. В плане этого экс-
перимента предусмотрено выделение двух переменных, каждая из
которых представлена своими 4 значениями (в результате полу-
чается 16 (4x4) групп). Подобный эксперимент, как было показа-
но в гл. 10, позволяет анализировать дисперсию выделенных
16 групп (SS7jfi) посредством дальнейшего разбиения этой дис-
персии на составляющие ее компоненты.
В гл. 10 было также показано, что планы факторных экспери-
ментов с несколькими значениями двух переменных могут быть
представлены в виде матрицы, в столбцах (С) которой представ-
лены значения одной переменной, а в строках (/?) —значения дру-
гой переменной. Используя буквы R и С для обозначения сумм
квадратов, соответствующих этим двум переменным, можно запи-
сать следующее уравнение для анализа межгрупповой суммы квад-
ратов':
SSB0 = SS,? 4- SSC + SSR.C, (47)
где SSR.C представляет собой сумму квадратов для взаимодейст-
вия между R и С. И в этом случае аддитивность представленных
в (47) сумм квадратов позволяет нам легко справиться со счетны-
ми проблемами, связанными на этот раз с вычислением показате-
ля Sr-c:
RSr.c — SS^a ~ SSr—-SSc. (48)
Промежуточное резюме. Принимая во внимание все сказанное,
можно записать:
S3 у •= SSU,« 4- 4- SSc 4- SSR.c- (49)
В практических расчетах будет использоваться следующая
процедура вычислений:
1. Расчет показателя SST по формуле (50).
2. Расчет показателя SSbg по формуле (51).
3. Расчет показателя SSWG = SST— SSBG по формуле (46).
4. Расчет показателя SSC с помощью варианта формулы (51).
18 -1778
265
5. Расчет показателя SSn с помощью того же варианта форму-
лы (51).
6. Расчет показателя SSh.c — SSbg — SSn— SSc по форму-
ле (48).
7. Расчет F по формуле (52).
Некоторые из только что упомянутых формул тесно связаны с
формулой (И), т. е. с расчетной формулой дисперсии:
S2...s*2 - (1П
Д' ' k ’
NS2 = SX2 - = Zd2 = SS.
N
После этих предварительных замечаний можно приступить к
рассмотрению примера. В ходе изложения будут сделаны некото-
рые необходимые добавления и уточнения.
ПРИМЕР ИЗ СЕЛЬСКОХОЗЯЙСТВЕННОЙ ПРАКТИКИ
Одними из первопроходцев в области разработки статистиче-
ских концепций были исследователи, занимавшиеся изучением сель-
ского хозяйства. Данные для нашего последнего в этом приложе-
нии примера взяты как раз из одной из таких работ [17]. Эта ра-
бота посвящена исследованию урожайности пшеницы, выращивае-
мой на участках, обработка которых осуществлялась различными
способами. Поставленный в исследовании эксперимент представ-
лял собой факторный эксперимент типа 4X4, при котором четыре
способа химической обработки почвы (1, 2, 3 и 4) пересекались с
использованием четырех различных видов удобрений (Л, В, С
и В). Таким образом, в плане эксперимента имелось 16 условий.
Под каждое из этих 16 условий было выделено по три отдельных
участка земли, засеянных пшеницей. Участки случайным образом
были размещены в окрестностях сельскохозяйственной лаборато-
рии с целью исключить воздействие на результаты эксперимента
фактора их благоприятного или неблагоприятного расположения.
Полученные результаты приводятся в табл. А.9. Обратите вни-
мание, что в данном случае в качестве обобщающих статистик
взяты не средние показатели, а значения сумм. Это сделано пото-
му, что именно они будут использоваться в дальнейших расчетах.
Анализ начинается с расчета SSr по формуле, которая, как
отмечалось, может быть выведена из формулы (11):
SSr = 2X2 — " (50)
У
Последний элемент в формуле (50) представляет собой попра-
вочный член. Как показано в формуле (10), этот поправочный
член может быть выражен следующим образом:
N
266
Таблица Л.9
Урожаи пшеницы на 48 участках
Вид удоб- рения Участок Химическая обработка Итого по 12 участкам
1 2 3 4
А 1 21,4 20,9 19,6 17,6
2 21,2 20,3 18,8 16,6
3 20,1 19,8 16,4 17,5
Итого 62,7 61,0 54,8 51,7 230,2
В 1 12,0 13,6 13,0 13,3
2 14,2 13,3 13,7 14,0
3 12,1 11,6 12,0 13,9
Итого 38,3 38, 5 38,7 41,2 156,7
С 1 13,5 14,0 12,9 12,4
2 11,9 15,6 12,9 13,7
3 13,4 13,8 12, 1 13,0
Итого 38,8 43,4 38,9 39,1 160,2
D 1 12,8 14,1 14,2 12,0
2 13,8 13,2 13,6 14,6
3 13,7 15, 3 13,3 14,0
Итого 40,8 42,6 41,1 40,6 164,6
Итого по 12 участкам 180,1 185,5 173,5 172,6 711,7
Фактически роль этого показателя в формуле SS сводится к вы-
читанию М из каждого возводимого в квадрат значения наблюде-
ния, что требуется в соответствии с выражением Sd2=SS. Попра-
вочный член для данных нашего примера составляет:
(SJV)2 = (711,7)? = 506516,89 =
N 48 48 ’ ‘
Теперь, применяя формулу (50), получаем:
SSr= (21,4)2 + (21,2)2+ ... + (14,6)2 + (14,0)2 —
— 10552,44 = 367,15.
На следующем шаге рассчитывается межгрупповая сумма
квадратов по формуле
S5B0==2~-----------(б*)
где (2Х)г — суммарное значение для каждой отдельной (г) груп-
пы. В соответствии с этой формулой мы должны возвести в квад-
рат каждое такое суммарное значение, разделить полученный ре-
зультат на число наблюдений в каждой группе (и), сложить все
fe=16 полученных частных от деления и вычесть поправочный
член. В нашем примере, таким образом, получаем:
18*
267
ос _ (62,7)2 . (38,З)2 , . (40, 6)2
оодс------—— -j ----- -р . . . Д--------
3 3 3
— 10552,44 = 10893,31 -= 10552,44 = 340,87.
Имея в своем распоряжении значения S5r и SSbg, величину SSWG
мы можем определить посредством вычитания первого из этих зна-
чений из второго:
SSff’G = 367,15 — 340,87 = 26,28.
Если бы это был мультивалентный эксперимент с 16 различны-
ми значениями некоторой простой переменной, то было бы доста-
точно вычисления полученных сумм квадратов. В этом случае мы
бы могли, разделив их на соответствующие показатели числа
степеней свободы, получить оценки общей дисперсии совокупности
(см. формулы (44) и (45)) и затем по ним рассчитать значение F:
52 _ 3671;> _ 24 48
52 = 0,82,
u ° 32 ’ ’
Е = -^ = 2-'=’ = 29,85. (52)
Л„ 0,82 ' '
В пашем примере имеется 16 различных сочетаний условий,
причем на каждое из этих сочетаний приходится по 3 участка, за-
сеянных пшеницей. Следовательно, N = 48 и, таким образом, общее
число степеней свободы равно 48—1—47. Число степеней свободы
для А=16 групп составляет k—1 = 15, а для внутригрупповой
(остаточной) суммы квадратов N — /г = 48—16 = 32. Рассчитанный
показатель F при 15 и 32 степенях свобды является высоко зна-
чимым. Однако этот результат не представляет какого-либо прак-
тического интереса, поскольку в данном случае межгрупповая дис-
персия — это в действительности некоторый сложный показатель,
состоящий из дисперсий, обусловленных воздействием химической
обработки полей, типом удобрений, а также взаимодействием этих
факторов. Мы сможем получить осмысленные результаты только в
том случае, если воздействие данных факторов будет исследовать-
ся раздельно.
Значения сумм квадратов для факторов химической обработ-
ки и типа удобрения определяются с помощью той же формулы,
которая использовалась при расчете межгрупповой суммы квадра-
тов (51):
_ у (ХХ)щ- (SX)2
п N
1
На этот раз, однако, значение суммы квадратов для фактора
268
химической обработки полей могло быть получено путем «обобще-
ния по всем типам используемых удобрений», а именно с помощью
сложения всех наблюдений, соответствующих различным способам
химической обработки полей, без учета различий в типах удобре-
ний. Поскольку значение п в приведенной выше формуле станет
равным 12 для каждого из 4 наборов наблюдений (столбцов таб-
лицы), то
_ (180,1)= (185,5)= (17.3,5)= (174,6)=
хим. обработка----------- i — I ~ | ~
— 10552,44 = 10561,61 — 10552,44 = 9,17.
Аналогичный расчет может быть проведен и для фактора типа
удобрения:
(230,2)2 + (156,7)= 4- (160,2)= + (164,6)=
•Ьитип удобрения — ” ~~
— 10552,44 = 10858,68 — 10552,44 = 306,24.
Теперь осталось только определить сумму квадратов для взаи-
модействия факторов, которая может быть получена с помощью
формулы (48):
5ХвзаимодейС1ВНЯ •-= 340,87-9,17 - 306,24 = 25,46.
Плоды наших трудов могут быть обобщены в следующей таб-
лице ANOVA:
Источник вариации Степени свободы Сумма квадратов S2 F
Химическая обработка 3 9, 17 3, 06 3,73*
Тип удобрений 3 .306, 24 102,08 124,49**
Взаимодействие 9 25,46 2,8.3 3, 45*
Внутри групп (остаточная) 32 26,28 0, 82
Итого 47 .367, 15
* р<0,05; ** ,с<0,01.
В каждом из столбцов этой таблицы приводится обычная ин-
формация. Возможно, в наибольшей мере заслуживают внимания
показатели числа степеней свободы. Чтобы не оставить никаких
неясностей, напомню, что четыре способа химической обработки
полей (как и четыре типа используемых удобрений) дают по 3 сте-
пени свободы. В случае взаимодействия имеется 9 степеней сво-
боды (3X3). Как нам уже известно, сложение этих показателей
дает число межгрупповых степеней свободы: 9 + 3 + 3= 15 = А—1.
269
Известно также, что остаточная дисперсия обладает N— 6 = 48—
—16 = 32 степенями свободы.
Из таблицы следует, что два главных эффекта являются зна-
чимыми: способ химической обработки полей — при уровне значи-
мости 0,05, а тип применявшегося удобрения — при уровне, суще-
ственно меньшем 0,01. Значимость фактора взаимодействия указы-
вает на то, что эффективность различных типов удобрения варьи-
руется при различных способах химической обработки. Общий эф-
фект от воздействия удобрения А на величину урожая был наи-
большим, однако сильнее всего он проявлялся при первом способе
химической обработки полей и слабее всего — при четвертом. Для
удобрения В были получены прямо противоположные результаты.
Типы удобрений С и Г) наиболее эффективно проявили себя при
втором способе химической обработки. Общий смысл наличия эф-
фекта взаимодействия заключается в том, что характер воздейст-
вия одной переменной на результаты эксперимента зависит от зна-
чения другой переменной. Поясним эту мысль на показателях, со-
держащихся в табл. А.9. Если мы рассчитаем для такой таблицы
значения разностей между соответствующими друг другу показа-
телями отдельных столбцов, то величина полученных разностей
при наличии эффекта взаимодействия будет, вообще говоря, для
каждой строки различной.
ЗАКЛЮЧИТЕЛЬНЫЕ
КОММЕНТАРИИ
В заключительной части книги содержится материал, который по тем или
иным причинам не был включен в основной текст. В некоторых случаях это (1)
материал, который мог бы помешать восприятию концепций, излагавшихся в ос-
новной части книги, (2) в других случаях здесь рассматриваются новые вопро-
сы, которые, как мне кажется, представляют собой полезное дополнение к ин-
формации, усвоенной ранее, (3) наконец, для каждой главы приводятся упраж-
нения. Ответы на эти упражнения можно найти в конце параграфа, посвящен-
ного соответствующей теме.
1. ПРИРОДА СТАТИСТИКИ
Упражнение
Столичная газета в одной из своих рубрик сообщала, что средняя цена до-
ма в определенном пригородном районе составляет 75 000 дол. Однако местное
агентство по продаже недвижимости возразило, заявив, что эта цена, скорее
составляет 00 000 дол. Откуда могло появиться подобное расхождение?
ЧТО ЕЩЕ МОЖНО ПОЧИТАТЬ
Теперь вам уже известно, что настоящая книга представляет собой не
столько пособие по статистике, сколько книгу о статистике вообще. Некоторые
из вас, возможно, найдут ее несерьезной, поскольку автор уделяет мало вни-
мания различным формулам и вычислениям. Если вам действительно так кажет-
ся, можно обратиться к другой литературе. В традиционных учебниках больше
внимания уделяется формальному обоснованию статистических концепций, и вам
придется над этими вопросами изрядно потрудиться. Из книг, в которых техни-
ческим вопросам уделяется относительно небольшое внимание и чтение которых
доставит вам несомненное удовольствие, могу порекомендовать следующие:
[6], [16], [21].
Ответ к упражнению
Когда цены на жилье постоянно по спирали поднимаются вверх, статистика
цен превращается в настоящий лабиринт противоречий. В данном случае, одна-
ко, все обстоит довольно просто — речь идет всего лишь о различных определе-
ниях: 75 000 дол. — «запрашиваемая» цена («цепа продавца»), устанавливаемая
продавцом в ситуации, когда имеются покупатели, которые бы желали приоб-
рести его собственность; 60 000 дол. — это «продажная» цена («цена покупате-
лей»), устанавливаемая в ситуации, когда продавец товара сам ищет покупа-
телей. Известная мне статистика цен на недвижимость, кроме того, свидетель-
271
ствует о том, что за последние месяцы увеличение цеп на частные дома в раз-
личных районах страны (а также внутри этих районов) составило от 1,4 до
13%. Чтобы получить меньшее значение этого показателя, необходимо включить
в анализ следующие категории домов: (а) дома в сельской местности, (б) пу-
стующие. дома, (в) дома в районах, где проживают национальные меньшинства,
(г) дома, находящиеся в таком плачевном состоянии, что Их покупка может
быть совершена только ради участка земли, на котором они расположены. Что-
бы получить большее значение приводившегося показателя, необходимо все пе-
речисленные категории домов исключить из рассмотрения и учитывать рост цен
только на дома, расположенные в наиболее популярных городских районах.
2. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ ДАННЫХ
Упражнение
Формула перевода градусов Цельсия в градусы Фаренгейта выглядит так:
F3 = 9/5б?“ -'г 32.
Если мы выразим градусы Цельсия в градусах Фаренгейта, то получим
С° - 5/9 (Р’ - 32).
Рис. Б.1. График к упражнению гл. 2
Рассчитанные с помощью этих уравнений соответствующие друг другу значения
приводятся в следующей таблице:
272
с° С °
—40 -40 ' 40 104
-30 —22 I 50 122
—20 — 4 1 60 140
—10 14 i 70 158
0 32 • 80 176
10 50 ! 90 194
20 68 | 100 212
30 86 1
Нанесите эти данные на график (рис. Б.1). Как вы охарактеризуете получен-
ную взаимосвязь? Можете ли вы свое визуальное впечатление обосновать ариф-
метически?
Ответ к упражнению
График взаимосвязи между градусами Фаренгейта и градусами Цельсия
имеет линейный характер. Как видно из рис. Б.2, при каждом изменении зна-
чения показателя градусов Цельсия па 10 единиц показатель градусов Фарен-
гейта изменяется на 18 единиц. Подобное постоянство изменений характеризует
линейную функцию.
Рис. Б.2. Ответ к упражнению гл. 2
3. ЧАСТОТНЫЕ РАСПРЕДЕЛЕНИЯ
Упражнения
Дж. Фреунд и Ф. Вильямс в [3] приводят следующие данные о времени
(в минутах), проведенном 100 посетителями за столиком в одном из кафе:
273
29 67 34 39 23 66 24 37 45 58
51 37 45 26 41 55 27 96 22 43
73 48 63 37 19 31 38 68 22 35
31 58 35 82 28 35 44 40 41 34
15 31 34 56 45 27 54 46 62 29
51 31 56 43 39 35 23 28 45 48
47 41 34 47 30 54 49 34 53 61
82 45 26 35 67 73 30 16 52 35
46 40 41 56 37 51 33 92 70 63
72 35 62 28 38 . 61 33 49 59 35
1. Проведите «инвентаризацию» этих данных, используя следующие интер-
валы: 10—19, 20—29, 30—39, 40—49, 50—59, 60—69, 70—79, 80—89, 90—99.
2. Постройте график, отражающий эти данные в предложенной вам систе-
ме координат (рис. Б.З).
10 19 го гд зо-зд чо-дд so-sg зо-зд го 79 во eg 90-99
19,5 2ч,5 39,5 99,5 59,5 69,5 79,5 39.5 99,5
Число минут
Рис. Б.З. График к упражнениям 2 и 3 гл. 3
3. Преобразуйте этот столбиковый график в частотный полигон, взяв за
основу середины выделенных интервалов: 14,5; 24,5 и т. д.
4. „Какое из следующих определений подходит для характеристики распре-
делений, полученных в упражнениях 2 и 3: симметричное, распределение с пра-
восторонней асимметрией, распределение с левосторонней асимметрией, J-образ-
пое?
5. Преобразуйте эти данные в распределение накопленных частот (рис. Б.4),
используя верхние границы выделенных интервалов в качестве оценок, значения
которых откладываются по оси X. Это позволит определить число наблюдений,
которое превышается значением данного наблюдения.
274
число минут
Рис. Б.4. График к упражнению 5 гл. 3
ЧАСТОТЫ МЕЛОЧЕЙ
Данные, представленные на рис. 3.2, взяты из «Энциклопедии мелочей» [22].
Далее приводится перечень разнообразных групп единиц, по которым осуществ-
лялось построение этого графика *.
Предметы, явления и другие объекты, встречающиеся группами, состоящи-
ми из:
нуля единиц: частота равна нулю;
одной единицы: частота равна нулю;
двух единиц: частота равна 1. Сиамские близнецы;
трех единиц: частота равна 15. 3 больших «Б» (Бах, Бетховен, Брамс);
3 призера в соревнованиях; триптих; 3 грации (Аглая, Талия, Эвфросина — до-
чери Зевса н Эврипомы); 3 карты (тройка, семерка, туз); 3 мушкетера (Атос,
Портос, Арамис); девиз 3 мушкетеров («все за одного, один за всех»); 3 про-
странственных измерения предметов (длина, ширина, высота); 3 мудреца; 3 доб-
рых феи (Флора, Фауна и Мэривеза в мультфильме Уолта Диснея «Спящая
Красота»); 3 мойры2 (Атропа, Клото, Лахесис); 3 фурии (Тиспфона, Алекто,
Мегера)3; триумвират; 3 горгопы (Стено, Евриала, Медуза);
четырех единиц: частота равна 7. 4 стороны света; 4 измерения (длина, ши-
рина, высота п время); 4 времени года; 4 стороны квадрата; 4 ножки стола;
4-летний срок полномочий президента в США; квадрига (колесница, запряжен-
ная четверкой лошадей);
пяти единиц: частота равна G. 5 великих озер (Верхнее, Мичиган, Гурон,
Эри, Онтарио); 5 игроков в баскетбольной команде; 5 лучей звезды; 5 олимпий-
ских колец; 5 лепестков цветка; 5 рек Аида (Стикс-—ненависти, Лета — забве-
ния, Кокит —жалоб и плача, Флегетон — огня, Ахеропт — горя, скорби);
1 При переводе в некоторых случаях примеры заменены. — Примеч. пер.
2 Богини человеческой судьбы у древних греков, дочери Зевса и Фемиды. —
Примеч. пер.
3 Богини мщения у древних римлян, обитательницы царства мертвых. —
Примеч. пер.
275
шести единиц: частота равна 3. 6 лучей снежинки; 6 игроков в хоккейной •
команде; 6 вопросов, задаваемых хорошим репортером (кто, что, где, когда,
почему и как);
семи единиц: частота равна 16. 7 дней педели; 7 путешествий Синдбада- '
морехода; 7 периодов в жизни человека (детство, отрочество, юность, возмужа- !
иие, зрелость, старость, вторая молодость); 7 нянек; 7 цветов радуги; 7 гномов ‘
и Белоснежка (Башфул, Док, Дони, Грамин, Хэппи, Слини, Снизи); 7 холмов 7
Рима; 7 козлят; «7 пятниц па неделе»; «7 небес»; поход семерых против Фив '
(Адраста, Полииика, Амфиарая, Тпдея, Капанея, Гнппомедонта, Парфепопея);
7 сестер (созвездие Плиады); «семеро одного не ждут», 7 братьев .Мальчика с
пальчика; 7 чудес древнего мира (Родосский Колосс, египетские пирамиды, ви- '
сячие сады Семирамиды в Вавилоне, Александрийский маяк, мавзолей в Гали- 1
карнассе, статуя Зевса в Олимпии, Храм Артемиды в Эфесе); 7 чудес средних
веков (катакомбы Александрии, Римский колизей, Великая китайская степа,
наклонная Пизанская башня, собор Св. Софии в Константинополе, фарфоровая
башня в Пекине, Стоунхендж в Англии);
восьми единиц: частота равна нулю;
девяти единиц: частота равна 1. 9 муз (Клио — покровительница истории;
Мельпомена — трагедии, Талия — комедии, Каллиопа — эпоса и красноречия,
Урания — астрономии, Евтерпа — лирической поэзии, Терпсихора — тайцев, По-
лигимния— хорового пения, Эрато — любовной поэзии);
десяти единиц: частота равна 1. Десятиборье.
Ответы к упражнениям
1. Инвентаризация данных:
10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 111. 4-+-+Д Щ-Г 1111 4-4-ГГ Г4Ч-Г J—H"t 4-+4Д 4-+ ГД 1111 4-+ДД 1-4-ДД 4-+Jrt 4-++Д 1 1 4-++Д 4-++Д 1111 Д++Д J-++T 1111 1 1 1 1
2, 3, 4. Графическое изображение данных. Форма приведенных на рис. Б.5
Iрафиков свидетельствует о том, что распределение имеет правостороннюю асим-
метрию. Хвост распределения расположен в той части рисунка, где приводятся
более высокие значения X.
5. Распределение накопленных частот (рис. Б.6).
4. ЗАДАЧИ НАУКИ
Упражнения
1. В данной главе основное внимание уделяется трем типам планов экспе-
риментов, названных соответственно бивалентным, мультивалентным и фактор-
ным экспериментами. Один из способов разобраться в сущности этих экспери-
ментов состоит в рассмотрении взаимосвязей между ними. При этом полезно
будет расположить эксперименты в соответствии с порядком возрастания слож-
ности их проведения. Под этим я подразумеваю следующее: факторный экспе-
римент может быть разбит на несколько мультивалентных экспериментов, каж-
дый из которых, в свою очередь, может быть разложен на несколько бивалент-
ных экспериментов. Представьте себе факторный эксперимент с двумя перемен-
ными, каждая из которых представлена 5 значениями (всего соответственно для
276
Накопленная частота v Частота
10-19 20-29 30-39 40-99 50-59 60-69 70-79 50-89 90-99
14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5.
Число минут
Рис. Б.6. Ответ к упраж-
нению 5 гл. 3
Рис. Б.5. Ответ к
упражнениям 2 и
3 гл. 3
277
проведения эксперимента должно быть выделено 25 групп — по одной на каж-
дую комбинацию переменных). План данного эксперимента представлен в таб-
лице:
Значения неза- висимой пере- менной В Значение независимой переменной Л
1 2 3 4 5
1 2 3 4 5 а f k Р и ь g 1 q V С h т г W d i п S X е i О t У
Внимательно изучите эту таблицу и, как только убедитесь, что вам все
в ней понятно, попробуйте проделать следующее:
а) выделите из таблицы какие-либо другие планы факторных эксперимен-
тов;
б) укажите несколько мультивалентных экспериментов двух различных ти-
пов;
в) выделите несколько бивалентных экспериментов двух различных типов.
Ответы к упражнениям
а) Ниже приводятся несколько планов факторных экспериментов, выделен-
ных из исходной таблицы:
a b f g
f g h, k I m, p q r
p q r s t, и v w x у
б) Два типа мультивалентных экспериментов будут соответственно вклю-
чать или только переменную А, например:
f g h
klrnn
и v w x у
или только переменную В, например:
a f k р и
I п s х
h т г
в) Бивалентные эксперименты будут соответственно включать или два зна-
чения переменной А, или два значения переменной В.
5. ЗАКОНЫ СЛУЧАЙНОСТЕЙ
Упражнения
Следующие упражнения помогут вам приобрести некоторый навык работы
с вероятностями биномиальных (дихотомических) событий. Для начала попро-
буйте построить свой собственный вариант треугольника Паскаля. Заполните
с этой целью соответствующими значениями таблицу, схема которой приводит-
ся на рис. Б.7.
278
п
Число
сочетаний
Рис. Б.7
Прежде чем приступить к заполнению этой таблицы еще раз внимательно
изучите схему треугольника Паскаля, представленную на рис. 5.3. В случае не-
обходимости внесите; в свой чертеж соответствующие исправления. Теперь вы
можете вписать в таблицу значения вероятностей, которые еще потребуются
при выполнении некоторых других упражнений. При заполнении таблицы в каж-
дом случае ваш ответ должен строиться по следующей логической схеме: веро-
ятность получения данного результата равна а на Ь, где а—число способов по-
лучения данного результата, b — общее число всех возможных исходов. В при-
веденных далее упражнениях будет рассматриваться опыт с подбрасыванием
монеты. Каждое из упражнений строится по схеме: вероятность выпадения пяти
решек при однократном подбрасывании пяти монет равна а на Ь. Определите
значения а и Ь. Ответ а=1, 6 = 32.
В дальнейшем будут рассмотрены более сложные задачи, поскольку в них
при нахождении соответствующих значений вероятности потребуется совместное
использование правил сложения и умножения вероятностей.
Правило сложения вероятностей
1. Определите вероятность выпадения 8 или 9 решек при подбрасывании
девяти монет.
2. Определите вероятность выпадения 8 пли 9 решек при подбрасывании де-
сяти монет.
3. Определите вероятность выпадения 2 решек и 1 орла или 2 орлов и
1 решки при подбрасывании трех монет.
4. Определите вероятность выпадения всех решек или всех орлов при под-
брасывании семи монет.
5. Определите вероятность того, что при подбрасывании шести монет вы-
падет, по крайней мере, 1 решка.
Правило умножения вероятностей
1. Определите вероятность того, что 2 раза подряд при подбрасывании мо-
неты выпадет решка.
2. Определите вероятность того, что при первом подбрасывании четырех
монет выпадет, по крайней мере, 3 решки, а при втором подбрасывании — по
крайней мере, 3 орла.
3. Определите вероятность выпадения 1, 2, 3, 4 и т. д. решек подряд.
279
4. Определите вероятность того, что при первом подбрасывании десяти мо-
нет выпадет нечетное число решек, а при втором подбрасывании этих монет —
четное число решек.
5. Одни человек подбрасывает четыре монеты, второй — две. Определите
вероятность того, что у первого во всех четырех случаях выпадут решки, а у
второго обе монеты упадут вверх орлом.
Ответы к упражнениям
Правило сложения вероятностей
1. а=10; 6 = 512.
2. « = 55; Ь=\ 024. '
3. а- 6; 6 = 8.
4. в = 2; 6=128.
5. а = 63; 6 = 64.
Правило умножения вероятностей
1. а=1; 6=4.
2. «=25; 6=256: 5/16X5/16=256.
3. «=1, 6 = 2; «=1, 6 = 4; а=1, 6 = 8; а=1, 6=16.
4. а=1; 6 = 4:512/1024X512/1 024 = 1/2X1/2=1/4.
5. а=1; 6 = 64 : 1/16X1/4=1/64.
6. НОРМАЛЬНАЯ КРИВАЯ
Упражнения
В первом из упражнений производится дополнительный анализ данных,
приведенных в заключительных комментариях гл. 3.
1. Рассчитайте среднее число минут, проведенных посетителем кафе за сто-
ликом.
2. Определите медиану с помощью распределения накопленных частот и с
помощью графического метода (см. с. 241).
В следующих упражнениях используются два набора чисел, которые позво-
лят продемонстрировать некоторые полезные свойства различных показателей:
11ервып набор а d- Второй набор (1 d\
1 46
2 47
3 48 J
4 49
5 50
6 51
7 52
3. Рассчитайте средние этих наборов чисел.
4. Рассчитайте стандартные! отклонения этих чисел, используя формулу
а
5. Как скажется на величине этих показателей прибавление к каждому из
чисел, принадлежащих приведенным наборам наблюдений, какого-либо постоян-
ного значения (в данном случае 45)?
6. Рассчитайте Z-оценки для значений 1, 4 и 7 в первом наборе наблюдений
и для значений 47, 49 и 51 — во втором.
В остальных упражнениях мы будем иметь дело с определением характе-
ристик площади нормальной кривой. При работе с этими упражнениями вам
может пригодиться знание следующих соотношанпй между показателями Z-оце-
280
пок и площадью нормальной кривой (мы рекомендуем вам запомнить эти дан-
ные) :
Значения Z-оценок, опреде- ляющие границы интервала Процент площади
±0, 6745 50
±1,00 68
±2,00 95
±2,58 99
Кроме того, вы должны учитывать еще один момент: нормальное распреде-
ление симметрично относительно значения средней. В упражнениях требуется
определить процент площади, заключенной в определенных границах нормаль-
ного распределения, характеризуемого следующими показателями:
. М = 50,
S = Ю.
7. Вначале^ обратившись, к данным приведенной таблицы, определите, в ка-
ких границах заключено 50% наблюдений распределения? 68%? 95%? 99%?
8. Определите границу, выше которой будет расположено 75% наблюдений;
25% наблюдений.
9. Какой процент наблюдений будет заключен между 40 и 70?
10. Какой процент наблюдений будет находиться в двух хвостах нормаль-
ного распределения, определяемых значениями 70 и 30? 75,8 и 24,2?
11. Указаны ли в каком-либо из приведенных упражнений границы стан-
дартных доверительных интервалов?
Ответы к упражнениям
2. Соответствующее распределение накопленных частот приводится в отве-
тах к упражнениям гл. 3. Значение медианы расположено в интервале между
значениями 39 и 49 и равно примерно 44 [39+1/5(49—39)]. Проверка по дан-
ным инвентаризации, при которой подсчет наблюдений производился, начиная
с наименьших значений показателей, подтверждает этот вывод.' Заметим, что
значение средней превышает значение рассчитанной только что медианы. По-
добный результат характерен для распределений с положительной асимметрией.,
3. Результаты расчетов приводятся в таблице:
Х3 d d- Х2 d а2
1 -3 9 46 -3 9
2 —2 4 47 -2 4
.3 —1 1 48 -1 1
4 0 0 49 0 0
5 + 1 1 50 1-1 1
6 4 51 -2 4
7 +3 9 52 ИЗ 9
28 0 28 343 0 28
м 4 0 4 49 0 4
19-1778
28)
Средняя первого набора чисел равна 4, второго набора 49,0.
4. S=^Sd2fN. Выражение "Zd2!N (которое представляет собой дисперсию,
S2) в обоих случаях равно 4,0: Следовательно, S=y4=2,0.
5. Поскольку только что полученное значение стандартного отклонения оди-
наково для обоих наборов чисел, отсюда следует, что прибавление одного и то-
го же значения к каждому из наблюдений распределения не приводит к изме-
нению величины стандартного отклонения.
6. Z1=(l—4)/2=—3/2=—1,5;
Z4=(4—4)/2=0/2=0;
Z, = (7—4) /2 = + 3/2 = + 1,5;
Z47=(47—49)/2=—2/2=—1,0;
/49= (49—49)/2=0/2=0;
Zsi= (51—49)/2= +2/2= +1.
Первая из указанных площадей заключена в интервале, границы которого
расположены на расстоянии 0,6745 стандартного отклонения по обе стороны от
значения средней: 50±0,6745Х 10=50+6,745=43,255 и 56,745. Другие значения
площадей соответственно расположены в интервалах, границы которых опреде-
ляются следующими показателями: 50+1 стандартное отклонение =40 и 60;
50+2 стандартных отклонепия=30 и 70; 50+2,58 стандартного отклонения=24,20
и 75,80.
8. Из ответов на вопросы, поставленные в упражнении 7, следует, что 75%
наблюдений расположено выше значения 43,255; 25% выше значения 56,745.
9. Данный процент наблюдений заключен в интервале, границы которого
определяются значением средней минус 1 стандартное отклонение (половина
интервала, в котором заключено 68% наблюдений, так как нормальное распре-
деление является симметричным) и значением средней плюс 2 стандартных от-
клонения (половина от 95%). Таким образом, 34%+47,5% = 81,5%.
10. Поскольку значения 70 и 30 расположены соответственно на 2 стандарт-
ных отклонения выше и ниже средней и поскольку в интервале, определяемом
этими значениями, заключено 95% наблюдений, то вне этого интервала нахо-
дится 5% наблюдений (искомое значение). По аналогичным причинам во вто-
ром случае соответствующее значение равно 1%.
11. Приведенные только что значения как раз и используются при проверке
нулевых гипотез в качестве стандартных (1 и 5%) уровней значимости.
7. ВЫБОРОЧНЫЙ МЕТОД И ПОЗНАНИЕ МИРА
Упражнения
Одним из основных понятий, рассмотренных в гл. 7, является понятие вы-
борочного распределения и его связь с объемом осуществляемых выборок.
В приведенных далее таблицах содержатся данные, которые помогут прояснить
существо некоторых связанных с этими вопросами проблем. Эти данные пред-
ставляют собой средние двух наборов выборок, извлеченных из таблицы случай-
ных чисел. В одном из этих наборов N=5, в другом N= 10.
1. В координатах на рис. Б.8 изобразите частотные распределения этих
средних.
а) Как называются полученные распределения?
б) Сделайте обобщенный вывод о воздействии объема выборок (#=5 про-
тив М=10) па характеристики этих распределений.
2. В столбцах таблицы, озаглавленных «Общая средняя», приводятся после-
довательные значения средних, полученные в результате представления двух
наборов, состоящих из 25 выборок одинакового объема, в виде совокупностей
выборок, объем которых непрерывно возрастает в первом случае от 5 наблюде-
ний в одной выборке до 10, 15, 20 и т. д. наблюдений в выборке, во втором
случае от 10 наблюдений до 20, 30, 40 и т. д.
а) Ознакомившись со значениями этих средних, какой вывод вы можете
сделать о точности оценивания показателя средней генеральной совокупности
при увеличении значения N?
б) Какое отношение данное явление имеет к закону больших чисел?
282
Средняя
Рис. Б.8. График к упражнению 1 гл. 7
Выборка Выбо- рочная средняя (ЛГ=5) Обшая сред- няя Выбо- рочная средняя (/V- 10) Обща я сред- няя В ыборка Выбо- ром на я средняя (W-5J Общая сред- ня я Выбо- рочная средняя (AZ«10) Общая сред- няя
1 3,2 3,2 3,4 3,4 16 4,8 4,7 4,5 4,5
2 4,2 3,7 5,5 4,4 17 3,2 4,6 3,7 4,5
3 3,2 3,5 4,0 4,3 18 3,8 4,5 4,1 4,4
4 5,6 4,0 4,3 4,3 19 6,2 4,6 4,5 4,4
5 3,6 4,0 4,2 4,3 20 5,8 4,7 4,3 4,4
6 4,6 4, 1 3,2 4, 1 21 6,4 4,8 5,9 4.5
7 2,0 3,8 4,2 4,1 22 4,0 4.7 5, 1 4,6
8 6,0 4,0 3,5 4,0 : 23 3,4 4,7 5,5 4.6
9 4.8 4,1 3,8 4,0 24 2,6 4,6 2.9 4, 5
10 6,4 4,4 6,3 4,2 25 4,2 4,6 4,0 4,5
11 4,8 4,4 4,6 4,3
12 3,0 4,3 4,9 4, 3
13 14 4,4 7,0 4.2 4,5 5,2 4,4 4,4 4,4 j Средняя 4,58 1,40 4,49 0,88
15 7,2 4,7 6,2 4,5 । Ожидае-
[ мое Sm 1,28 0,91
3. Поскольку известно, что для совокупности случайных чисел <т=2,87, мы
можем для выборок объемом 5 и 10 наблюдений рассчитать Зм по формуле
19* 283
2,87
V N
Для выборок, где W=5, получаем:
Для выборок, где М=10, соответственно имеем:
Фактически полученные значения оценок, равные соответственно 1,40 и 0,88,
приводятся в нижней части таблицы.
а) Какой из этого можно сделать вывод о влиянии объема выборки на
оценку Sm?
б) Что можно сказать в связи с этим о предположениях, лежащих в основе
применения тестов по проверке статистических гипотез?
4. Рассмотрим теперь несколько иную проблему. Как можно использовать
имеющуюся в нашем распоряжении информацию о влиянии N на оценки сред-
ней для объяснения возможной ошибки в сообщении о цене дома (75 000 дол.)
в одном из пригородных районов (см. упражнение к гл. 1)?
Ответы к упражнениям
1. а) Выборочные распределения средних.
б) Выборки большего объема (Л'= 10) дают значения средних, распре-
деление которых, скорее, напоминает нормальное, чем выборочное распределение
средних, полученное по выборкам меньшего объема. Соответствующие примеры
приводятся на рис. Б.9.
Средняя
Рис. Б.9. Ответ к упражнению 1 гл. 7
284
2. а) При возрастании объема выборок оценка средней становится более
точной. При 1У=10 оценка средней отклоняется от известного значения средней,
равного 4,5, не более чем на 0,1 единицы уже после 12-й выборки, объем ко-
торой составляет 120 наблюдений. В случае с выборками объемом по 5 наблю-
дений такой точности удается добиться после 23 выборки общим объемом
в 115 наблюдений.
б) Закон больших чисел был введен в гл. 5 в связи с ожидаемыми (теоре-
тическими) долями. По мере возрастания числа наблюдений фактически полу-
чаемое значение доли все больше приближается к теоретически ожидаемому.
Очевидно, нечто аналогичное происходит и со статистиками (например, сред-
ней), рассчитываемыми для информации, имеющий непрерывную природу.
3. а) Выборки большего объема позволяют получить более точную опен-
ку Sar.
б) Выборки небольшого объема приводят к получению неточных оценок SM.
В данном случае проблема усложняется еше и тем, что выборочное распреде-
ление средних не является нормальным, и, следовательно, отсутствуют основа-
ния для применения соответствующих статистик нормальной кривой.
4. В действительности данная оценка базировалась всего лишь на двух на-
блюдениях. Очевидно, такая средняя не очень связана со значением Л'
8. КОРРЕЛЯЦИЯ
Упражнения
В упражнениях к гл. 6 уже рассчитывались S и некоторые Z-оцепкп для
следующих наборов чисел:
1
о
3
4
5
6
7
46
47
48
49
50
51
52
Итого
Средняя
1. Рассчитайте оставшиеся Z-оценки, а также коэффициент корреляции по
формуле
X(ZxZy)
' N
2. Теперь, когда в вашем распоряжении имеются Z-оценки, можно провести
перестановку значений X и У и посмотреть, как это повлияет па величину г.
Проведите соответствующее исследование для следующих пар значений:
X 1 2 3 4 5 6 7
У 52 51 50 49 48 47 46
X 1 2 3 4 5 6 7
У 48 50 . 52 . 46 51 49 47
1 Поскольку генеральная совокупность цен продавцов домов районе представлена всего лишь двумя значениями. — Примеч. пер. В данном
285
В остальных упражнениях используются две группы X и Y, для которых
имеются следующие значения статистик:
Мх = 50. Му= 100,
S.v= 10, Sy= 15,
rXy = 4- 0,60.
3. Какая доля дисперсии У объясняется корреляцией с X?
4. Если в пашем распоряжении имеется значение X, равное 70, то каким
будет ваш прогноз относительно величины соответствующего значения У? На-
поминаем, что Zv=rZx, однако это уравнение выражено в показателях Z-оценок.
5. Чему равно значение Напоминаем, что этот показатель представля-
ет собой корень квадратный из остаточной дисперсии.
6. Располагая значением Sv.x, полученным в упражнении 5, укажите грани-
цы 50%-, 68%- и 95%-иого интервалов доверительной вероятности для соответ-
ствующего значения У, прогнозная оценка которого получена в упражнении 4.
(П редупреждение. Полученное в упражнении 4 значение должно находить-
ся между 115 и 120. Значение, найденное в упражнении 5, должно находиться
между 10 и 15. Если вы получили другие значения, не попадающие в указанные
интервалы, то, прежде чем приступить к выполнению данного упражнения, про-
верьте еще раз свои вычисления и исправьте все обнаруженные ошибки.)
Ответы к упражнениям
X У zy
1 —1,5 46 -1,5 -t-2,25
2 —1.0 47 —1,0 +1.00
3 —0,5 48 —0,5 +0,25
4 0 49 0 0
Г) +0,5 50 +0,5 +0,25
6 + 1,0 51 + 1,0 + 1,00
7 + 1.5 52 + 1,5 +2,25
Итого +7,00
Средняя + 1,00
Поскольку г представляет собой среднее прогйведения Z-оценок, то г=1,00.
2. В первом случае г= 1,00. Чтобы получить коэффициент корреляции для
второго случая, проделаем все необходимые вычисления:
X Zx У Zy ^х'^у
1 —1,5 48 —0,5 +о. 75
3 —0,5 50 +0,5 —0,25
5 +0,5 52 +1,5 +0,75
7 + 1,5 46 —1,5 -2,25
2 —1,0 51 + 1,0 —1,00
4 0 49 0 0
6 + 1,0 47 —l.o —1,00
Итого —3,00
Средняя=г —0,43
286
3. r= +0,60; r2 = 0,36— доля объясняемой дисперсии. Отметьте для себя, что
ответ был бы тем же, если бы г равнялся —0,60.
4. Основные этапы вычислений таковы:
70 — 50 20 „
Zr =---------= —=2,0,
х 10 10
Zy=0,60 .2,0 = 1,2,
Y = My + (Sy Zy) = 100+ (15 • 1,2) = 118-
5. Вновь приведе.м основные этапы вычислений:
доля объясняемой дисперсии = 0,36;
доля остаточной дисперсии=0,64;
/0764 = 0,80;
0,80- 15= 12 = SV
6. В данном упражнении используется информация о показателях площади
нормальной кривой. Так, известно, что 50% площади заключено в интервале,
границы которого определяются значениями Af±0,6745S; 68% площади — в ин-
тервале с границами Л4±15; 95% площади — в интервале с границами M±‘2S.
Теперь, если вы понимаете, что прогнозное значение Y, равное 118, представля-
ет собой среднюю распределения, для" которого стандартное отклонение Sy.x
равно 12, то
50%-ные доверительные границы= 118+0,6745(12) = 110 и 126;
68%-ные доверительные границы = 118± 1,0(12) = 106 и 130;
95%-ные доверительные границы= 118+2,0(12) =94 и 142.
9. ДЕЙСТВИТЕЛЬНЫЕ И МНИМЫЕ КОРРЕЛЯЦИОННЫЕ СВЯЗИ
Упражнения
1. В исследованиях воздействия «подсознательной рекламы» на поведение
потребителей часто говорится об эффекте, производимом приказами типа «по-
купать жареную кукурузу», «пить кока-колу», которые подаются со скоростью,
превышающей порог возможностей человеческого восприятия *. В сообщениях о
результатах этих исследований, которые никогда, впрочем, не приводились в ко-
личественной форме, утверждалось, что «подсознательная реклама» приводила
к увеличению потребления рекламируемых с ее помощью продуктов. Однако
впоследствии пришли к выводу, что полученные в этих исследованиях результа-
ты следует рассматривать в контексте проблемы базовых оценок. Можете ли вы
объяснить, почему так произошло?
2. Повторное обследование людей, проявивших в детстве выдающиеся спо-
собности, проведенное спустя 20 лет после первого такого обследования, пока-
зало, что средний коэффициент IQ этих людей уменьшился со 145 до 115 пунк-
тов. Авторы данного обследования объяснили полученный результат отсутстви-
ем стимулирующего воздействия окружающей среды. Альтернативное объясне-
ние может состоять в том, что выявленное снижение значения IQ частично, а
возможно, и полностью — следствие регрессионного эффекта.
а) Зная о том, что совокупность коэффициентов IQ является нормально
распределенной и что нормально распределенные совокупности формируются под
воздействием множества независимых причин, можете ли вы связать данный
факт с явлением регрессии к средней?
б) В приведенном выше примере два теста по определению значений коэф-
фициентов IQ с точки зрения методики их проведения существенно различаются.
1 Этого удается достигнуть, например, посредством вклеивания в ленту
кинофильма отдельных кадров с рекламой соответствующих товаров. Поскольку
скорость движения кинопленки такова, что человеческий глаз не в состоянии
зафиксировать прохождение по экрану отдельного кинокадра, рекламные встав-
ки остаются незамеченными. — Примеч. пер.
287
Предположим, однако, что среднее значение совокупности коэффициентов IQ
в обоих случаях составило 100, а стандартное отклонение 15 пунктов. По имею-
щимся в нашем распоряжении данным определите величину корреляции между
этими тестами.
В приведенной таблице содержатся данные о средней результативности
18 лучших игроков .бейсбольной команды после 45 игр, а также в конце сезо-
на [1]. Как видно из таблицы, средние, рассчитанные по показателям 45 игр,
являются не очень хорошей основой для прогнозирования значений сезонных
средних. Коэффициент корреляции между ними равен всего 4-0,23. Соответст-
вующие данные нанесены на график, представленный па рис. Б.10. Линия ре-
грессии, связывающая прогнозные значения сезонных средних е 45-дневными
средними, также приводится па этом графике. Числа, проставленные возле каж-
дой точки, указывают па номер игрока в таблице.
Игрок 43-днев- ная средняя Сезонная средняя Прог- нозное значение средней Игрок i 45 днев- ная | средняя Сезонная средняя Прог- нозное значение средней
1 400 340 277 и 225 265 253
2 380 290 275 12 225 260 253
3 360 280 272 13 225 305 253
4 330 220 268 14 225 265 253
5 315 275 266 15 220 225 2.52
6 315 220 266 16 200 280 250
7 285 215 261 17 180 320 248
8 270 210 260 18 160 200 245
9 240 270 255
10 240 230 255 Средняя 266 259 ' 259
3. Можно ли назвать коэффициент корреляции, равный +0,23, коэффшщен-
том надежности и/или коэффициентом обоснованности? Почему?
4. Предположим, что после 45 игр руководство клуба решило отчислить из
команды тех игроков, средняя результативность которых оказалась ниже 266,
и оставить только тех игроков, средняя результативность которых превысила
это значение. Будем считать, что успешным решением является решение о со-
хранении в команде игрока, потенциальное значение сезонной средней которого
превышает 259 (сезонную среднюю), и отчисление игрока, чья средняя окажется
нижи этой оценки. По отношению к каким игрокам данное решение окажется
правильным?
288
5. Разделите неправильные решения на две группы: несправедливые по от-
ношению к игрокам и несправедливые по отношению к клубу.
6. Статья [1], из которой взяты использованные нами данные, называется
«Парадокс Стейна». «Парадокс Стейна» состоит в том, что в большинстве ста-
тистических ситуаций характеристики, полученные для прошлого, представляют
собой наилучший прогноз характеристик, которые будут получены в будущем.
Однако в данном случае это не так, поскольку прогноз, осуществленный с по-
мощью коэффициента корреляции, оказался лучше для 14 игроков из 19.
а) Укажите этих игроков.
б) Какую концепцию иллюстрирует данный результат?
в) Как можно объяснить данное явление с точки зрения факторов, воздей-
ствие которых обусловливает изменения в уровне результативности бейсболи-
стов?
г) Если вы — азартный человек, то можете в некоторых случаях выиграть
пари, заключенное в середине сезона о будущих результатах игроков. Каким
образом?
Ответы к упражнениям
I. В действительности на результаты, полученные в этих исследованиях, не-
видимому, повлиял тот факт, что в дни проведения экспериментов температура
воздуха была ниже средней. Поэтому люди чаще, чем в среднем, покупали в эти
дни горячую поджаренную кукурузу, соленый привкус которой вызывал жажду,
утоляемую кока-колой.
2. а) Крайние значения (высокие пли низкие) появляются в результате слу-
чайного сочетания множества чрезвычайно благоприятных пли неблагоприятных
не зависящих друг от друга условий. Характеристики, измеряемые, повторно,
вряд ли будут определяться подобным необычным сочетанием условий, и полу-
ченный при этом результат будет выглядеть не столь уникальным, как раньше.
б) Поскольку первоначально полученный коэффициент IQ на 3 стандартных
отклонения превосходит значение средней, а при повторном измерении — только
па одно стандартное отклонение, то в соответствии с формулой Zv = rZ.x значе-
ние г должно быть равным +0,33, т. е. 1,00 — 0,33-3,0. Хотя применявшиеся при
проведении этих измерений тесты существенно отличались друг от друга, мало-
вероятно, что коэффициент корреляции между ними был меньше значения +0,50.
Следовательно, некоторая часть уменьшения значения IQ обусловлена воздейст-
вием реальных факторов.
3. На мой взгляд, этот коэффициент корреляции -можно назвать коэффици-
ентом обоснованности — в том смысле, что с его помощью может прогнозиро-
ваться интересующая исследователя характеристика; однако он также является
(низким) коэффициентом надежности, поскольку получен на базе двух последо-
вательных измерений одного и того же объекта.
4. Принятые решения будут правильными только по отношению к игрокам
1, 2, 3, 5, 10, 15 и 18.
5. Несправедливость по отношению к игрокам 9, 11, 12, 13, 14, 16 и 17.
Несправедливость по отношению к клубу 4, 6, 7 и 8.
6. а) Прогнозы па основе использования коэффициента оказались лучше
для всех игроков, за исключением 1, 10, 15 и 18.
б) Регрессию к средней, поскольку лучший прогноз по показателю г (зна-
чение которого очень невелико) не отличается по своей точности от прогноза,
осуществленного для всех игроков с помощью показателя средней.
в) Регрессионная ошибка.
г) Нужно заключить пари о том, что к концу сезона показатели ведущих
игроков ухудшатся, а слабых игроков улучшатся.
10. ANOVA
Перед тем как приступить к ознакомлению с материалом данного раздела,
полезно повторить вопросы, связанные с факторными экспериментами (см. гл. 4).
Тогда вы сможете лучше оценить эффективность методов, рассматриваемых да-
лее.
Упражнения
Предположим, проводится исследование показателей, характеризующих уро-
289
вень преступности п трех типах районов, различающихся по среднему уровню
дохода на душу населения (А — бедный район, В — средний, С—богатый),
в которых деятельность полиции также характеризуется тремя уровнями актив-
ности (1 — активность полиции после начала эксперимента не изменилась, 2 —
активность полиции после начала эксперимента снизилась, ее отношение к пра-
вонарушениям стало более терпимым, 3 — активность полиции после начала
эксперимента возросла). Допустим, имеется по пять районов каждого из ука-
занных типов — пять наблюдений на каждую клетку таблицы эксперимента. На-
конец, предположим, что получены следующие данные о среднем для соответ-
ствующих районов числе преступлений в расчете на тысячу человек: А—• 1, 40;
В— 1, 35; С— 1,30. Л —2, 35; В — 2, 30; С — 2, 25. А —3, 45; В —3, 45;
С —3, 45.
1. Постройте схему исследования и отразите в ней полученные результаты.
2. Заполните приведенную часть таблицы ANOVA:
Источник вариации Степень свободы
Итого
3. Предположим, что все различия в данных, обобщенные по соответствую-
щим условиям, значимы.
а) Имеется ли тогда главный эффект типа района?
б) Имеется ли главный эффект уровня активности полиции?
в) Имеется ля взаимодействие?
Предположим, что некоторая организация потребителей произвела сравне-
ние трех типов малолитражных автомобилей, изготовленных в Италии, Японии
и ФРГ. Причем оценивались такие характеристики, как удобство в управлении,
плавность хода, надежность тормозов, мощность мотора. Оценки выставлялись
по следующей 4-баллыюй шкале: 4 — отлично, 3 — хорошо, 2 — удовлетвори-
тельно, 1 — плохо. Была осуществлена единственная выборка, в которой было
отобрано по одному автомобилю каждого типа (данный факт имеет важное зна-
чение) посредством анонимной покупки машин у местных агентов соответствую-
щих фирм. Допустим, при оценивании были получены следующие результаты:
Тип авто- мобиля Оцениваемые характеристики •средняя
удобство мощность торм оз а ход
ФРГ 3 3 4 3 3,25
Япония 2 2 .3 2 2,25
Италия 1 1 2 1 1,25
Средняя 2,0 2,0 3,0 2,0
290
4. а) Свидетельствуют ли данные таблицы о наличии главного эффекта оце-
ниваемых характеристик?
б) Имеется ли главный эффект типа автомобиля?
в) Имеется ли взаимодействие?
5. Заполните следующую таблицу ANOVA. Возможно, в процессе ее запол-
нения вы кое-чему удивитесь. Некоторые ответы покажутся вам ошибочными.
Однако это не так.
Источник вариации Степени свободы
Внутри групп
Итого
6. Предположим, при покупке автомобиля вас в первую очередь интересует
плавность его хода. В какой степени вы склонны доверять полученной в иссле-
довании высокой оценке этого качества у автомобилей, изготовленных в ФРГ.
Ответы к упражнениям
Уровень активности полицип Тип района Итого
А в с
1 40 35 30 105
2 35 30 25 90
3 45 45 45 135
Итого 120 НО 100
Источник вариации Степени свободы
Тип района 2
Активность полиции . 2
Взаимодействие 4
Внутри групп 36 -
Итого 44
3. а) Да. б) Да. в) Да.
4. а) Да. б) Да. в) Нет.
5. Поскольку в нашем распоряжении имеется только по одному автомобилю
291
каждого типа, число степенен свободы для показателя внутригрупповой диспер-
сии равно нулю:
Источник вариации Степени свободы
Оцениваемые характеристики Тип автомобиля 3 2
Взаимодействие 6
Внутри групп 0
Итого 11
6. Очень в незначительной. Поскольку число степеней свободы внутри групп
равно нулю, вы не можете обобщить какую-либо единичную оценку на всю со-
вокупность автомобилей данного типа. Однако тот факт, что оценке подверга-
лись четыре характеристики автомобиля, позволяет сделать (возможно, сущест-
венно более важный) обобщающий вывод о превосходстве перед другими рас-
смотренными малолитражками автцмобилей, изготовленных в ФРГ. Данный при-
мер является иллюстрацией важной проблемы, связанной с оценкой дорогостоя-
щих товаров. При отборе всего лишь одного экземпляра вы не можете распро-
странить результат, полученный при исследовании этого экземпляра, на совокуп-
ность в целом, если у вас пет оснований считать, что в производстве данного
продукта достигнут очень высокий уровень стандартизации. Подобное предпо-
ложение, однако, довольно рискованно. В выпущенной на заводах продукции
встречаются и бракованные изделия. Так, например, автомбили, изготовленные
накануне или сразу после окончания уикэнда с большей вероятностью, чем ав-
томобили, выпущенные в другие дни недели, могут оказаться бракованными.
ЛИТЕРАТУРА
1. Efran В, М о г г i s С. Stein’s paradox in statistics. Scientific American, 236,
1977, p. 119—127.
. 2. Fen'z. W. D. Conflict and stress as related physiological motivation and sen-
sory, perceptual and cognitive functioning. Psychological Monographs, 78, 1964,
Whole N 8.
3. F r e u n d J., W i 11 i a m s F. Elementary business statistics: the modern appro-
ach. Englewood Cliffs. N. Y., Prentice-Hall, 1972.
4. Hess E. II. The role of pupil size in communication. Scientific American, 232,
1975, p. 110—118.
5. Holt E. B. Animal Drive and the Learning Process. N. Y., Henry Holt, 1931,
p. 4—5.
6. H u f f D. How to Lie with Statistics. N. Y., W. W. Norton, 1954.
7. JacobyO. On poker. N. Y., Doubleday, 1946.
8. К a h n e m a n D., Tversky A. On the psychology of prediction. Psychologi-
cal Review, 80, 1973, p. 237—251.
9. Larsen R. S., S t г о u p D. F. Statistics in the real World. N. Y., Macmillan,
1976.
10. Lindquist E. F. Statistical analysis in Educational Research. Boston,
Houghton Mifflin, 1940, p. 48—50.
11. Moroney M. J. Facts from figures. Middlesex, England, -Penguin Books,
Ltd., 1951.
12. Mosteller F., Kruckal W. II., Link R. J7., Pieters R. S., Ri-
sing G. R. Statistics by Example: Exploring Data. Reading, Mass., Addison-
Wesley, 1973.
13. M о s t e 11 e r F., W a 1 1 a c e D. L. Deciding authorship. In: J. M. Tanur, et al.
Statistics: A Guide to the Unknown, San Francisco, Holden-Day, 1972.
292
14. P h i 11 i p s D. P. Death and birthday: an unexpected relationship. In Tanur J.,
Mosteller F. et al. (eds) Statistics: a Guide to the Unknown. San Francisco,.
Holden-Day, 1972.
15. Rahe R. H. Subjects’ recent life changes and their near future illness re-
ports.— Annals of Clinical Research, 14, 1972, p. 250—265.
1G. Schutte J. G. Everything you always Wanted to know about 1 .huiienlary
Statistics tbut were afraid to ask). Englewood Cliffs. N. Y., Prentice Hall, 1977.
17. Snedecor G. W. Statistical Methods. 3rd ed. Ames, Iowa, The Iowa State
College Press, 1940.
18. Stone L. J., Church J. Childhood and Adolescence. N. Y., Random House,
1973.
19. Tennov D. Psychotherapy: The Hazardous Cure. Garden City. N. Y., Doub-
leday, 1976.
20. Vanek J. Time spent in housework. Scientific American, 231, 1974, p. 116—120.
21. Wallis W. A., Roberts H, V. The Nature of Statistics. N. Y., Free Press,
1962.
22. Worth F. E. The Trivia Encyclopedia. Los Angeles, Brooke House, 1974.
ОГЛАВЛЕНИЕ
Предисловие к русскому изданию.......................................5
Предисловие.................................................... . 13
1. Природа статистики..........................................15
2. Графическое изображение данных.......................35
3. Частотные распределения.....................................55
4. Задачи науки................................................71
5. Законы случайностей.........................................95
6. Нормальная кривая..........................................120
7. Выборочный метод и дознание мира........................., 144
8. Корреляция ................................................173
9. Действительные и мнимые корреляционные связи...............193
10. ANOVA .....................................................218
Приложение ................................................. 238
Заключительные комментарии........................................271
Литература ..................................................292
Г. КИМБЛ
Как правильно пользоваться статистикой
Книга одобрена па совместном заседании редколлегий
серий «Математико-статистические методы за рубежом»
и «Библиотечка иностранных книг для экономистов и
статистиков» 20.05.80
Зав. редакцией А. В. Павлюков
Редактор Е. В. Крестьянинова
Мл. редактор О. Б. Стеаанченко
Техн, редактор И. В. Завгородняя
Корректоры Г. А. Башарина, 3. С. Кандыба
Худож. редактор О. Н. Поленова
ИБ № 1104
Сдано в набор 16.04.82. Подписано в печать 4.10.82.
Формат 60X90Vie. Бум. тип. № 3.
Гарнитура «Литературная». Печать высокая. П. л. 18,5.
Усл. п. л. 18,5. Уел. кр.-отт. 18,75. Уч.-изд. л. 19,88.
Тираж 20000 экз. Заказ 1778. Цена 1 р. 30 к.
Издательство «Финансы и статистика», Москва, ул. Чер-
нышевского, 7
Великолукская городская типография управления
издательств, полиграфии и книжной торговли
Псковского облисполкома, г. Великие Луки,
ул. Полиграфистов, 78/12
Кимбл Г.
К40 Как правильно пользоваться статистикой/Пер. с англ.
Б. И. Клименко; Предисл. II. К. Дружинина.—М.: Финан-
сы и статистика, 1982. — 294 с., ил.— (Б-чка иностр, книг
для экономистов и статистиков).
В пер.: 1 р. 30 к.
В книге в популярной форме излагаются основные вопросы математической
статистики. Рассматривается применение статистических методов при интерпрета-
ции результатов научного эксперимента.
Для экономистов, статистиков, социологов, студентов и аспирантов эконо-
мических вузов и факультетов.
0702000000—166 ББК 22J72
Д 010(01)-82 в 517.8