Автор: Воронов И.А.
Теги: формы лекарственных средств медицинские материалы оборудование строительство статистика базы данных социологические исследования учебное пособие компьютерные технологии
ISBN: 978-5-89160-054-6
Год: 2008
Федеральное агентство связи
Государственное образовательное учреждение
высшего профессионального образования
«Санкт-Петербургский Государственный университет телекоммуникаций
имени проф. М.А. Бонч-Бруевича»
И.А. Воронов
ЭКСПЕРИМЕНТ
и методы обработки многомерных данных
в исследованиях человека
с применением SPSS:
медико-биологические исследования,
психология, физическая культура и спорт
Учебное пособие
200401
Санкт-Петербург
2008
УДК [621.37/.39:615.47] (075.8)
ББК 380:P
В 75
Рецензенты:
профессор, доктор технических наук, заведующий кафедрой
биомедицинской техники СПбГУТ им. проф. М.А. Бонч-Бруевича,
генеральный директор ассоциации электронной промышленности
Санкт-Петербурга, заместитель директора НПО «Авангард»
Н.П. Меткин
доктор технических наук, ведущий научный сотрудник
лаборатории биомедицинской информатики СПИИРАН
В.А. Дюк
Одобрено в качестве учебного пособия редакционно-издательским советом университета
В 75
Воронов, И.А. Эксперимент и методы обработки многомерных данных в исследованиях человека с применением SPSS: медикобиологические исследования, психология, физическая культура и спорт:
учебное пособие. 200401 / И.А. Воронов; ГОУВПО СПбГУТ. – СПб.,
2008. –100с.
ISBN 978-5-89160-054-6
Рассмотрены различные планы и техники экспериментов. Особое внимание
посвящено методам обработки многомерных данных с помощью компьютерного статистического пакета SPSS.
Предназначено для студентов специальности 200401 «Биотехнические и медицинские аппараты и системы». Соответствует программе «Методы обработки биомедицинских сигналов и данных».
Может быть полезно специалистам и аспирантам, бакалаврам и магистрам
специальностей и направлений, связанных с человекознанием.
УДК [621.37/.39:615.47] (075.8)
ББК 380:P
ISBN 978-5-89160-054-6
© Воронов И.А., 2008
© Государственное образовательное
учреждение высшего профессионального образования
«Санкт-Петербургский государственный университет
телекоммуникаций им. проф. М.А. Бонч-Бруевича», 2008.
2
Содержание
Введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1. Экспериментальные планы с малыми объемами выборок. . . . . . . . . . . .
6
2. Экспериментальные планы с большими объемами выборок. . . . . . . . . . 14
3. Методы обработки многомерных данных. . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1. Классификация многомерных методов. . . . . . . . . . . . . . . . . . . . . . . 47
3.2. Множественный регрессионный анализ (МРА) . . . . . . . . . . . . . . . 48
3.3. Дискриминантный анализ (ДА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4. Факторный анализ (ФА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5. Кластерный анализ (КА) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6. Многомерное шкалирование (ММШ) . . . . . . . . . . . . . . . . . . . . . . . . 65
4. Техники экспериментов O, P, Q, R, S, T. . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Приложение 1. Пример экспериментального плана с малым объемом
выборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Приложение 2. Пример экспериментального плана с большим объемом
выборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Приложение 3. Статистические таблицы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Литература. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3
ВВЕДЕНИЕ
Non scholae, sed vitae discimus.
Не для школы, но для жизни учимся.
Человечество изобрело множество методов познания окружающего мира.
Если речь идет о религии, то здесь методом познания является личный опыт
общения с тем, что люди назвали богом, посредством соблюдения определенных ритуалов в соответствии с религиозным календарем. Роль учебных центров в религии играют монастыри.
Если же речь заходит о науке, то основными методами познания здесь
являются классификация собранной первичной информации, эксперимент, математические методы анализа данных и поиска знаний в этих данных, наконец,
уточненная классификация научной информации и моделирование. Учебные
центры – университеты.
Алгоритм познания можно представить в форме шести последовательных взаимосвязанных шагов:
1. Выбор объекта и предмета познания (исследования), явления, процесса.
2. Регистрация явления, процессов, детектирование, измерение, тестирование
или диагностика, создание баз данных; анализ.
3. Выявление закономерностей, обработка данных, создание баз знаний; синтез.
4. Первичная (экспериментальная) попытка управления объектом и предметом
познания (исследования), явлением, процессом; проект модели.
5. Обратная связь, коррекция.
6. Надежное управление объектом и предметом познания (исследования), явлением, процессом; окончательная модель.
Одним из наиболее сложных объектов познания является сам человек. До
сих пор в науке не существует четких окончательных моделей организма человека, его психики, поведения. Одним из многочисленных примеров тому является противостояние Западной (биолого-анатомической) и Восточной (информационно-энергетической1) моделей функционирования организма человека и
связанных с ними методов воздействия на человека – лечения человека, адаптации, научения (обучения и тренировки), развития индивидуальных и личностных качеств, качеств субъекта деятельности.
Необходимо учитывать и тот факт, что, с одной стороны, развитие, в настоящее время, компьютерных технологий явилось предпосылкой широкого внедрения методов математического анализа в науки о человеке: медико-биологические исследования [4], психологию [6], физическую культуру и спорт [3].
С другой стороны, уровень овладения специалистами указанных областей деятельности математико-статистическими методами обработки данных оставляет желать лучшего. Не только дипломные работы студентов, но и научные
Имеется в виду восточное понятие «ци» – «жизненная сила», некорректно переводимое на русский язык как «энергия» или «пневма».
1
4
исследования более высокого уровня не дают повода для оптимизма. И цитата
из юмористического рассказа О’Генри, приведенная ниже, к сожалению, все
чаще становится нормой расчетов данных экспериментальных исследований в
таких «НИР»: «Если я съел курочку, а ты остался голодным, значит, в среднем
мы съели по пол курочки».
Для устранения сложившегося противоречия и написано настоящее
учебно-методическое пособие.
Первый раздел посвящен рассмотрению планов экспериментов с малым
количеством объектов исследования.
Второй раздел рассматривает эксперименты с большими объемами выборок.
Третий раздел кратко описывает на примерах методы обработки многомерных данных с помощью компьютерного статистического пакета SPSS.
Примеры, приведенные в разделе 3 для расчетов в программе SPSS, в электронном виде, можно заказать, отправив по электронной почте woronoff1960@mail.ru запрос с пометкой «примеры SPSS» и Вам будет выслан файл
«Воронов_примеры.rar» (3,65 кб), а также, если требуется, файл «Иллюстрированный самоучитель по SPSS.rar» (5,72 Мб). Некоторые примеры заимствованы
из [4, 7].
В четвертом разделе описаны планы экспериментов типов O, P, Q, R, S,
T, где исследуются объект (O, P), условия (Q, R) и методика (S, T).
Особое внимание автор обращает на прил. 1 и 2. Это одни из лучших образцов проведения экспериментов по указанным планам с малыми и большими
выборками, с одной стороны, и подходов к исследованию человека, с другой.
Естественно, эти два примера не исчерпывают всего многообразия экспериментальных подходов, но они могут быть преподнесены в качестве крайних образцов широкого спектра экспериментов. Указанная структура учебнометодического пособия продиктована реалиями сегодняшнего дня и многолетним опытом преподавания дисциплины автором.
Так как пособие предназначено прежде всего для приобретения навыков
практических расчетов, оно, в основном, построено на конкретных примерах.
Автор не ставит своей задачей теоретический анализ методов математической
статистики, не заостряет внимание на причинах выбора тех или иных методов
анализа данных, он предлагает ряд примеров, которые моделируют наиболее
часто встречающиеся задачи из практики.
Автор с благодарностью примет все конструктивные предложения по
улучшению настоящего учебно-методического пособия. Отзывы можно направлять на электронный адрес, указанный выше.
И.А. Воронов
14 января 2008 г.
5
1. ЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ
С МАЛЫМИ ОБЪЕМАМИ ВЫБОРОК
Исследование, базирующееся на одиночном испытуемом или малой выборке, называется планом с малым n, или малым числом испытуемых. Большинство исследований в психологии базируется на большой совокупности испытуемых, которая позволяет получить большое количество данных. Соответствующие им планы экспериментов иногда называют планами с большим n [9].
Данные, полученные в ходе этих экспериментов, подлежат статистическому анализу, в котором могут быть сделаны вероятностные заключения и
широкие обобщения. В силу огромной популярности экспериментов с большим
n и их сопоставимости с современными статистическими приемами может показаться, что планы с малым n с методологической точки зрения второстепенны. Однако в таких отраслях наук о человеке, как клинические исследования,
психофизика, оперантное научение и спорт высших достижений, проведение экспериментальных планов с большими n зачастую оказывается просто невозможным.
Исследования, проводимые на одном испытуемом, связаны с особыми
проблемами. В этих экспериментах измерения производятся до и после введения независимой переменной, а это означает, что сравнения производятся в
различные периоды времени. В начальный период проводятся измерения с тем,
чтобы определить исходный уровень (или базис), например, поведенческих характеристик, которые существуют до введения независимой переменной. Эти
поведенческие характеристики можно измерить с помощью тестов, которые
оценивают несколько черт поведения. Если исследователя интересуют эмоциональные изменения, которые происходят после введения независимой переменной, например, после введения в организм лекарства, меняющего настроение, базис может включать в себя описание нескольких характеристик, таких
как ощущение счастья, непосредственность и общительность. После введения
независимой переменной, в данном случае лекарства, меняющего настроение,
производятся последующие оценки по тем же самым многомерным характеристикам. Эти показания сравниваются с исходным уровнем и представляют собой главный эффект исследования.
Клиническая психология. Поскольку в исследованиях с одним испытуемым решающую роль играют индивидуальные различия, необходимо подробное описание испытуемого. В исследованиях в области психотерапии это описание включает в себя «историю болезни», пример которой приведен в прил. 1.
Автор эксперимента Реймонд Новако [9] дает описание клинических данных
испытуемого, которые включают в себя описание его производственной ситуации, симптомы, госпитализацию, реакцию на стрессовые ситуации и предыдущее лечение. В клинических исследованиях идентификация этих характеристик
особенно важна, так как именно определяют методику дальнейшего лечения.
6
Психофизические исследования. В психофизических экспериментах, как
правило, изучается связь между физическими стимулами и тем, как испытуемый воспринимает эти стимулы. Во многих психофизических экспериментальных моделях каждый испытуемый подвергается воздействию десятков или даже сотен различных стимулов во время одного эксперимента. Тем самым, хотя
количество наблюдений в психофизических экспериментах и базируется всего
лишь на нескольких испытуемых (или даже на одном испытуемом), оно может
превышать количество наблюдений в эксперименте с большим n. Кроме того,
во многих психофизических экспериментах испытуемые не догадываются о
возможном результате эксперимента. Фактически многие исследователи в этой
области сами берут на себя роль испытуемых в собственных экспериментах,
мотивируя это тем, что реакции испытуемого имеют физический характер и на
них не влияет знание теории или гипотезы. Этот аргумент станет еще более основательным, если принять во внимание то, через какое большое количество
опытов проходит каждый испытуемый.
Сюда же можно отнести и психофизиологические тесты.
Спорт высших достижений. Не секрет, что существуют «одиночные»
виды спорта. Здесь ставка делается на одного или несколько спортсменов, которых обслуживает целая команда специалистов: тренеры, врачи, психологи и
др. Функциональное, психическое и профессиональное состояние спортсмена –
залог победы государства на международных соревнованиях. Проигрыш спортсмена обходится слишком дорого. По его выступлению судят не только о спортивных достижениях в стране, но, порой, и о самой стране. Поэтому в спортивной науке провести экспериментальный план с большим n зачастую просто невозможно. Спортсмена исследуют большим количеством тестов с применением
информационных технологий [3] и компьютерных методов обработки данных.
Оперантное обусловливание. В начале XX в. в исследовательской деятельности психологов, специализировавшихся в области научения, доминировали две модели научения. Одна из них была разработана И.П. Павловым и называется классическим обусловливанием; вторая была предложена
Э.Л. Торндайком, усовершенствована Б.Ф. Скиннером и носит название оперантного обусловливания. Начальные эксперименты в обоих направлениях исследований ставили целью идентифицировать необходимые для научения условия, используя подопытных животных. Павлов прибегал к помощи своих
знаменитых выделявших слюну собак, а Торндайк исследовал, как эффект вознаграждения отражается на поведении кошек. Скиннер в своих экспериментах
сначала использовал крыс, затем голубей и, наконец, наряду с различными видами животных, людей. Сейчас в лабораториях, где исследуются процессы
научения, имеет место все более широкое использование различных видов животных для определения законов поведения.
Основу классического обусловливания, по Павлову, демонстрирует
схема условного рефлекса. Известно, что проблему научения можно свести к
выработке сложного комплекса условных рефлексов. Прежде чем приступать к
7
изучению всего этого комплекса, необходимо рассмотреть простой одиночный
условный рефлекс. Классический «слюнный» рефлекс можно описать следующим образом.
1. Когда собаке дают мясо (безусловный раздражитель), у нее выделяется слюна (безусловный рефлекс).
2. Звонит звонок, затем собаке дают мясо; это повторяют несколько раз.
3. Звонит звонок (условный раздражитель), у собаки выделяется слюна; условный рефлекс образовался.
4. Если условный раздражитель повторяется несколько раз, но собаке не дают
мяса, она перестает реагировать на звонок; рефлекс угасает.
Алгоритм выработки условного рефлекса – это алгоритм высшего порядка, который изменяет, в соответствии с внешними условиями, алгоритм работы управляющей системы (системы безусловных и закрепившихся условных
рефлексов). Выявление алгоритмов работы сложной управляющей системы,
каковой является головной мозг, очень важно для понимания работы мозга.
Еще в 1958 г. отечественный исследователь А.А. Ляпунов указывал:
«Критерием того, что функционирование некоторой управляющей системы
изучено, является возможность моделировать ее...». Зная алгоритм выработки
условного рефлекса, можно моделировать это явление на ПК или построить
нервную сеть, поведение которой будет описываться этим алгоритмом. Последнее значительно интереснее, так как построенная нервная сеть позволит
представить себе структуру и принципы строения нервных сетей, делающих
возможным обучение и приспособление к окружающей обстановке, адаптацию.
Обозначим безусловный раздражитель буквой F, событие «появился безусловный раздражитель» – p(F); p(F) = 1, если безусловный раздражитель появился и p(F)=0, если он не появился. Условный раздражитель обозначим G, и
р(G) – событие «появился условный раздражитель».
Имеется специальный математический аппарат для описания строения
алгоритмов – логические схемы алгоритмов. Отдельные части алгоритма, перерабатывающего информацию, называются операторами. Будем обозначать их
прописными латинскими буквами. В алгоритм могут входить некоторые логические условия, которыми определяется дальнейший порядок выполнения алгоритма. Будем обозначать логическое условие Р(Е). Так, в нашем алгоритме
логическими условиями будут Р(G) и P(F). Логическое условие, например Р(G)
будет выполнено, если появляется раздражитель G.
Алгоритм состоит из нескольких частей – операторов. Последовательное
выполнение нескольких операторов будем обозначать как их произведение.
Например, запись
A1·A2·A3·A4
означает, что сначала выполняется оператор A1 , затем A2 и т. д.
Выражение, составленное из операторов и логических условий, называется логической схемой алгоритма.
Например, логическая схема алгоритма безусловного рефлекса (F→a):
8
1,2
↓ K(F) P(F) 1↑Aω 2↑
где: К(F) – оператор ввода информации;
А – оператор выполнения действия а, т. е. этот оператор заставляет систему совершить действие а;
ω – тождественно ложное условие, т. е. оно всегда не выполняется и поэтому всегда означает переход по стрелке;
Стрелки в этой схеме означают переход к следующей oneрации в случае
невыполнения логического условия. Каждая стрелка имеет начало (стрелка вверх)
и конец (стрелка вниз). Начало и конец отмечаются одинаковыми цифрами.
Для приведенного алгоритма, если Р(F)= 1, т. е. появился безусловный
раздражитель, алгоритм выглядит так:
2
↓ K(F) Aω 2↑
т. е. при появлении F система отвечает действием а и возвращается в исходное
состояние по стрелке 2 (так как ω – тождественно ложное условие, т. е. оно
всегда не выполняется и поэтому обозначает безусловный переход по стрелке).
Построим теперь логическую схему алгоритма выработки простого условного рефлекса. Пусть в системе имеется запоминающий элемент, который
хранит возбуждение, связанное с событием GΛF (Λ – логический оператор
«И»). Этот накопитель имеет порог h и, когда хранимое в нем возбуждение
превзойдет порог h, образуется связь между условным раздражителем и действием (G→a). Обозначим текущее значение содержимого накопителя r и введем
логическое условие р(r≥h) такое, что:
р (r ≥ h) = 1, если r ≥ h;
р (r ≥ h) = 0, если r < h.
Накопление возбуждения может происходить по различным законам (см.
ниже).
Введем операторы: R – оператор накопления возбуждения в накопителе
по определенному закону; S – оператор нейтрализации части возбуждения в
накопителе; K(F,G) – оператор ввода информации.
Логическая схема алгоритма запишется в виде:
3,4,7
↓ K(F,G) p(G) 1↑ p(F) 2↑ R 5,6↓ Aω 3↑ 2↓ S p(r≥h) 4↑ ω 5↑ 1↓ p(¯F) 6↑ ω 7↑
Такая запись алгоритма позволяет уже в некоторой степени представить,
какова должна быть структура нервной сети. В этой нервной сети должны быть
представлены события G, F, GΛF; эта нервная сеть должна иметь запоминающий элемент (накопитель) и какие-то переключающие элементы, управляемые
накопителем. Все эти элементы должны быть соединены в соответствии с алгоритмом.
Задача построения нервной сети по заданному алгоритму имеет неоднозначное решение, можно построить различные сети, реализующие данный алгоритм в зависимости от того, какой элемент взять за основу нервной сети. В
связи с этим возникает задача построения модели нейрона, более точно соответствующей реальному нейрону, что требует уточнения нейрофизиологических данных о нем.
9
Однако несмотря на неоднозначность решения, принципы построения
нервной сети, реализующей данный алгоритм, и ее структура в общих чертах
останутся одинаковыми для всех возможных сетей, поведение которых описывается данным алгоритмом.
Рассмотрим теперь нервную сеть, реализующую описанный алгоритм
(алгоритм выработки классического условного рефлекса). На рис. 1.1 приведена схема нервной сети, предложенная Дж. Нейманом еще в 1956 г.
Рис. 1.1
G – вход от условного раздражителя;
F – вход от безусловного раздражителя;
А – выход;
Р, N – нейроны с порогом
h = 2;
Q, М, T
– нейроны с порогом
h = 1;
R, S – накопители возбуждения
Сеть имеет два входа (G, F) и один выход (А). В необученном состоянии
раздражитель G не вызывает никакой реакции (А = 0); возбуждение же рецептора F вызывает реакцию А, что иллюстрирует наличие безусловного рефлекса.
Чтобы выработать условный рефлекс, необходимо некоторое время подавать совместно раздражители G и F.
При этом в результате каждого возбуждения пары входов G и F возбуждается нейрон Р, нейрон Q не возбуждается. Импульсы при совпадении G и F
накапливаются в счетчике R, выход которого возбуждается только тогда, когда
число пришедших импульсов превзойдет некоторую фиксированную величину.
С выхода R возбуждение передается на нейрон М (h = l) с петлей обратной связи. Этот нейрон играет роль ячейки памяти. Теперь, если появляется один раздражитель G, возникает реакция А, так как нейрон N (порог h = 2) имеет один
возбужденный вход (концевая пластина нейрона М). Условный рефлекс выработан. Если теперь на схему подается только сигнал G, то будет возбуждаться
нейрон Q. Возбуждение нейрона Q передается на счетчик S и, если событие
GΛ¯F повторяется несколько раз подряд, возбудится аксон счетчика, имеющий
концевую тормозящую пластину на нейроне М, нейрон М тормозится – рефлекс угасает.
Если в процессе обучения наряду с событием GΛF происходит событие
GΛ¯F, то возбуждается нейрон Q и происходит сброс счетчика R. Обучение
10
нужно начинать сначала. Аналогичная ситуация наблюдается при гашении
рефлекса.
Рассмотрим, какие законы накопления и нейтрализации возбуждения
реализуют операторы R и S. Из рассмотрения схемы нервной сети видно, что
оператор R реализует следующую функцию:
r1 = r + 1,
где r – содержимое накопителя. Порог накопителя h – фиксированная величина.
Оператор S более сложен; его можно представить в таком виде:
...р (r < h) 1↑ 2↓ ¯R ω 3↑ 1↓ S1 p(s > h1) 2↑ 3↓…
Здесь оператор ¯R означает нейтрализацию всего содержимого в накопителе R,
т. е. ¯R(r)=0; оператор S1 реализуется функцией:
s1 = s + 1,
где: s – содержимое счетчика «забывания»; h1 – порог счетчика забывания.
Таким образом, рефлекс образуется только в том случае, если происходит h раз подряд событие GΛF и при этом ни разу не происходит событие GΛ¯F.
Это, вероятно, не совсем точно согласуется с данными физиологических
экспериментов. А.А. Ляпунов (1958) присваивал другое содержание операторам R и S. Величина r после каждого эксперимента пересчитывается по закону:
r1 = r + η + δ,
где: η – некоторая случайная величина с математическим ожиданием, равным
0; δ – приращение, которое может быть положительным или отрицательным в
зависимости от того, применяется оператор R или S.
Каким образом в действительности реализуется закон накопления возбуждения, еще неясно. Для выяснения этого вопроса необходимо поставить серию физиологических экспериментов с целью выявления закона распределения
вероятностей числа необходимых повторений события GΛF, чтобы рефлекс
выработался. Из этого простого примера понятно, что точное алгоритмическое
описание процесса может вызвать необходимость ставить новые эксперименты
и точно указать, какие именно эксперименты следует проводить для точного
представления всего процесса в целом. Возможность полного алгоритмического описания процесса указывает на его изученность (конечно, здесь имеются в
виду лишь информационные связи, а не энергетические).
Описание модели условного рефлекса было бы не полным, если не привести пример имитационного моделирования самого нейрона. На рис. 1.2 приведена такая модель и ее электрическая схема.
Электронные нейроны, изображенные на рис. 1.2, объединенные в схему
рис. 1.1 и составят имитационную модель классического обусловливания.
Важным принципом оперантного обусловливания является то, что реакции, за которыми следует вознаграждение или позитивное подкрепление,
имеют тенденцию к усилению, тогда как реакции, которые не вознаграждаются, идут на убыль.
11
Рис. 1.2. Схематическое изображение нейрона (слева), его модели (в середине)
и электрической схемы искусственного нейрона (справа):
1 – тело клетки;
Рn, Рi, Р2, P1 – входы нейрона; R1 – R5, Rm – сопротивления;
2 – дендриты;
Sn, Si, S2, S1 – синапсические C1 – C3, Cm – конденсаторы;
3 – аксон;
контакты;
T1 – T3 – транзисторы;
4 – коллатерали;
Р – выходной сигнал;
D – диод;
5 – концевое разветвлеК – пороговое значение сигна- R6 – резистор, задающий порог
ние аксона.
ла;
пропускания
Одним из основных сторонником планов с малым n следует назвать
Скиннера, который наблюдал эволюцию поведения у одного испытуемого.
Скиннер продемонстрировал этот принцип опытами на крысах, определяя, усиливается ли реакция, состоящая в нажатии на рычаг, после вознаграждения.
Изобретенное Скиннером приспособление было названо «ящиком Скиннера».
Первоначальное поведение крысы, помещенной в «ящик Скиннера», является
по сути естественным поисковым поведением: она обнюхивает углы, перемещается от одной стенки к другой, изучает их, умывает мордочку. Лишь небольшая часть этих реакций имеет что-то общее с реакцией нажатия на рычаг,
но опытный исследователь может идентифицировать реакции, предшествующие нажатию на рычаг, и подкрепить их. Процесс избирательно подкрепляемого последовательного приближения к основной реакции (нажатие на рычаг) называется целенаправленным формированием. Животное постепенно подходит
все ближе к рычагу, затем ставит свою лапку рядом с рычагом, касается его и,
наконец, надавливает на него.
Собрано много данных, относящихся к конкретным условиям, которые
облегчают оперантное обусловливание. Например, если вознаграждение следует сразу же за необходимой реакцией, тогда обусловливание происходит быстрее, чем в том случае, когда вознаграждение происходит с задержкой.
Другие исследователи изучили то влияние, которое оказывает на поведение вторичное подкрепление (стимулы, которые связаны с первичным вознаграждением). Основной вывод на основании этих исследований таков: вторичное подкрепление обладает сильным свойством вознаграждения. Вспомните о
12
тех свойствах вознаграждения, которыми обладает во многих обществах вторичное подкрепление в виде денег. В этом исследовании Прайор, Хаага и
О'Рейлли (1969) использовали в качестве обусловленного подкрепления свист,
как хорошо различимый сигнал.
Рис. 1.3. Кумулятивная диаграмма занятия 16, во время которого подопытное животное (дельфин) продемонстрировало 8 различных типов реакций, причем 4 из них
наблюдались впервые (прыжок в воздух, вращение, боковой удар хвостом и удар обратной стороной хвоста) [9]
Результаты экспериментов с операционным обусловливанием представляются графически в виде диаграммы кумулятивной (накопленной) частоты
(рис. 1.3). На таком графике реакции подопытного животного аккумулируются
и изображаются на оси ординат, а на оси абсцисс отмечается время. Поскольку
реакции складываются, кривая реакции всегда идет вверх; случаи отсутствия
реакции показываются линией, параллельной оси абсцисс.
Контрольные вопросы
1. Что такое экспериментальный план с малым объемом выборки n?
2. В каких отраслях наук о человеке применяются экспериментальные планы с
малыми n?
3. Что такое классическое обусловливание?
4. Что такое оперантное обусловливание?
13
2. ЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ
С БОЛЬШИМИ ОБЪЕМАМИ ВЫБОРОК
В общем случае любой эксперимент проводится или в целях определения
сходства/различия (близости/удаленности) между объектами-признаками; либо
в целях определения связи признаков «Х1» и «Х2», измеренных в одинаковых
условиях.
Пример для первого случая. Необходимо проверить эффективность методики развития координационных способностей у баскетболистов. Объектами
будут служить спортсмены, а признаком – показатель координационных способностей.
Формируем две группы – контрольную и экспериментальную – и проводим первичное испытание координационных способностей. Например, регистрируем количество попаданий мяча в корзину из 20 попыток – параметр «Х».
Теперь мы должны сравнить, насколько результаты тестирования признака «Х» в одной группе (контрольной) отличаются от результатов другой
(экспериментальной). После первичного испытания (Х1) статистически достоверного различия между результатами тестирования обеих групп быть не
должно.
Испытуемых обеих групп начали тренировать, развивая исследуемое качество, используя две разные методики (к примеру, методом подражания и методом исключения избыточных степеней свободы движения).
По прохождении курса обучения проводим повторное тестирование (X2)
обеих групп. Теперь результаты тестирования признака «Х» должны статистически достоверно различаться.
Затем по более высокой динамике исследуемого признака «Х» определяется эффективность методики.
Пример для второго случая. Параллельно с регистрацией количества
попаданий мячом в корзину из 20 попыток (признак «Х»), измеряется время
выполнения теста в секундах (признак «Y»).
Замечено, что спортсмены более высокого уровня затрачивают меньше
времени на выполнение теста с лучшей результативностью. Между признаками
«X» и «Y» существует статистически достоверная связь, описываемая математической формулой.
Прекрасный пример экспериментального плана с большим объемом выборки в спорте приведен в прил. 2.
Измерение признаков объектов позволяет создавать базы данных; выявление закономерностей взаимосвязей признаков или объектов – базы знаний.
После того как признак объекта зарегистрирован и измерен, данные могут быть представлены в различной качественно-количественной форме, в различных шкалах.
14
Шкалы представления данных
Определение надлежащей шкалы представления данных позволяет выбрать адекватный метод статистического анализа. Общепринятыми и широко
используемыми являются следующие четыре шкалы измерения: номинальная,
порядковая, интервальная и отношений. Номинальная и порядковая шкалы являются качественными, а интервальная и отношений – количественными.
Более сложные виды анализа (параметрические), например, проверка по
F-критерию или t-критерию, применяются для количественных данных, тогда
как другие, менее мощные (непараметрические) виды анализа данных, подобные проверке по критерию χ2 и ранговой корреляции Спирмена (Spearman),
применяются для категориальных данных.
Номинальная шкала. Данные, классифицируемые как номинальные,
имеют наименьшее число ограничений, обычно используются в качестве символов для описания категориальных данных или представителей какого-либо
класса и не обладают математическими свойствами. Примером номинальных
данных, используемых в качестве категориальных символов, могут быть номера, присваиваемые какой-то переменной, например полу, где мужчин обозначим символом «1», а женщин – символом «2». Поскольку эти номера представляют собой лишь символы, а не числовые величины, присвоение мужчине значения «17», а женщине – значения «4» никак не отразилось бы на категориях.
Иногда, вместо цифровых, используют буквенные символы, например, «М» и
«Ж» для обозначения пола или, в случае переменной для обозначения уровня
знаний, «Н» – низкий и «В» – высокий.
Пример порядковой шкалы для
Номинальные данные используются обозначения уровня спортивного
также для идентификации отдельных пред- мастерства:
ставителей какого-то класса. Так, каждому
0 – мсмк
1 – мс
участнику исследований часто присваивают2 – кмс
ся свой уникальный номер (например, иден3 – 1-й разряд
тификационный номер испытуемого – №).
4 – 2-й разряд
Анализ числовых величин номиналь5 – 3-й разряд
ного уровня ограничен операциями, подобными проверке по критерию χ2, и описательными статистическими характеристиками, такими как частота и мода. Мы можем лишь определить, сколько
элементов относится к каждому классу. Номинальные данные часто используются в качестве независимой переменной для сортировки представителей по
классу при сравнении результатов тестов или других зависимых (выходных)
переменных.
Порядковая шкала. Когда данные носят категориальный характер, но
ранжированы внутри категорий, их называют порядковыми. Рассмотрим, например, случай присвоения номеров братьям и сестрам в соответствии с их порядком рождения. Старший ребенок получает номер 1, следующий за ним –
номер 2 и т. д. Глядя на эти величины, мы получаем представление о порядке
появления детей на свет, однако нельзя ничего сказать о том, насколько один
15
ребенок старше другого. Если в семье три ребенка, нельзя утверждать, что самый старший в два раза старше самого младшего.
Так же проводится ранжирование спортсменов на соревнованиях. Лучший спортсмен получает 1-е место, следующий за ним – 2-е место и т. д. Но
нельзя ничего сказать о том, насколько один спортсмен лучше другого. Если в
рейтинге указаны несколько спортсменов, то это не значит что спортсмен с
рейтингом 1 лучше спортсмена с рейтингом 2 также как спортсмен с рейтингом
2 лучше спортсмена с рейтингом 3 и т. д. Для порядковых данных можно использовать те же описательные статистические показатели, что и для номинальных; однако можно также использовать ранговые (порядковые) статистические характеристики, подобные корреляции Спирмена и проверке по критерию Манна-Уитни (Mann-Whitney).
Интервальная (относительная) шкала. Если данные ранжированы и
интервалы между всеми последовательными величинами равны, уровень оценки называют интервальной шкалой. Примечательной особенностью интервальных данных является то, что они обходятся без такой величины, как «истинный» нуль. Примерами интервальных данных являются температурная шкала
Цельсия, возраст, календарная хронология. Так нулевой отметке термометра
соответствует определенная температура; когда мы появляемся на свет, наш
возраст не равен нулю; а настоящее учебное пособие написано в 2008 г. от Рождества Христова, в 7516 г. от сотворения мира и примерно через 12 млрд. лет
после образования Солнечной Системы. Интервальные данные являются количественными, и к ним применимы практически все виды статистического анализа и описательной статистики, если только метод не требует наличия «истинного» нуля, который не является свойством интервальных данных.
Шкала отношений (абсолютная). Измерения на шкале отношений
включают в себя «истинный» нуль и обладают всеми свойствами других шкал
измерения, а также при желании могут быть преобразованы в интервальные,
порядковые и номинальные данные. Примерами измерений на шкале отношений являются расстояние, высота и промежуток времени. Отметка «нуль сантиметров» указывает на отсутствие расстояния или высоты, а нулевая отметка
времени – на то, что еще ничего не произошло. Данные этого уровня позволяют произвести относительные сравнения. Четыре сантиметра – это половина
от восьми сантиметров, а 300 млс. – это удвоение промежутка времени, равного
150 млс. Относительные числа обладают всеми свойствами действительных чисел, поэтому к ним применимы все виды описательной статистики и статистического анализа.
Совокупность исходных данных
Как правило, совокупность исходных данных изображают в виде таблицы «объекты-признаки», в которой переменные (признаки) располагают в
столбцах (графах), а данные индивидуального участника (объекты) – в строках
(иногда называемых «записями»).
16
Совокупность исходных данных типа «объект-признак», приведенная
в табл. 2.1, будет использоваться ниже для вычисления статистических показателей в примерах. Эта совокупность имитирует данные, которые могли
бы быть получены в ходе небольшого исследования обучающихся экспериментального учебного курса. Цель исследования: определить факторы,
влияющие на средний балл (СБ) успеваемости студентов в осеннем и весеннем семестрах.
Таблица 2.1
УдовлетвоУровень
ренность
знаний
учебой
X1
X2
X3
X4
X5
X6
X7
X8
X9
1
1
3
60
3,9
3,9
38
1
Н
2
1
3
22
4,6
4,0
15
2
В
3
2
2
17
4,7
5,0
10
2
В
4
1
2
19
4,2
4,0
30
2
В
5
2
1
23
5,0
4,9
12
3
В
6
1
3
27
3,7
3,9
35
3
В
7
2
4
18
3,7
4,5
30
1
Н
8
2
2
32
4,4
4,9
30
2
Н
9
2
2
22
4,6
4,7
20
3
Н
10
2
1
20
4,9
5,0
10
1
В
11
1
2
29
5,0
5,0
20
3
В
12
2
2
18
4,0
4,0
35
3
Н
13
1
2
18
4,6
3,7
30
1
В
14
1
2
20
4,2
4,5
30
1
Н
15
2
3
19
4,0
4,1
35
2
Н
16
1
1
19
4,9
4,8
10
1
В
17
2
3
37
4,7
4,5
10
3
Н
Примечание: данные этой таблицы будут использоваться ниже в некоторых примерах.
Номер Пол
Порядок
СБ
СБ
Возраст
рождения
осенний весенний
Отработанные часы
Исходные данные включают для семнадцати объектов девять переменных (признаков): пять из них (X1, X2, X3, X8, X9) – качественные, а четыре (X4, X5, X6, X7) – количественные. Как говорилось выше, шкала измерения обусловливает, какой статистический метод может быть применен
для анализа имеющихся переменных; поэтому следует определить шкалу
измерения для каждого признака-переменной, используемой в данном исследовании.
Х1 – номер испытуемого относится к номинальным данным; каждый номер – это «имя», за которым стоит конкретный человек (объект).
Номер используется для идентификации записей (строк), и его никогда не
следует использовать в каком бы то ни было виде анализа, кроме подсчета
количества записей (n).
Х2 – переменная пол также номинальная; обе категории пола являются взаимоисключающими, поскольку участник исследования может
17
принадлежать только одной из них. Для переменной «пол» номера являются символами категорий: 1 – мужчина, а 2 – женщина.
Х3 – порядок рождения представляет собой порядковую шкалу:
1 соответствует первенцу, 2 – родившемуся вторым и т. д.
Х4 – возраст относится к интервальным данным.
X5 и X6 – СБ, определенный по 5-балльной шкале – порядковые
данные. СБ соответствуют две переменные: осень и весна.
Х7 – отработанные часы указаны за неделю – это относительная шкала.
Х8 – удовлетворенность учебой – это номинальная шкала, где 1 –
высокая, а 3 – низкая удовлетворенность.
Х9 – уровень знаний (Н – низкий, В – высокий) – номинальная шкала.
Задача 2.1. Из 120 студентов вуза, занимающихся физической культурой, требуется отобрать 25 человек для сдачи теста. Определить, какие из
120 студентов будут включены в состав исследуемой выборки?
Решение. 1. Каждому из 120 испытуемых присваивается номер от 1 до 120.
2. В таблице случайных чисел (по трем первым цифрам всех чисел) найти
25 чисел, не превышающих 120.
Таблица случайных чисел
Ответ. Тестирование должны пройти испытуемые под номерами:
90, 91, 47, 41, 62, 84, 50, 31, 39, 87, 60, 70, 38, 40, 22, 116, 49, 54, 53, 67, 3,
13, 64, 56, 89.
18
Задача 2.2. Каждый из выбранных студентов выполнил тест на точность.
Измерялось количество попаданий баскетбольного мяча в корзину из 20 попыток. Проанализировать выборку количества попаданий баскетбольного мяча в
корзину из 20 попыток у 25 испытуемых:
6, 9, 5, 10, 7, 9, 8, 10, 9, 10, 8, 11, 9, 12, 9,10, 8, 10, 11, 9, 10, 9, 8, 7, 11.
Значение признака
Число вариант
Частота к 100%
Частота к 1
Накопленная частота
5
1
4
0,14
4
6
1
4
0,14
8
7
2
8
0,29
16
8
4
16
0,57
32
9
7
28
1,00
60
10
6
24
0,86
84
11
3
12
0,43
96
12
1
4
0,14
100
Задание студентам на самостоятельную работу.
С помощью MS Excel построить графики:
1. Полигон распределения частот (абсцисса – значение признака; ордината –
число вариант);
30
Частота (%)
28
25
24
20
16
15
12
10
8
5
4
4
4
0
5
6
7
8
9
10
Значение признака
Рис. 2.1. Полигон распределения частот
19
11
12
2. Гистограмму распределения удачных бросков (абсцисса – значение признака; ордината – число вариант);
1
1
Частота
0,9
0,86
0,8
0,7
0,57
0,6
0,5
0,43
0,4
0,29
0,3
0,2
0,14
0,14
5
6
0,14
0,1
0
7
8
9
10
11
12
Значение признака
Рис. 2.2. Гистограмма распределения
3. Кумуляту распределения (абсцисса – значение признака; ордината – кумулированные частоты).
100
90 Накопленная
80
96
100
частота (%)
84
70
60
60
50
40
32
30
20
10
4
16
8
0
5
6
7
8
9
10
Значения признака
Рис. 2.3. Кумулята распределения частот
20
11
12
Задача 2.3 [1]. Исследовалась динамика венозного давления ∆
ных при эпидуриальной анестезии:
15, 20, 20, 25, 30, 30, 35, 55.
Xi
Выявить аномальность числа «55» в вы1
борке для P ≤ 0,05
2
Критериальная статистика вычисляется по
3
формуле
4
Dn
( xn M )
SD
В нашем случае D8 =(55-28,75)/11,66=2,25,
что больше табличного D8 =2,17 для P≤0,05
Вывод: «55» – аномально.
5
6
7
8
15
20
20
25
30
30
35
55
M=28,75
P≤0,05
d
-13,75
-8,75
-8,75
-3,75
1,25
1,25
6,25
26,25
вд
у 8 боль-
d2
189,06
76,56
76,56
14,06
1,56
1,56
39,06
689,06
SS=1087,50
δ2 =135,94
SD=11,66
D=2,25
Dtab=2,17
Критические значения статистики Dn
Примечание: Распределение величины Dn получено Карлом Пирсоном (1857 – 1936) и Николаем Васильевичем Смирновым (1910 – 1966). В таблице приведены значения, рассчитанные
Н.В. Смирновым и Ф. Граббсом в 1950 г.
21
Задача 2.4 [5]. Содержание Ca (мг%) в сыворотке крови клинически здоровых павианов гамадрилов.
13,6
14,7
13,1
11,6
11,9
12,2
12,7
11,5
14,5
11,6
12,9
10,4
10,9
12,4
10,8
11,9
10,5
12,3
12,3
11,9
12,3
11,6
12,0
11,9
11,0
11,6
11,2
12,6
12,8
12,0
9,9
11,7
11,1
11,4
12,6
10,6
11,9
12,6
11,7
11,4
12,7
12,1
13,5
12,8
10,0
11,1
9,7
12,8
12,2
14,7
11,7
10,9
11,2
11,4
10,3
10,7
13,0
12,5
12,3
11,3
10,8
12,1
13,5
10,9
12,7
12,3
9,6
12,8
11,6
13,2
10,4
9,2
10,1
12,7
11,7
11,5
12,5
11,4
12,0
14,3
10,9
10,7
14,0
13,8
12,1
11,2
11,6
12,5
13,5
13,2
10,2
11,5
10,0
13,2
13,8
11,5
9,0
12,3
12,5
14,2
Требуется: сгруппировать данные (n = 100) в вариационный ряд (упорядоченные по возрастанию элементы выборки).
1. Устанавливаем величину классового интервала по формуле для выборки объемом 100 и менее единиц
i
x max x min
1 3,32 lg n = 0,8
2. Строим таблицу.
Классы
по уровню Ca, 8,6-9,3 9,4-10,1 10,2-10,9 11,0-11,7 11,8-12,5 12,6-13,3 13,4-14,1 14,2-14,9
мг%
Срединные
значения
9,0
9,8
10,6
11,4
12,2
13,0
13,8
14,6
классов
Частота
100
2
6
15
23
25
17
7
5
Накопленная
2
8
23
46
71
88
95
100
частота
3. С помощью MS Excel построим графики:
а) Гистограмму распределения Ca в крови (абсцисса – границы классовых интервалов; ордината – частоты вариант);
б) Кумуляту (абсцисса – значения классовых вариант; ордината – кумулированные частоты).
22
МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Величины, отражающие все результаты измерений в распределении, называются центральной тенденцией. Тремя характеристиками центральной тенденции являются: среднее, медиана и мода. Среднее (M) – это среднее арифметическое, которое нахоится путем сложения всех результатов (Σxi ) и деления
полученной суммы на количество результатов (n).
Медиана (Me) – это значение, расположенное в центре распределения и
разделяющее все наблюдения на две половины. Мода (Mo) – это величина или
категория, которая появляется наиболее часто. Среднее отклонение (более подробно см. ниже) вычисляют по следующей формуле:
Номер Возраст (xi)
1
M x
xi
X1
X4
n
3
17
23
Задача 2.5. Каков средний возраст женщин, участво- 5
7
18
вавших в исследовании? Поскольку мы исключаем из
8
32
этого анализа мужчин, то должны подсчитать только те
22
результаты в графе возраст, которым соответствует чи- 9
20
словое значение 2 в графе пол (номера в этом анализе не 10
12
18
нужны; они приведены в качестве справки)
15
19
1
206
M
xi
22,88 .
п = 9 Σxi = 206
n
9
ОЦЕНКА ИЗМЕНЧИВОСТИ
Стандартное отклонение (standard deviation – SD) – это один из наиболее часто используемых показателей того, насколько величины отличаются от среднего. Формула для вычисления стандартного отклонения:
SD
1
n 1
( xi
M )2
SS
.
n 1
Задача 2.6. Каково стандартное отклонение для количества часов, отработанных в неделю мужчинами?
Выберите из графы отработанные часы данные по мужчинам (мужчинам в
графе пол соответствует числовое значение 1).
Подсчитайте для этой группы среднее арифметическое М.
Вычислите отклонение D – отнимите среднее значение от количества часов,
отработанных каждым человеком D=(xi – M),
Возведите в квадрат каждую из полученных величин D2=(xi – M)2.
Вычислите сумму квадратов отклонений SS = ΣD2.
Подставьте эти величины в формулу SD.
23
X1
Номер
1
2
4
6
11
13
14
16
n=8
M
1
n
xi
208
8
X7
Отработанные часы (xi)
38
15
30
35
20
30
30
10
Σxi = 208
SD
26
D
12
–11
4
9
–6
4
4
–16
SS
n 1
D2
144
121
16
81
36
16
16
256
SS = 686
686
9,89
7
Помимо средней арифметической нередко требуется определить среднее гармоническое, квадратическое, кубическое, а так же их средневзвешенные значения. В приведенных ниже примерах ознакомимся с ними.
Вычисление средней арифметической
способом произведений или основным
Задача 2.7
Длина
[5]. Длина тела личинок личинок,
щелкуна (мм), отобранных случайным спомм
собом в посеве озимой ржи, варьировала
7
следующим образом:
10
7, 10, 14, 12, 15, 16, 12.
14
Используя MS Excel, определить:
12
Формулы: =СРЗНАЧ(А1:А7)
15
=СУММ(B1:B7)
16
=B1^2
12
=КОРЕНЬ(C8/(7-1))
M = 12
1) среднее арифметическое:
1
M
xi – простое = 12;
D
D2
-5
-2
2
0
3
4
0
0
28
5
3
0
7
14
0
SS = 57
n
2) дисперсию – dispersion
или variance:
2
3) стандартное отклонение
SD
(среднеквадратическую
ошибку) – standard deviation
SS
n
или (если n<30)
SS
или (если n<30) SD
n
24
2
SS
;
n 1
SS
= 3,09.
n 1
Задача 2.8
8
[5]. На
10
свиноферме зарегистри8
рован опорос 64 свинома7
ток. От каждой свиномат12
ки получено следующее
8
количество живых поро8
сят:
6
Используя MS Excel определить:
1) среднее арифметическое
(взвешенное (Σpi=n)):
10
6
9
10
7
9
7
7
3) стандартное отклонение:
Классы (xi)
5
6
7
8
9
10
11
12
1
n
Mp
2
p
2) дисперсию (при учете весов):
10
7
8
8
7
12
8
12
8
8
7
5
9
8
6
8
n 1
2
p
1
(
n
pi xi2
(
11
9
8
8
5
6
9
6
5
7
8
11
7
9
7
10
xi pi или M p
1
SD
Частоты (pi)
4
7
13
15
7
9
6
3
n = Σpi = 64
6
9
10
8
5
7
11
6
xi p i
pi
7
11
11
10
10
7
10
11
= 8,25;
pi xi ) 2 ) = 3,46;
= 1,86.
xipi
20
42
91
120
63
90
66
36
Σxipi=528
xi 2
25
36
49
64
81
100
121
144
pixi2
100
252
637
960
567
900
726
432
2
Σpi xi = 4574
Вычисление средней гармонической
Mh
Средняя гармоническая простая:
n
1
xi
Задача 2.9 [5]. 5 доярок в течение 1 часа ручным способом надоили следующее количество молока: 10, 20, 25, 30, 20 – всего 105 л. Сколько времени
затрачивает в среднем доярка на выдаивание 1 л молока?
М = 105/5 = 21 л.
Мh =5 /(1/10 +1/20 +1/25 +1/30 +1/20) = 5 /0,273 = 18,31 л
t= 60 / 21 = 2,86 мин. t = 60/18,31 = 3,23 мин.
25
Средняя гармоническая взвешенная:
Mh
n
(
pi .
)
xi
Задача 2.10 [5].
Плотность колосьев ржи =
Длина колосьев
8 9 10 11 12
(кол-во зерен в колосе) /
Кол-во зерен в колосе 36 38 40 41 42
(длина колоса). Объем выЧастота (n = 20)
2 5 10 2 1
борки – 20 растений
Плотность колосьев
4,5 4,2 4,0 3,7 3,5
Средняя плотность колосьев в выборке:
Мh= 20 / (2×1/4,5 + 5×1/4,2 + 10×1/4,0 + 2×1/3,7 + 1×1/3,5) = 20 / 5 = 4.
Сравните: М = (2×4,5 + 5×4,2 + 10×4,0 + 2×3,7 + 1×3,5) / 20 = 81/20 = 4,1.
Вычисление средней квадратической
Применяется при выражении признаков мерами площади
xi2
Средняя квадратическая простая M q
n
pi xi2
; взвешенная M q
n
.
Задача 2.11 [5].
Измерялся – диаметр корзинок
подсолнуха в см., n = 10
Средний размер признака
Диаметр корзинок (xi)
Число случаев (pi)
8 11 13 15 16 17
1 1 2 3 2 1
pi xi2 1×82+1×112 +2×132 +3×152 +2×162 +1×172 =1999. M q
1999
10
14,1 см.
Сравните: М = (1×8 +1×11 +2×13 +3×15 +2×16 +1×17) / 10 = 139 /10 = 13,9 см.
Вычисление средней кубической
Применяется при выражении признаков мерами объема.
Средняя кубическая простая M C
xi3
3
n
; взвешенная M C
3
pi xi3
n
.
Задача 2.12 [5]. Измерялся диаметр
яиц в мм [полусумма большого и малого диаметров], n = 18 яиц
Средний размер признака
pi xi3
Диаметр яиц (xi) 47 48 50 54 56 60
Число случаев (pi) 2 4 6 3 2 1
2×473 + 4×483 + 6×503 + 3×543 + 2×563 + 1×603 = 24397;
MC
3
24397
18
26
51 мм.
Вычисление средней геометрической
Применяется при увеличении линейных размеров тела, прироста численности популяции за определенный промежуток времени
Mg
x1 x2 x3 ...xn
Средняя геометрическая
обычно вычисляется с помощью десятичных логарифмов по формуле
n
lg xi
lg M g
Задача 2.13 [5].
n 1
.
Возраст Живая
Абсолютные
мышей масса,
недельные
(неделя) г, xi прибавки массы, г
1
10
2
15
5
3
20
5
4
27
7
5
35
8
6
46
11
7
58
12
8
72
14
9
87
15
Сумма
77
Логарифм
прибавок
массы
0,69897
0,69897
0,84510
0,90309
1,04139
1,07918
1,14613
1,17609
7,58892
Если признак варьируется не- Возраст Живая Относительные
прерывно и выборка группиру- мышей масса, недельные приется в интервальный вариаци- (неделя) г, xi бавки массы, г,
онный ряд, то
Q
1
10
lg Qi
2
15
1,50
lg M g
,
n 1
3
20
1,33
где Qi =x2 / x1
4
27
1,35
lgМg = 0,93806 / 8 = 0,1173,
5
35
1,30
6
46
1,31
Мg = 1,310 г.
7
58
1,26
8
72
1,24
Сравните: Мi =10,50/8 =1,313 г.
9
87
1,21
Сумма
10,50
Логарифм
прибавок
массы
lgQ
0,17609
0,12385
0,13033
0,11394
0,11727
0,10037
0,09342
0,08279
0,93806
Живая масса подопытных
мышей изменяется с возрастом. Средняя геометрическая недельных абсолютных
прибавок массы мышей за
первые 9 недель их жизни
lgМg =7,58895/8 =0,94861,
Мg = 8,9 г.
Сравните: М =77/9 = 9,6 г.
Используют также следующую формулу: lg M g
27
lg xn lg x0
.
n 1
Задача 2.14 [5]. Селекция гибридного хлопчатника за 5 лет позволила увеличить длину волокна с 26,3 мм до 31,0 мм. Определить среднегодовой эффект.
lg xn lg x0 lg 31,0 lg 26,3 0,07140
lg M g
0,01785.
n 1
5 1
4
Мg = 0,1044мм → 10,44% → Среднегодовой эффект: 10,44/5 = 2,1%.
SD
V
100% .
Вычисление коэффициента вариации:
M
3,0 2,7 2,1 1,6 1,2 1,6 2,2
Задача 2.15 [5]. На кролиководческой 2,1 2,3 1,5 1,1 2,2 2,5 2,4
ферме взвешивание 35 животных показа- 1,9 2,1 2,3 1,3 1,0 1,8 1,9
ло следующий результат:
1,8 3,2 2,1 2,9 3,0 1,3 1,9
2,6 1,5 2,4 2,7 1,9 2,0 2,6
Сравнить V двух выборок – 35 кроликов и 64 поросят (см. задачу 2.8).
Vкроликов = 27,3%,
Vпоросят = 22,5%.
Определение медианы
Медиана (Me) – средняя, относительно которой ряд распределения делится на 2 половины (в обе стороны от медианы) одинаковое количество вариант.
Me
xMe
n
i 2
ps
pMe
,
где: XMe – нижняя граница интервала, в котором находится Ме или полусумма
соседних классовых вариант; i – величина классового интервала; n – объем выборки; ps – число накопленных частот, стоящее перед медианным классом; pMe –
частота медианного класса.
Задача 2.16 [5]. (см. Задачу 2.4) Вычислить Ме ряда распределения Са
(мг%) в сыворотке крови павианов гамадрилов
Классы по содержанию
Са в сыворотке крови
8,6 – 9,3
9,4 – 10,1
10,2 – 10,9
11,0 – 11,7
11,8 – 12,5
12,6 – 13,3
13,4 – 14,1
14,2 – 14,9
Срединные значения
классов
9,0
9,8
10,6
11,4
12,2
13,0
13,8
14,6
28
Частоты
(pi)
2
6
15
23
25
17
7
5
100
Накопленные
частоты (ps)
2
8
23
46
71
Вариант 1. i = 0,8. Величина n/2= 50 находится между ps = 46 и ps = 71.
Границы интервала для (ps = 71) – 11,8 ÷ 12,5 т. е. pMe = 25.
По формуле: Ме = 11,8 + 0,8 (50 – 46) / 25 = 11,93.
Вариант 2. По формуле: Ме = (11,4 + 12,2) / 2 + 0,8 (50 – 46)/25 = 11,93.
Задача 2.17 [5] (см. задачу 2.6). Вычислить Ме ряда распределения численности поросят.
Классы (xi) Частоты (pi) Накопленные частоты
4
5
4
7
6
11
13
7
24
15
8
39
7
9
9
10
6
11
3
12
Σpi= 64
Величина n/2= 32 находится
между
ps = 24 и ps = 39.
То xMe = (7+8)/2 = 7,5;
pMe = 15.
По формуле:
Ме = 7,5 + 1 (32 – 24)/15 =
7,5 + 0,53 = 8,03.
Определение моды
Мода (Mo) – наиболее часто встречающаяся, в данной выборке, величина. Класс с наибольшей частотой называется модальным.
Mo
x ниж
i
p2
2 p2
p1
p1
p3
,
где: Xниж – нижняя граница модального класса; i – величина классового интервала; p1 – частота класса, предшествующего модальному; p2 – частота модального класса; p3 – частота класса, следующего за модальным.
Задача 2.18 [5]
Классы по
Срединные Чассодержанию Са значения тоты
(см. задачу 2.4). Вычислить
в сыворотке
классов (pi)
(используя MS Excel) Мо
крови
ряда распределения Са
8,6 – 9,3
9,0 2
(мг%) в сыворотке крови
9,4 – 10,1
9,8 6
павианов гамадрилов.
10,2 – 10,9
10,6 15
11,0 – 11,7
11,4 23
i = 0,8.
11,8 – 12,5
12,2 25
По формуле
12,6 – 13,3
13,0 17
Мо = 11,8 +0,8 (25-23) /
13,4 – 14,1
13,8 7
(2×25-23-17) = 11,8+0,16 =
14,2 – 14,9
14,6 5
11,96.
100
29
Накопленные
частоты
(ps)
2
8
23
46
71
Хи-квадрат
Хи-квадрат (χ ) – это непараметрический статистический показатель, используемый для определения того, отличается ли наблюдаемая частота результатов от ожидаемой частоты. Поскольку для подсчета χ 2 необходимы частоты,
можно использовать как количественные, так и качественные переменные.
Формула для χ2, где О соответствует наблюдаемой (эмпирической) частоте, а Е
– ожидаемой (теоретической):
2
2
(O E ) 2
.
E
Степени свободы df для χ2, где R – число строк, а С – число столбцов в таблице распределения частот, находят с помощью формулы df ( R 1)(C 1) .
Задача 2.19 [9]. Наблюдается ли различие между уровнем знаний женщин
и мужчин? При вычислении χ2 желательно пользоваться таблицами распределения частот, помогающими упорядочить О и Е частоты. В таблице распределения эмпирических частот подсчитываются суммы по столбцам, по строкам и
общая сумма n. Чтобы подсчитать значение для каждой клетки в таблице распределения теоретических частот, умножьте сумму всей строки на сумму
столбца и разделите полученный результат на общую сумму n. Затем эти величины О и Е используются в формуле для вычисления критерия хи-квадрат
Таблица распределения эмпирических частот (O)
Низкий
Высокий
6
3
2
6
8
9
Таблица распределения теоретических частот (E)
Пол
Низкий
Высокий
Женщины
(9×8)/17 = 4,24
(9×9)/17 = 4,76
Мужчины
(8×8)/17 = 3,76
(8×9)/17 = 4,24
Итого
8
9
Пол
Женщины
Мужчины
Итого
Х2
категория
Женщины
2
Мужчины
1
Х9
Уровень знаний
НИЗКИЙ
ВЫСОКИЙ
НИЗКИЙ
ВЫСОКИЙ
2
O
6
3
2
6
(O E ) 2
E
Е
4,24
4,76
3,76
4,24
(O – Е)
1,76
– 1,76
– 1,76
1,76
(O – Е)2
3,11
3,11
3,11
3,11
Итого
9
8
п = 17
Итого
9
8
п = 17
(O – Е)2/Е
0,74
0,65
0,83
0,74
2,95 .
В нашем примере R = 2 и С = 2; таким образом, df = 1. Чтобы определить,
превышает ли полученная нами величина χ2 (2,95) желаемое критическое значение, мы обращаемся к табл. П 3.З. Критическое значение при df = 1 и уровне
значимости 0,05 равно 3,84. Полученная нами величина 2,94 меньше этого критического значения; следовательно, между мужчинами и женщинами отсутствует статистически значимое различие в уровне знаний.
30
Распределение случайно изменяющихся величин
Формула закона нормального распределения
f ( xi )
1
SD 2
( xi
e
M )2
2 SD 2
,
где: f(xi) – высота подъема кривой (плотность вероятности для значения xi); е –
основание натурального логарифма (2,718); π – число «пи» (3,14159); М – среднее арифметическое; SD – стандартное отклонение.
Знание формы распределения, в частности нормального, позволяет сделать правильный выбор критериев сравнения выборок. В случае нормального распределения
можно использовать параметрические критерии. В иных случаях – непараметрические. Форма распределения определяется по величинам эксцесса (kurtosis) и
асимметрии (skewness). Последние должны быть в диапазоне от – 1 до + 1 при точных вычислениях и от – 2 до + 2 – при вычислениях, не требующих высокой точности. А так же по Z-критерию Колмогорова-Смирнова – если он определен на
уровне значимости p > 0,05, то распределение не отличается от нормального.
Параметрические критерии
Параметрические методы обладают высокой чувствительностью. К ним
относятся критерии t-Стьюдента и F-Фишера (ANOVA).
Условия применения параметрических методов: 1) соответствие распределения значений в генеральной выборке нормальному закону; 2) достаточно
большая выборка, чтобы судить о законе распределения; 3) выполнение требования о гомогенности дисперсии при сравнении средних значений для независимых выборок; 4) наличие или отсутствие в выборке выбросов (экстремально
больших или экстремально малых значений).
31
ПРИМЕНЕНИЕ t-КРИТЕРИЯ
Для вычисления уровня статистической достоверности различия между
двумя средними2, в случае, если эти значения измерены в интервальной шкале
или шкале отношений, используется t-критерий. Существует три типа
t-критерия: для одной выборки, для независимых и зависимых выборок.
Критерий t-Стьюдента для одной выборки
t
M
A
m
df
,
где ошибка среднего
n 1,
m
SD
.
n
Критерий t-Стьюдента для независимых выборок (примерный)
t
M2
M1
m 22
m12
df
,
n1
n2
2.
Критерий t-Стьюдента для независимых выборок (точный) для выборок разных объемов
t
M2
M1
(n1 1) 12 (n2 1)
n1 n2 2
2
2
.
1
n1
1
n2
Критерий t-Стьюдента для зависимых выборок
Md
t
df n 1 .
,
md
Чтобы определить величину t, потребуются формулы для вычисления
SS – сумм квадратов, δ2 – дисперсии, SD – стандартного отклонения и df – степеней свободы (см. выше):
SS
SS
2
SS
( xi M ) 2 ,
SD
,
.
n 1
n 1
Задача 2.20 (вариант с одной выборкой). Выделяются ли ученики с высоким осенним СБ из всей массы учеников?
Вначале вычисляем среднее арифметическое показателя Х5, А = 4,418
После этого формируем матрицу для учеников с высоким осенним СБ и
вычисляем среднее арифметическое M, отклонения D, квадраты отклонений D2,
сумму квадратов отклонений SS, дисперсию δ2, стандартное отклонение SD и
ошибку среднего m.
Затем определяем t-критерий Стьюдента и сравниваем его с табличным.
2
Также говорят: для определения того, является ли различие в распределении значений
между двумя группами случайным или статистически значимым.
32
Номер учащихся с
хорошими знаниями
2
3
4
5
6
10
11
13
16
СБ осенний
D
–0,022
0,078
–0,422
0,378
–0,922
0,278
0,378
–0,022
0,278
ΣD = 0,000
4,6
4,7
4,2
5,0
3,7
4,9
5,0
4,6
4,9
М = 4,622
n=9
df = 8
t
M
A
m
D2
0,0005
0,0060
0,1783
0,1427
0,8505
0,0772
0,1427
0,0005
0,0772
SS = 1,4756
δ2 = 0,1844
SD = 0,4295
m = 0,1432
4,622 4,418
1,429 .
0,143
Обращаясь к табл. П 3.4 и имея df = 8, а уровень значимости p = 0,05, мы
получаем критическое значение 2,306, которое выше рассчитанного нами.
Вывод. Средние баллы тех, кто занимается лучше, статистически значимо не отличаются от СБ всей выборки (от ожидаемого среднего значения).
Задача 2.21 (вариант с независимыми выборками). Имеют ли учащиеся с
высоким уровнем знаний более высокие осенние СБ, чем учащиеся, которые
занимаются хуже? Для решения задачи необходимо сформировать матрицы для
учеников с высоким осенним СБ и для учеников с низким осенним СБ, затем
вычислить для каждой из выборок среднее арифметическое M, отклонения D,
квадраты отклонений D2, сумму квадратов отклонений SS, дисперсию δ2, стандартное отклонение SD и ошибку среднего m. После чего определить t-критерий Стьюдента и сравнить его с табличным. Матрицу для учеников с высоким
осенним СБ мы уже обработали в примере выше, осталось повторить аналогичные вычисления для матрицы для учеников с низким осенним СБ.
Номер учащихся
со слабыми знаниями
1
7
8
9
12
14
15
17
n=9
df = 8
СБ осенний
D
–0,375
–0,475
0,225
0,425
–0,175
0,025
–0,175
0,525
ΣD = 0,000
3,9
3,7
4,4
4,6
4,0
4,2
4,0
4,7
М = 4,175
df = 9 + 8 – 2 = 15
33
D2
0,1406
0,2256
0,0506
0,1806
0,0306
0,0006
0,0306
0,2756
SS = 0,9350
δ2 = 0,1336
SD = 0,3655
m = 0,1292
По формуле для вычисления примерного критерия t-Стьюдента для независимых выборок получаем:
t
M2
M1
m22
m12
4,622 4,175
0,1432 2
2,318 .
0,1292 2
По формуле для вычисления точного критерия t-Стьюдента для независимых выборок разных объемов получаем
M2
t
M1
4,622 4,188
(n1 1) 12 (n2 1)
n1 n2 2
2
2
1
n1
2,317
(9 1)0,1844 (8 1)0,1086 1 1
9 8 2
9 8
1
n2
Обращаясь к табл. П 3.4 и имея df = 15, а уровень значимости р = 0,05, мы
выбираем критическое значение 2,131. Полученная нами величина t = 2,317
превышает 2,131 и может считаться статистически значимой на уровне 0,05.
Поэтому мы заключаем, что средние баллы тех, кто занимается лучше, статистически значимо отличаются от СБ тех, кто занимается хуже.
t-критерий для зависимых выборок (для повторных измерений), как правило, используется в
тех случаях, когда: 1) до и после некоторого воздействия анализируются пары результатов от
каждого человека или 2) подбираются пары испытуемых, идентичных по таким характеристикам, как возраст, пол, интеллект или уровень выполнения задания. В отличие от t-критерия
для независимых выборок, когда количественная переменная (СБ) разбита на группы с помощью двух уровней категориальной переменной (знания), t-критерий для зависимых выборок
оценивает разность (D) между двумя количественными измерениями.
Задача 2.22 (вариант с зависимыми выборками). Отличается ли весенний
СБ от осеннего СБ у учащихся с высоким уровнем знаний?
X9
Номер учащихся
с хорошими знаниями
2
3
4
5
6
10
11
13
16
X5
X6
Осенний СБ
Осенний СБ
4,6
4,7
4,2
5,0
3,7
4,9
5,0
4,6
4,9
4,0
5,0
4,0
4,9
3,9
5,0
5,0
3,7
4,8
D = X5 – X6
0,600
–0,300
0,200
0,100
–0,200
–0,100
0,000
0,900
0,100
Мd = 0,144
n=9
df = 8
t
Md
md
0,144
1,047 .
0,138
34
D2
0,360
0,090
0,040
0,010
0,040
0,010
0,000
0,810
0,010
SS = 1,370
δ2 = 0,171
SD = 0,414
m = 0,138
Обращаясь к табл. П 3.4 и имея df = 8, а уровень значимости 0,05, выбираем критическое значение 2,306. Подсчитанная нами величина t = 1,047 не
превышает 2,306 и не может считаться статистически значимой на уровне 0,05.
Вывод. Между весенними и осенними СБ отсутствуют статистически
значимые различия.
Задача 2.23 (дополнительный пример). Какая методика эффективнее для
развития параметра А (кистевая динамометрия) путем вычисления уровня статистической достоверности различия между двумя средними по t-критерию
Стьюдента на уровне значимости p < 0,05. Перед проведением эксперимента
были сформированы две группы – контрольная и экспериментальная – по 12
испытуемых, которые прошли тест по параметру А.
КГ 68 65 71 69 64 62 62 67 59 61 65 64
ЭГ 67 68 72 65 67 61 64 61 62 69 60 65
По соответствующим формулам вычисляем степень свободы df и t-критерий
для независимых выборок. Значения заносим в соответствующие ячейки таблицы:
До
эксперимента
Контрольная группа
dfНЕзавис = 22
tНЕзавистаб=2,074
Экспериментальная группа
dfзавис=11
tзавистаб=2,201
t11-12= 2,259
t11-21= 0,227
После
эксперимента
t12-22= 2,304
t21-22= 2,828
Выполняем расчеты, как это показано в таблице ниже (например, в программе MS Excel).
Обращаясь к табл. П 3.4 и имея df = 22 для независимых выборок, а уровень значимости 0,05, выбираем критическое значение 2,074. Рассчитанное в
примере t11-21= 0,227 меньше табличного, поэтому: тесты по параметру А, выполненные перед проведением эксперимента, показали, что статистически достоверных различий между группами КГ и ЭГ по параметру А нет.
Вывод. В таких условиях МОЖНО начинать проводить эксперимент.
В течение двух недель испытуемые КГ тренировались по методике F, а
экспериментальной – по методике G. Затем было проведено повторное тестирование параметра А:
КГ 72 68 71 69 67 64 63 67 61 62 64 65
ЭГ 69 70 74 72 69 65 68 70 64 72 68 68
По соответствующим формулам вычисляем степень свободы df и
t-критерий для зависимых выборок.
35
Подсчитанные нами величины t указывают, что после 2 недель тренировок в обеих группах произошли статистически достоверные изменения. Статистически достоверно (t12-22= 2,304) стали различаться и данные КГ и ЭГ, а показатель экспериментальной группы t21-22= 2,828 больше показателя контрольной
группы t11-12= 2,259.
Обращаясь к табл. П 3.4 и имея df = 22 для независимых и df = 22 для зависимых выборок, а уровень значимости 0,05, выбираем критические значения
– соответственно 2,074 для независимых и 2,201 для зависимых выборок.
Вывод. Методика G экспериментальной группы оказалась более эффективной, чем методика F, которая применялась для развития параметра А в контрольной группе.
КГ
1
2
3
4
5
6
7
8
9
10
11
12
ЭГ
13
14
15
16
17
18
19
20
21
22
23
24
A1
68
65
71
69
64
62
62
67
59
61
65
64
М = 64,8
A1
67
68
72
65
67
61
64
61
62
69
60
65
М = 65,1
D
3,3
0,3
6,3
4,3
–0,8
–2,8
–2,8
2,3
–5,8
–3,8
0,3
–0,8
0,0
D
1,9
2,9
6,9
–0,1
1,9
–4,1
–1,1
–4,1
–3,1
3,9
–5,1
–0,1
0,0
D2
10,6
0,1
39,1
18,1
0,6
7,6
7,6
5,1
33,1
14,1
0,1
0,6
SS = 136,3
δ2 = 12,4
m = 1,0
D2
3,7
8,5
47,8
0,0
3,7
16,7
1,2
16,7
9,5
15,3
25,8
0,0
SS = 148,9
δ2 =13,5
m = 1,1
A2
72
68
71
69
67
64
63
67
61
62
64
65
М = 66,1
A2
69
70
74
72
69
65
68
70
64
72
68
68
М = 69,1
36
D
5,9
1,9
4,9
2,9
0,9
–2,1
–3,1
0,9
–5,1
–4,1
–2,1
–1,1
0,0
D
–0,1
0,9
4,9
2,9
–0,1
–4,1
–1,1
0,9
–5,1
2,9
–1,1
–1,1
0,0
D2
Dзавис
35,0
3,7
24,2
8,5
0,8
4,3
9,5
0,8
25,8
16,7
4,3
1,2
SS = 134,9
δ2 =12,3
m = 1,0
–4
–3
0
0
–3
–2
–1
0
–2
–1
1
–1
М = –1,3
D2
Dзавис
D2
–2
–2
–2
–7
–2
–4
–4
–9
–2
–3
–8
–3
М = –4,0
4
4
4
49
4
16
16
81
4
9
64
9
SS = 264
δ2 = 24,0
m = 1,4
0,0
0,8
24,2
8,5
0,0
16,7
1,2
0,8
25,8
8,5
1,2
1,2
SS = 88,9
δ2 = 8,1
m = 0,8
D2
16
9
0
0
9
4
1
0
4
1
1
1
SS = 46
δ2 = 4,2
m = 0,6
Дисперсионный анализ
Дисперсионный анализ (ANOVA) является одним из наиболее полезных и
универсальных статистических методов, применяемых в психологии в настоящее время. Его можно использовать в экспериментах с межгрупповыми (bg) и
внутригрупповыми (wg) планами и в экспериментах, которые имеют несколько
уровней категориальной независимой переменной, но только одну количественную зависимую переменную. Дисперсионный анализ основан на
F-распределении. Основные формулы для подсчета F приведены в таблице.
Формулы
Сумма квадратов
Общая
Total
Межгрупповая
Between Group
SSbg
Внутригрупповая
Within Group
SS wg
SStotal
SS wg
SSbg
n(M j
Group
k
SS total
Число степеней свободы
dftotal = N – 1
dfbg = k – 1
MTotal )2
n
SS bg
( xi
Mj
Group
j 1 i 1
Коэффициент
детерминации
R2
SS bg
SS total
Средние
квадраты
MSbg
SSbg
dfbg
SSwg
dfwg
dfwg=
) 2 = dftotal – dfbg = MSwg
=N–k
F-отношение
MS bg
Фишера
Fэ
MS wg
Задача 2.24. Зависит ли количество отработанных часов Х7 от уровня
удовлетворенности учебой Х8? Для проведения этого анализа нам потребуется
данные Х7 всех испытуемых (n=17) расположить в 3 группы (k=3), каждая из
которых будет соответствовать определенному уровню удовлетворенности
учебой X8.
Вначале вычисляем общее средние арифметические Mtotal = 24 и групповые Mgroup1 = 25, Mgroup2 = 24, Mgroup3. = 22.
Затем вычисляем отклонения D от Mtotal и квадраты отклонений D2.
Вычисляем общую сумму квадратов отклонений SStotal=1776.
По формуле вычисляем межгрупповую (Between Group) сумму квадратов отклонений
SSbg
n(M j Group M Total ) 2 6(25 24) 5(24 24) 6(22 24) 23 .
Вычисляем внутригрупповую (Within Group) сумму квадратов отклонений
SS wg SS total SS bg 1776 23 1753 .
Определяем степени свободы: dfbg = k – 1 = 3 – 1 = 2;
dftotal = N – 1 = 16;
dfwg = dftotal – dfbg = 16 – 2 = N – k = 17 – 3 = 14.
Теперь вычисляем межгрупповой (Between Group) средний квадрат:
MSbg
SSbg
dfbg
23
11 .
2
И внутригрупповой (Within Group) средний квадрат: MS wg
37
SSwg
df wg
1753
125 .
14
X8
1
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
3
D2
D
14
6
–14
6
6
–14
-9
–14
6
6
11
–12
11
–4
–4
11
–14
X7
38
30
10
30
30
10
15
10
30
30
35
12
35
20
20
35
10
Mtotal = 24
209
42
184
42
42
184
73
184
42
42
131
134
131
13
13
131
184
SStotal = 1776
SSbg = 23
SSwg = 1753
R2 = 0,01
Mgroup
25
24
22
dfbg = 2
dfwg = 14
MSbg= 11
MSwg= 125
F = 0,091
FT= 3,316
p = 0,05
Наконец, вычисляем критерий Фишера
Fэ
MS bg
MS wg
11
125
0,091.
После того как рассчитана величина F, необходимо обратиться к
табл. П 3.5, в которой величины даны парами, где верхнее число соответствует критическому значению на уровне 0,05, а нижнее – критическому значению на уровне 0,01. Столбцы расположены в соответствии со степенями
свободы между группами (dfbg), а строки – в соответствии со степенями
свободы внутри групп (dfwg). Чтобы получить критическое значение для
нашего анализа, двигайтесь вниз по столбцу для dfbg = 2, пока не достигнете строки, соответствующей dfwg = 14. Перед нами две величины, 3,74 и
6,51, Поскольку полученная нами величина F (0,091) не превышает 3,74,
делаем вывод, что наши результаты статистически незначимы, т. е. между
количеством отработанных часов и уровнем удовлетворенности учебой нет
никакой связи.
38
Непараметрические критерии
Непараметрические методы обладают меньшей чувствительностью, чем
параметрические. Применение рассмотренных в предыдущем разделе параметрических критериев было связано с целым рядом допущений. Например,
сравнивая выборочные средние значения с помощью t-критерия, принимались
следующие предположения: обе выборки являются случайными, т. е. каждая
из них получена в результате независимых измерений; обе выборки получены
из генеральных совокупностей, имеющих нормальное распределение; дисперсии генеральных совокупностей равны между собой.
На практике эти предположения строго никогда не выполняются, поэтому применение параметрических критериев всегда связано с опасностью
ошибочных выводов, возникающей из-за нарушения принятых допущений.
В математической статистике в этом случае применяются непараметрические методы, применение которых зависит от меньшего числа допущений.
Условия применения непараметрических методов: 1) несоответствие
распределения значений в генеральной выборке нормальному закону;
2) слишком малая выборка, чтобы судить о законе распределения;
3) невыполнение требования о гомогенности дисперсии при сравнении
средних значений для независимых выборок; 4) наличие в выборке выбросов (экстремально больших или экстремально малых значений).
Важную группу непараметрических критериев составляют ранговые
критерии. Ниже рассматриваются некоторые из ранговых критериев. Но
предварительно следует познакомиться с понятием «ранг», играющим
здесь ключевую роль.
Ранги
Ранжированная выборка получается, если расположить выборочные
данные в порядке возрастания или убывания. Рангом выборочного значения называется порядковый номер этого значения. Ранг однозначно определен порядковым номером, если в выборке нет совпадающих значений.
Если же они есть, то их ранги определяются как среднее арифметическое
порядковых номеров совпадающих значений. Рангами могут быть представлены данные, выраженные в порядковой шкале, в том числе результаты наблюдения качественных признаков, когда невозможно измерить точное численное значение признака, но можно определить очередность значений по принципу «больше-меньше» (например, места в спортивных состязаниях, результаты судейства в баллах, оценки за экзамен и т. п.).
Номер 1
2
3
4
5
6
7
8
9 10
Пример. Получена
п/п
выборка (n = 10), после ранxi
12 14 15 15 15 16 18 19 19 22
жирования она выглядит
R
1
2
4
4
4
6
7 8,5 8,5 10
следующим образом:
Значения с порядковыми номерами 3, 4, 5 и 8, 9 совпали, поэтому их
ранги R определяются как R = (3 + 4 + 5)/3 = 4 и R = (8 + 9)/2. Таким образом, ранг не обязательно будет целым числом.
39
Сравнение двух независимых выборок (критерий U-Манна-Уитни)
Считается, что критерий U-Манна-Уитни самый простой ранговый критерий (в отечественной литературе этот критерий иногда называют также критерий Вилкоксона для независимых выборок или критерием Уайта).
Применение критерия U-Манна-Уитни основано на единственном предположении: выборки получены из однотипных непрерывных распределений.
При этом вид распределения генеральных совокупностей X и Y никак не оговаривается. Допущение о непрерывности распределений может быть принято, когда исследуемый признак имеет большое число возможных градаций. Гипотеза
Но: F(x) = F(y) – это утверждение о том, что функции распределения обеих генеральных совокупностей одинаковы. Иначе говоря, обе выборки получены из
одной и той же генеральной совокупности и эффект обработки отсутствует.
Поясним это более подробно. Поскольку функции распределения F(х) и
F(у) равны, то, следовательно, равны и характеристики положения этих распределений (среднее значение и медиана). Поэтому, если эффект оценивается по
различию средних арифметических двух выборок, то нулевую гипотезу можно
было бы записать в виде Но: μx = μy. В этом случае критерий U-Манна-Уитни
является непараметрическим аналогом t-критерия для независимых выборок.
Ниже рассматривается применение критерия U-Манна-Уитни на конкретном примере.
Задача 2.25 [17]. Результаты в беге на 100 м контрольной и экспериментальной групп студентов вузов на занятиях по физической культуре:
КГ
ЭГ
xi
yi
Номер xi yi Ri
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
11,3
11,4
11,7
11,8
11,8
12,0
12,0
12,1
12,2
12,3
12,4
12,5
12,6
12,6
12,8
12,8
13,0
13,2
13,3
13,8
1
2
3
4,5
4,5
6,5
6,5
8
9
10
11
12
13,5
13,5
15,5
15,5
17
18
19
20
12,6
11,3
12,3
12,8
11,8
12,2
12,1
11,7
12,8
12,4
13,2
13,3
13,8
11,4
12,8
12,0
12,6
11,8
13,0
12,5
Объем выборки для контрольной группы – nх = 10 и для
экспериментальной – nу = 10.
Проверим гипотезу Но: Мех = Меy против двусторонней
альтернативы Н1: Мех=Mеу. Уровень значимости р = 0,05.
Порядок применения критерия U-Манна-Уитни:
1. Объединяем обе выборки в одну. Объем объединенной выборки будет n = nх+ nу = 20.
2. Ранжируем объединенную выборку, располагая данные в порядке возрастания. При этом отмечаем полужирным шрифтом данные, относящиеся к одной из выборок
(все равно какой), например, КГ.
3. Находим ранги Ri объединенной выборки. Отмечаем
ранги, относящиеся, например, к КГ.
4. Суммируем по отдельности ранги, относящиеся к
первой и второй выборкам, т. е. находим суммы рангов:
RX = ΣRXi = 127,5; RY = ΣRYi = 82,5.
RX + RY = 127,5 + 82,5 = 210.
40
Для проверки правильности этих операций можно использовать тот факт,
что сумма всех рангов: RX + RY = n(n + 1)/2 = 20(20+1)/2 = 210.
5. Меньшую из сумм рангов (в данном случае RY = 82,5) принимаем в
качестве значения критерия U-Манна-Уитни.
6. Из П 3.6 находим критическое значение критерия U-Манна-Уитни при
уровне значимости p = 0,05 и при объемах выборки n1 = 10 и n2 = 10: Up = 78.
7. Вывод: если U ≤ Up различие считается статистически значимым на
уровне значимости p (нулевая гипотеза отбрасывается). В противном случае
различие статистически незначимо, как в данном случае: 82,5 ≥ 78.
Сравнение двух связанных выборок
В табл. П 3.7 приведены крити(критерий W-Вилкоксона)
ческие значения двустороннего
Критерий W-Вилкоксона для связанных критерия W-Вилкоксона. Если
односторонний
выборок является непараметрическим анало- используется
критерий, то значения этой табгом t-критерия.
Задача 2.26 [17]. У группы школьников
лицы соответствуют удвоенным
уровням значимости:
Wp двух = Wp / 2одн.
(n=10) до (xi) и после (yi) пребывания в спортивном лагере измеряли жизненную емкость легких (ЖЕЛ)
Номер xi
yi
di =
R1
Ранги
1. Отбрасываем пары с одинакоп/п
мл.
мл. xi – yi
│di│ выми значениями x и y ; для дальi
i
1
3 400 3 800 –400
100 2,5 (+)
нейших расчетов объем выборки со2
3 600 3 700 –100
–100 2,5 (–)
кращаем на число отброшенных пар.
3
3 000 3 300 –300
–100 2,5 (–)
2. В нашем примере отбрасывает4
3 500 3 600 –100
–100 2,5 (–)
5
2 900 3 100 –200
–200 5,5 (–) ся пара номер 7, и объем выборки
6
3 100 3 200 –100
–200 5,5 (–) станет n = 10 – 1 = 9.
7
3 200 3 200
0
–300 7,5 (–)
3. У оставшихся пар вычисляем
8
3 400 3 300
100
–300 7,5 (–) разности di = xi – yi.
9
3 200 3 500 –300
–400 9 (–)
4. Находим ранги R |di| абсолют10 3 400 3 600 –200
ных значений разностей di.
5. Отмечаем ранги, относящиеся к положительным и отрицательным
значениям разностей.
6. Находим по отдельности суммы рангов отрицательных, и положительных разностей R (–) и R (+). Суммы рангов: R (+) = 2,5; R (–) = 42,5.
7. Контроль: R (+) + R (–) = 2,5 + 42,5 = 9(9 + 1)/2 = 45.
8. Меньшую из сумм рангов принимаем в качестве значения критерия W.
Для нашего примера W = R (+) = 2,5.
9. Из П 3.7. находим критическое значение Wp критерия W-Вилкоксона
при уровне значимости p =0,05 и n =10, W =7.
10. Вывод: если W< Wp, то Н0 отбрасывается и различие связанных выборок является статистически значимым на уровне значимости р. В противном
случае различия статистически незначимы. Для нашего примера W < W0,05, поэтому различия статистически значимы на уровне значимости p ≤ 0,05.
41
Оценка связи
Силу связи между двумя переменными можно определить с помощью коэффициента корреляции (r). Имеется несколько различных формул
для вычисления корреляции. Наиболее распространенный метод вычисления корреляции – корреляция как произведение моментов Пирсона, которая
требует интервальных или относительных данных для каждой переменной.
Однако если хотя бы одна из переменных порядковая, для определения меры связи необходимо использовать ранговый (порядковый) коэффициент
корреляции Спирмена (rs) – непараметрический статистический показатель.
Ранговый коэффициент корреляции Спирмена
Формула для вычисления
rS
1
6
( RX
RY )
n(n 2 1)
2
.
Задача 2.27. Какова корреляция между рангом рождения и СБ осенним для людей, отработавших 20 и менее часов? Ранг рождения – это порядковая переменная, поэтому необходимо использовать формулу Спирмена. Выберите записи с числовыми значениями 20 или менее из графы Отработанные часы. Впишите номера испытуемых в первый столбец, а
СБ осенний (XI) – во второй. Расположите часы в порядке возрастания и
впишите данные по рангу СБ (Rx) и рангу рождения (RY) в столбцы 3 и 4.
Определите разность между рангом СБ и рангом рождения (Rx – RY), возведите в квадрат каждую разность: (Rx – RY)2, а затем сложите полученные результаты Σ(RX – RY)2. Подставьте эти величины в формулу.
X1
Номер
2
3
5
9
10
11
16
17
n=8
X5
СБ осенний
XI
4,6
4,7
5,0
4,6
4,9
5,0
4,9
4,7
rS
1
X3
Ранг рождения
Ry
3
2
1
2
1
2
1
3
Ранг СБ
Rx
1
2
4
1
3
4
3
2
6
(RX
n( n
2
RY )
1)
2
1
6(27)
8(64 1)
1
(Rx – Ry)
(Rx – RY)2
–2
0
3
–1
2
2
2
–1
4
0
9
1
4
4
4
1
Σ(RX – RY)2 = 27
164
504
0,678 .
По табл. П 3.1 определяем статистическую значимость r, найдя критическое значение. В нашем примере rS = 0,678, а n = 8. Выбрав уровень
значимости р = 0,05, мы видим, что в нашем случае величина rS не достигает критического значения 0,738 и, следовательно, он не является статистически значимым, что неудивительно, принимая во внимание ограниченное
число наблюдений.
42
Коэффициент корреляции Пирсона
Еще один часто используемый коэффициент корреляции, называемый коэффициентом корреляции Пирсона (r), используется для измерения
связи между двумя переменными на интервальных шкалах. Используется
только в случае линейной зависимости. Формула для приблизительного
вычисления r.
DX DY
r
DX2
DY2
.
Задача 2.28. Какова корреляция между количеством отработанных часов (X7) и СБ осенним (X5) испытуемого? Начните анализ с построения
столбцов для номера, СБ (Xi) и отработанных часов (Yi). Далее найдите отклонения DX и DY , затем квадраты отклонений DX2 и DY2. Затем вычислите
суммы квадратов отклонений ΣDX2 и ΣDY2, а также сумму произведений отклонений ΣDXDY.
X1
№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
n = 17
X5
СБ
Xi
3,9
4,6
4,7
4,2
5,0
3,7
3,7
4,4
4,6
4,9
5,0
4,0
4,6
4,2
4,0
4,9
4,7
4,4
X7
Отработанные часы
Yi
38,0
15,0
10,0
30,0
12,0
35,0
30,0
30,0
20,0
10,0
20,0
35,0
30,0
30,0
35,0
10,0
10,0
23,5
DX
–0,5
0,2
0,3
–0,2
0,6
–0,7
–0,7
0,0
0,2
0,5
0,6
–0,4
0,2
–0,2
–0,4
0,5
0,3
0,0
DY
14,5
–8,5
–13,5
6,5
–11,5
11,5
6,5
6,5
–3,5
–13,5
–3,5
11,5
6,5
6,5
11,5
–13,5
–13,5
0,0
DX2
0,3
0,0
0,1
0,0
0,3
0,5
0,5
0,0
0,0
0,2
0,3
0,2
0,0
0,0
0,2
0,2
0,1
3,3
DY2
209,4
72,8
183,0
41,9
132,9
131,6
41,9
41,9
12,5
183,0
12,5
131,6
41,9
41,9
131,6
183,0
183,0
1776,2
DXDY
–7,5
–1,6
–3,8
–1,4
–6,7
–8,2
–4,6
–0,1
–0,6
–6,5
–2,1
–4,8
1,2
–1,4
–4,8
–6,5
–3,8
–63,4
Полученные значения подставьте в формулу
r
DX DY
D
2
X
2
Y
D
63,4
3,1 1776,2
0,848.
Примечание. Знак «минус» перед коэффициентом корреляции отражает
направление связи, а не значение. В данном случае зависимость обратная – чем
больше человек занимается, тем ниже его СБ осенний (естественно, это шуточный пример). Чтобы найти уровень значимости для r, нам необходимо подсчитать степени свободы, или df = (n – 2), а затем обратиться к табл. П 3.2. Имея
43
df = 15 и используя уровень значимости 0,05, мы можем определить, превышает ли полученная нами величина r = 0,846 критическое значение, приведенное в
таблице. Критическое значение равно 0,456 и меньше полученной нами величины 0,846; таким образом, между количеством отработанных часов и
СБ осенним имеет место статистически значимая отрицательная корреляция.
Регрессионно-корреляционный анализ
Регрессионный анализ устанавливает форму зависимости случайной
величины y и значениями переменной x.
Корреляционный анализ определяет степень связи между двумя случайными величинами y и x.
Графическое решение задачи выявляет регрессию (форму зависимости) и уравнение связи. Линейная зависимость описывается уравнением
40
y = a + bx,
где: а и b – коэффициенты,
определяемые
по формулам:
35
30
25
a = y – bx,
y = -20,148x + 112,54
2
R = 0,7187
b
r
SDy
SDx
20
.
15
10
3,5
3,7
3,9
4,1
4,3
4,5
4,7
4,9
Задача 2.2.18. Для задачи 2.1.4 построить график и определить уравнение регрессии.
r
DX DY
D
b r
SDy
2
X
2
Y
D
63,4
3,1 1776,2
0,848
r2 = 0,719 как на графике.
10,54
20,15 ,
a = 23,5 – 4,4(–20,15) = 112,54.
SDx
0,44
Итак, уравнение регрессии
y = 112,54 – 20,15x.
0,848
44
Но так ли это на самом деле? Оказывается, в данном примере была
(умышленно) допущена неточность. Все уравнения, по которым проводились расчеты, применяются только в случае линейной зависимости. На
графике же точки расположены явно не на одной линии, и мы можем предположить, что регрессия может быть иной, нелинейной. Если зависимость y
от x нелинейная, то иногда эту зависимость можно линеаризовать с помощью преобразования переменных x и y. Линеаризацию можно провести с
помощью формул табл. П 3.8. Но для данного случая остановимся на полигональной зависимости
y = b0 x0 + b1 x1 + b2 x2 + b3 x3 + … + bn xn
где n – степень функции.
Используя электронную
таблицу MS Excel, строим полигональную линию тренда (n = 3)
и
получаем
r = – 0,906
2
(r = 0,820). Это выше, чем при
расчетах линейной зависимости.
Если вы не можете принять решение, какую формулу
подобрать для конкретной регрессии, то выберете ту, при которой получается максимальный
коэффициент корреляции.
40
3
2
y = 52,409x - 693,71x + 3023,7x - 4313,1
R2 = 0,8201
35
30
y = -20,148x + 112,54
R2 = 0,7187
25
20
15
10
3,5
3,7
3,9
4,1
4,3
45
4,5
4,7
4,9
Контрольные вопросы
1. Опишите схему классического экспериментального плана с большими объемами выборок n.
2. Перечислите и охарактеризуйте шкалы представления данных.
3. Что такое совокупность исходных данных «объекты-признаки»?
4. Как пользоваться таблицей случайных чисел?
5. Как строится полигон распределения частот?
6. Как строится гистограмма распределения частот?
7. Как строится кумулята распределения частот?
8. Как выявляется аномальность числа в выборке?
9. Как группируются данные в вариационный ряд?
10. Перечислите меры центральной тенденции.
11. Вычисление средней арифметической (простой и взвешенной).
12. Вычисление средней гармонической (простой и взвешенной).
13. Вычисление средней квадратической (простой и взвешенной).
14. Вычисление средней кубической (простой и взвешенной).
15. Вычисление средней геометрической (простой и взвешенной).
16. Вычисление коэффициента вариации.
17. Определение медианы.
18. Определение моды.
19. Как оценивается изменчивость параметра?
20. Какой критерий используется для определения того, отличается ли наблюдаемая частота результатов от ожидаемой частоты?
21. Нормальное распределение и его определение по эксцессу и асимметрии.
22. Нормальное распределение и его определение по z-критерию КолмогороваСмирнова.
23. Параметрические критерии, условия их применения.
24. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для одной выборки)?
25. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для независимых выборок)?
26. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для зависимых выборок)?
27. Какой вид анализа используется в экспериментах с межгрупповыми и внутригрупповыми планами?
28. Какой вид анализа используется в экспериментах, которые имеют несколько
уровней категориальной независимой переменной, но только одну количественную
зависимую переменную?
29. Непараметрические критерии, условия их применения.
30. Сравнение двух независимых выборок (критерий U-Манна-Уитни).
31. Сравнение двух связанных выборок (критерий W-Вилкоксона).
32. Как оценивается связь между двумя переменными (в ранговых шкалах)?
33. Как оценивается связь между двумя переменными (в интервальных шкалах)?
34. Регрессионный анализ.
35. Корреляционный анализ.
36. Линеаризация функций.
46
3. МЕТОДЫ ОБРАБОТКИ МНОГОМЕРНЫХ ДАННЫХ
3.1. Классификация многомерных методов
Наиболее часто в исследованиях
Необходимость знаний многомерных мечеловека применяются следующие тодов, их возможностей и ограничений
многомерные методы: множественный требуются уже на стадии общего замысла
регрессионный анализ (МР), фактор- исследования. Например, ориентируясь
ный анализ (ФА), многомерное шкали- только на факторно-аналитическую морование (МШ), кластерный анализ дель, исследователь ограничен в выборе
процедуры диагностики: она должна со(КА), дискриминантный анализ (ДА).
стоять в измерении признаков у множества
Эти методы можно классифици- объектов. При этом исследователь огранировать по трем основаниям: 1) в соот- чен и в направлении поиска: он изучает
ветствии с интеллектуальной операци- либо взаимосвязи между признаками, либо
ей (по способу преобразования исход- межгрупповые различия по измеряемым
ной информации) – по назначению ме- признакам. Общая осведомленность о друтода; 2) по способу сопоставления гих многомерных методах позволит исследователю использовать более широкий
данных – по сходству (различию) или круг психодиагностических процедур, репропорциональности
(корреляции); шать более широкий спектр не только на3) по виду исходных эмпирических учных, но и практических задач.
данных.
Классификация методов по назначению
1. Методы предсказания (экстраполяции): МР и ДА. МР предсказывает
значения метрической «зависимой» переменной по множеству известных значений «независимых» переменных, измеренных у множества объектов (испытуемых). ДА предсказывает принадлежность объектов (испытуемых) к одному
из известных классов (номинативной шкале) по измеренным метрическим
(дискриминантным) переменным.
SPSS (Statistical Package for the So2. Методы классификации: варианты cial Science) – статистический паКА и ДА. КА («классификация без обуче- кет для социальных наук.
ния») по измеренным характеристикам у
множества объектов (испытуемых) либо по данным об их попарном сходстве
(различии) разбивает это множество объектов на группы, в каждой из которых
содержатся объекты, более похожие друг на друга, чем на объекты из других
групп. ДА («классификация с обучением», «распознавание образов») позволяет
классифицировать объекты по известным классам, исходя из измеренных у них
признаков, пользуясь решающими правилами, выработанными предварительно
на выборке идентичных объектов, у которых были измерены те же признаки.
3. Структурные методы: ФА и МШ. ФА направлен на выявление структуры переменных как совокупности факторов, каждый из которых – это скрытая, обобщающая причина взаимосвязи группы переменных. МШ выявляет
шкалы как критерии, по которым поляризуются объекты при их субъективном
попарном сравнении.
47
Классификация методов по исходным предположениям о структуре данных
1. Методы, исходящие из предположения о согласованной изменчивости
признаков, измеренных у множества объектов. На корреляционной модели основаны ФА, МР, отчасти – ДА.
2. Методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны КА и МШ, частично – ДА. МШ и ДА подтверждают предположение о
том, что исходные различия между объектами можно представить как расстояния между ними в пространстве небольшого числа шкал (функций).
Классификация методов по виду исходных данных
1. Методы, использующие в качестве исходных данных только признаки,
измеренные у группы объектов (МР, ДА и ФА).
2. Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами (КА и МШ). МШ, кроме того, может анализировать данные о попарном сходстве между совокупностью объектов, оцененном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.
3.2. Множественный регрессионный анализ (МР)
МР предназначен для изучения взаимосвязи одной переменной (зависимой) и нескольких других переменных (независимых) в интересах предсказания некоторого результата или существенности влияния той или иной переменной на предсказываемый результат.
Исходные данные для МР представляют собой матицу «объект-признак».
Связь одной переменной (зависимой) Y и нескольких других переменных
(независимых) Xn выражают линейным уравнением
y = b0 + b1 x1 + b2 x2+ … + bn xn+ e,
где: y – зависимая переменная; x1, 2 … n – независимые переменные; b1, 2 … n – параметры модели; e – ошибка предсказания.
Качественным аналогом МР является ДА (см. разд. 3.2).
Используя данные тестирования по 16-фактороному опроснику, Р. Кеттелл
выявил профессиональные портреты для:
психотерапевта у = 0,72A + 0,29B + 0,29H + 0,29N,
психодиагноста у = 0,31A + 0,78B + 0,47N,
из которых следует, что для психотерапевта важна общительность (А), а
для психодиагноста – интеллект (В).
Условия получения приемлемых результатов МР
Регрессия, как и корреляция, анализирует линейные зависимости.
Ранее была рассмотрена процедура оценки криволинейных зависимостей в
контексте простого регрессионного анализа. Если теория или статистический расчет показывает, что между критерием и одним или несколькими
48
предикторами существует криволинейная зависимость, то можно применить процедуру линеаризации.
Основные условия применения МРА:
1. Исследование должно быть продумано по форме и исполнению.
Анализ регрессии для не связанных по смыслу величин приводит к бесполезным результатам.
2. Объем выборки желательно иметь n ≥ 50.
3. Данные должны быть корректными и записаны в таблицу без ошибок.
4. Распределение значений предикторов должно быть близким к нормальному (значения асимметрий и эксцессов по модулю не превосходят 1).
5. Нормальность распределения зависимой переменной также желательна, однако допустимы как отклонения от нормальности, так и использование дискретных переменных с малым числом значений.
6. Наиболее жестким требованием является запрет на использование
независимых переменных, корреляции между которыми близки к 1 (-1).
Поэтому перед проведением регрессионного анализа никогда не бывает
лишним вычисление корреляций между предикторами.
7. Не желательно задействовать предикторы, совпадающие по смыслу.
Задача 3.1 [7]. Для решения требуется программа SPSS и файл данных
MR.sav. Число объектов в файле данных MR.sav n = 46. Переменные файла, которые мы будем использовать: помощь – зависимая переменная, интерпретируемая как время (в секундах) оказания помощи партнеру (среднее
– 30, стандартное отклонение – 10); симпатия – оценка своей симпатии к
партнеру, нуждающемуся в помощи (по 20-балльной шкале); агрессия –
оценка своей агрессивности к партнеру (по 20-балльной шкале); польза –
оценка пользы от своей помощи (по 20-балльной шкале); проблема – оценка серьезности проблемы своего партнера (по 20-балльной шкале); эмпатия – оценка эмпатии (склонности к сопереживанию) как результат тестирования (по 10-балльной шкале).
1. Запустите программу SPSS. После выполнения этого шага на экране появится окно редактора данных SPSS. Откройте файл данных MR.sav,
выполнив следующие действия: выберите в меню File (файл) команду
Open ► Data (открыть ►данные) или щелкните на кнопке Open File (открыть файл) панели инструментов. В открывшемся диалоговом окне дважды щелкните на имени MR.sav или введите его с клавиатуры и щелкните
па кнопке ОК.
2. В меню Analyze (анализ) выберите команду Regression ► Linear
(регрессия ► линейная). На экране появится диалоговое окно Linear Regression (линейная регрессия) (рис. 3.1).
3. Щелкните сначала на переменной помощь, чтобы выделить се, а
затем – на верхней кнопке со стрелкой, чтобы переместить переменную в
49
поле Dependent (зависимая переменная). Выделите переменные симпатия,
проблема, эмпатия, польза и агрессия, затем переместите их в список Independent(s) (независимые переменные).
4. В раскрывающемся
списке Method
(метод) выберите
пункт
Forward (прямой). Щелкните на кнопке
ОК, чтобы открыть окно вывода.
5. В результате программа сгенерирует данные,
показывающие,
какая из независимых переменных оказывает наибольРис. 3.1
шее влияние на
зависимую переменную. Метод Forward (прямой) обеспечит включение в уравнение регрессии всех предикторов, имеющих значимую частную корреляцию с критерием β
в порядке убывания значимости.
Задача 3.2 [7]. Для решения требуется программа SPSS и файл данных
MR.sav.
1. Откройте диалоговое окно Linear Regression (линейная регрессия), показанное на
рис. 3.1. Если Вы уже
успели поработать с
этим окном, очистите
его щелчком на кнопке
Reset (сброс) и выполните следующие действия.
Рис. 3.2
50
2. Щелкните
сначала на переменной помощь, чтобы
выделить се, а затем –
на верхней кнопке со
стрелкой, чтобы переместить переменную в поле Dependent (зависимая переменная). Выделите
переменные симпатия, проблема, эмпатия, польза и агрессия, затем переместите их в список
Independent(s) (независимые
переменные).
3. В
раскрывающемся
списке
Method (метод) выберите пункт Stepwise (по шагам).
4. Щелкните па
кнопке Statistics (стаРис. 3.3
тистики), чтобы открыть диалоговое окно Linear Regression: Statistics (линейная регрессия: статистики), (рис. 3.2). Установите флажок Descriptives (описательные статистики) и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Linear Regression (линейная
регрессия).
5. Щелкните па кнопке Save
(сохранение), чтобы открыть диалоговое окно Linear Regression: Save
(линейная регрессия: сохранение)
(рис. 3.3). Установите флажок Unstandardized (нестандартизированные
значения) и щелкните на кнопке Continue (продолжить), чтобы вернуться
в диалоговое окно Linear Regression
(линейная регрессия).
6. Щелкните на кнопке Options
(параметры), чтобы открыть диалогоРис. 3.4
51
вое окно Linear Regression: Options (линейная регрессия: параметры), показанное на рис. 3.4. В поле Entry (включение) введите значение 0,1, в поле Removal (удаление) введите значение 0,2 и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Linear Regression (линейная
регрессия).
7. Щелкните на кнопке ОК, чтобы открыть окно вывода.
В результате выполнения приведенных инструкций будут сгенерированы
данные, позволяющие судить о том, какая из независимых переменных оказывает наибольшее влияние на критерий.
На основе этих данных можно составить уравнение регрессии:
(помощь) = – 5 ,315 + 1,257 (польза) + 1,168 (агрессия) + 1,033(симпатия).
3.3. Дискриминантный анализ (ДА)
ДА позволяет предсказать Примеры ситуаций, в которых было бы
принадлежность объектов к двум или весьма желательно вычислить вероятность
более непересекающимся группам.
того или иного исхода в зависимости от
Исходными данными для ДА совокупности измеряемых переменных:
является множество объектов, разде- а) подходит ли соискатель работы на ту
ленных на группы так, что каждый или иную должность, б) страдает ли психически больной человек шизофренией
объект может быть отнесен только к или психозом, в) вернется ли заключенный
одной группе. Допускается при этом, в тюрьму или к нормальной жизни после
что некоторые объекты не относятся выхода на свободу, г) какие факторы
ни к какой группе (являются «неиз- влияют на увеличение риска пациента повестными»). Для каждого из объек- лучить сердечный приступ и т. п.
тов имеются данные по ряду количественных переменных. Такие переменные называются дискриминантными переменными, или ДА представляет собой альтернативу МР (см. разд. 3.2)
предикторами.
для случая, когда зависимая
Задачами ДА является определение: 1) ре- переменная представляет сошающих правил, позволяющих по значениям бой не количественную, а капредикторов отнести каждый объект (в том числе чественную (номинативную)
и «неизвестный») к одной из известных групп; 2) переменную. При этом ДА
«веса» каждого предиктора для разделения объек- решает, по сути, те же задачи,
что и МР: предсказание знатов на группы.
чений «зависимой» перемеДА основан на составлении уравнения рег- ненной (в данном случае карессии, использующего номинативную зависи- тегорий номинативного признака) и определение того,
мую переменную.
какие «независимые» переЭтапы ДА
менные лучше всего подходят
ДА состоит из четырех основных этапов.
для такого предсказания.
1. Выбор переменных-предикторов. Исследователь использует свои теоретические знания, практический опыт, догадки и
52
т. п. для того, чтобы составить список переменных, которые могут повлиять на
результат группировки (переменную-критерий).
2. Обычно на начальном этапе ДА для предикторов формируется корреляционная матрица. В данном контексте она имеет особый смысл, называется
общей внутригрупповой корреляционной матрицей и содержит средние коэффициенты корреляции для двух или более корреляционных матриц (каждая для
одной группы). Помимо общей внутригрупповой корреляционной матрицы
можно также вычислить ковариационные матрицы для отдельных групп, для
всей выборки либо общую внутригрупповую ковариационную матрицу. Нередко исследователи применяют серию t-критериев между двумя группами для
каждой переменной либо однофакторный дисперсионный анализ, если число
групп оказывается больше двух. Поскольку целью дискриминантного анализа
является составление наилучшего уравнения регрессии, дополнительный анализ исходных данных никогда не является лишним.
3. Выбор параметров. В этом разделе будет продемонстрирован один из
методов ДА. По умолчанию программа реализует метод, который основан на
принудительном включении в регрессионное уравнение всех предикторов, указанных исследователем. В нашем случае используется метод Уилкса (Wilks),
относящийся к категории пошаговых методов и основанный на минимизации
коэффициента Уилкса (λ) после включения в уравнение регрессии каждого нового предиктора.
Так же как и в случае МР, сущест4. Интерпретация результатов. Це- вует критерий для включения прелью ДА является составление уравнения дикторов в уравнение регрессии
регрессии с использованием выборки, для (по умолчанию таким критерием
которой известны значения и предикторов, является F > 3,84) и критерий для
и критерия. Это уравнение позволяет по из- исключения предикторов из уравнения регрессии (по умолчанию F
вестным значениям предикторов опреде- < 2,71). Коэффициент k представлить неизвестные значения критерия для ляет собой отношение внутридругой выборки. Разумеется, точность рас- групповой суммы квадратов к обсчитываемых значений критерия для вто- щей сумме квадратов и характерирой выборки в общем случае не выше, чем зует долю влияния предиктора на
для исходной. Так, в нашем примере рег- дисперсию критерия. Со значением
k связаны величины F и р, характерессионное уравнение обеспечило около ризующие его значимость
90% корректных результатов для той выборки, с помощью которой оно было создано. Соответственно, точность предсказания успешности обучения для 10 абитуриентов может достигать 90%
лишь в том случае, если выборка претендентов совершенно идентична тем 46
учащимся, данные для которых послужили основой для прогноза.
Задача 3.3 [7]. Для решения требуется программа SPSS и файл данных DAFA-KA.sav. Файл DA-FA-KA.sav содержит данные о 46 учащихся (объекты с
1-го по 46-й), закончивших курс обучения, в отношении которых известны
оценки успешности обучения: «зачет» – 1, «незачет» – 0. Кроме того, в файл
53
включены данные предварительного тестирования этих учащихся до начала
обучения (13 переменных):
► и1, и2, ..., и11 – показатели теста интеллекта;
► э_и – показатель экстраверсии по тесту Г. Айзенка;
► н – показатель нейротизма по тесту Г. Айзенка.
Для 10 абитуриентов (объекты с 47-го по 56-й) известны лишь результаты их предварительного тестирования (13 перечисленных переменных). Значения переменной оценка для них еще неизвестны и в файле данных им соответствуют пустые ячейки. Требуется спрогнозировать успешность обучения 10
абитуриентов на основе предварительного тестирования в предположении, что
выборки закончивших обучение и абитуриентов идентичны.
1. Откройте
файл данных DAFA-KA.sav.
2. В меню
Analyze (анализ)
выберите команду
Classify ► Discriminant (классификация > дискриминантный
анализ). На экране
появится диалоговое окно Discriminant Analysis
(дискриминантный
анализ)
Рис. 3.5
(рис. 3.5).
3. Переместите переменную оценка в
поле Grouping Variable (группирующая переменная). Щелкните па кнопке Define Range
(задать диапазон), чтобы открыть диалоговое
окно Discriminant Analysis: Define Range
(дискриминантный анализ: Задание диапазона) (рис. 3.6). В поле Minimum (минимум)
Рис. 3.6
введите значение 0, в поле Maximum (максимум), введите значение 1 и щелкните на кнопке Continue (продолжить), чтобы
вернуться в диалоговое окно Discriminant Analysis (дискриминантный анализ).
4. Переменные от и1 до н переместите в список Independents (независимые переменные), установите переключатель Use stepwise method (использовать пошаговый метод).
5. Щелкните на кнопке Statistics (статистики), чтобы открыть диалоговое
окно Discriminant Analysis: Statistics (дискриминантный анализ: статистики)
54
(рис. 3.7). Установите флажки Means (средние), Box's M (М Бокса), Univariate
ANOVAs (однофакторный дисперсионный анализ), Unstardardized (нестандартизированные коэффициенты) и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis (дискриминантный анализ).
6. Щелкните па кнопке
Method (метод), чтобы открыть диалоговое окно Discriminant Analysis: Stepwise
Method (дискриминантный
анализ: пошаговый метод)
(рис. 3.8). В поле Entry
(ввод), введите значение
1,125, в поле Removal (вывод), введите значение 1 и
Рис. 3.7
щелкните на кнопке Continue
(продолжить), чтобы вернуться в диалоговое окно Discriminant Analysis
(дискриминантный
анализ).
7. Щелкните
на кнопке Classify
(классификация),
чтобы открыть диалоговое окно Discriminant Analysis:
Classification (дисРис. 3.8
криминантный анализ: классификация)
(рис. 3.9). Установите флажки Casewise results (результаты для объектов),
Summary
table
(итоговая таблица)
и щелкните на
кнопке
Continue
(продолжить), чтобы вернуться в диаРис. 3.9
логовое окно Discriminant Analysis (дискриминантный анализ).
55
8. Щелкните на кнопке ОК, чтобы открыть окно вывода.
В результате выполнения приведенных инструкций будут сгенерированы
коэффициенты (Canonical Discriminant Function Coefficients) для группировки
интересующих нас объектов в целях прогнозирования: На основе этих данных
можно составить уравнение регрессии
(0/1) = – 9,865 + 0,382 (счет в уме) – 0,241 (умозаключения) +
+ 0,214 (понятливость) + 0,185 (аналогии) + 0,162 (скрытые фигуры) +
+ 0,157 (заучивание слов) + 0,097 (экстраверсия)
или
(0/1) = – 9,865 + 0,382 (и4) – 0,241 (и9) + 0,214 (и5) + 0,185 (и7) + 0,162 (и2) +
0,157 (и11) + 0,097 (э_и).
3.4. Факторный анализ (ФА);
За последние 30–40 лет ФА приобрел значительную популярность в психологических и социальных исследованиях. Во многом этому способствовала
разработка Раймондом Кеттеллем знаменитого 16-факторного личностного опросника (16PF). Именно при помощи ФА ему удалось свести около 4500 наименований личностных особенностей к 187 вопросам, которые, в свою очередь, позволяют измерить 16 различных свойств личности.
ФА дает возможность количественно определить латентные переменные, которые непосредственно измерить невозможно, исходя из нескольких доступных измерению явных переменных. Например, явные характеристики «посещает развлекательные мероприятия», «много разговаривает», «охотно идет на контакт с любым незнакомым человеком» могут
служить оценками латентного качества «общительность», которое непосредственно не поддается количественному измерению. ФА позволяет выделить для большого числа признаков сравнительно узкий набор
«свойств», объединяющих более тесно связанные признаки в группы и называемые факторами.
Процедура ФА состоит из четырех основных стадий:
1. Вычисление корреляционной матрицы для всех переменных, участвующих в
анализе.
2. Извлечение факторов.
3. Вращение факторов для создания упрощенной структуры.
4. Интерпретация факторов.
Первые три операции кратко рассматриваются в следующих примерах; последняя операция описывается лишь на концептуальном уровне.
Задача 3.4 [7]. Для решения требуется программа SPSS и файл данных DAFA-KA.sav.
1. Откройте файл данных DA-FA-KA.sav.
56
2. В
меню
Analyze
(анализ)
выберите команду
Data Reduction ►
Factor (сокращение
данных > факторный анализ). На экране появится диалоговое окно Factor
Analysis (факторный анализ) (рис.
3.10). Переместите
переменные и1 –
и11 в список VaРис. 3.10
riables
(переменные).
3. Щелкните на кнопке Rotation (вращение), чтобы открыть диалоговое
окно Factor Analysis: Rotation (факторный анализ: вращение) (рис. 3.11). В
группе Method (метод) установите переключатель Varimax и щелкните на
кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Factor
Analysis (факторный анализ).
4. Щелкните на кнопке ОК,
чтобы открыть окно вывода.
При выполнении этого шага
проводится факторный анализ,
включающий следующие операции: 1) вычисление корреляционной матрицы для 11 переменных,
задействованных
в
анализе;
2) извлечение 11 факторов методом
главных
компонентов;
3) выбор для вращения всех факРис. 3.11
торов, чьи собственные значения
не меньше 1; 4) вращение факторов по методу Varimax; 5) вывод матрицы преобразования факторов.
Задача 3.5 [7]. Для решения требуется программа SPSS и файл данных DAFA-KA.sav. В этом примере проводится факторный анализ с участием тех же
11 переменных, что и в предыдущем случае, но задаются дополнительные параметры. Включены в вывод одномерные описательные статистики всех переменных, коэффициенты корреляции, а также критерий многомерной нормальности и адекватности выборки. Для извлечения факторов используется метод
главных компонентов, а для отображения – график собственных значений.
57
Вращение факторов производиться методом Varimax, а благодаря установке
флажка Loading plot(s) (диаграммы нагрузок), отображена факторная структура после вращения. Переменные сортируются по величине их нагрузок по факторам.
1. Откройте файл данных DA-FA-KA.sav.
2. В меню Analyze (анализ) выберите команду Data Reduction ► Factor
(сокращение данных > факторный анализ). На экране появится диалоговое окно Factor Analysis (факторный анализ)
(см. рис. 3.10). Переместите переменные
и1 – и11 в список Variables (переменные).
3. Щелкните на кнопке Descriptives (описательные статистики), чтобы
открыть диалоговое окно Factor Analysis: Descriptives (факторный анализ:
Рис. 3.12
описательные статистики) (рис. 3.12). В
группе Statistics (статистики) установите флажок Univariate Descriptives (одномерные описательные статистики), в
группе Correlation matrix (корреляционная матрица) – флажки Coefficients
(коэффициенты) и КMО and Barlett's Test of sphericity (критерии КМО и сферичности Барлетта) и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Factor Analysis (факторный анализ).
4. Щелкните на
кнопке Extraction (извлечение), чтобы открыть диалоговое окно
Factor Analysis: Extraction
(факторный
анализ:
извлечение)
(рис.3.13). Установите
флажок Scree Plot
(график собственных
значений) и щелкните
на кнопке Continue
Рис. 3.13
(продолжить), чтобы
вернуться в диалоговое
окно Factor Analysis (факторный анализ).
5. Щелкните на кнопке Rotation (вращение), чтобы открыть диалоговое
окно Factor Analysis: Rotation (факторный анализ: вращение) (рис. 3.11). В
группе Method (метод) установите переключатель Varimax, в группе Display
(отображать) – флажок Loading plot(s) (диаграммы нагрузок) и щелкните на
58
кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Factor
Analysis (факторный анализ).
6. Щелкните па кнопке Options
(параметры), чтобы открыть диалоговое окно Factor Analysis: Options
(факторный анализ: параметры), показанное на рис. 3.14. Установите флажок Sorted by size (сортировать по величине) и щелкните на кнопке Continue (продолжить), чтобы вернуться в
диалоговое окно Factor Analysis (факторный анализ).
Рис. 3.14
7. Щелкните на кнопке ОК, чтобы открыть окно вывода.
3.5. Кластерный анализ (КА)
КА имеет определенное сходство с ДА; сходство заключается в том, что
исследователь в обоих случаях ставит перед собой цель разделить совокупность объектов (а не переменных) на несколько более мелких групп. Тем не
менее, процесс классификации в двух видах анализа принципиально различен.
В КА объекты классифицируются на основе их различия без какой-либо предварительной информации о количестве и составе классов. В ДА количество и
состав классов изначально задан, и основная задача заключается в определении
того, насколько точно можно предсказать принадлежность объектов к классам
при помощи данного набора дискриминантных переменных (предикторов).
Выделяют несколько этапов КА: 1) выбор переменных-критериев для
кластеризации; 2) выбор способа измерения расстояния между объектами, или
кластерами (изначально
считается, что каждый
объект
соответствует
одному кластеру); 3)
формирование кластеров; 4) интерпретация
результатов.
Задача 3.6.
Для решения требуется программа SPSS и файл
данных KA.sav, который
содержит данные о 16
подержанных кардиотренажерах «беговая дорожка» разных марок,
Рис. 3.15
59
выставленных на продажу. Провести КА объектов.
1. Откройте файл данных KA.sav.
2. В меню Analyze (анализ) выберите команду Classify ► Hierarchical
Cluster (Классификация ► иерархическая кластеризация). Откроется диалоговое окно Hierarchical Cluster Analysis (иерархический кластерный анализ)
(рис. 3.15). Переменную фирма переместите в поле Label Cases by (Различать объекты по), а переменные цена –
усл_км
переместите
в
список
Variable(s) (переменные).
3. Щелкните на кнопке Plots (диаграммы), чтобы открыть диалоговое
окно Hierarchical Cluster Analysis:
Рис. 3.16
Plots (иерархический кластерный анализ: диаграммы) (рис. 3.16). Установите флажок Dendrogram (дендрограмма) и
переключатель None (нет) в группе Icicle (диаграмма накопления). Щелкните
на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster Analysis (иерархический кластерный анализ).
4. Щелкните на кнопке Method (метод), чтобы открыть диалоговое окно
Hierarchical Cluster Analysis: Method (иерархический кластерный анализ: метод) (рис. 3.17). В списке Cluster Method (метод кластеризации) оставьте выбранным пункт Between–groups linkage (межгрупповое связывание), в списке
Standardize (стандартизация) выберите пункт Z score (z-шкала) и щелкните па
кнопке Continue (продолжить), чтобы вернуться в
диалоговое окно Hierarchical Cluster Analysis (иерархический
кластерный
анализ).
5. Щелкните па кнопке Save (сохранить), чтобы
открыть диалоговое окно
Hierarchical Cluster Analysis: Save New Variables
(иерархический кластерный
анализ: сохранение новых
переменных) (рис.3.18). Установите
переключатель
Single Solution (заданное
число кластеров), введите в
Рис. 3.17
60
расположенное рядом поле значение 3 и щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster Analysis
(иерархический кластерный анализ).
6. Щелкните па кнопке ОК, чтобы открыть окно вывода.
Примечания: 1. В данном примере кластеризация осуществляется по следующим переменным: цена (стоимость), т_сост (экспертная оценка технического состояния по 10-балльной шкале), эксплуат (количество месяцев эксплуатации), усл_км (кол-во условных километров пробега с начала эксплуатации).
2. По умолчанию используется квадрат Евклидова расстояния,
согласно которому расстояние между объектами равно сумме квадратов разностей между значениями
одноименных переменных объектов. Предположим, что тренажер А
имеет показатели технического состояния и эксплуатации 7 и 7, а
тренажер В – 6 и 13. В этом случае
Рис. 3.18
расстояние между тренажерами вычисляется следующим образом: (7 – 6)2 + (7 – 13)2 = 37. При выполнении КА
сумма квадратов разностей вычисляется для всех переменных. Получаемые
расстояния используются программой при формировании кластеров. Помимо
Евклидова существуют и другие виды расстояний. При необходимости обратитесь к руководству пользователя SPSS. Относительно вычисления расстояния
может возникнуть следующий вопрос: будет ли адекватным результат КА в том
случае, если переменные имеют различные шкалы измерения? Так, все переменные файла KA.sav имеют самые разные шкалы. Для решения проблемы
шкалирования в SPSS используется стандартизация, в частности, ее простой
метод – нормализация переменных, приводящая все переменные к стандартной
z-шкале (среднее равно 0, стандартное отклонение – 1). Помимо одинаковой
шкалы нормализованные переменные также имеют равные веса. В случае, если
все исходные данные имеют одну и ту же шкалу измерения либо веса переменных по смыслу должны быть разными, стандартизацию переменных проводить
не нужно.
3. Существует два основных метода формирования кластеров: метод
слияния и метод дробления. В первом случае исходные кластеры увеличиваются путем объединения до тех пор, пока не будет сформирован единственный
кластер, содержащий все данные. Метод дробления основан на обратной операции: сначала все данные объединяются в один кластер, который затем делится на части до тех пор, пока не будет достигнут желаемый результат. По умолчанию программой SPSS используется метод слияния, и мы рассмотрим его в
этом разделе. В методе слияния предусмотрено несколько способов объедине61
ния объектов. Способ, применяемый по умолчанию, называется межгрупповым
связыванием, или связыванием средних внутри групп. SPSS вычисляет наименьшее среднее значение расстояния между всеми парами групп и объединяет
две группы, оказавшиеся наиболее близкими. На первом шаге, когда все кластеры представляют собой одиночные объекты, данная операция сводится к
обычному попарному сравнению расстояний между объектами. Термин «среднее значение» приобретает смысл лишь на втором этапе, когда сформированы
кластеры, содержащие более одного объекта. Так, в нашем примере на начальном этане имеется 16 кластеров (объектов); сначала в кластер объединяются
два объекта с наименьшим расстоянием друг от друга. Затем подсчет расстояний повторяется, и в кластер объединяется еще одна пара переменных. На втором этапе вы получите либо 13 свободных объектов и 1 кластер, объединяющий 2 объекта, либо 11 свободных объектов и 2 кластера по 2 объекта в каждом. В конечном счете, все объекты окажутся в одном большом кластере. Существуют и другие методы объединения объектов. При необходимости обратитесь к руководству пользователя SPSS.
4. Как и в случае ФА, желаемое число кластеров и оценка результатов
анализа зависят от целей исследователя. Для данного примера наиболее предпочтительно число кластеров, равное 3. Как показывает анализ, все тренажеры
можно разделить на 3 группы: 1-я группа (на дендрограмме занимает центральное положение) имеет среднюю стоимость (среднее значение – 11883), небольшой срок эксплуатации (8 мес) и низкий условный километраж (3139 км). 2-я
группа (на дендрограмме – вверху) имеет низкую стоимость (8750), небольшой
пробег, наибольший возраст, не высокое техническое состояние (6). 3-я группа
(на дендрограмме – внизу) содержит дорогие модели с небольшим сроком эксплуатации и изношенности, высоким баллом технического состояния.
62
Задача 3.7 [7]. Для решения требуется программа SPSS и файл данных DAFA-KA.sav. В этой задаче проводится КА, в котором вместо объектов участвуют переменные и1 – и11.
Обычно при группировании переменных исследователя интересует их
взаимосвязь, а не их различие (сходство), как при группировании объектов. Исключением является случай, когда данные представляют собой оценки объектов экспертами, в этом случае строки соответствуют экспертам, а столбцы –
оцениваемым объектам. Поскольку в нашем примере интерес представляют
именно взаимосвязи между переменными и мы хотим сравнить результаты с
ФА, то в качестве меры близости целесообразно выбрать корреляцию. При
этом корреляции надо учитывать по абсолютной величине, так как большие (по
модулю) отрицательные их величины так же свидетельствуют о связи, как и
большие положительные. Все это необходимо иметь в виду, если речь идет о
кластеризации переменных. Большинство остальных параметров команды оставим установленными по умолчанию; даже в стандартизации в данном случае
нет необходимости, так как на величину корреляции не влияют единицы измерения переменных. Добавим лишь дендрограмму в выводимые результаты и
исключим оттуда диаграмму накопления.
1. Откройте файл данных DA-FA-KA.sav.
2. В меню Analyze (анализ) выберите команду Classify ► Hierarchical Cluster
(классификация ► иерархическая кластеризация). Откроется диалоговое окно Hierarchical Cluster Analysis (иерархический кластерный анализ)
(рис.3.19). В группе Cluster (кластеризация) установите переключатель Variables (переменные). Переместите переменные и1 – и11 в список Variable(s)
(переменные).
3. Щелкните на кнопке
Plots
(диаграммы),
чтобы открыть диалоговое окно Hierarchical Cluster Analysis: Plots (иерархический кластерный анализ:
диаграммы)
(рис. 3.16). Установите флажок Dendrogram (дендрограмма)
и переключатель None
(нет) в группе Icicle
(диаграмма накопления). Щелкните на
Рис. 3.19
кнопке
Continue
(продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster
63
Analysis (иерархический
кластерный анализ).
4. Щелкните на кнопке
Method (метод), чтобы
открыть диалоговое окно Hierarchical Cluster
Analysis: Method (иерархический кластерный
анализ:
метод)
(рис. 3.20). В списке Interval (интервал) выберите пункт Pearson correlation
(корреляция
Пирсона), а в группе
Transform
Measures
Рис. 3.20
(преобразование значений) установите флажок
Absolute values (абсолютные значения). Щелкните на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster Analysis
(иерархический кластерный анализ).
5. Щелкните на кнопке ОК, чтобы открыть окно вывода.
64
Rotated Component Matrixa
аналогии
счет в уме
числовые ряды
умозаключения
заучивание слов
осведомленность
пропущенные слова
геометрическое
сложение
скрытые фигуры
понятливость
исключение
изображений
1
,792
,765
,752
,632
-,083
,045
,252
Component
2
,199
-,115
-,029
,247
,847
,773
,741
3
,040
,257
,069
,215
-,010
,108
,179
,281
-,036
,771
,093
,017
,071
,434
,752
,587
,170
,313
,341
Extraction Method: Principal Component Analysis .
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 5 iterations.
Сравните результаты КА и ФА, изображенные выше (см. файл DA-FA-KA.sav).
3.6. Многомерное шкалирование (МШ)
Основное достоинство МШ – представление больших массивов данных о
различии объектов в графическом виде. При МШ матрица различий между
объектами (вычисленными, например, по их экспертным оценкам) представляется в виде одно-, двух– или трех– и более мерного графического изображения
взаимного расположения этих объектов. Если две точки на изображении удалены друг от друга, то между соответствующими объектами имеется значительное расхождение; напротив, близость точек говорит о сходстве объектов.
МШ имеет много общих черт с ФА. Так же, как и при ФА, создается система координат пространства, в котором определяется расположение точек. Так
же, как и при ФА, происходит снижение размерности и упрощение данных.
Однако при ФА обычно используются коэффициенты корреляции, а при МШ –
меры различия между объектами. Наконец, в ФА наибольший интерес вызывают углы между точками, представляющими данные, а в МШ ключевой величиной является расстояние между этими точками.
Помимо факторного анализа МШ имеет несколько общих черт с КА (см.
раздел 3.5). В обоих случаях анализируется расстояние между объектами; однако при КА типичной является количественная процедура объединения объектов в группы (кластеры), а при МШ качественный анализ объектов проводится
визуально с помощью диаграммы.
65
Процедура ММШ SPSS, имеющая историческое название ALSCAL, фактически не является одной программой, а представляет собой набор небольших
процедур, каждая из которых соответствует своему типу данных. В этом разделе будут приведены несколько примеров для различных типов данных.
В первом примере будет обработана социограмма для группы учащихся;
здесь их количественные оценки отношений друг к другу будут преобразованы
в графическое изображение взаимного расположения учащихся.
Во втором примере будут рассмотрены результаты тестирования учащихся по пяти показателям и графически представлены различия между учащимися на плоском изображении.
Наконец, третий пример будет представлять собой небольшое исследование восприятия и понимания студентами пяти многомерных методов статистического анализа.
Задача 3.8 [7]. Для решения требуется программа SPSS и файл данных
MDS-1.sav. Квадратная асимметричная матрица различий. Преподаватель
решил создать идеальную психологическую обстановку в группе во время занятия, рассадив учащихся так, чтобы ни один из них не оказался рядом с тем,
кто ему не нравится. Для этого каждому из 12 студентов было предложено оценить степень своей симпатии к своим однокурсникам по пятибалльной шкале
(от 1 до 5, где 1 – максимум симпатии, а 5 – максимум антипатии). Результатом
МШ будет диаграмма, на которой удаленность точек будет соответствовать отношениям между учащимися.
Вначале необходимо создать квадратную (12 × 12) матрицу различий.
Позже на основе этой матрицы будет построено двухмерное изображение, иллюстрирующее взаимоотношения студентов. В ходе МШ исходная матрица 12
× 12 преобразуется в гораздо более простую матрицу 12 × 2 (где 2 – число измерений), содержащую координаты точек для изображения. Исходную матрицу
называют квадратной
асимметричной матрицей различий. Пояснения, что означают составляющие это
определение термины, даны в конце настоящего раздела.
1. Откройте
файл данных MDS1.sav. В меню Analyze (анализ) выберите команду Scale ►
Multidimensional
Scaling (шкалироваРис. 3.21
66
ние ► многомерное шкалирование). Откроется диалоговое окно Multidimensional Scaling (многомерное шкалирование). После выполнения предыдущего
шага у Вас должно быть открыто диалоговое окно Multidimensional Scaling
(многомерное шкалирование). Переместите переменные с1 – с12 в список Variables (переменные) (рис. 3.21).
2. Щелкните на кнопке Shape (форма),
чтобы открыть диалоговое окно Multidimensional Scaling: Shape Of Data (многомерное
шкалирование: форма данных). Установите
переключатель Square asymmetric (квадратная асимметричная) и щелкните на кнопке
Рис. 3.22
Continue (продолжить), чтобы вернуться в
диалоговое окно Multidimensional Scaling (многомерное шкалирование)
(рис. 3.22).
3. Щелкните
на кнопке Model
(модель), чтобы открыть диалоговое
окно Multidimensional
Scaling:
Model (многомерное шкалирование:
модель). В группе
Conditionality (условие) установите
переключатель Row
Рис. 3.23
(строка) и щелкните
на кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.23).
4. Щелкните на кнопке Options
(параметры), чтобы открыть диалоговое
окно Multidimensional Scaling: Options
(многомерное шкалирование: Параметры). Установите флажок Croup plots
(групповые диаграммы) и щелкните на
кнопке Continue (продолжить), чтобы
вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.24).
5. Щелкните на кнопке ОК, чтобы
открыть окно вывода.
Рис. 3.24
67
Задача 3.9 [7]. Для решения требуется программа SPSS и файл данных
MDS-2.sav. Квадратная симметричная матрица различий.
Преподавателю необходимо рассадить 12 учащихся в соответствии с результатами их тестирования по пяти показателям. Поскольку результаты тестирования не относятся к данным, характеризующим различия, необходимо сначала вычислить различия по имеющимся данным и таким образом свести задачу к предыдущей.
Исходные данные для этой задачи естественно представить в виде прямоугольной матрицы 12 × 5, в которой для каждого из 12 учащихся указаны результаты 5 тестов (файл MDS-2.sav). Затем по исходным данным строится
квадратная (12 × 12) матрица различий между учащимися. Наконец, как и в
предыдущем примере, SPSS создает матрицу координат 12 × 2 и визуально
представляет ее в виде диаграммы.
Обратите внимание на два ключевых свойства матрицы различий: она
является квадратной и симметричной. Несмотря на то, что исходная матрица
является прямоугольной, т. е. ее строки (объекты) соответствуют учащимся, а
столбцы (переменные) – тестам, в матрице различий как строки, так и столбцы
соответствуют учащимся, и, следовательно, матрица является квадратной с
размером 12 × 12. Далее, поскольку, к примеру, учащийся 1 отличается от уча-
68
щегося 5 по результатам тестирования так же, как учащийся 5 от учащегося 1,
матрица различий является симметричной.
В следующем примере демонстрируется двухмерное шкалирование
квадратной симметричной матрицы различий, которую SPSS создает при задании переменных из файла данных. Данные матрицы различий имеют интервальный тип. В этом примере используется файл данных MDS-2.sav.
1. Откройте
файл MDS-2.sav. В
меню Analyze (анализ) выберите команду Scale ► Multidimensional Scaling (шкалирование
►
многомерное
шкалирование). Откроется диалоговое
окно Multidimensional Scaling (многомерное шкалирование). Переместите
переменные тест1 –
Рис. 3.25
тест5 в список Variables (переменные) (рис.
3.25).
2. В группе Distances (расстояния) установите
переключатель
Create distances from data (вычислить расстояния
по данным) и щелкните на
кнопке Measure (мера),
чтобы открыть диалоговое
окно
Multidimensional
Scaling: Create Measure
from Data (многомерное
шкалирование: Создание
меры для данных). В
Рис. 3.26
группе Create Distance
Matrix (создание матрицы
расстояний) установите переключатель Between cases (между объектами) и
щелкните па кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.26).
69
3. Щелкните на кнопке Model (модель), чтобы открыть диалоговое окно
Multidimensional Scaling: Model (многомерное шкалирование: модель). В
группе Level of Measurement (уровень измерения) установите переключатель
Interval (интервальный) и щелкните на кнопке Continue (продолжить), чтобы
вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.27).
4. Щелкните
на кнопке Options
(параметры), чтобы
открыть диалоговое
окно Multidimensional Scaling: Options (многомерное
шкалирование: Параметры). Установите флажок Group
plots
(групповые
диаграммы)
и
Рис. 3.27
щелкните на кнопке
Continue (продолжить), чтобы вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.24).
5. Щелкните на кнопке ОК, чтобы открыть окно вывода.
70
Квадратная матрица – это матрица, строки и столбцы которой представляют
один и тот же набор объектов. В данном случае этим набором объектов является группа
учащихся: каждый учащийся оценивает меру своей симпатии/антипатии к каждому из
остальных. Если бы строки и столбцы матрицы представляли не одни и те же, а разные
объекты, матрица бы называлась не квадратной, а прямоугольной, которая в контексте
данного пособия не рассматривается.
Асимметричная матрица – это матрица, для которой отношение двух объектов
друг к другу может быть разным. Так, например, симпатия Петра к Ирине не означает,
что Ирине Петр тоже симпатичен. Визуально асимметричность матрицы выражается в
том, что как минимум для одной пары ячеек, симметрично расположенных относительно
главной диагонали матрицы, значения различны. Если же ни одного такого различия для
матрицы не установлено, то матрица называется симметричной. Примером матрицы, которая всегда симметрична, является корреляционная матрица.
Матрица различий – матрица, данные которой представляют меру различия. В
данном случае значения матрицы отражают степень отличия отношения одного студента
к другому от идеального; чем больше значение, тем больше различие. Существуют также
матрицы сходств, в которых значения отражают степень некоторого сходства. Если бы
преподаватель вместо матрицы различий составил матрицу сходств, то изображение, полученное в результате многомерного шкалирования, скорее внесло бы путаницу, чем помогло в решении задачи.
Задача 3.10 [7]. Для решения требуется программа SPSS и файл данных
MDS-3.sav. Пример двухмерного шкалирования с использованием квадратных
симметричных матриц и модели индивидуальных различий. В обоих рассмотренных примерах создавалась единственная матрица различий, на основе
которой вычислялись координаты точек-объектов для визуального представления. Однако в некоторых случаях возможно координатное представление нескольких матриц различий; примером может служить ситуация, когда несколько экспертов оценивают один и тот же набор объектов. В этих случаях говорят о ММШ индивидуальных различий.
Шести студентам предложили сравнить между собой 5 многомерных
статистических методов: множественный регрессионный анализ (МР), факторный анализ (ФА), кластерный анализ (КА), дискриминантный анализ (ДА) и
многомерное шкалирование (МШ). Каждым студентом предъявляются все возможные пары из этих методов для оценки различия между ними (1 – максимально сходны, ..., 5 – максимально различны). Затем по данным для 6 студентов составляется 6 матриц различий (5×5 каждая).
Поскольку SPSS предъявляет определенные требования к формату данных при использовании модели индивидуальных различий, был создан специальный файл MDS-3.sav (рис. 3.28). Требования к формату файла сводятся к
наличию в этом файле нескольких квадратных матриц одинакового размера. В
файле MDS-3.sav присутствует 6 матриц размером 5×5. Первые 5 строк файла
соответствуют первой матрице, следующие 5 строк – второй матрице, и т. д.
Всего под матрицы отведено 30 строк.
71
1. Откройте файл
данных MDS-3.sav. В
меню Analyze (анализ)
выберите команду Scale ► Multidimensional
Scaling (шкалирование
► многомерное шкалирование). Откроется
диалоговое окно Multidimensional Scaling
(многомерное шкалирование). Переместите
переменные mra – mds
в список Variables (переменные) (.
2. Щелкните на
кнопке Model (модель), чтобы открыть
диалоговое окно Multidimensional Scaling:
Model (многомерное
шкалирование:
модель), показанное на
рис. 3.29. В группе
Level of Measurement
(уровень
измерения)
установите переключатель Ratio (отношение), а в группе Scaling
Model (модель шкалирования) – переключатель Individual differences Euclidian distance (индивидуальные
различия. Евклидово
расстояние), после чего
щелкните на кнопке
Continue
(продолжить), чтобы вернуться
в диалоговое окно
Multidimensional Scaling (многомерное шкалирование).
Рис. 3.28
Рис. 3.29
72
3. Щелкните на кнопке Options (параметры), чтобы открыть диалоговое
окно Multidimensional Scaling: Options (многомерное шкалирование: параметры). Установите флажок Croup plots (групповые диаграммы) и щелкните на
кнопке Continue (продолжить), чтобы вернуться в диалоговое окно Multidimensional Scaling (многомерное шкалирование) (рис. 3.24).
4. Щелкните на кнопке ОК, чтобы открыть окно вывода.
МШ
ФА
КА
МР
ДА
Dimension 1 (абсцисса) – слева расположены методы, основанные на
корреляции, справа – на различиях по расстоянию.
Dimension 2 (ордината) – сверху структурные методы, снизу – методы
предсказания.
Контрольные вопросы
1. Множественный регрессионный анализ (МР).
2. Факторный анализ (ФА).
3. Многомерное шкалирование (МШ).
4. Кластерный анализ (КА).
5. Дискриминантный анализ (ДА).
73
4. ТЕХНИКИ ЭКСПЕРИМЕНТОВ O, P, Q, R, S, T
В 1946 г. Р. Кеттелл предложил схемы эксперимента для выборок с малым n, названные «техника P» и «техника O» [27].
Техника P заключается в том, что одному испытуемому предъявляется
не очень большое количество тестов, повторяющихся через некоторые интервалы времени и в результате получают «серию случаев». Обычно определяются
корреляции между каждой парой таких «переменных», что дает коэффициенты,
показывающие, в какой мере два теста (например, тесты на психологическую и
физиологическую реакцию на стресс), выполняемые данным испытуемым в течение какого-то времени, характеризуются одинаковым колебанием результатов. В этом случае можно определить основные влияния, лежащие в основе
этих колебаний и изменений, и характерные для индивидуальных особенностей
испытуемого.
Техника P позволяет изучать: 1) индивидуальные, неповторимые свойства испытуемых; 2) их психосоматические связи.
Техника О применятся при исследовании одного испытуемого. Но в отличие от техники Р здесь коррелируют не тесты, выполняемые человеком в течение довольно большой серии случаев, а сами эти случаи. Например, используется большая серия тестов (не менее 20 – 25). С их помощью обследуется
один человек в течение, скажем, m дней. Каждый день мы получаем какой-либо
набор оценок из всех тестов серии. Здесь коррелируют не тесты, а дни.
Техника О является транспонированной к технике Р (табл. 4.1).
Таблица 4.1
Тесты
Дни
1
2
3
…
m
А
А1
А2
А3
Аm
B
B1
B2
B3
Bm
Строки,
C
C1
C2
C3
Cm
коррелирующие
…
при технике Р
N
N1
N2
N3
Nm
Столбцы, коррелирующие при технике O
Когда же речь заходит об экспериментах для выборок с большими n,
применяют «технику R» и «технику Q».
Техника R применяется при исследовании по возможности больших
групп объектов с помощью одноразового единовременного тести- Например, если с помощью техники R
рования признаков относительно определяются физические качества или
небольшим количеством тестов. телесно-кинестетические интеллектуальВ этом случае определяют попар- ные способности группы испытуемых, то
ные взаимосвязи показателей при- техника Q определяет «лиц со способностями к спортивной деятельности».
знаков.
74
Техника Q исследует корреляции (или близости) между относительно
небольшим количеством объектов, единовременно прошедших большую серию
тестов. Полученные данные (коэффициент корреляции или расстояние) показывают, в какой мере два объекта одинаковы при выполнении одних и тех же
тестов. Техника Q является транспонированной к технике R (табл. 4.2).
Таблица 4.2
Испытуемые
Тесты
(объекты)
1
2
3
…
m
А
А1
А2
А3
Аm
B
B1
B2
B3
Bm
Строки,
C
C1
C2
C3
Cm
коррелирующие
…
при технике Q
N
N1
N2
N3
Nm
Столбцы, коррелирующие при технике R
Последнее время все чаще начинают применяться еще две техники, названные «техника S» и «техника T».
В технике S сопоставляются результаты двух испытуемых при выполнении одного теста в течение целой серии случаев. Она имеет особое значение
для социальной психологии, поскольку может помочь при измерении сходстваразличия реакций двух человек на идентичные задания в течение целой серии
случаев. Исследование таких групп, состоящих из двух человек, как, например,
близнецы, мужья и жены, руководители и их подчиненные и т. п., даст материал, с помощью которого можно будет изучить, насколько одинаково или неодинаково выполняли два человека определенные задания в данной серии случаев. Эта техника может иметь большое значение для эмпирического определения группы людей с учетом их реакции на задания или ситуации. Именно этим
социальным аспектом объясняется обозначение техники буквой S (англ. social).
В технике Т сопоставляются два случая выполнения одного теста
большой группой испытуемых. Она представляет собой попросту анализ надежности, определяемой для одного и того же теста и для тех же самых испытуемых в различных обстоятельствах. Много респондентов выполняют один и
тот же тест два раза. Возникает вопрос: будут ли результаты первого испытания теми же, что и второго, т. е. будет ли группа людей, плохо выполнивших
тест в первый раз, той же, что и группа людей, плохо выполнивших тест во
второй раз? Техника T является транспонированной к технике S (табл. 4.3).
Таким образом, существуют три основные экспериментальные модели,
каждая из которых включает две техники. Всего таких техник шесть. Каждая
основная схема включает три главных элемента: «испытуемый объект», «тест»
(задание) и «случай». В каждой такой схеме один из элементов является постоянным, а два остальных – переменными. Таким образом: а)
75
а) первая схема с техниками R и Q относится к одному случаю (случай –
constant);
б) вторая схема с техниками О и Р относится к одному испытуемому;
в) третья схема с техниками S и Т относится к одному тесту.
Таблица 4.3
Испытуемые
Случаи
(объекты)
1
2
3
…
m
А
А1
А2
А3
Аm
B
B1
B2
B3
Bm
Строки,
C
C1
C2
C3
Cm
коррелирующие
…
при технике S
N
N1
N2
N3
Nm
Столбцы, коррелирующие при технике T
Техники Р и S используют серию случаев, техники О и Q – серию тестов, техники R и Т – группу испытуемых.
В техниках Р и R коррелируют тесты, О и Т – случаи, Q и S – испытуемые объекты.
Таблица 4.4
СтрокиТехника
Исследуют
Применяют
Коррелируют
столбцы
O
Серию тестов
Случаи
║
1 испытуемого
P
Серию случаев
Тесты
═
Q
Серию тестов
Испытуемые
═
1 случай
R
Группу испытуемых Тесты
║
S
Серию случаев
Испытуемые
═
1 тест
T
Группу испытуемых Случаи
║
Контрольные вопросы
1. Техника эксперимента типа «O».
2. Техника эксперимента типа «P».
3. Техника эксперимента типа «Q».
4. Техника эксперимента типа «R».
5. Техника эксперимента типа «S».
6. Техника эксперимента типа «T».
7. Какими техниками эксперимента исследуется объект?
8. Какими техниками эксперимента исследуются условия?
9. Какими техниками эксперимента исследуется методика?
76
Приложение 1
Пример экспериментального плана с малым объемом выборки
ПРИВИВКА ПРОТИВ СТРЕССА: КОГНИТИВНАЯ ТЕРАПИЯ ГНЕВА
И ЕЕ ПРИМЕНЕНИЕ В СЛУЧАЕ ДЕПРЕССИИ3
Реймонд Новако, Калифорнийский университет, Ирвайн, 19774
Специальные вопросы
В клинической психотерапии в целях устранения расстройств на почве
гнева (до 70-х гг. ХХ в.) уделялось немного внимания теории, так и экспериментированию. В статье представлено развитие метода когнитивной (образовательной) поведенческой терапии, используемого для купирования гнева, а также результаты его применения к госпитализированному депрессивному пациенту с серьезными проблемами на почве гнева. Метод лечения назван «прививка против стресса», который состоит из трех основных ступеней: когнитивной подготовки, приобретения навыков и их повторения, практических занятий. Обсуждается связь между гневом и депрессией.
Введение
В современном обществе стресс и вспышки гнева стали распространенным явлением. Стрессоры, с которыми мы сталкиваемся в повседневной жизни,
становятся причиной раздражительности, часто проявляющейся в виде гнева. В
своей работе Реймонд Новако исследует «расстройства на почве гнева» и их
лечение.
A. Лечение расстройств на почве гнева оказалось вне поля зрения как
теории психотерапии, так и исследовательской практики. При этом имеется
обилие лабораторных исследований, посвященных агрессии. Ранее Новако
представил метод лечения хронической гневливости и провел его экспериментальный анализ. Хотя и встречаются разрозненные сообщения об ограниченных вмешательствах в случае проявлений гнева, существует явная потребность
в координации работ в этой области. С целью создания более детальной концепции проблемы гнева и терапевтических вмешательств в случае его проявлений в настоящей работе описано развитие когнитивной поведенческой терапии
и представлены результаты ее применения к госпитализированному депрессивному пациенту с серьезными проблемами на почве гнева.
Пациентов, имеющих серьезные проблемы с контролированием гнева,
ранее успешно лечили с помощью метода когнитивной поведенческой терапии.
В настоящей работе этот метод лечения получает дальнейшее развитие, следуя
3
Заметим, что существует множество иных способов купирования гнева, поэтому приведенную работу следует рассматривать только как пример проведения эксперимента
с малым объемом выборки.
4
Статья сокращена и адаптирована автором настоящего учебного пособия.
77
процедуре, названной прививкой против стресса, которая ранее использовалась для устранения проблем, связанных с тревогой и болью.
Терапия «прививки против стресса», разработанная Майхенбаумом
(1975), состоит в том, чтобы помочь пациенту выработать когнитивные, эмоциональные и поведенческие навыки, а затем обеспечить практику этих навыков, подвергая пациента регулируемому, дозированному воздействию стрессоров, которые приводят в действие, но не перенапрягают его защитные механизмы. Метод прививки против стресса включает три основных шага или фазы:
а) когнитивную подготовку, б) приобретение навыков и их повторение и в)
практические занятия. Этот подход был впервые разработан для подготовки
полицейских. Описаны дальнейшее развитие этого подхода как клинической
процедуры и его применение для купирования гнева у депрессивного пациента,
помещенного в отделение интенсивной психотерапии.
B. Когнитивная подготовка. Начальная фаза служит для информирования
пациентов о функциях гнева и об особенностях его проявления, для налаживания взаимопонимания между пациентом и терапевтом и для обоснования данного метода лечения. Этому способствует специальное учебное руководство
для пациентов. В руководстве описываются механизмы и формы гнева, случаи,
когда гнев превращается в проблему, причины гнева и способы его регуляции.
Компонентами фазы когнитивной подготовки являются: а) идентификация людей и ситуаций, которые вызывают гнев; б) признание различий между
гневом и агрессией; в) понимание когнитивных, соматических и поведенческих
детерминант гнева, причем особый упор делается на провоцирующие гнев вербальные самовнушения; г) проведение грани между оправданным и немотивированным гневом; д) распознавание признаков напряжения и возбуждения в
начале провоцирующей цепочки и е) представление концепции купирования
гнева в качестве стратегии противодействия.
C. Приобретение навыков и их повторение. Процесс приобретения навыков включает в себя знакомство с тремя группами приемов противодействия,
моделирование этих приемов терапевтом и повторение их пациентом. На когнитивном уровне пациента учат тому, как можно посмотреть на провоцирующие ситуации альтернативным образом – путем изменения своих личных конструктов и более спокойного отношения к событиям, которым часто придают
преувеличенное значение.
Двумя ключевыми когнитивными приемами регуляции гнева являются:
проблемно-ориентированный подход к провоцирующему воздействию и позитивные вербальные самовнушения. Проблемно-ориентированный подход включает в
себя нацеленность на желаемые результаты и использование поведенческой стратегии, направленной на достижение этих результатов. Самоинструкции используются для того, чтобы смягчить оценку провоцирующего воздействия и направлять противодействующие модели поведения. Самоинструкции служат тому, чтобы использовать их на различных стадиях провоцирующей цепочки, а именно, во
время: а) подготовки к провоцирующему воздействию, б) воздействия и конфрон78
тации, в) подавления возбуждения и г) последующей рефлексии, когда конфликт
либо не разрешается, либо разрешается. Стадии в) и г) отвечают за возможную
неудачу саморегуляции и за продление состояния возбуждения или его повторение путем постоянных размышлений о случившемся.
На эмоциональном уровне пациента учат навыкам релаксации, а также
призывают его сохранять чувство юмора как средство, позволяющее забыть о
гневе. Обучение релаксации проводилось с помощью психотелесного метода
Якобсена, состоящего в последовательном напряжении и расслаблении различных групп мышц. Упор должен делаться как на физическую, так и на психическую релаксацию, состоящую в создании приятных мысленных образов в целях
приведения человека в состояние легкой сонливости. Процедуру дополняют
дыхательные упражнения. Экспериментально подтверждено, что когнитивный
контроль более эффективен по сравнению с релаксацией. Однако релаксация
позволяет пациенту осознать физическое напряжение и волнение, предшествующие проявлению гнева, и пробуждает в нем веру в его способность справляться с неприятными внутренними состояниями.
Поведенческие цели лечения состоят в том, чтобы обеспечить эффективное проявление чувств, уверенность в собственных действиях и осуществление
шагов, ориентированных на разрешение трудностей. В общем, пациента побуждают использовать гнев так, чтобы максимально проявлялись его адаптивные
функции и сводились к минимуму те его функции, которые затрудняют адаптацию. К позитивным функциям гнева относится его действие в качестве источника энергии, стимулятора чувства контроля и средства, позволяющего справиться с проблемной ситуацией.
Терапевтическая процедура позволяет пациентам распознать гнев и его
источник в окружающей среде, а затем излить этот гнев в невраждебной форме.
Этот прием обеспечивает контроль за накоплением гнева, предотвращает агрессивную избыточную реакцию и создает предпосылки для изменения ситуации, вызвавшей гнев.
Пробуждение у пациента про- Гнев – это эмоциональная реакция на
блемно-ориентированных
реакций стресс или конфликт, вызванная тем,
способствует проявлению моделей по- что внешние события приходят в
ведения, направленных на разрешение противоречие с нашими желаниями.
трудностей. Плохая поведенческая
приспособляемость связана с неспособностью человека реагировать на трудности эффективно, для достижения желаемых целей. Купирование гнева включает в себя конфронтационную стратегию, когда человек учится сосредоточиваться на проблемах и целях. Такие модели поведения можно быстро приводить в действие и последовательно направлять средствами самовнушений.
D. Практические занятия. Практические занятия формируют навыки. Регуляция гнева – это проявление нашей способности справляться с провоцирующей ситуацией, и на этой стадии лечения пациентам предоставляется шанс
проверить свои возможности. Пациент подвергается дозированному воздейст79
вию провоцирующих гнев стимулов, которые мысленно им представляются
или предъявляются во время ролевых игр. Содержание этих имитаций подбирается исходя из иерархии вызывающих гнев ситуаций, с которыми пациент,
скорее всего, столкнется в реальной жизни. Последовательно работая над каждым иерархическим эпизодом, сначала мысленно, а затем во время ролевых
игр, пациент получает возможность отшлифовать навыки обуздания гнева, которые он ранее разучил вместе с терапевтом.
E. История болезни. Пациент – 38-летний мужчина, начальник отдела
кредитования в крупной коммерческой фирме, жалующийся на большие перегрузки на работе, был помещен в психиатрическое отделение больницы с диагнозом депрессивный невроз. После помещения его в клинику выяснилось, что
он находится в состоянии тяжелой депрессии, его преследуют суицидальные
мысли и сомнения в собственной полноценности. В середине рабочего дня у
него начинались головные боли, его преследовали боли в левой половине груди, причиной которых, как выяснилось в ходе проверки на диагностическом
тренажере, было мышечное напряжение. Пациент пробыл в больнице 3 недели,
затем лечащий врач передал его мне для проведения курса психотерапии. В то
время я как раз начал вести среди персонала курс, посвященный терапии гнева.
Основной поведенческой средой, в которой у пациента возникали трудности с
контролем гнева, были производство, дом и церковь. Пациент был женат и
имел шестерых детей, один из которых отличался избыточной активностью.
Сложившаяся на работе обстановка способствовала накоплению у пациента гнева и враждебных чувств по отношению к руководителям, коллегам и
подчиненным. На работе он, как правило, чрезмерно контролировал свой гнев –
активно подавлял его, а затем периодически взрывался, разражаясь потоком
бранных выражений и проклятий, когда возникал конфликт. Дома он вел себя
более импульсивно и агрессивно – накопленные на работе напряжение и фрустрация приводили к тому, что дома он очень легко поддавался на провокации,
особенно остро реагируя на хулиганские выходки детей. Шум, непослушание и
частые стычки между детьми являлись подходящим поводом для проявления
гнева. Он быстро изливал свой гнев в вербальной и физической форме. Не будучи строгим родителем, он прибегал к физическим воздействиям и угрозам применения силы (например, к таким: «Я сверну твою чертову голову»), как к средству контроля за поведением детей. Недисциплинированность детей часто превращалась в проблему во время церковных служб. В свое время пациент учился
в семинарии и поэтому привык ценить посещения церкви всей семьей. Однажды, перед самой госпитализацией, пациент решительно выдворил из церкви
двух своих мальчиков за учиненный ими беспорядок и высказал в их адрес такие угрозы, что один из них убежал прочь. В этот момент пациент начал осознавать, что его реакция на происходящее «перехлестывает через край», но чувствовал себя неспособным внести в свое поведение желаемые коррективы.
В период госпитализации лечебные занятия проводились 3 раза в неделю
в течение 3,5 недель. После выписки в течение 2 месяцев дважды в неделю
80
проводились амбулаторные беседы. Во время этих бесед обсуждались случаи
проявления гнева, занесенные пациентом в дневник. Постоянно осуществлялось моделирование приемов обуздания гнева, их повторение и практика.
F. Измеряемые зависимые переменные. Готовность поддаться на провокацию определялась сначала с помощью опросника, включавшего в себя описание 80 ситуаций проявления гнева, которые респондент оценивал используя
5-балльную шкалу. Было выявлено, что этой шкале присущ высокий уровень
внутренней согласованности для различных совокупностей испытуемых.
G. Поведенческие оценки выставлял психолог-клиницист, имевший 9летний опыт последипломной работы. Выставлялись бинарные оценки по
14 характеристикам проявления гнева (например, нетерпелив в отношениях с
людьми, выражает недовольство другими людьми, угрожает причинить вред
кому-то, быстро проявляет антагонистические реакции), и по 8 характеристикам конструктивных действий и позитивных сдвигов (например, добродушен и
обладает чувством юмора, преисполнен оптимизма в отношении будущего,
терпим и внимателен к другим людям, находит конструктивные решения в
конфликтных ситуациях, уверен в себе). Выставлялись шкальные оценки по
трем поведенческим параметрам: а) «Человек находится в состоянии равновесия и ведет себя непринужденно», б) «Человек демонстрирует враждебность
или гнев (проявленный гнев)» и в) «Человек сдерживает гнев и негодование
(подавленный гнев)». Эти пункты оценивались с помощью 8-балльных шкал,
диапазон которых простирался от слов «вовсе нет» до «именно так», проставленных против каждого деления шкалы.
H. Надежность поведенческих оценок бинарно определялась во время
групповой терапии, трудотерапии и отдыха в 9-ти периодах наблюдения, причем в каждых условиях велось наблюдение в среднем за восемью пациентами.
Роль оценивающих выполняли 4 медсестры психиатрической клиники, имевшие в среднем 6-летний трудовой стаж, а также психолог-клиницист.
I. Средний процент согласия по 22 пунктам для каждой пары оценивающих был равен 84,6%. По 3 параметрам шкалы оценки психолога коррелировали с оценками 3 медсестер, которые поочередно наблюдали за пациентом на 3х занятиях курса групповой терапии. Средние корреляции были 0,76 для пункта
1, 0,86 – для пункта 2 и 0,66 – для пункта 3. Таким образом, наибольшая согласованность была получена для оценок «проявленного гнева» и наименьшая –
для оценок «подавленного гнева». В случае групповой терапии оценки поведения психологом также коррелировали с самооценками пациента, что дало корреляции 0,92, 0,68 и 0,75 для соответствующих пунктов. Был сделан вывод, что
эти суждения являются достаточно надежными для анализа настоящего случая.
J. Наблюдение пациента за собственными гневными реакциями является
неотъемлемой частью лечебной процедуры. Пациент вел дневник наблюдений
за проявлениями гнева, по которым выставлялись две оценки по 7-балльной
шкале: а) степень испытанного гневного возбуждения и б) степень успеха, достигнутого в обуздании гнева. Как уже говорилось, в отдельных случаях гневное
81
возбуждение оправданно и уместно. Следовательно, важно оценить то, в какой
степени регуляция гнева вызвала появление конструктивной реакции на провоцирующее воздействие. Наш пациент проявлял свой гнев главным образом дома и на работе. В больнице он выплескивал его лишь изредка. Поэтому пациент
оценивал свое поведение во время визитов домой по выходным дням, когда ему
разрешали покидать клинику, а после выписки и возвращения на работу он делал это ежедневно.
K. Результаты. Оценка готовности пациента поддаться на провокацию,
проводившаяся перед началом лечения с помощью опросника, принесла суммарный результат по всем показателям равный 301 баллу. При выписке была
проведена повторная оценка, которая дала 258 баллов. Разница в 43 балла представляет собой снижение более чем на 1 стандартное отклонение, полученное
для выборки по колледжам и для пациентов с хроническими проблемами на
почве гнева, участвовавшими в предыдущем исследовании.
Непрерывные замеры изменений в поведении были получены с помощью
шкал поведенческих оценок и исходя из самооценок пациента. Поведенческие
оценки гнева были получены в ходе групповой терапии. Поскольку пациент
уже находился в больнице в течение 3 недель перед тем, как он был направлен
на лечение, можно было получить только однонедельный исходный уровень
характеристик.
L. Результаты замеров характеристик поведения и шкальных оценок
эмоциональной реакции представлены на рис. П 1.1. Можно заметить, что в
процессе лечения у пациента наблюдались позитивные сдвиги по всем показателям. Со временем возросло количество позитивных характеристик поведения
и шкальных суждений об уравновешенной эмоциональной реакции, тогда как
антагонистические действия и суждения о проявленном и подавленном гневе
шли на убыль.
M. После 3-ей недели проведения курса лечения лечащий врач, персонал
и пациент сошлись на том, что настало время выписки. Данные об улучшении
состояния пациента были получены исходя из самооценок гнева и его обуздания. Они фиксировались во время отлучек пациента из больницы по выходным
дням в течение периода госпитализации и ежедневно после выписки.
N. На рис. П 1.2 представлены результаты за 60 дней, в течение которых
фиксировались самонаблюдения частоты проявлений гнева, их интенсивности
и степени контроля. Из 5 недель периода госпитализации отражены только последние 15 дней, т. к. проявлений гнева в связи с событиями, происходившими
в больнице, было немного, они опущены.
Из-за отсутствия более удовлетворительного исходного периода (который нельзя было продлить ввиду продолжительности пребывания пациента в
отделении интенсивной психотерапии до начала лечения) перемены в поведении должны были оцениваться по ходу лечения. В выходные дни перед началом лечения средняя частота проявлений гнева была 4,0 в день, и, по словам
пациента, этот показатель был вполне типичным. Можно заметить, «что сред82
няя частота проявлений гнева уменьшилась с 1,55 в день в течение первого 20дневного периода до 1,10 в день для второго 20-дневного интервала и до 0,40 в
день для третьего интервала. Средние оценки интенсивности гнева для этих интервалов были соответственно 4,30; 4,62 и 4,25, тогда как средние оценки обуздания гнева были соответственно 4,30; 4,97 и 4,50. Это указывает на то, что, когда пациент все-таки начинал гневаться, степень регуляции гнева была соразмерна степени возбуждения или превышала ее. Необходимо отметить, что отдельные по-настоящему успешные случаи самоконтроля иногда не фиксировались пациентом, который, подобно многим депрессивным личностям, не желал
придавать слишком большого значения своим достижениям. Поэтому он периодически не регистрировал случаи, когда ему удавалось добиться высокой
степени самоконтроля и обуздать свой гнев. К сожалению, не удалось получить
оценок от его жены, но она заметила, что его состояние постоянно улучшается,
разительно отличаясь от его предшествующего поведения.
Рис. П 1.1. Оценки врачом поведения пациента при проявлениях гнева
и его обуздания во время госпитализации
83
O. Среди наиболее очевидных и важных достигнутых поведенческих изменений было уменьшение импульсивной агрессии, проявлявшейся в виде карательных действий в ответ на хулиганские выходки детей. В период лечения пациент зафиксировал в дневнике многочисленные случаи физических стычек между мальчиками, которые пробуждали в нем чувство гнева. Было отмечено 10 подобных инцидентов, произошедших дома, 5 – в автомобиле и 2 – в церкви. Рассматривая 2 последних места действия, можно оценить серьезность происшествий и их потенциальный эффект. Например, инциденты, которые произошли в
автомобиле, были по-настоящему нервирующими. Кулачные бои между мальчиками завершались
тем, что у них оказывались разбитыми
губы,
появлялись
синяки под глазами
и шишки на голове.
В одном случае в
качестве
оружия
был
использован
гриф тяжелоатлетической штанги. Несмотря на серьезность этих происшествий, в течение
трехмесячного периода лечения пациент лишь 3 раза
применял к своим
детям физическое
воздействие. До начала лечения для него было обычным
делом
ударить
мальчиков в ответ
на драку или предшествующую
ей
словесную перепалку.
Рис. П 1.2. Самооценки частоты проявлений гнева,
P. Саморегуего интенсивности и степени его обуздания
ляция гнева является весьма важным
аспектом способности справляться со стрессом.
Серьезность клинической проблемы – немаловажный фактор. То, что
этот фактор нельзя сбрасывать со счетов, видно из сравнения продолжительно84
сти лечения в настоящем случае с продолжительностью предыдущего контролируемого исследования. В клинической выборке, исследовавшейся Новако
(1975), во время экстенсивной долечебной оценки были выбракованы все испытуемые, за исключением тех, у которых были серьезные проблемы на почве
гнева. Однако Новако использовал выборку с амбулаторными больными, и в
ходе 6 лечебных занятий были достигнуты статистически значимые результаты. Сопоставимые результаты потребовали и занятий в больнице и в амбулаторных условиях. Вдобавок стали более совершенными клинические процедуры, было использовано учебное руководство и ежедневно с помощью магнитофона проводилась релаксационная терапия. Серьезность проблемы на почве
гнева была осложнена психическими нарушениями, связанными с депрессией.
Анализ эксперимента (по Р. Солсо) [6].
Первый разд. A являет собой прекрасный пример вводной части, в которой указывается актуальность эксперимента, кратко сообщается о методе лечения и использовании полученных результатов. Формальная гипотеза не выдвигается, но приводится достаточно деталей для того, чтобы читатель сам мог вывести ее логическим путем.
Во введении дается определение методу «прививки против стресса», а в
разд. B, C и D описываются ступени этого метода, даются операциональные
определения понятиям.
Подробная история болезни приведена в разд. E. Специальные тесты
описаны в разд. F и поведенческие оценки в разд. G и I. В разд. H определяется
надежность оценок. Пациент также вел наблюдение за своими гневными реакциями J. В разд. K проводится сравнение результатов, полученных с помощью
опросников во время предварительного лечения и в момент выписки. Результаты представлены в разделе L на рис. П 1.1, на котором изображены 5 различных показателей поведения пациента в состоянии гнева и его обуздания.
Из разд. M мы узнаем, что психиатр, персонал и пациент приняли решение о выписке последнего. Долговременные эффекты лечения представлены в
разд. N и на рис. П 1.2. В разд. O излагается взгляд экспериментатора на успех
лечения и серьезность исходной проблемы; а в разд. P исследование обсуждается в контексте теоретического вопроса, поднятого во введении.
Контрольные вопросы
1. Обсудите проблемы, связанные с объективным измерением зависимых переменных в клинических исследованиях.
2. Почему полученные результаты не обсуждаются с точки зрения статистической
достоверности?
3. Почему показания снимались и до начала лечения?
4. Почему исследователь решил использовать многомерные оценки поведения?
5. Какие меры предосторожности были предприняты, чтобы гарантировать объективность поведенческих оценок?
6. Почему составной частью исследования является подробная история болезни?
7. Какие важные этические вопросы затронуты в исследовании?
85
Приложение 2
Пример экспериментального плана с большим объемом выборки
ЗАПОМИНАНИЕ ЧАСТОТНОСТИ ПРОДЕМОНСТРИРОВАННЫХ
ПРИЕМОВ КАРАТЭ5: СРАВНЕНИЕ МАСТЕРОВ И НОВИЧКОВ
Бернард Дж. Бедон, Дарлин В. Хауард, Джорджтаунский университет, 19926
Специальные вопросы: субъектные переменные
Субъектные переменные – это независимые переменные, характеризующие индивидуума, как субъекта исследования. Этот тип переменной не подвергается активному воздействию со стороны экспериментатора; она просто
выбирается – в качестве характеристики, являющейся неотъемлемым свойством испытуемого (субъекта). Например, распространенными субъектными
переменными являются пол, расовая принадлежность, возраст, социальный
статус, тип личности или IQ (коэффициент умственного развития). Этими
переменными нельзя манипулировать в лабораторных условиях. Однако необходимо сделать одно предупреждение: экспериментатор должен добиваться того, чтобы между выбранной субъектной переменной и другой субъектной переменной отсутствовала какая-либо систематическая связь. Это называют смешиванием субъектных переменных.
ВВЕДЕНИЕ
7
Приемы кáта каратэ были показаны в определенном порядке группе людей, изучающих каратэ, одну половину которой составляли опытные, а другую
– начинающие каратисты. Количество повторений демонстрируемых приемов в
кáта варьировалось от 0 до 11. Между мастерами и новичками не отмечалось
каких-либо различий в точности, с которой они оценивали частотность приемов, но опытные спортсмены продемонстрировали значительное превосходство
над новичками в припоминании показанных приемов. Полученные данные свидетельствуют, что на запоминание частотности наблюдаемых действий не
влияет такая субъектная переменная, как ранее приобретенные знания. Вывод:
запоминание частотности события основывается на автоматических процессах.
A1. Исследования показывают, что люди хорошо оценивают частоту, с
которой происходят события, даже когда они изначально не намереваются ее
запоминать. Большинство предыдущих исследований запоминания частотности
проводилось на вербальном материале (например, с перечнями слов); однако
5
Терминология стоек, ударов и защит каратэ исправлена автором настоящего учебно-методического пособия в соответствии с принятой в Российской Федерации.
6
Статья сокращена и адаптирована автором настоящего учебного пособия.
7
Кáта – комплекс боевых приемов каратэ, выполняемых в жесткой последовательности с целью формирования двигательного навыка.
86
последние исследования были расширены путем использования быстрого показа невербального материала, такого как фотографии лиц и рисунки объектов
или японские иероглифы кана 8, демонстрировавшиеся людям, говорившим на
английском языке. В настоящем эксперименте мы еще больше расширили рамки этого исследования, подвергнув изучению то, как испытуемые запоминают
серию движений каратиста.
Хашер и Закс предположили, что кодирование частотности происходит
автоматически, но по данному вопросу существуют разные точки зрения. Одним из фактических свидетельств в пользу автоматического характера кодирования частотности является то, что люди, отличающиеся друг от друга своими
интеллектуальными способностями или ранее приобретенными релевантными
знаниями, обычно демонстрируют схожие по точности результаты, когда их
просят оценить частоту, с которой происходят какие-то события. Этот результат противоречит оценкам памяти, которые обычно свидетельствуют о значительных различиях, обусловленных интеллектуальными способностями и ранее
приобретенными знаниями. К примеру, опытные люди припоминают больше
данных, имеющих отношение к области их ведения, чем новички.
A2. В целях получения дополнительных данных, касающихся автоматичности запоминания частотности, в настоящем эксперименте сравнивали то, как
запоминают движения в кáта каратэ опытные и начинающие спортсмены. В каратэ определенные блоки и удары должны выполняться в соответствующей
стойке и зависят от характера движения человеческого тела, его направленности и распределения веса.
A3. Рабочая гипотеза: Учитывая публикации, касающиеся влияния опыта,
экспериментаторы ожидали, что мастера каратэ припомнят больше движений,
чем новички, поскольку первые уже обладают определенными структурированными знаниями об этом виде спорта. Также ожидалось, что, если кодирование частотности носит автоматический характер, то обе группы покажут одинаковую точность при оценке частоты, с которой демонстрируются приемы.
Метод. План эксперимента. Эксперимент включал в себя межгрупповую
переменную опытности (мастера или новички) и две внутригрупповые переменные, к которым относились тип теста (оценка частотности или припоминание) и фактическая частотность событий (0, 1, 2, 3, 4, 5, 6, 7, 9, 11).
B. Испытуемые: 30 добровольно принявших участие в исследовании
учеников летних курсов Каратэистской ассоциации Томпкинса (ТКА), занимавшихся в классе мастеров и начинающих. В каждой группе по 15 испытуемых. Группа мастеров – обладатели черных поясов или практикующие каратэ
не менее 3,5 лет (наиболее опытный мастер занимался каратэ 8 лет); 5 женщин
и 10 мужчин; возраст испытуемых – от 15 до 45 лет. Группа новичков – обладатели белого или желтого поясов, или любой каратист, занимавшийся менее 1
8
Японское письмо на основе китайской иероглифики.
87
года (самый неопытный новичок занимался 4.5 месяца); 2 женщины и 13 мужчин; возраст испытуемых – от 14 до 37.
20 приемов каратэ, которые демонстрировались с различной частотностью были выбраны Б. Дж. Бедоном (первым автором, инструктором каратэ,
имеющим черный пояс и 13-летний опыт занятий). Приемы и их частотности
были следующими: верхний блок (4), нижний блок (2), удар кулаком назад (11),
удар ногой вперед (2), боковой удар ногой (3), блок судо (6), круговой удар ногой (1), U-образный удар кулаком (0), удар ребром руки (2), надавливание ладонью вверх (3), крестообразный блок (1), надавливание вниз (2), стойка киба
(6), стойка дзенкуцу (9), стойка фудо (7), кошачья стойка (2), блок «гора» (2),
вращательный удар ногой (0), удар ногой с зацепом (0) и удар локтем (1). Таков
был порядок приемов в перечне, составленном по окончании теста, но не порядок демонстрации, поскольку эти приемы должны применяться внутри логических рамок используемым каратистом кáта (например, блоки «гора» должны
применяться в стойке киба).
C. 1. Эксперимент начался с устной инструкции: «Пожалуйста, обратите
особое внимание на кáта, который вы сейчас увидите, так как затем будет проверено, насколько хорошо вы запомнили использованные в нем приемы».
2. После чего одновременно всем испытуемым был продемонстрирован кáта,
исполненный самим Б. Дж. Бедоном. Мастера наблюдали комплекс отдельно от
новичков. 3. Затем испытуемых попросили оценить частоту, с которой демонстрировался каждый прием; например, вопрос мог быть таким: «Сколько раз
выполнялся нижний блок?» Когда задавался вопрос, демонстрировался соответствующий прием, с тем чтобы не было никаких недоразумений. Испытуемые записывали свои ответы на листе бумаги, который забирался сразу же после этой части эксперимента и заменялся чистым листом. 4. Потом следовал 5минутный интервал сохранения, во время которого испытуемых просили считать вслух по 3 всей группой. 5. По окончании этого периода в течение 60 секунд проводился тест на свободное припоминание, во время которого испытуемые записывали все приемы, которые они могли вспомнить.
D1. Результаты. Оценка частотности была получена путем нахождения
средней арифметической по всем испытуемым для каждого приема (рис. П. 2.1).
Как видно из диаграммы, оценки испытуемыми частоты, с которой демонстрировались приемы, близки к фактической частотности. Коэффициенты корреляции между фактической и оцененной частотностями rм = 0,907 (n = 9, p < 0,001)
для мастеров и rн = 0,909 (n = 9, p < 0,001) для новичков.
D2. Никто не указал приемов, которые не были включены в первоначальную последовательность. Как и ожидалось, мастера вспомнили значительно
больше приемов, чем новички; первые указали в среднем вдвое большее число
приемов, чем вторые. Среднее число приемов, припомненных мастерами (из
возможного максимума, равного 20), составило Mм = 14,9 (SD = 2,0; разброс: 13
– 16), а новичками – Mн = 8,3 (SD = 2,0; разброс: 6 – 12). Разница статистически значима (t = 11,2; df = 28; р < 0,001).
88
E1. Исследование показывает, что мастера и новички одинаково точно
оценивают частотность приемов каратэ, хотя мастера демонстрируют значительно лучшие результаты, чем новички, при свободном припоминании приемов. В последующем обсуждении испытуемые выражали удивление по поводу
того, что они столь точно оценивали частотность приемов. В действительности
большинству испытуемых казалось, что они очень плохо запомнили, сколько
раз демонстрировались различные приемы.
E2. Это удивление согласуется с утверждением, что информация, касающаяся частотности, кодируется неосознанно или без приложения каких-либо
усилий, а кодирование частотности носит автоматический характер для самых
различных событий, включая такие действия, как приемы каратэ.
Паттерн точности для припоминания частотности приемов каратэ похож
на паттерн, полученный в ходе исследований других видов стимулов. Обычно в
таких исследованиях средняя оцененная частотность бывает почти идентичной
фактической частотности, когда частотность событий меньше четырех или
около того, но в случае высоких частотностей люди, как правило, дают заниженные оценки. Был один прием – удар кулаком назад,– частоту демонстрации
которого ни одна из групп не оценила правильно и который был единственным
приемом, показанным 11 раз.
E3. Когда испытуемых спросили о
причинах этого, их ответы указали на возможную демонстрационную ошибку, заключавшуюся в том, что
данный удар был произведен слишком быстро по сравнению с
другими движениями в
исполняемом кáта. Эта
разница в скорости, вероятно, и повлияла на
оценку испытуемых,
ибо исследование показало, что погреш- Рис. П 2.1. Средняя оцененная частотность приемов
ность в оценке частот- каратэ как функция фактической частотности, полученная для мастеров и новичков
ности события может
быть вызвана рядом возможных причин, среди которых неравномерность времени демонстрации.
E4. В случае теста на припоминание причиной того, что мастера показали
лучшие результаты, чем новички, была скорее всего не разница в способности
89
подбирать правильные названия, так как и мастерам, и новичкам были хорошо
знакомы названия всех использованных приемов каратэ.
E5. Когда испытуемых спрашивали об их ответах на задание по припоминанию, новички сообщили только о том, что они старались вспомнить как
можно больше показанных приемов. Мастера же говорили, что они пользовались определенными мнемоническими приемами. Например, пытаясь припомнить, демонстрировались ли блоки суто, они вспоминали, что эти блоки
обычно выполняются в стойке фудо, а верхние и нижние блоки – в стойке дзенкуцу. То есть вместо того, чтобы пытаться припомнить отдельные фрагменты
информации, мастера группировали все паттерны информации в «блоки». Исследования в области навыков запоминания, баскетбола, компьютерного программирования и медицинской практики показали, что блоки информации, которые запоминают люди, имеющие опыт в определенной сфере, крупнее, чем
те, которые запоминают начинающие. Мастера полагались на имевшийся у них
запас релевантных знаний, приобретенных в течение долгих лет занятий, новички же не обладали необходимой подготовкой в боевых искусствах, которая
позволила бы им сделать определенные выводы и сгруппировать материал в
виде смысловых информационных блоков. Мнемонические приемы, которыми
пользовались мастера, были основаны на информации о частотности событий,
которую они хранили в закодированном виде в долговременной памяти и которая была почерпнута из их многолетних наблюдений за выполнением приемов
каратэ. Данное заключение согласуется с утверждением, что информация о
частотности используется при овладении новыми знаниями, а также при упорядочении и извлечении из памяти уже имеющихся знаний.
Краткая характеристика выборки и результатов эксперимента
n Муж Жен
r
p
M
SD
min-max
Мастера
15
10
5
14,9
2,0
13–16
0,907 0,001
Новички
15
13
2
8,3
2,0
6–12
0,909 0,001
30
0,001 t = 11,2
Анализ эксперимента (по Р. Солсо) [6].
Концепция автоматического характера кодирования частотности изложена в разд. А1. Поскольку авторов интересует оценка этого феномена на примере каратэ, возникает необходимость уделить внимание описанию ката каратэ
А2. Рабочая гипотеза изложена в А3.
В разд. B приведена информация об испытуемых, используемом материале и процедурах.
Разд. C являет собой хороший пример описания процедуры: в нем излагается точный порядок происходивших событий.
Данные, полученные для обеих зависимых переменных (оценки частотности и свободного припоминания) описаны в разд. D1; критерии внесения поправок в листы с ответами – в разд. D2.
90
В разд. E1 приведены общие результаты исследования. В E2 дана дополнительная информация, касающаяся бесед с испытуемыми после эксперимента.
В разделе «Обсуждение» приведена дополнительная информация, относящуюся к ходу эксперимента. Хотя понимание экспериментального контекста и не
является частью фактической процедуры эксперимента, оно предоставляет информацию, с помощью которой можно лучше оценить полученные результаты.
Возможные недостатки эксперимента описаны в разд. E3, а в разд. E4 приведены свидетельства, опровергающие возможное альтернативное объяснение. В
разд. E5 проведен анализ полученных данных.
Контрольные вопросы
1. Охарактеризуйте способ подбора групп (мастера и новички). Укажите
на другие возможные способы подбора этих групп.
2. Экспериментаторами предполагалось, что испытуемые не обладали
предварительными знаниями о кáта, с тем, чтобы его можно было принять за
независимую переменную. Если бы кáта был знаком испытуемым, как это могло бы отразиться на результатах эксперимента? Имелась ли у авторов возможность удостовериться в том, что испытуемые не сталкивались ранее с данным
набором приемов?
3. Как сказалась на эксперименте инструкция: «Пожалуйста, обратите
особое внимание на кáта, который вы сейчас увидите, так как затем будет проверено, насколько хорошо вы запомнили использованные в нем приемы»? Можно ли было обойтись без этой инструкции? Следовало ли от нее отказаться?
4. Зачем испытуемых просили считать вслух по три в течение пяти минут, перед тем как они начали выполнять следующее задание?
5. Используя информацию из разд. E «Результаты», касающуюся припоминания, изобразите приблизительную гистограмму.
6. Какой вид деятельности может послужить основой для подобного эксперимента?
91
Приложение 3
СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
Таблица П 3.1
Критические значения р
(коэффициента корреляции
Спирмена для рангов)
Таблица П 3.2
Критические значения r
(коэффициента корреляции
Пирсона)
N р = 0,05
р = 0,01
5
1,000
6
0,886
1,000
7
0,786
0,929
8
0,738
0,881
9
0,683
0,833
10
0,648
0,794
12
0,591
0,777
14
0,544
0,715
16
0,506
0,665
18
0,475
0,625
20
0,450
0,591
22
0,428
0,562
24
0,409
0,537
26
0,392
0,515
28
0,377
0,496
30
0,364
0,478
Примечание. Таблица из [9].
Уровень значимости для
df проверки по двустороннему критерию
0,10
0,05
0,01
1
0,988
0,997
0,9999
2
0,900
0,950
0,990
3
0,805
0,878
0,959
4
0,729
0,811
0,917
5
0,669
0,754
0,874
6
0,622
0,707
0,834
7
0,582
0,666
0,798
8
0,549
0,632
0,765
9
0,521
0,602
0,735
10
0,497
0,576
0,708
11
0,476
0,553
0,684
12
0,458
0,532
0,661
13
0,441
0,514
0,641
14
0,426
0,497
0,623
15
0,412
0,482
0,606
16
0,400
0,468
0,590
17
0,389
0,456
0,575
18
0,378
0,444
0,561
19
0,369
0,433
0,549
20
0,360
0,423
0,537
25
0,323
0,381
0,487
30
0,296
0,349
0,449
35
0,275
0,325
0,418
40
0,257
0,304
0,393
45
0,243
0,288
0,372
50
0,231
0,273
0,354
60
0,211
0,250
0,325
70
0,195
0,232
0,303
80
0,183
0,217
0,283
90
0,173
0,205
0,267
100
0,164
0,195
0,254
Примечание. Таблица из [9].
92
Таблица П 3.3
Критические значения χ2
Таблица П 3.4
Критические значения t
p
0,05
0,01
1
3,84
6,64
2
5,99
9,21
3
7,82
11,34
4
9,49
13,28
5
11,07
15,09
6
12,59
16,81
7
14,07
18,48
8
15,51
20,09
9
16,92
21,67
10
18,31
23,21
11
19,68
24,72
12
21,03
26,22
13
22,36
27,69
14
23,68
29,14
15
25,00
30,58
16
26,30
32,00
17
27,59
33,41
18
28,87
34,80
19
30,14
36,19
20
31,41
37,57
21
32,67
38,93
22
33,92
40,29
23
35,17
41,64
24
36,42
42,98
25
37,65
44,31
26
38,88
45,64
27
40,11
46,96
28
41,34
48,28
29
42,56
49,59
30
43,77
50,89
Примечание. Таблица из [9].
p
0,10 0,05 0,02 0,01 0,001
1 6,314 12,70 31,82 63,65 636,619
6
1
7
2 2,920 4,303 6,965 9,925 31,599
3 2,353 3,182 4,541 5,841 12,924
4 2,132 2,776 3,747 4,604 8,610
5 2,015 2,571 3,365 4,032 6,869
6 1,943 2,447 3,143 3,707 5,959
7 1,895 2,365 2,998 3,499 5,408
8 1,860 2,306 2,896 3,355 5,041
9 1,833 2,262 2,821 3,250 4,781
10 1,812 2,228 2,764 3,169 4,587
11 1,796 2,201 2,718 3,106 4,437
12 1,782 2,179 2,681 3,055 4,318
13 1,771 2,160 2,650 3,012 4,221
14 1,761 2,145 2,624 2,977 4,140
15 1,753 2,131 2,602 2,947 4,073
16 1,746 2,120 2,583 2,921 4,015
17 1,740 2,110 2,567 2,898 3,965
18 1,734 2,101 2,552 2,878 3,922
19 1,729 2,093 2,539 2,861 3,883
20 1,725 2,086 2,528 2,845 3,850
21 1,721 2,080 2,518 2,831 3,819
22 1,717 2,074 2,508 2,819 3,792
23 1,714 2,069 2,500 2,807 3,768
24 1,711 2,064 2,492 2,797 3,745
25 1,708 2,060 2,485 2,787 3,725
26 1,706 2,056 2,479 2,779 3,707
27 1,703 2,052 2,473 2,771 3,690
28 1,701 2,048 2,467 2,763 3,674
29 1,699 2,045 2,462 2,756 3,659
30 1,697 2,042 2,457 2,750 3,646
60 1,671 2,000 2,390 2,660 3,505
∞ 1,645 1,960 2,326 2,576 3,291
Примечание. Таблица из [9].
df
df
93
Таблица П 3.5
Критические значения F
Степени свободы для числителя dfbg
p=0,05
p=0,01
1
Степени свободы для знаменателя dfwg
2
3
4
5
6
7
8
9
10
11
12
1
161, 45
4032,10
18,51
98,49
10,13
34,12
7,71
21,20
6,61
16,26
5,99
13,74
5,59
12,25
5,32
11,26
5,12
10,56
4,6
10,04
4,84
9,65
4,75
9,33
2
199,50
4999,03
19,00
99,01
9,55
30,81
6,94
18,00
5,79
13,27
5,14
10,92
4,74
9,55
4,46
8,65
4,26
8,02
4,10
7,56
3,98
7,20
3,88
6,93
3
215,72
5403,49
19,16
99,17
9,28
29,46
6,59
16,69
5,41
12,06
4,76
9,78
4,35
8,45
4,07
7,59
3,86
6,99
3,71
6,55
3,59
6,22
3,49
5,93
4
224,57
5623,14
19,25
99,25
9,12
28,71
6,39
15,98
5,19
11,39
4,53
9,15
4,12
7,85
3,84
7,01
3,63
6,42
3,48
5,99
3,36
5,67
3,26
5,41
5
230,17
5764,08
19,30
99,30
9,01
28,24
6,26
15,52
5,05
10,97
4,39
8,75
3,97
7,46
3,69
6,63
3,48
6,06
3,33
5,64
3,20
5,32
3,11
5,06
94
6
233,97
5859,39
19,33
99,33
8,94
27,91
6,16
15,21
4,95
10,67
4,28
8,47
3,87
7,19
3,58
6,37
3,37
5,80
3,22
5,39
3,09
5,07
3,00
4,82
8
238,89
5981,34
19,37
99,36
8,84
27,49
6,04
14,80
4,82
10,27
4,15
8,10
3,73
6,84
3,44
6,03
3,23
5,47
3,07
5,06
2,95
4,74
2,85
4,50
12
243,91
6105,83
19,41
99,42
8,74
27,05
5,91
14,37
4,68
9,89
4,00
7,72
3,57
6,47
3,28
5,67
3,07
5,11
2,91
4,71
2,79
4,40
2,69
4,16
24
249,04
6234,16
19,45
99,46
8,64
26,60
5,77
13,93
4,53
9,47
3,84
7,31
3,41
6,07
3,12
5,28
2,90
4,73
2,74
4,33
2,61
4,02
2,50
3,78
∞
254,32
6366,48
19,50
99,50
8,53
26,12
5,63
13,46
4,36
9,02
3,67
6,88
3,23
5,65
2,93
4,86
2,71
4,31
2,54
3,91
2,40
3,60
2,30
3,36
14
16
18
20
25
30
40
50
60
70
80
90
100
200
∞
4,60
8,86
4,49
8,53
4,41
8,28
4,35
8,10
4,24
7,77
4,17
7,56
4,08
7,31
4,03
7,17
4,00
7,08
3,98
7,01
3,96
6,98
3,95
6,92
3,94
6,90
3,89
6,97
3,84
6,64
3,74
6,51
3,63
6,23
3,55
6,01
3,49
5,85
3,38
5,57
3,32
5,39
3,23
5,18
3,18
5,06
3,15
4,98
3,13
4,92
3,11
4,88
3,10
4,85
3,09
4,82
3,04
4,71
2,99
4,60
3,34
5,56
3,24
5,29
3,16
5,09
3,10
4,94
2,99
4,68
2,92
4,51
2,84
4,31
2,79
4,20
2,76
4,13
2,74
4,07
2,72
4,04
2,71
4,01
2,70
3,98
2,65
3,88
2,60
3,78
3,11
5,03
3,01
4,77
2,93
4,58
2,87
4,43
2,76
4,18
2,69
4,02
2,61
3,83
2,56
3,72
2,52
3,65
2,50
3,60
2,49
3,56
2,47
3,53
2,46
3,51
2,42
3,41
2,37
3,32
2,96
4,69
2,85
4,44
2,77
4,25
2,71
4,10
2,60
3,86
2,53
3,70
2,45
3,51
2,40
3,41
2,37
3,34
2,35
3,29
2,33
3,26
2,32
3,23
2,30
3,21
2,26
3,11
2,21
3,02
Примечание. Таблица из [9].
95
2,85
4,46
2,74
4,20
2,66
4,01
2,60
3,87
2,49
3,63
2,42
3,47
2,34
3,29
2,29
3,19
2,25
3,12
2,23
3,07
2,21
3,04
2,20
3,01
2,19
2,99
2,14
2,89
2,09
2,80
2,70
4,14
2,59
3,89
2,51
3,71
2,45
3,56
2,34
3,32
2,27
3,17
2,18
2,99
2,13
2,89
2,10
2,82
2,07
2,78
2,06
2,74
2,04
2,72
2,03
2,69
1,98
2,60
1,94
2,51
2,53
3,80
2,42
3,55
2,34
3,37
2,28
3,23
2,16
2,99
2,09
2,84
2,00
2,66
1,95
2,56
1,92
2,50
1,89
2,45
1,88
2,42
1,86
2,39
1,85
2,37
1,80
2,28
1,75
2,18
2,35
3,43
2,24
3,18
2,15
3,01
2,08
2,86
1,96
2,62
1,89
2,47
1,79
2,29
1,74
2,18
1,70
2,12
1,67
2,07
1,65
2,03
1,64
2,00
1,63
1,98
1,57
1,88
1,52
1,79
2,13
3,00
2,01
2,75
1,92
2,57
1,84
2,42
1,71
2,17
1,62
2,01
1,52
1,82
1,44
1,68
1,39
1,60
1,35
1,53
1,32
1,49
1,30
1,46
1,28
1,43
1,19
1,28
1,00
1,00
Таблица П 3.6
Критические значения U-Манна-Уитни для независимых выборок
n1
3
4
5
5
6
7
8
9
10
11
12
13
14
15
16
5
6
7
8
9
10
11
12
13
14
15
16
6
7
7
8
8
9
9
10
10
11
11
12
11
12
13
14
15
15
16
17
18
19
20
21
6
6
6
7
7
7
8
8
10
10
11
11
12
12
13
14
14
15
15
17
18
20
21
22
23
24
26
27
28
29
31
15
16
17
17
18
19
20
21
22
22
23
24
6
7
26
27
29
31
32
34
35
37
38
40
42
36
38
40
42
44
46
48
50
52
54
23
24
25
26
27
28
30
31
32
33
34
32
34
35
37
38
40
41
43
44
46
8
9
10 11 12 13
14
n2
р = 0,05
49
51
53
55
58
60
63
65
67
63
65
68
71
73
76
79
82
78
81
85
88
91
94
97
96
100
103
106
110
114
115
119
123
127
131
137
141
145
150
160
164
169
р = 0,01
43
45
47
49
51
53
54
56
58
56
58
61
63
65
67
70
72
71
74
76
79
81
84
86
87
90
93
96
99
102
106
109
112
115
119
125
129
133
137
147
151
155
Примечание. Таблица из [5].
Таблица П 3.7
Критические значения W-критерия Вилкоксона для сопряженных пар
n
6
7
8
9
10
11
12
13
14
15
р
0,05 0,01
1
3
5
1
7
3
9
4
12
6
15
8
18 11
22 14
26 17
n
16
17
18
19
20
21
22
23
24
25
р
0,05 0,01
31 21
36 24
41 29
47 33
53 39
60 44
67 50
74 56
82 62
90 69
Примечание. Таблица из [17].
96
Таблица П 3.8
Линеаризующие преобразования
Примечание. Таблица из [1].
97
Литература
Основная
1. Большаков, А.А. Методы обработки многомерных данных и временных рядов: учеб. пособие / А.А. Большаков, Р.Н. Каримов. –М.: Главная линия
– Телеком, 2007.
2. Вероятность и математическая статистика: Энциклопедия / под. ред.
Ю.В. Прохорова. – М.: Большая Российская энциклопедия, 2003.
3. Воронов, И.А. Информационные технологии в физической культуре и
спорте: учеб. Пособие / И.А. Воронов. – СПб.: СПбГУП, 2007.
4. Дюк, В.А. Информационные технологии в медико-биологических исследованиях / В.А. Дюк, В.Л. Эммануэль. – СПб.: Питер, 2003.
5. Лакин, Г.Ф. Биометрия: учеб. пособие / Г.Ф. Лакин. – М.: Высш. школа, 1980.
6. Наследов, А.Д. Математические методы психологического исследования. Анализ и интерпретация данных: учеб. пособие / А.Д. Наследов. – СПб.:
Речь, 2006.
7. Наследов, А.Д. SPSS: Компьютерный анализ данных в психологии и
социальных науках / А.Д. Наследов. – СПб.: Питер, 2007.
8. Реброва, О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ Statistica / О.Ю. Реброва. – М.: МедиаСфера, 2002.
9. Солсо, Р. Экспериментальная психология / Р. Солсо, К. МакЛин. –
СПб.: Прайм-ЕВРОЗНАК, 2006.
10. Толстова, Ю.Н. Основы многомерного шкалирования: учеб. Пособие /
Ю.Н. Толстова. – М.: КДУ, 2006.
11. Шапкин, С.А. Экспериментальное изучение волевых процессов (с применением SPSS): учеб. пособие / С.А. Шапкин. – М.: Ин-т психологии РАН. 1997.
Дополнительная
12. Бейли, Н. Т. Дж. Статистические методы в биологии / Н. Т. Дж. Бейли. – М.: Иностр. лит-ра, 1962.
13. Биркгофф, Г. Математика и психология / Г. Биркгофф. – М.: Сов. Радио, 1977.
14. Болл, Р.М. Руководство по биометрии / Р.М. Болл, Дж.Х. Коннел, Ш.
Панканти, Н.К. Рахта, Э.У. Сеньор. – М.: Техносфера, 2007.
15. Дружинин, В.Н. Экспериментальная психология: учеб. пособие / В.Н.
Дружинин. – СПб.: Питер, 2001.
16. Дюк, В.А. Компьютерная психодиагностика. Научно-популярное издание / В.А. Дюк. – СПб.: Братство, 1994.
17. Иванов, В.С. Основы математической статистики: учеб. пособие для
институтов физической культуры / В.С. Иванов. – М.: Физическая культура и
спорт, 1990.
18. Кэмпбелл, Д. Модели экспериментов в социальной психологии и прикладных исследованиях / Д. Кэмпбелл. – М.: 1980.
98
19. Мартин, Д. Психологические эксперименты / Мартин Д. – СПб., 2002.
20. Налимов, В.В. Теория эксперимента / Налимов В.В. – М.: Наука, 1971.
21. Попечителев, Е.П. Анализ числовых таблиц в биотехнических системах
обработки информации / Е.П. Попечителев, С.В. Романов. – Л.: Наука, 1985.
22. Салманов, О.Н. Математическая экономика с применением Mathcad и
Excel / О.Н. Салманов. – СПб.: БХВ-Петербург, 2003.
23. Червинская, К.Р. Компьютерная психодиагностика: учеб. пособие /
К.Р. Червинская. –СПб: Речь, 2003.
24. Чигирев, Б.И. Методы анализа данных / Б.И. Чигирев. – М.: Финансы
и статистика, 1985.
25. Эксперимент, модель, теория. – Москва-Берлин: Наука, 1982.
26. Яковлев В.Б. Статистика. Расчеты в Microsoft Excel: учеб. пособие. /
В.Б. Яковлев. – М.: Колосс, 2005.
27. Okon J. Analiza czinnikowa w psychologii. (Факторный анализ в психологии) – Warszawa: Panstwowe wydawnictwo naukowe, 1964.
Электронные ресурсы
28. Воронов, И.А. Информационные технологии в физической культуре и
спорте: электронный учебник / И.А. Воронов. – СПб.: СПбГУФК им. П.Ф. Лесгафта, 2006.
29. Иллюстрированный самоучитель по SPSS.
30. Математическая статистика: электронный учебник. – М.: StatSoft, 1998.
99
Воронов Игорь Анатольевич
Эксперимент и методы обработки многомерных данных
в исследованиях человека с применением SPSS:
медико-биологические исследования, психология,
физическая культура и спорт
Учебное пособие
200401
Редактор Е.Ю. Пономарева
Подписано к печати 16.06.2008
Объем 6,25 усл. печ.л. Тираж 150 экз. Зак. 28
РИО ГОУВПО СПбГУТ. 191186 СПб., наб. р. Мойки, 61
Отпечатано в СПбГУТ
100
Федеральное агентство связи
Государственное образовательное учреждение
высшего профессионального образования
«Санкт-Петербургский Государственный университет телекоммуникаций
имени проф. М.А. Бонч-Бруевича»
И.А. Воронов
ЭКСПЕРИМЕНТ
и методы обработки многомерных данных
в исследованиях человека
с применением SPSS:
медико-биологические исследования,
психология, физическая культура и спорт
Учебное пособие
200401
Санкт-Петербург
2008
101
102