Текст
                    (В.<В. Афанасьев
94..А- Сивов
МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА
В ПЕДАГОГИКЕ

Министерство образования и науки Российской Федерации ГОУ ВПО «Ярославский государственный педагогический университет им. К.Д. Ушинского» В.В. Афанасьев, М.А. Сивов МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ПЕДАГОГИКЕ Ярославль 2010
УДК 519.226 ББК 22.172 А 94 Печатается по решению редакционно-издательского совета ЯГПУ им. К.Д. Ушинского Рецензент: доктор пед. наук, профессор, заведующий кафедрой математического анализа ЯГПУ Евгений Иванович Смирнов Афанасьев В.В., Сивов М.А. Математическая статистика в педагогике [Текст] учебное пособие / под науч. ред. д-ра ист. наук, проф. М.В. Новикова. - Ярославль Изд-во ЯГПУ, 2010. ~ 76 с. Пособие предназначено для студентов и аспирантов высших педа- гогических учебных заведений. В нем изложены основные методы мате- матической статистики для вероятностно-статистического планирования, проведения, анализа и заключения педагогических наблюдений и экспе- риментов. Учитель и преподаватель имеют возможность использовать посо- бие для математически обоснованного подхода к анализу своей экспери- ментальной и повседневной педагогической деятельности. УДК 519.226 ББК 22.172 Пособие подготовлено по проекту «Компетентностный подход к подготовке научных кадров в высшей школе» в рамках программы Рособразования РФ «Развитие научного потенциала высшей школы» ISBN 978-5-87555-366-0 © ГОУ ВПО «Ярославский государст- венный педагогический универси- тет им. К.Д. Ушинского», 2010 © Афанасьев В.В., 2010 © Сивов М.А., 2010
Содержание Введение 4 Структура педагогического эксперимента . . 5 Математическая обработка педагогического эксперимента .6 Характеристики положения вариационного ряда . 14 Характеристики рассеивания . 19 Корреляционное отношение . 22 Коэффициент вариации . 23 Доверительный интервал . 25 Ранговые корреляции и взаимосвязи в педагогических экспериментах . 27 Коэффициент корреляции Пирсона 30 Корреляционные матрицы и графы .34 Коэффициент конкордации . 3 6 Статистические гипотезы . 39 Параметрические критерии согласия . 41 Критерий Стьюдента 41 Критерий Крамера-Уэлча 44 Критерий Фишера 45 Непараметрические критерии . 47 Критерий Пирсона 47 Проверка нормальности распределения 49 Критерий Манна-У итни 50 Критерий Колмогорова-Смирнова. 53 Критерий Вилкоксона 56 Критерий знаков . 57 Критерий Макнамары . 59 Критерий Крускала-Уоллиса 61 Критерий Фридмана. 63 Критерий Пейджа. 65 Значимость коэффициента корреляции . 68 Существенность коэффициента конкордации 70 Опорная таблица курса 71 Библиографический список. .74 3
Введение Для педагога очень важно уметь анализировать результаты своей профессиональной деятельности, а также грамотно планиро- вать и проводить психолого-педагогические эксперименты, обра- батывать их результаты. Специфика статистической обработки результатов психо- лого-педагогических исследований заключается в том, что анали- зируемая база данных характеризуется большим количеством по- казателей различных типов, их высокой вариативностью под влия- нием неконтролируемых случайных явлений, необходимостью учета объективных и субъективных факторов, сложностью корре- ляционных связей между переменными выборками. Психолого-педагогические исследования можно разбить на три группы. Первая - это номинальные переменные (пол, возраст и другие анкетные данные). Арифметические операции над такими ве- личинами лишены смысла, так что результаты описательной стати- стики (выборочные средние, дисперсия) к таким величинам не при- менимы. Классический способ их анализа - разбиение на классы от- носительно тех или иных номинальных признаков и проверка значи- мых различий по классам. Вторая группа данных имеет количест- венную шкалу измерения, но эта шкала является порядковой (орди- нальной). При анализе ординальных переменных используются как разбиение на подвыборки, так и ранговые технологии (например, на- хождение ранговой корреляции). Третья группа - количественные переменные, отражающие степень выраженности замеряемого пока- зателя, - это успеваемость, тесты Амтхауэра, Ксттелла и другие оце- ночные тесты. При работе с выборками этой группы применимы все стандартные виды анализа, и при достаточно большом объеме вы- борки их распределение обычно близко к нормальному. Одной из главных целей исследования является анализ из- мерений, происходящих в процессе обучения, оценка значимости и направленности этих изменений и выявление основных факто- ров, влияющих на процесс. При этом возможны два подхода. Можно рассматривать длительность эксперимента и вычислять его корреляцию с интересующими нас индивидуальными характери- стиками испытуемого. Однако проводимые исследования показы- вают, что в процессе профессионализации изменяются зачастую не сами показатели, а структура взаимосвязей между ними. Поэтому более предпочтительным методом является разбиение данных на группы (подвыборки), их самостоятельный, а затем сравнительный анализ и проверка значимости различий в группах. Для аргументации эффективности того или иного подхода в педагогике, как правило, проводят формирующий эксперимент. 4
Структура педагогического эксперимента Педагогический (или формирующий) эксперимент, — это спе- цифический исключительно для педагогики вид эксперимента, в кото- ром активное воздействие экспериментальной ситуации на испытуемого должно способствовать его развитию и личностному росту. Педагогический эксперимент требует очень высокой ква- лификации со стороны экспериментатора, так как неудачное и не- корректное использование методик может привести к негативным для испытуемого последствиям. В ходе такого эксперимента предполагается формирование определенного качества (именно поэтому он еще называется ’’фор- мирующий”). Можно выделить множество различных педагогиче- ских экспериментов. Однако большинство из них имеют общую структуру. Как правило, в эксперименте участвуют две группы: экспериментальная и контрольная. Необходимо, чтобы до проведе- ния эксперимента обе группы несущественно отличались по иссле- дуемому признаку. Участникам экспериментальной группы предла- гается новый метод обучения (воспитания) или определенное зада- ние, которое (по мнению экспериментаторов) будет способствовать формированию заданного качества. Контрольной группе испытуе- мых данное задание не предоставляется и обучение ведется тради- ционным способом. В конце эксперимента две группы снова срав- ниваются между собой для оценки полученных результатов. Важно не только зафиксировать и сравнить полученные ре- зультаты, но и обосновать их, доказать неслучайность и значи- мость полученных различий. Как правило, установить связь между воздействием на испытуемого и полученным результатом, а также обосновать эффективность (или неэффективность) проведенного эксперимента помогают инструменты математической статистики. Формирующий эксперимент как метод появился благодаря теории деятельности (А.Н. Леонтьев, Д.Б.Эльконин и др.), в кото- рой утверждается идея о первичности деятельности по отношению к психическому развитию. В ходе формирующего эксперимента активные действия совершают как испытуемые, так и эксперимен- татор. Со стороны экспериментатора необходима высокая степень контроля над протекающим экспериментом и своевременное вне- сение корректировок в данный процесс. Это отличает эксперимент от наблюдения или экспертизы. В эксперименте желательна фиксация числовых результа- тов в контрольной и экспериментальной группах с целью после- дующей проверки данных вероятностно-статистическими метода- ми обработки. 5
Математическая обработка педагогического эксперимента Большинство педагогических исследований призвано отве- тить на вопрос, верно ли сделанное исследователем предположе- ние, подтверждается ли выдвинутая им гипотеза. Наиболее при- влекательным с точки зрения эффективности и целесообразности методом психолого-педагогического исследования является опыт. Однако сами результаты опыта, как правило, не позволяют нам сделать чётких и научно обоснованных выводов о справедливости (или ложности) выдвинутой гипотезы. Проанализировать резуль- таты опыта и сделать полезные выводы помогают математические методы исследования. Очевидно, что в большинстве случаев невозможно поста- вить опыт над всем множеством объектов, в отношении которых формулируется исследовательская гипотеза. Такое множество но- сит название генеральной совокупности. Например, при желании понять, каким образом меняется успеваемость учащихся при ис- пользовании той или иной модели обучения, исследователь дол- жен был бы провести эксперимент с каждым учеником. Но такой метод затруднителен в силу его трудоёмкости, дороговизны и дли- тельности. Поэтому педагогические и психологические опыты, как правило, производятся не над всей генеральной совокупностью исследуемых объектов, а лишь над их частью, называемой выбор- кой. Таким образом, эксперимент, а затем и анализ полученных результатов осуществляется над выборкой. Для корректного исследования необходимо, чтобы изучае- мая выборка в максимальной мере соответствовала генеральной совокупности, отражала наблюдаемые в ней явления, их изменчи- вость, т.е. была репрезентативной. Наиболее простой способ до- биться репрезентативности - это составить выборку методом слу- чайного отбора исследуемых объектов. Данный метод предпола- гает соблюдение таких условий, при которых каждый член гене- ральной совокупности имеет равные с другими шансы попасть в выборку. Наличие какой-либо закономерности отбора не допуска- ется. Результаты исследования репрезентативной выборки мож- но подвергать анализу с использованием математических методов. Для этого необходимо специальное оформление (представление) результатов опыта. Наиболее востребованным и часто применяе- мым является метод представления результатов опыта в виде ва- риационного ряда. 6
Вариационный ряд - это таблица, отображающая зависи- мость между видами исходов проводимого опыта и количествами тех или иных исходов. Рассмотрим следующий эксперимент. Тридцати студентам был задан следующий вопрос: «Какое чувство наиболее ярко про- является (ощущается) Вами в момент сдачи важного экзамена?» В результате вопроса были получены такие варианты ответов: «страх», «подавленность», «волнение», «растерянность», «ничего не чувствую», «эмоциональное возбуждение». В данном экспери- менте опытом является опрос. Разновидности исхода опыта - это различные ответы испытуемых. Чтобы составить вариационный ряд, необходимо знать, сколько человек дали тот или иной ответ. Если «страх» испытывают 5 человек, «подавленность» - 2, «волне- ние» - 14, «растерянность» - 4, «ничего не чувствуют» - 2, а «эмо- циональную возбуждение» - 3 человека, то искомая таблица будет выглядеть следующим образом: Исход опыта Страх Подав- ленность Волнение Расте- рянность Ничего не чувст- вуют Эмоци- ональное воз- буждение Количество исходов 5 2 14 4 2 3 Построенная таблица отражает результаты проделанного опыта. При этом для математической обработки результата, как правило, необходимо представить исходы опыта в числовом виде. Например, испытываемые чувства можно пронумеровать и в таб- лице вместо их словесной формулировки записать соответствую- щие номера. В диссертационной работе Л.А. Агафоновой рассматрива- ется выбор учащихся курсов УПК. Из 52 человек курсы техниче- ской направленности выбрали 27 человек, «журналистику» 11 человек, «воспитатель» - 7 человек и «правоведение» - 7 человек. Построим для данной выборки школьников вариационный ряд, пронумеровав курсы. В результате получим следующую таб- лицу: Курсы 1 2 3 4 Выбрало человек 27 11 7 7 В некоторых исследованиях исходы опыта выражаются числами, а значит, искусственное числовое представление вариан- тов не требуется. 7
В классе провели тестирование по определению уровня до- верия учащихся друг к другу. Уровень доверия определяется по 10-балльной шкале. Результатом йсследования стали следующие данные: уровень доверия, равный 1, определился у 1 человека, равный 2 - у 3 человек, равный 4 - у 6 человек, равный 6 - у 9 че- ловек, равный 8 - у 4 человек, равный 10 - у 2 человек. Запишем полученные результаты в виде вариационного ряда, где имеют место следующие варианты: 1, 2, 4, 6, 8 и 10 бал- лов. Получим следующую таблицу: Вариант 1 2 4 6 8 10 Количество испытуемых 1 3 6 9 4 2 Для удобства при использовании математических методов исследования элементы множества значений выборки (варианты исхода опыта) обозначают через х,. В рассматриваемом примере их можно обозначить: xi=l, х2=2, х3=4, х4=6, х5=8, Хб=10. Количе- ства испытуемых, соответствующих тому или иному варианту, называют частотами данных вариантов. Обычно частоты обозна- чаются через Ш|. Например, для варианта х3=4 частота т3 равна 6. При этом общее количество испытуемых, принявших участие в исследовании, называется объёмом выборки, который находится как сумма всех частот и обозначается буквой п. В данном случае п= 1+3+6+9+4+2=25. Для того чтобы показать, какую долю от всего объёма вы- борки представляет тот или иной вариант, используется понятие относительной частоты. Относительные частоты обозначаются через fi и определя- ются как отношение соответствующей частоты ш, к объёму вы- борки п, т.е. J i Таблица, отображающая зависимость между вариантами Xj и относительными частотами ft, называется статистическим рядом. Важно заметить, что в вариационном и статистическом ря- дах варианты принято располагать в порядке возрастания. Сумма относительных частот статистического ряда всегда равна единице: к fi — 1, где к - количество различных вариантов. /=1 8
Составим статистический ряд для рассмотренного опыта с изучением уровня доверия школьников друг к другу. Для решения поставленной задачи достаточно разделить соответствующие значения частот на объём выборки п=25. На- r т, 1 Л . т-, 3 Л _ пример, / = —L = — = 0.04; f2 = —- = — = 0.12 и т.д. В резуль- п 25 и 25 тате получим следующий статистический ряд: Вариант Xj 1 2 4 6 8 10 Относительная частота f. 0.04 0.12 0.24 0.36 0.16 0.08 Убедимся, что 6 £/=0.04 + 0.12 + 0.24 + 0.36 + 0.16 + 0.08 = 1 /=1 Иногда для лучшей иллюстрации результатов исследова- ния используют полигон частот. Под полигоном частот выборки понимают ломаную линию с вершинами в точках (х;; ш,). Используют также полигон относи- тельных частот выборки, для которого вершины ломаной имеют координаты (х,; fj). Построим полигон относительных частот для изучения уровня тревожности (по 100-балльной шкале), которое дало сле- дующие результаты: X, (Тревожность, бал- лы) 10 15 20 25 30 35 40 45 50 55 т, (Количество испы- туемых, чел.) 2 3 5 10 10 7 5 5 2 1 Найдём сначала объём выборки: п=2+3+5+10+10+7+5+5+2+1=50. Далее построим статистический ряд. Для этого найдём относительные частоты ft = —L п х, (Тревож- ность) 10 15 20 25 30 35 40 45 50 55 fj (Относитель- ная частота) 0.04 0.06 0.1 0.2 0.2 0.14 0.1 0.1 0.04 0.02 Теперь можно построить полигон относительных частот. 9
Помимо полигона частот для иллюстрации результатов опыта используются также столбчатые и круговые диаграммы. Столбчатая диаграмма строится аналогично полигону час- тот. Отличие заключается в том, что вместо отрезков изображают- ся прямоугольники соответствующей высоты. На круговой диаграмме вариант отображается в ви- де сектора, градусная мера угла которого равна 360° ft. Рассчи- таем градусные меры секторов, соответствующих тем или иным частотам: Xi (Тревожность) 10 15 20 25 30 35 40 45 50 55 fi (Относительная частота) 0.04 0.06 0.1 0.2 0.2 0.14 0.1 0.1 0.04 0.02 Градусная мера сектора 14.4 21.6 36 72 72 50.4 36 36 14.4 12 10
Таким образом, круговая диаграмма будет иметь вид: Помимо диаграмм для наглядного представления результа- тов, а также для установления аналога с классическим законом распределения используется гистограмма, для чего вводится поня- тие плотности относительной частоты. Плотность относительной частоты равна отношению сум- мы частот соответствующего интервала к произведению общего объёма выборки п и длины h, соответствующего интервала, то есть она вычисляется следующим образом: т; n-ht Пусть результаты теста записаны в таблице: Результат теста (в баллах) (интервалы) Количество испытуемых (чел.), т. Плотность относительной частоты Менее 3 баллов 2 ® 0.022 30-3 От 3 до 4 баллов 8 — « 0.267 301 От 4 до 5 баллов 15 — = 0.5 301 От 5 до 6 баллов 5 —^—«0.167 301 11
Построим гистограмму результатов тестирования, для чего потребуется нахождение плотности относительной частоты. Она рассчитывается следующим образом. Сначала необходимо узнать объём и всей выборки, т.е. количество участников тестирования. п=2+8+15+5=30. Для каждого интервала находим его длину h,: ^=3-0=3, h2=4-3=l, h3=5-4=l, h4=6-5=l. Для построения гистограммы выборки воспользуемся пря- моугольной декартовой системой координат. По оси абсцисс отме- тим имеющиеся интервалы: от 0 до 3, от 3 до 4, от 4 до 5 и от 5 до 6. Сопоставим каждой абсциссе из выбранного интервала ордина- ту, равную соответствующей плотности относительной частоты (см. рисунок). В качестве графика получим отрезки, параллельные оси абсцисс. Для наглядности эти отрезки можно достроить до за- крашенных прямоугольников. При этом площадь каждого полу- ченного прямоугольника будет численно равна соответствующей относительной частоте. Поэтому вся площадь закрашенной фигу- ры будет равна единице. Таким образом, мы получим графическое отображение относительных частот выборки. 6 результаты При построении гистограммы мы опирались на данные, за- писанные в таблице с помощью интервального метода. Если вы- борка имеет сравнительно большой объём или содержит большое количество различных вариантов, то могут возникнуть трудности вычислительного характера. Для решения этой проблемы и при- меняется метод интервалов. 12
Суть метода интервалов заключается в разбиении множе- ства значений измеряемой величины на интервалы. Тогда выборка записывается следующим образом: Измеряемая величина Xi х е [а;Ь) х е[6;с) Частота т. ГП1 т2 Такая запись означает, что выборка содержит mi значений величины х; таких, что Я < Xi: < Ь , т2 значений величины Xj та- ких, что Ь < Xt < С Выборку можно представить в виде любого количества интервалов. Подытоживая сказанное, заметим, что для организации пе- дагогических исследований с помощью математических методов изначально полученную в результате опыта информацию необхо- димо представить в виде вариационного или статистического ряда. Для наглядности вариационный и статистический ряды изобража- ются при помощи диаграмм, полигонов частот или гистограмм. Зная, как можно представить результаты эксперимента для их математической обработки, целесообразно перейти непосредст- венно к рассмотрению математических методов. 13
Характеристики положения вариационного ряда Одной из задач педагогического исследования является сравнение полученных результатов. Например, после проведения контрольной работы в параллельных классах мы хотим узнать, ка- кой класс справился лучше. Таким образом, возникает необходи- мость сравнения данных из нескольких вариационных (или стати- стических) рядов. После написания срезовой контрольной работы по матема- тике ученики двух десятых классов одной школы показали сле- дующие результаты: Оценка 2 3 4 5 Количество учащихся 10 «А» класса, получивших соответствующую оценку 2 10 3 Количество учащихся 10 «Б» класса, получивших соответствующую оценку 1 9 10 Ученики какого класса справились с контрольной работой лучше? С этой целью охарактеризуем результаты испытания в ка- ждом классе одним числом. В математической статистике существует понятие выбо- рочной средней величины. Пусть выборка задана своим вариационным рядом: Измеряемая величина х. Х1 х2 хк Частота т. mi т2 тк Тогда выборочной средней будет называться величина, оп- ределяемая по формуле: к ххт,+х2т2+... + хктк _ х =----------------------, или х = —------, тх + т2 +... + тк п где п объём выборки, т.е.: к п = т1+т2 +...+тк = i=i Воспользовавшись предложенной формулой, найдём выбо- рочные средние для двух классов. 14
Для 10 «А» класса: Для 10 «Б» класса: _ 2-2 + 3-7 + 4-10 + 5-3 80 „ х =-------------------= — « 3.64 • 2 + 7+10 + 3 22 _ 2-1 + 3-9 + 4-10 + 5-1 74 Х~ 1 + 9 + 10 + 1 ~ 21 Заметим, что выборочная средняя величина в данной зада- че показывает среднюю оценку десятиклассников. Тогда, согласно проделанным расчётам, можно сказать, что в 10 «А» классе сред- няя оценка, полученная за контрольную работу, выше, чем в 10 «Б». Поэтому можно сделать вывод, что 10 «А» класс справился с данной контрольной работой лучше. При этом следует иметь в виду, что учащиеся обоих клас- сов писали одну и ту же контрольную работу и проверял данную работу один учитель. В противном случае, если задания контроль- ных работ в различных классах были бы разными или они оцени- вались различными педагогами, сделанный вывод о том, какой класс справился с работой лучше, был бы некорректным. Помимо выборочной средней охарактеризовать успевае- мость помогает такое понятие, как медиана. Под медианой выборки понимают такое значение Ме изме- ряемой величины, которое разбивает выборку на две группы такие, что суммы относительных частот в первой и во второй группах должны быть не менее 'Л. Составим таблицу с относительными частотами для 10 «А». Оценка (вариант) 2 3 4 5 Количество учащихся 10 «А» класса, получивших соответствующую оценку (частота) 2 7 10 3 Относительная частота Z mi по (ft =—,п = 22) п fi=2/22 fz=7/22 f3=10/22 f4=3/22 Таким образом, в рассмотренном примере для 10 «А» клас- са медианой является оценка «4», т.к. 10 «А» можно разделить на 2 группы, причем суммы относительных частот в группах будут рав- ны: 2 + 7 + 10 22 2’ ^10+3 22 0,59 > — 2 15
Аналогичным образом 10 «Б» можно разбить на 2 группы (10 и 11 человек). В данном случае в роли числа М также выступа- ет число 4, т.к. ^z=W±l„0,52al Ь* 21 2 Выборка может иметь одну либо две медианы. Например, по предложенной ниже таблице можно заметить, что выборка име- ет медианы Mi=3 и М2=4. Оценка (вариант) 2 3 4 5 Количество учащихся, получивших соответст- вующую оценку (частота) 10 10 1 Относительная частота (/ =—,и = 22) п fi=l/22 f2=10/22 f3= 10/22 f4=l/22 Число 3 является медианой, т.к. 2 Zz 1 + 10 1 22 " 2’ Л 10+10+1 1 22 "2 Однако число 4 также является медианой, потому что: 1 + 10 + 10 > 1 22 -2’ у z^lO + U 1 22 “2 Заметим, что некоторые авторы считают невозможным на- личие двух медиан и предлагают в подобном случае выбрать в ка- честве медианы среднее арифметическое двух медиан. В качестве дополнительной характеристики выборки ме- диану рекомендуется использовать в тех случаях, когда выборка содержит варианты, сильно отличающиеся от выборочного сред- него. 16
Кроме медианы можно использовать такую числовую ха- рактеристику, как мода. Мода показывает, какой вариант встреча- ется в выборке наиболее часто. В рассмотренном ранее примере для 10 «А» класса модой является оценка «4», т.к. она имеет самую большую частоту в предложенной выборке. Вернемся к примеру с контрольной работой. По имеющим- ся данным можно найти средний балл за проведённую контроль- ную работу для обоих классов. Сделать это можно несколькими способами. Способ первый. Обобщить имеющиеся данные в виде одно- го вариационного ряда. Для этого рассчитаем, сколько десяти- классников в двух классах написали контрольную работу на «2», на «3», на «4» и на «5» и запишем данные в таблицу. Оценка 2 3 4 5 Количество учащихся, получивших соответ- ствующую оценку 2+1=3 7+9=16 10+10=20 3+1=4 Далее воспользуемся формулой для выборочной средней. При этом учтём, что объём п полученной выборки будет равен 43. Тогда выборочная средняя для двух классов школы будет равна: _ 2-3 + 3-16 + 4-20 + 5-4 154 „ са х =---------------------=-----« 3.58. 43 43 Таким образом, средний балл за контрольную работу в обоих классах получился выше, чем в «Б» классе, и ниже, чем в «А» классе. Способ второй. Если выборку можно разбить на несколько групп (напри- мер, на разные школы, классы и т.д.), то выборочная средняя Xt для i-й группы называется групповой средней. Известно, что общая выборочная средняя ( Хв) может быть получена из групповых (Xt) средних следующим образом: к к L", Средний балл для обеих групп нам уже известен: для пер- вой группы он равен jq «3.64, а для второй группы - х2 «3.52. 17
Тогда выборочную среднюю (средний балл) для двух классов можно рассчитать так: _ 3,64*22 + 3,52-21 о со ха »----------------« 3,58. в 43 Заметим, что решение задачи обоими способами привело нас к одному результату. Рассмотрим аналогичный пример. Проведение ЕГЭ по ма- тематике в трёх школах дало следующие результаты по 100- балльной шкале: Школа Школа №1 Школа №2 Школа №3 Средний балл 72 85 69 Количество уча- щихся, сдавав- ших ЕГЭ 50 44 61 Определим средний результат по ЕГЭ для трёх данных школ. В предложенной задаче общий объём п выборки - это ко- личество учеников, сдававших ЕГЭ, п=155. Средний балл для каж- дой школы можно считать групповой средней, где в роли i-й груп- пы выступает соответствующая школа. Тогда решение задачи сводится к вычислению общей сред- ней через групповые средние по указанной выше формуле. _ 72-50 + 85-44 + 69-61 11549 пл _ х =-----------------------—--------~ 74.5 Таким образом, 155 155 Н средний результат ЕГЭ для этих трёх школ составляет 74.5 балла. Попытаемся определить, как сильно отличаются друг от друга средние результаты по ЕГЭ в трёх школах. Для этого в ма- тематической статистике существуют показатели рассеивания. 18
Характеристики рассеивания Главная характеристика рассеивания вариационного ряда называется дисперсией. Выборочная дисперсия DB рассчитывается по следующей формуле: к -x)2mi J=1 п где Xj - i-я величина из выборки, встречающаяся mi раз; п - объём выборки; X - выборочная средняя; к - количество различных зна- чений в выборке. В рассматриваемом примере: Х]=72, mi=50; х2=85, m2=44; х3=69, т3=61; n=155; к=3; х = 74.5 Тогда: „ (72-74.5)2-50+(85-74.5)2-44+(69-74.5)2-61 1ГП п —--------------------------------------------~ 16.9. 155 Заметим, что чем больше значение дисперсии, гем сильнее отличие значений измеряемой величины друг от друга. Если в вы- борке все значения измеряемой величины равны между собой, то дисперсия такой выборки равна нулю. Дисперсия обладает особыми свойствами. Свойство 1. Значение дисперсии любой выборки неотрица- тельно, т.е. D[x]>0. Свойство 2. Если измеряемая величина постоянна Х=с, то дисперсия для такой величины равна нулю: D[c]=0. Свойство 3. Если все значения измеряемой величины х в вы- борке увеличить в с раз, то дисперсия данной выборки увеличится в с2 раз: D[cx]=c2D[x], где c=const. Иногда вместо дисперсии используют выборочное среднее квадратическое отклонение сгв, которое равно арифметическому квадратному корню из выборочной дисперсии: ав = Для рассмотренного примера выборочное среднее квадра- тическое отклонение равно св = = V16.9 «4.11. Дисперсия позволяет оценить не только степень различия измеряемых показателей внутри одной группы, но может быть ис- 19
пользована и для определения отклонения данных между разными группами. Для этого используется несколько видов дисперсии. Если в качестве выборки берётся какая-либо группа, то дисперсия данной группы называется групповой дисперсией. Чтобы выразить численно различия между дисперсиями несколь- ких групп, существует понятие межгрупповой дисперсии. Меж- групповой дисперсией называется дисперсия групповых средних относительно общей средней: межгр где к - число групп в общей выборке, *^7 - выборочная средняя для i-й группы, п, - объём выборки i-й группы, X выборочная средняя для всех групп. Рассмотрим пример. Средняя оценка за контрольную работу по математике в 10 «А» классе составила 3.64, а в 10 «Б» классе 3.52. В 10 «А» учатся 22 человека, а в 10 «Б» - 21. Найдём межгрупповую дисперсию. В данной задаче выборка разбивается на две группы (два класса). Выборочная средняя для всех групп равна: _ 3.64-22+ 3.52-21 х =----------------» 3.58. В таком случае межгрупповая дисперсия равна: межгр (3.64-3.58)2 -22 + (3.52-3.58)2 -21 22 + 21 = 0.0002. Поскольку межгрупповая дисперсия близка к нулю, то мы можем сделать вывод, что оценки одной группы (10 «А» класса) в малой степени отличаются от оценок второй группы (10 «Б» клас- са). Иными словами, с точки зрения межгрупповой дисперсии рас- смотренные группы в незначительной степени отличаются по за- данному признаку. 20
Если общая выборка (например, класс учеников) разбита на несколько групп, то помимо межгрупповой дисперсии можно рассчитать ещё внутригрупповую дисперсию. Такая дисперсия является средней величиной для всех групповых дисперсий. Внутригрупповая дисперсия DBHrp рассчитывается по фор- муле: к YDln' /=1____ к ’ /=1 где к - количество групп в общей выборке, Ц - дисперсия i-й группы объёма п,. Существует взаимосвязь между общей (DB), внутригруппо- вой (DBHrp) и межгрупповой (ВмеЖгр) дисперсиями: ^в^Г^Бнгр^Т-^межгр • 21
Корреляционное отношение Межгрупповая и общая дисперсии помогают определить, насколько сильно результат педагогического эксперимента (или любого другого опыта) обусловлен принадлежностью испытуемо- го к той или иной группе. Для этого используется коэффициент детерминации г]2 = . Рассмотрим пример. Пусть оценки, полученные на ЕГЭ по математике выпускниками классов с разными профилями, описа- ны в следующей таблице. Профиль класса (группа) Средний балл в группе, к. Численность груп- пы (чел.), ns Дисперсия в группе, Di Общеобразовательный 62 23 10,15 Гуманитарный 59 25 9,81 Естественно- географический 71 18 12,3 Физико-математический 75 30 8,6 Определим, в какой степени успешность сдачи ЕГЭ зави- сит от принадлежности учащегося к той или иной группе. Для это- го сначала найдем средний балл за экзамен для всей совокупности испытуемых: V х. • и _ V 62-23+ 59-25+ 71 18 + 75-30 6429 х = -А=---=---------------------------=------~ 67 23 + 25 + 18 + 30 96 Найдем межгрупповую дисперсию: к (62 - 67/-23+ (59 - 67/ 25 + (71-67/ 18 + (75-67)г-30 Далее следует определить внутригрупповую дисперсию: '' 10,15-23 + 9,81-25 + 12,3-18 + 8,6-30 оос Л 96 1=1 Определим общую дисперсию: DB=DBHrp+DMeHap=9,98+45,66=55,64. 7 межгв 45,66 Л Следовательно: Т] —----------— ——~ ~ 0,82. £> 55,64 22
Полученный коэффициент детерминации показывает, что успешность сдачи ЕГЭ в данном опыте на 82% обусловлена при- надлежностью учащегося к той или иной группе. Используют также эмпирическое корреляционное отно- шение, получаемое извлечением квадратного корня из коэффици- ента детерминации. В рассмотренном примере Т] = д/0,82 « 0,91 Чем ближе значение корреляционного соотношения к единице, тем более тес- ную связь мы наблюдаем. Соответственно, в данном случае было показано наличие тесной связи между успешностью сдачи ЕГЭ и принадлежностью учащегося к той или иной группе обучаемых. Общая дисперсия помогает численно оценить, как сильно отличаются варианты выборки друг от друга. Межгрупповая дис- персия помогает выявить степень различия между группами дан- ной выборки. Однако в педагогических исследованиях зачастую не требуется численная оценка параметра, но при этом важно знать, существенно ли отличаются испытуемые (или группы испытуе- мых) друг от друга по тому или иному признаку. Ответ на такой вопрос даёт коэффициент вариации. Коэффициент вариации Рассмотрим пример. Для проведения эксперимента необ- ходимо, чтобы у испытуемых был примерно одинаковый интел- лектуальный коэффициент (IQ). Тестирование по методике Айзен- ка показало следующий результат: 115, 117, 110, 122, 112. Можно ли проводить эксперимент с данной группой? Для ответа на поставленный вопрос необходимо выяснить, значимо ли различие между IQ в данной группе. Используем ко- эффициент вариации. Для этого необходимо: 1. Найти выборочную среднюю: _ 115 + 117 + 110 + 122 + 112 х =------------------= 115.2- 5 2. Рассчитать ошибку Sx репрезентативности выбо- рочной средней по формуле: Sx = J—--------- Объём выборки у п(п-Х) п=5. Тогда: 1(115-115.2)2 +(117-115.2)2 +(110-115.2)2 +(122-115.2)2 + (112 -115.2)2 S’=-V Г4 ’ $,=4.34. 23
3. Найти коэффициент Сх вариации по формуле: S Сх = -100%. В рассматриваемом примере: X 4.34 Сх = -100% « 3.77%. х 115.2 Принято считать, что различие между испытуемыми (или группами испытуемых) по указанному признаку незначимо, если коэффициент вариации не превосходит 5%. Для повышения уров- ня надёжности проводимого эксперимента иногда эту планку сни- жают до 3%. Таким образом, в рассмотренном примере испытуемые по показателю IQ незначительно отличаются друг от друга (т.к. Сх=3.77%<5%). Однако для проведения более надёжного экспери- мента следует набрать другую группу испытуемых, чтобы коэф- фициент вариации был ещё ниже (в частности, менее 3%). В диссертационной работе С.Б. Рябчиковой утверждается, что измерения показателя ориентации на духовно-нравственные ценности в трёх группах отличается существенно. По авторской методике было определено, что уровень данного критерия в бал- лах имеет следующие значения: 61, 64 и 72,8. Проверим утвержде- ние о существенности различий показателя. Для этого используем коэффициент вариации. В данном случае выборочная средняя равна х « 65.93. _*)2 С — . i ~ Т С/1 . СХ = ^-100%; X 3 54 С = —г—400% «5.37%. х 65.93 Таким образом, можно говорить о справедливости утвер- ждения автора о существенности различий между оценками групп. 24
Доверительный интервал До сих пор мы находили различные числовые характери- стики выборки, которые определяются одним числом. Такие оцен- ки называются точечными. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. Поэтому для небольших выбо- рок следует пользоваться интервальными оценками. Интерваль- ной называют оценку, которая определяется двумя числами - кон- цами интервала. Интервальная оценка позволяет установить точ- ность и надежность оценок, а сами интервалы в этом случае назы- ваются доверительными. Доверительным интервалом называется интервал, по- строенный с помощью случайной выборки из распределения с не- известным параметром, такой, что он содержит данный параметр с заданной вероятностью а. В педагогике наиболее распространенным является оценка математического ожидания а случайной величины X, распреде- ленной по нормальному закону, при известном среднем квадрати- ческом отклонении о. В этом случае для оценки математического ожидания а служит интервал: _ст - О’ х -t—j==<a<x +t—j=, \П у/П где t—j= = 6 - точность оценки, п - объём выборки, X - выбо- у/П рочное среднее, t аргумент функции Лапласа, при котором Ф(0 = - Рассмотрим пример. Пусть среднее квадратическое откло- нение о нормально распределенного признака X генеральной со- вокупности равно 5, объём выборки п равен 100 и выборочное среднее X = 20 Найдем доверительный интервал математиче- ского ожидания а при а=0,9. Все величины, кроме t, известны. Найдем t по специальной 0,9 таблице, исходя из соотношения Ф(1) = = 0,45. Получим, что t=l ,65, следовательно: 25
x-t-^<a<x+t-^, 20-1,65-Д=<а< 20+1,65—^=, \n у/п д/ЮО 7100 или 19,175<а<20,825. Таким образом, можно сделать вывод о том, что математи- ческое ожидание генеральной совокупности с вероятностью а=0,9 окажется внутри полученного интервала. Во многих педагогических задачах требуется установить и оценить зависимость одной случайной величины от другой. Две случайные величины могут быть связаны функциональной зави- симостью, что случается крайне редко, либо зависимостью другого рода, называемой статистической, либо быть независимыми. Статистической называется зависимость, при которой из- менение одной из величин влечет изменение распределения дру- гой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется выборочная средняя другой. В этом случае статистическую зависимость назы- вают корреляционной. 26
Ранговые корреляции и взаимосвязи в педагогических экспериментах В математической статистике для любой измеряемой вели- чины можно вычислить числовые характеристики. Они помогают произвести интерпретацию данных, записанных в числовом виде. Однако с их помощью не представляется возможным описать связь между двумя величинами. Существует ряд способов, позво- ляющих определить параметры связи нескольких измеряемых ве- личин. Наиболее простым среди них можно назвать метод, исполь- зующий понятие ранговой корреляции. Для применения данного метода на практике регистрируют два показателя на одной выбор- ке испытуемых, предварительно их проранжировав. Коэффициент ранговой корреляции - это число, по кото- рому можно определить характер и силу связи. Предположим, что у группы испытуемых с помощью неко- торой методики оценивались такие качества, как аккуратность и вежливость. По характеру связь может быть либо прямой, либо обратной. Прямая связь показывает, что высокий уровень одной из- меряемой величины (например, аккуратности) соответствует дос- таточно высокому уровню другой измеряемой величины (в данном случае вежливости). Таким образом, прямая связь между аккурат- ностью и вежливостью показывает: от аккуратного человека сле- дует ожидать, что он окажется вежливым. Обратная связь, напро- тив, демонстрирует, что наиболее высоким значениям первой ве- личины соответствуют наиболее низкие значения второй измеряе- мой величины, то есть наличие обратной связи между аккуратно- стью и вежливостью показало бы, что наиболее аккуратные люди данной выборки являются наименее вежливыми, и наоборот: веж- ливым людям не свойственна аккуратность. Однако знать только характер связи величин недостаточно для полноценного описания этой связи. Важным является также понятие силы. Чем сильнее связь, тем ярче выражена зависимость измеряемых величин. Коэффициент ранговой корреляции позволяет выявить как силу, так и характер связи. В определении рангового коэффициен- та корреляции ключевую роль играет понятие ранга. Расположим значения хь х2, ..., хп величины X в порядке возрастания (или убы- вания), т.е. xi<x2<...<xn (или Х1>х2>...>Хп). Тогда в имеющейся вы- борке значение Xj величины X можно заменить рангом i этого зна- чения. При наличии равных показателей у записанных значений 27
им присваивается общий ранг, равный среднему арифметическому соответствующих вариантных мест. Замена значений величины X на соответствующие ранги называется ранжированием. Проран- жировав значения величин X и Y, мы получим новые выборки, по которым можно вычислять ранговые коэффициенты корреляции. Среди ранговых коэффициентов корреляции следует выде- лить коэффициент Спирмена, определяющийся по формуле: 6 IX r _ j____। где di - разность соответствующих рангов вели- 5 (и-1)л(л + 1)’ чин X и Y, п - объём выборки. Коэффициент корреляции Спирмена обладает следующими свойствами: 1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=l имеет место строго прямая связь, а при rs= -1 - строго обратная связь. 2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то - прямая связь. 3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует. 4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми ве- личинами. Связь принято считать сильной, если | rs |> 0.7 средней силы, если 0.3<|rs|<0.7, и слабой, если | rs |< 0.3 Заметим, что существует и более тонкая града- ция силы связи, представленная шкалой Чертока, отобра- женной в таблице:_________________________________ Коэффициент корреляции Характеристика силы связи |г,|<0.1 связь практически отсутствует 0,l<|rs|<0,3 слабая связь 0,3<|rs|<0,5 умеренная связь 0,5<|rs|<0,7 связь средней силы 0,7<|rs|<0,9 сильная связь 0,9<|rs|<l очень сильная связь Проиллюстрируем на примере, как рассчитывается коэффици- ент корреляции Спирмена. Определим характер и силу связи меж- ду результатами ЕГЭ по математике и физике, используя данные из приведенной ниже таблицы. Ученик 1 2 3 4 5 6 7 8 9 10 ЕГЭ, физика 95 90 86 82 75 75 64 60 57 50 ЕГЭ, математика 92 94 83 80 55 60 45 72 61 70 28
Проранжируем имеющиеся данные в порядке их убывания и найдём квадраты разностей соответствующих рангов. Особое внимание следует обратить на то, что пятое и шестое место по фи- зике делят два ученика, набравшие по 75 баллов. В этом случае для данных испытуемых следует присвоить ранг 5,5 (т.е. среднее арифметическое значение между 5 и 6). Физика, ранг 1 2 3 4 5,5 5,5 7 8 9 10 Математика, ранг 2 1 3 4 9 8 10 5 7 6 d? 1 1 0 0 12,25 6,25 9 9 4 16 Объём выборки п=10.Тогда: , 6 , 6 (1 + 1 + 0 + 0 + 12,25 + 6,25 + 9 + 9 + 4 + 16) Л,е = 1-----------= 1-----------------------------------« U,o5. (Л7-1)Л7(/7Ч 1) 9-10-11 Следовательно, имеет место прямая связь средней силы. Использование коэффициента ранговой корреляции Спир- мена очень удобно в силу относительной простоты его расчёта. Однако в математической статистике показано, что коэффициент корреляции Спирмена применим не во всех случаях. Эффектив- ность и качество оценки методом Спирмена снижается, если раз- ница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэф- фициент Спирмена, если имеет место неравномерное распределе- ние значений измеряемой величины. В рассмотренном примере значения измеряемой величины изменяются практически равномерно, без явных «скачков», то есть если расположить оценки в порядке убывания, то каждая после- дующая оценка отличается от предыдущей примерно одинаково. Кроме того, отличие значений двух оценок по сравнению с самими оценками относительно невелико. Поэтому в данном примере це- лесообразно использовать коэффициент Спирмена. 29
Коэффициент корреляции Пирсона Для определения корреляционной зависимости между дву- мя случайными величинами используют коэффициент корреляции Пирсона. Заметим, что понятие корреляции является одним из ос- новных понятий теории вероятностей и математической статисти- ки; оно было введено Гальтоном и Пирсоном. Рассмотрим пример распределения оценок, для которого использование коэффициента Спирмена нецелесообразно. Ученик 1 2 3 4 5 ЕГЭ по физике 98 40 39 39 35 ЕГЭ по математике 92 94 83 80 55 В указанной таблице имеет место «скачок» в оценках по физике, выраженный в сильном различии оценок первого и второ- го учеников. Разница между этими оценками существенна и поро- ждает неравномерность распределения оценок. В подобных случаях рекомендуется применять выбороч- ный коэффициент корреляции г Пирсона. Для его расчета необхо- димо найти особую величину k(X,Y), называемую ковариацией. Пусть величина X принимает значения хь х2, хп, а величина Y уь у2, ут. Тогда можно найти выборочную среднюю X для величины X и выборочную среднюю У для ве- личины Y. Если Пу - это частота, с которой встречается в получен- ных выборках Xi и yj, а п - объём выборки (и = ), то кова- риация k(X,Y) вычисляется по формуле: П = - X - * КУ; ~ у Для малых выборок ковариацию удобно находить с помощью ковариационного графа, для построения которого необ- ходимо вычислить выборочные средние для величин X, Y и отно- пп сительные частоты —. Ковариационный граф имеет вид: п 30
Таким образом, ковариацию k(X,Y) можно находить как вес всего ковариационного графа. Заметим, что по корреляцион- ному графу удобно находить и дисперсии случайных величин, ко- торые также необходимы для вычисления коэффициента корреля- ции Пирсона. Выборочный коэффициент корреляции определяется по формуле: 7г>и)£>(У) Для иллюстрации использования коэффициента корреля- ции и применения ковариационного графа рассмотрим пример. В выпускном классе проводились контрольные работы по физике и математике, которые дали следующие результаты: оценки матем. оценки х по физикех. «2» «3» «4» «5» «2» 1 чел. 2 чел. 1 чел. - «3» 1 чел. 4 чел. 2 чел. - «4» - 1 чел. 3 чел. 4 чел. «5» - 1 чел. 3 чел. 2 чел. Определим характер и силу связи между оценками в про- веденных работах. Для этого найдём выборочную ковариацию и коэффициент корреляции. Объём выборки равен п=25, т.к. контрольные работы писа- ли 25 человек (сумма всех данных в таблице). Пусть X - это оценки по физике, a Y - оценки по матема- тике. Тогда по имеющейся таблице составим две таблицы (по строкам и столбцам) для нахождения выборочных средних. 31
По физике (велмшнаХ): Оценка «2» «3» «4» «5» Количество чел. 4 7 8 6 По математике (величина Y)± Оценка «2» «3» «4» «5» Количество чел. 2 8 9 6 По данным таблицам находим выборочные средние: _ 2-4 + 3-7 + 4-8 + 5-6 х =--------------------= 3.64. 25 Из построенного графа находим ковариацию: к(Х, У) = -1.64 • 0.04 • (-1.76) + (-1.64) • 0.08 • (-0.76) +... +1.36 • 0.08 • 1.24; Л(2Г,У) = 0.5136. По корреляционному графу находим и выборочные дис- персии: D(X)=(-1,64)2(0,04+0,08+0,04)+(-0,64)2(0,04+0,16+0,08)+ +(0,36)2(0,04+0,12+0,16)+( 1,36)2(0,04+0,12+0,08)= 1.03, аналогично вычисляем дисперсию D(Y)=0.82. Поэтому г(Х,У) «--г.т« 0.55. Таким образом, 71.03-0.82 между оценками по физике и математике в данной выборке суще- ствует прямая связь средней силы. 32
Ранговая корреляция Спирмена и выборочный коэффици- ент корреляции позволяют нам определить характер и силу связи для двух измеряемых величин. Но на практике педагогические и психологические эксперименты зачастую производят измерения большего количества величин. Например, тестирование учащихся может проводиться по таким параметрам, как трудолюбие, усид- чивость, память, качество речи и т.д. Для того чтобы узнать, каким образом связаны все эти качества, можно использовать два сле- дующих метода: 1. Рассматривают попарные связи и иллюстрируют их на корреляционных матрицах или корреляционных графах. 2. Находят множественный коэффициент ранговой корреля- ции - коэффициент конкордации. 33
Корреляционные матрицы и графы Значения корреляции для пар величин можно записывать в со- ответствующие столбцы и строки матрицы (таблицы). Например, для трёх хь х2, х3 величин корреляционная матрица будет иметь вид: ’'ll Г12 Пз" (г) = Г21 Г22 Г23 /з1 г32 гзз_ В данном случае г,, - это коэффициент корреляции между i-й и j-й характеристиками и очевидно, что он равен q, (Гу=гД а также rii=l для всех допустимых значений i. Поэтому для упрощения корреляционную матрицу принято представлять в треугольном виде: Построим корреляционную матрицу ранговой попарной связи результатов трёх тестирований 10 студентов. Результаты ранжирования тестирования указанных студентов представлены в таблице: Тест А (ранг) 1 2 3 4 5 6 7 8 9 10 Тест В (ранг) 2 1 3 4 9 8 10 5 7 6 Тест С (ранг) 10 9 8 7 6 5 4 3 2 1 Для решения поставленной проблемы найдём коэффициент корреляции Спирмена для тестов А и В (г12), А и С (Г]3) и В и С (г2з)- После проведения расчётов получаем, что п2= 0,64, г23= - 0,58, r13= -1. Тогда корреляционная матрица будет иметь следую- щий вид: 34
0.64 -1 1 -0.58 1 Наглядно попарную связь измеряемых величин удобно представить с помощью корреляционного графа. В вершинах кор- реляционного графа указывается измеряемая величина, а над рёб- рами, соединяющими вершины, проставляется соответствующее значение коэффициента корреляции. Таким образом, полученную в предыдущем примере корреляционную матрицу легко заменить корреляционным графом. Для определения степени зависимости нескольких резуль- татов по совокупности используют множественный коэффициент ранговой корреляции. 35
Коэффициент конкордации Корреляционная матрица и корреляционный граф показы- вают взаимосвязь нескольких измеряемых величин попарно. Если же имеется необходимость в определении взаимосвязи сразу всех величин, то для её оценки используют коэффициент конкордации. Надо заметить, что наличие сильных попарных связей между ве- личинами ещё не означает, что данные величины имеют аналогич- но сильную связь в своей совокупности. Рассмотрим на примере, каким образом рассчитывается коэффициент конкордации и какой следует делать вывод о силе множественной связи по числовому значению данного коэффици- ента. Итоги ЕГЭ по четырём предметам (средний балл) за 2008 год в городах и ближайшему к областному центру району Яро- славской области отображены в таблице. Определим, как связаны успехи по всем четырём предметам. Хпредмет город Х^ Русский язык (баллы) Математика (баллы) Физика (бал- лы) История (бал- лы) Ярославль 54.90 51.89 54.75 53.74 Переславль 54.93 50.66 48.59 53.13 Ростов 52.38 50.19 53.71 56.74 Рыбинск 53.06 52.14 51.55 52.92 Тугаев 50.20 49.30 49.63 56.33 Углич 50.80 45.43 47.67 51.14 Ярославский район 49.34 48.37 53.36 39.81 Чтобы определить общую связь всех четырёх предметов, найдем ранговый коэффициент множественной корреляции, а для определения парных связей будем использовать известный уже нам ранговый коэффициент корреляции Спирмена. В обоих случа- ях потребуется произвести ранжирование баллов по каждому предмету. Для отыскания коэффициента конкордации потребуется также найти суммы R, рангов (и их квадраты) для каждого района или города, т.е. суммы рангов по строкам (см. таблицу ниже). В результате имеющаяся таблица примет вид: хпредмет город Русский язык (1) Математика (?) Физика (3) История (4) Ri R,2 балл ранг балл ранг балл ранг балл ранг Ярославль 54.90 2 51.89 2 54.75 1 53.74 3 8 64 Переславль 54.93 1 50.66 3 48.59 6 53.13 4 14 196 36
Ростов 52.38 4 50.19 4 53.71 2 56.74 1 11 121 Рыбинск 53.06 3 52.14 1 51.55 4 52.92 5 13 169 Тугаев 50.20 6 49.30 5 49.63 5 56.33 2 18 324 Углич 50.80 5 45.43 7 47.67 7 51.14 6 25 625 Ярославский район 49.34 7 48.37 6 53.36 3 39.81 7 23 529 Если первым предметом считать русский язык, вторым - математику, третьим - физику, а четвёртым - историю, то можно рассмотренным ранее способом рассчитать коэффициенты корре- ляции Гц Спирмена и составить с их помощью корреляционную матрицу. После проведения расчётов получим, что корреляционная матрица имеет вид: Г1 0.75 0.07 0.29’ 1 0.43 0.33 (г) = 1 0.36 1 Как видим, в полученной матрице все связи прямые. Одна- ко при этом есть сильные и слабые попарные связи. Поэтому для характеристики взаимосвязанности всех четырёх величин инте- ресно рассчитать коэффициент конкордации w, который определя- ется по формуле: 12S w = —, т (и-1)и(и + 1) где п - объём выборки (в частности, количество городов и рай- онов), m - количество измеряемых величин (в частности, предме- тов), а параметр S находится следующим образом: Таким образом, £ Я,2 =64 + 196 + 121 + 169 + 324 + 625 + 529 = 2028; I £ Я, =8 + 14 + 11 + 13 + 18 + 25 + 23 = 112. / Тогда: 1122 5 = 2028--------= 236. 7 37
А т.к. n=7 и m=4, то вычисляем искомый коэффициент конкорда- ции: 12-236 w =--------- 16-6-7-8 «0.52. Надо заметить, что коэффициент конкордации - это неот- рицательное число, не превосходящее единицы, т.е. 0 < w <1. При этом связь считается слабой, если w менее 0.3, средней силы, если w изменяется от 0.3 до 0.7, и сильной, если w>0.7. Следовательно, между рассмотренными результатами ЕГЭ по четырем предметами наблюдается связь средней силы. На разных этапах статистического исследования возникает необходимость в формировании и экспериментальной проверке некоторых предполагаемых утверждений (гипотез). 38
Статистические гипотезы В педагогике для проверки эффективности предлагаемого ав- торского подхода, как правило, выбираются экспериментальная и кон- трольная группы. При этом первым делом проверяется, является ли уровень подготовленности групп по исследуемому признаку примерно одинаковым. Следующим требованием при организации эксперимента является одинаковый уровень работающих в этих группах эксперимен- таторов-педагогов, а ещё лучше, если это делает по-разному сам автор предлагаемого подхода (традиционно - в контрольной группе и с ис- пользованием разработанного метода - в экспериментальной группе). Для проверки и подтверждения полученных результатов ис- пользуют так называемые критерии согласия. Данные критерии да- ют возможность установить, в каком случае результаты проведенных сравнений носят случайный характер, а в каком являются следствием предложенного автором подхода. Например, если найти коэффициент корреляции между уров- нем знаний по точным и гуманитарным наукам для выборки, состоя- щей из малого числа учеников или отобранных специальным обра- зом, то полученный результат, скорее всего, не будет отражать взаи- мосвязь между уровнями знаний для учащихся всей школы. В этом случае говорят о нерепрезентативное™ выборки. Таким образом, можно сделать вывод, что в некоторых слу- чаях найденные числовые характеристики выборки не могут быть использованы в качестве аргумента для обоснования какого-либо вы- вода. В таком случае говорят о несущественности полученных ре- зультатов. Проверить, является ли результат значимым, помогают статистические гипотезы. Статистической гипотезой называется утверждение о соответст- вии той или иной выборки некоторому классическому распределению или о совпадении основных числовых характеристик распределений. В педагогике, как правило, статистическую гипотезу можно сформулировать в виде утверждения о несущественное™ различий полученных результатов в контрольной и экспериментальной группах. Статистические гипотезы могут быть проверены методами ма- тематической статистики. В результате будет получен вывод о том, сле- дует ли отклонить выдвинутую гипотезу или принять её. Однако данные методы не позволяют нам гарантировать полную достоверность полу- ченных результатов, то есть всегда существует ненулевая вероятность ошибки. При этом возможно допущение ошибок двух типов. Ошибка первого рода - это такая ошибка, в результате ко- торой отвергается правильная гипотеза. Вероятность совершить та- кую ошибку называется уровнем значимости ОС. Как правило, в ка- 39
честве уровня значимости принято использовать следующие вероят- ности: 0.1,0.05,0.01. Ошибка второго рода состоит в том, что будет принята не- правильная гипотеза. Вероятность ошибки второго рода обозначают 0. При работе со статистическими гипотезами необходимо вы- двинуть основную гипотезу, которую обычно обозначают Но и назы- вают нулевой гипотезой, а также альтернативную гипотезу, являю- щуюся, как правило, логическим отрицанием нулевой гипотезы. Далее в рассматриваемых примерах в качестве основной гипотезы Но будем выдвигать предположение о несущественности различий полученных результатов. Значит, в альтернативной гипотезе будет утверждаться о том, что полученные результаты различаются существенно. Процедура обоснованного сопоставления высказанной гипоте- зы с полученными выборками осуществляется с помощью того или иного статистического критерия и называется статистической провер- кой гипотезы. Под критической областью понимают совокупность значений критерия, при которых нулевую гипотезу По отвергают. Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую можно предста- вить следующим образом: Математическая статистика предлагает ряд критериев достоверности, с помощью которых становится возможным оце- нить статистические гипотезы и которые разделяются на два типа - параметрические и непараметрические. 40
Параметрические критерии согласия К параметрическим критериям относятся такие виды кри- териев, которые позволяют оценить результаты по какому-то из параметров вероятностного распределения признака (выборочные средние, дисперсии и т.д.). Наиболее распространённым параметрическим критерием является t-критерий Стьюдента (псевдоним У Госсета). Критерий Стьюдента Проверка гипотезы о существенности или несущественно- сти различия двух выборочных средних - одна из часто встречаю- щихся процедур в исследовательской работе. В этом случае можно применить критерий Стьюдента (при условии достаточно больших объёмов выборок (п>30) или убедившись, что статистические ряды близки к нормальному закону распределения), t-критерий приме- няется в двух вариантах - когда сравниваемые выборки не зависи- мы (не связаны) и когда они зависимы (связаны). Уровень значимости t-критерия равен вероятности оши- бочно отвергнуть гипотезу о равенстве выборочных средних двух выборок, когда в действительности эта гипотеза имеет место. При проверке разности двух средних с помощью t- критерия Стьюдента используется следующий алгоритм: 1. Записать вариационный ряд результатов X эксперимен- тальной группы. 2. Записать вариационный ряд результатов Y контрольной группы. 3. Найти выборочные средние двух выборок X и у 4. Найти выборочные дисперсии Dx и Dy. 5. Вычислить эмпирическое значение критической статисти- «1 Dx+n2'Dy П, -П, , ——--(«1+«2-2) пх +п2 6. Определить по таблице критическое значение И, + п2 — 2) для соответствующего уровня значи- 41
мости а и данного числа степеней свободы г = пх + п2 - 2. Если /эмп > t, то различия между средними значениями экс- периментальной и контрольной групп существенны на данном уровне значимости. Рассмотрим пример расчета для сравнения стрессоустой- чивости для двух профессий: учителя и менеджера по продажам для двух групп (nj=32, п2=33). Учителя Менеджеры устойчивость к стрессу (бал- лы) устойчивость к стрессу (баллы) 1 23 1 25 2 17 2 24 3 18 3 17 4 19 4 23 5 22 5 24 6 18 6 22 7 19 7 24 8 17 8 20 9 20 9 21 10 21 10 22 11 24 11 23 12 19 12 19 13 21 13 23 14 20 14 21 15 22 15 20 16 23 16 19 17 18 17 25 18 16 18 26 19 17 19 21 20 21 20 24 21 25 21 23 22 20 22 25 23 15 23 22 24 16 24 23 25 18 25 20 26 21 26 22 27 20 27 24 42
28 19 28 21 29 17 29 20 30 18 30 25 31 19 31 24 32 16 32 22 X Dx 19,34 6,17 33 22 У D, 22,3 4,41 Выдвинем нулевую гипотезу Но={х-у = О} при альтер- нативной гипотезе Н|={ х - у * 0}. Находим выборочные средние х = ^(23 + 17 + 18 + 19 + ...+ 18 + 19 + 16)» 19,34; у = -—(25 + 24 + 17 + 23 + ...+ 24 + 22 + 22) » 22,30; и дисперсии: Dx== ^2 ^23 "19,34)2 + 7 ~19,34)2 + ‘ ‘+ 6 “19,34)2) * 6,17’ Dy = ±((25 - 22,3)2 + (24 - 22,3)2 +... + (22 - 22,3)2) » 4,41. Вычисляем эмпирическое значение критерия: t эмп |19,34-22,3| 732-6,17 + 33-4,41 /32-33 V 65 (65-2)» 5,11 Для выбранного уровня значимости а=0,01 находим по таб- лице критическое значение ^(0,01; 32+33-2)=2,66. t,Mn=5,l1>2,66=4^(0,01 ;63), таким образом гипотеза о несу- щественности различий в средних значениях стрессоустойчивости на уровне значимости а=0,05 отклоняется, и можно говорить о различном уровне устойчивости к стрессу между учителями и ме- неджерами. Изобразим алгоритм определения t-критерия Стьюдента с по- мощью схемы. 43
Кроме того, следует обратить внимание на то, что t-критерий можно использовать лишь при выполнении следующих условий: 1. Наблюдения в каждой из рассматриваемых групп взяты случайным образом из одной и той же генеральной сово- купности (например, две группы студентов одного курса или дети одного возраста и т.д.) 2. Наблюдения имеют нормальные распределения или объ- ёмы выборок ni и п2 больше 30. Критерий Крамера-Уэлча В педагогике иногда ^-критерий Стьюдента заме- няют более простым критерием Крамера-Уэлча. Эмпирическое значение данного критерия рассчитывается по следующей форму- ле: Тэмп = / = • Vй! • «2 • Dx+n2 Dy Следует заметить, что эмпирическое значение критерия Крамера-Уэлча есть приближенное значение эмпирического зна- чения t-критерия Стьюдента. Легко видеть, что при достаточно больших ni и п2 справедливо следующее приближенное равенство: 44
I (и. + n, - 2) • лИ-«г-—----------"=^ V «1+«2 Заметим, что критические значения для критерия Крамера- Уэлча зависят только от уровня значимости а и выражаются через критические значения t-критерия Стьюдента следующим образом: 71/0,01) = Гкр(0,01;«>) = 2,58; 7^(0,05) = ^(0,05;оо) = 1,96; 7^(O,1) = ^(O,1;«>) = 1,65. Поэтому алгоритм и схема использования критерия Краме- ра-Уэлча будут аналогичными, как и для критерия Стьюдента. Рассмотрим использование этого критерия для данных из предыдущего примера. Найдем эмпирическое значение для критерия Крамера- Уэлча: ^934-22,3^^^ д/32-6,17 + 33-4, Поскольку Ткр(0,01)=2,58<5,19=Тэмп, то сравниваемые вы- борочные средние отличаются значимо. Рассмотренный пример показывает, что эмпирические зна- чения t-критерия Стьюдента и критерия Крамера-Уэлча в незначи- тельной мере отличаются друг от друга. При этом очевидно, что чем больше объёмы выборок, тем меньше отличия числовых зна- чений данных критериев. Критерий Фишера F - критерий Фишера является параметрическом критери- ем и используется для сравнения дисперсий двух вариационных рядов. Эмпирическое значение критерия вычисляется по формуле: где - большая дисперсия, - меньшая дисперсия рассматри- ваемых вариационных рядов. Если вычисленное значение критерия F3Mn больше критиче- ского для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то диспер- сии считаются различными. Иными словами, проверяется гипоте- 45
за, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: Ho={Dx=Dy}. Критическое значение критерия Фишера следует опреде- лять по специальной таблице, исходя из уровня значимости а и степеней свободы числителя (пг1) и знаменателя (пг-1). Проиллюстрируем применение критерия Фишера на сле- дующем примере. Дисперсия такого показателя, как стрессоустой- чивость, для учителей составила 6,17 (ni=32), а для менеджеров 4,41 (п2=33). Определим, можно ли считать уровень дисперсий примерно одинаковым для данных выборок на уровне значимости 0,05. Для ответа на поставленный вопрос определим эмпириче- ское значение критерия: F3Mn 6,17 4,41 «1,4. При этом критическое значение критерия FKp(0,05;31;32)=2. Таким образом, Рэмп=1,4<2=Р1ф, поэтому нулевая гипотеза о равенстве генеральных дисперсий на уровне значимости 0,05 при- нимается. 46
Непараметрические критерии Непараметрические критерии не содержат расчёта пара- метров распределения и основаны на оперировании частотами или рангами. Непараметрические критерии, как правило, менее слож- ны в вычислениях и могут быть измерены в любой шкале, начиная от шкалы наименований. Критерий Пирсона Критерий согласия %2 - Пирсона позволяет осуществлять проверку эмпирического и теоретического (либо другого эмпири- ческого) распределений одного признака. Данный критерий при- меняется, в основном, в двух случаях: Для сопоставления эмпирического распределения признака с теоретическим распределением (нормальным, показательным, равномерным либо каким-то иным законом); Для сопоставления двух эмпирических распределений одного и того же признака. Идея метода - определение степени расхождения соответ- ствующих частот п; и и' чем больше это расхождение, тем боль- ше значение %2 эмп ^2 =у i Объемы выборок должны быть не меньше 50, и необходимо ра- венство сумм частот &=&' Нулевая гипотеза Н0={два распределения практически не различаются между собой}; альтернативная гипотеза Hi={расхождение между распределениями существенно}. Приведем схему применения %2 — критерия для сопостав- ления двух эмпирических распределений: 47
Рассмотрим применение критерия на следующем примере. Среди школьников с 1 по 7 класс в течение двух недель проводился опрос об удовлетворенности собственными оценками. Результаты опроса представлены в таблице: Номер возрастного интерва- ла (соответствует классу) Число удовлетворенных оценками в первую неделю исследования Число удовлетворенных оценками на второй неделе исследования 1 16 17 2 13 13 3 8 9 4 11 9 5 4 3 6 3 4 7 3 3 Можно ли считать, что эмпирическое распределение на первой неделе исследования согласуется с эмпирическим распределением на второй неделе исследования, т.е. структура удовлетворенности ответами учащихся сохранилась в течение данного времени? Пусть уровень значимости равен 0,05. Вычислим эмпирическое значение критерия: 2 _ v («< -«/>2 _ 06-17)2 х (13-13)2 (8-9)2 (11-9)2 (4 — З)2 (3-4) £ п' 17 13 9 9 3 4 3 48
По таблице критических точек распределения %2 по за- данному уровню значимости 0,05 и числу степеней свободы к=7-1 находим критическую точку /2^,(0,05;6) = 12,6. Поскольку %2э»т = 1,20 < 12,6 = %2кР, то нет оснований отвергать нулевую гипотезу об одинаковом распределении мнений учащихся о своей успеваемости в разные недели. Проверка нормальности распределения Для проверки распределения на предмет соответствия нор- мальному закону вычисляют выборочную среднюю х и среднее квадратическое отклонение о, а затем вычисляют теоретические частоты по следующей формуле: <У где: п - объём выборки, h - шаг (разность между двумя соседними — 1 и2 х Х>~Х ( А 1 ~ вариантами), и, =------, (р(и) = —==-е 2 сг у/2л Рассмотрим пример. В результате выборочного обследова- ния стажа работы профессорско-преподавательского состава полу- чены следующие данные: Стаж рабо- ты (лет) 0-4 4-8 8-12 12-16 16-20 20-24 24-28 28-32 Число пре- подавателей 3 8 25 40 46 31 6 2 Выяснить, является ли распределение стажа работы нор- мальным на уровне значимости а=0,01. Для решения поставленной задачи перейдем от заданного интервального распределения к распределению равноотстоящих вариант и вычислим выборочную среднюю и выборочное среднее квадратическое отклонение. п=161, х=— (2-3 + 6-8 + 10-25 + 14-40 + 18-46 + 22-31 + 26-6 + 30-2) «16, 161 а = Jd~x «5,43, a «/= Д=^^(м) = 118,6-^(м/). сг 49
Составим расчетную таблицу, заполняя её последовательно по столбцам слева направо: Xi II .X 31 I XI <р(ъ) л. (ПгП(’)2 1 2 -2,58 0,014 1,66 3 1,8 1,08 2 6 -1,84 0,073 8,66 8 0,44 0,05 3 10 -1,1 0,218 25,85 25 0,72 0,033 4 14 -0,37 0,373 44,24 40 17,89 0,41 5 18 0,37 0,373 44,24 46 3,1 0,07 6 22 1,1 0,218 25,85 31 26,52 1,03 7 26 1,84 0,073 8,66 6 7,08 0,82 8 30 2,58 0,014 1,66 2 0,12 0,07 I 161 г2 = 3,56 ЛЭМП По таблице критических точек распределения по уровню значимости а=0,01 и числу степеней свободы k=s-3=8-3=5 нахо- дим критическую точку критической области 4(0,05;5) = 15,1. Так как = 3,56 <15,1 = то гипотезу о нормальном распределении генеральной совокупности принимаем. Критерий Манна-Уитни U-критерий Манна-Уитни используется для оценки разли- чий между двумя малыми выборками (пьпг>3 или ni=2, пг>5) по уровню количественно измеряемого признака. При этом первой выборкой принято считать ту, где значение признака больше. Нулевая гипотеза Но~ {уровень признака во второй выборке не ниже уровня признака в первой выборке}; альтернативная ги- потеза - Н1={уровень признака во второй выборке ниже уровня признака в первой выборке}. Рассмотрим алгоритм применения U-критерия Манна- Уитни: 1. Перенести все данные испытуемых на индивидуальные кар- точки, пометив карточки 1-й выборки одним цветом, а 2-й - другим. 2. Разложить все карточки в единый ряд по степени возрастания признака и проранжировать в таком порядке. 3. Вновь разложить карточки по цвету на две группы. 4. Подсчитать сумму рангов отдельно по группам и проверить, совпадает ли общая сумма рангов с расчетной. 50
5. Определить большую из двух ранговых сумм Тх. 6. Вычислить эмпирическое значение U: гт _ _ • (пх + 1) U — Пх • П2 Ч - Тх 5 где п. - количество испытуемых в i - выборке (/ = 1, 2), пх количество испытуемых в группе с большей суммой рангов. 7. Задать уровень значимости а и, используя специальную табли- цу, определить критическое значение UKp(a). Если U3Mn > UKp , то Hq на выбранном уровне значимости принимается. Рассмотрим использование U критерия Манна-Уитни на примере. Проведение срезовой контрольной работы по математике (алгебра и геометрия) в средней общеобразовательной школе дало следующие результаты по 10-балльной шкале для класса, обу- чающегося по программе «Развивающее обучение» (7 «Б»), и клас- са, обучающегося по традиционной системе (7 «А»): Ученик \ Класс 7 «А» (баллы) 7 «Б» (баллы) 1 9 5 2 7 10 3 7 7 4 8 8 5 6 8 6 4 4 7 4 6 8 8 8 9 6 8 10 6 9 11 5 7 12 - 10 Определите, превосходят ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по математике. Сравнение результатов показывает, что баллы, полученные за контрольную работу, в 7 «Б» классе несколько выше, поэтому первой считаем выборку результатов 7 «Б» класса. Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной. Если можно, то это будет означать, что класс, обучающийся по системе развивающего обучения, име- ет более качественные знания по математике. В противном случае на выбранном уровне значимости различие окажется несущест- венным. 51
Для оценки различий между двумя малыми выборками (в данном примере их объёмы равны: П]=12, п2=11) используем кри- терий Манна-Уитни. Проранжируем представленную таблицу: 7 «Б» (баллы) ранг 7 «А» (баллы) ранг 10 22,5 10 22,5 9 20.5 9 20.5 8 16.5 8 16.5 8 16.5 8 16.5 7 11.5 8 16.5 7 11.5 8 16.5 6 7.5 7 11.5 6 7.5 7 11.5 6 7.5 6 7.5 5 4.5 5 4.5 4 2 4 2 4 2 Сумма: 168.5 Сумма: 107.5 При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой вели- чины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания. Например, 4 балла получили 3 ученика (см. таблицу). Значит, первые 3 позиции в расположении займёт балл, равный 4. Поэтому ранг для 4 баллов - это среднее арифметиче- „, _ . 1+2+3 ское для позиции 1, 2 и 3, или: ---= 2. Аналогично рассуж- даем при вычислении ранга для балла, равного 5. Такой балл по- лучили двое учащихся. Значит, при распределении по возрастанию первые три позиции занимает балл, равный 4, а четвёртую и пятую позиции займёт балл, равный 5. Поэтому его ранг будет равен среднему арифметическому между числами 4 и 5, т.е. 4.5. Используя предложенный принцип ранжирования, полу- чим таблицу рангов. Заметим, что выбор среднего арифметическо- го в качестве ранга применяется при любом ранжировании, в том числе необходимого и для вычисления других критериев досто- верности или же коэффициента корреляции Спирмена. Чтобы использовать критерий Манна-Уитни, рассчитаем суммы рангов рассматриваемых выборок (см. таблицу). Сумма для первой выборки равна 168,5, для второй - 107,5. Обозначим наи- большую из этих сумм через Тх (Тх=168.5). Среди объёмов щ и п2 52
выборок наибольший обозначим пх. Этих данных достаточно, что- бы воспользоваться формулой расчёта эмпирического значения критерия: п (и +1) измп=пхп2+^^--------т 2 Тх= 168,5, пх=12>11=п2. Тогда: 1213 иэмп = 11 • 12 + -168.5 = 41.5 ЭМП гу Критическое значение критерия находим по специальной таблице. Пусть уровень значимости равен 0.05. Гипотеза Но о незначительности различий между баллами двух классов принимается, если Uxp<u3Mn. В противном случае Но отвергается и различие определяется как существенное. ич,( 0.05) = 35. и = 35<41.5 = z/ кр ЭЛ1П Следовательно, различия в уровне знаний по математике среди учащихся можно считать несущественными. Схема использования критерия Манна-Уитни выглядит следующим образом Критерий Колмогорова-Смирнова Данный критерий также позволяет оценить существен- ность различий между двумя выборками, в том числе возможно 53
его применение для сравнения эмпирического распределения с теоретическим. Критерий позволяет найти точку, в которой сумма накоп- ленных частот расхождений между двумя распределениями явля- ется наибольшей, и оценить достоверность этого расхождения. Нулевая гипотеза Но={различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхо- ждения между ними)}. Схематично алгоритм применения критерия Колмогорова- Смирнова можно представить следующим образом: Проиллюстрируем использование критерия Колмогорова- Смирнова на примере. При изучении творческой активности студентов были по- лучены результаты для экспериментальных и контрольных групп (см. таблицу). Являются ли значимыми различия между контроль- ной и экспериментальной группами? Уровень усвоения Частота в эксперимен- тальной группе Частота в контрольной группе Хороший 172 чел. 120 чел. Приблизительный 36 чел. 49 чел. Плохой 15 чел. 36 чел. Объём выборки П!=172+36+15=223 п2= 120+49+36=205 54
Вычисляем относительные частоты f, равные частному от деления частот на объём выборки, для двух имеющихся выборок. Далее определяем модуль разности соответствующих от- носительных частот для контрольной и экспериментальной выбо- рок. В результате исходная таблица примет следующий вид: Относительная частота экспериментальной группы (^эксп) Относительная частота контрольной группы (Сконто) Модуль разности час- тот |f3KCn “ ^ICOHTpl 172/223^0.77 120/205-0.59 0.18 36/223-0.16 49/205~0.24 0.08 15/223-0.07 36/205-0.17 0.1 Среди полученных модулей разностей относительных час- тот выбираем наибольший модуль, который обозначается dmax. В рассматриваемом примере 0.18>0.1>0.08, поэтому dmax=0.18. Эмпирическое значение критерия ХэМП определяется с помощью формулы: ^эмп ^тах у пх + п2 Чтобы сделать вывод о схожести по рассматриваемому критерию между двумя группами, сравним экспериментальное значение кри- терия с его критическим значением, определяемым по специаль- ной таблице, исходя из уровня значимости ОС В качестве нулевой гипотезы примем утверждение о том, что сравниваемые группы незначительно отличаются друг от друга по уровню усвоения. При этом нулевую гипотезу следует принять в том случае, если наблю- даемое значение критерия не превосходит его критического значе- ния. 2 =0,18 эмп ’ 223-205 223 + 205 Считая, что (X = 0.05, по таблице определяем критическое значение критерия: 1^,(0,05)=1,36. Таким образом, ХэМП=1,86>1,36= Хкр. Следовательно, нуле- вая гипотеза отвергается, и группы по рассмотренному признаку отличаются существенно. Заметим, что объёмы рассматриваемых выборок должны быть достаточно большими: П]>50, п2>50. 55
Критерий Вилкоксона Критерий применяется для сопоставления показателей из- менений в двух разных условиях на одной и той же выборке испы- туемых. С его помощью можно определить, является ли сдвиг по- казателя в каком-то одном направлении более существенным, чем в другом. Нулевая гипотеза Но={существенность сдвигов в типичном направлении не превосходит существенности сдвигов в нетипич- ном направлении}. На объём выборки накладывается следующее условие: 5<п<50. Для демонстрации применения критерия определим зна- чимость различий изменений вербальной памяти до и после иппо- терапии (в баллах), используя следующие данные: Измерение до эксперимента 6 5 4 3 7 6 4 4 5 6 Измерение после эксперимента 8 5 6 4 7 7 5 3 8 7 Воспользуемся следующим алгоритмом: 1. Вычислим разности между индивидуальными значениями показателя после проведения эксперимента и до него. 2. Для полученных разностей найдём их модули и произве- дём их ранжирование в порядке возрастания. 3. Отметим ранги, соответствующие сдвигам в нетипичном направлении. Например, если в большинстве случаев по- сле проведения эксперимента наблюдалось увеличение измеряемого параметра, то его уменьшение следует счи- тать нетипичным сдвигом. После выполнения указанных действий исходную таблицу можно представить следующим образом (нетипичные сдвиги вы- делены шрифтом). Измерение до экспе- римента 6 5 4 3 7 6 4 4 5 6 Измерение после эксперимента 8 5 6 4 7 7 5 3 8 7 Разность показателей 2 0 2 1 0 1 1 -1 3 1 Модуль разности 2 0 2 1 0 1 1 1 3 1 Ранг модуля разности 8.5 1.5 8.5 5 1.5 5 5 5 10 5 Эмпирическое значение критерия определяется как сумма рангов, соответствующих нетипичным сдвигам. В рассмотренном примере имеется только один такой сдвиг (см. таблицу), которому соответствует ранг, равный 5. Поэтому эмпирическое значение 56
критерия будет численно равно этому рангу: Тэмп=5. Критическое значение следует искать в специальной таблице. Пусть уровень значимости равен 0.05. По таблице находим, что Ткр(0.05)=10. Сравним полученные значения критерия. Если критическое значение не превосходит эмпирического, то на данном уровне зна- чимости отсутствуют основания для отклонения нулевой гипотезы о несущественности различий. Иначе нулевая гипотеза отвергает- ся. Т.к. Тэмп=5<10=Ткр(0,05), то нулевую гипотезу следует от- вергнуть и считать различия существенными. Таким образом, схема применения критерия Вил- коксона будет иметь следующий вид: Критерий Вилкоксона позволяет установить не только на- правленность изменений, но и их выраженность. Следующий рас- сматриваемый нами критерий служит только для определения на- правления изменения в двух связанных выборках. Критерий знаков Сравнивая результаты «до» и «после» какого-либо воздей- ствия на учащихся, педагог видит тенденции повторного измере- ния - большинство показателей могут увеличиваться или, напро- тив, уменьшаться. Для того чтобы доказать эффективность воздей- ствия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Одним из наиболее простых кри- териев различия является критерий знаков G. Он дает возможность установить, на сколько однонаправленно изменяются значения 57
признака при повторном измерении связанной однородной выбор- ки. Критерий знаков применяется к данным, полученным в ранго- вой, интервальной и шкале отношений. В остальных случаях, ко- гда сдвиги могут быть определены количественно и варьируются в достаточно широком диапазоне, лучше применять критерий Вил- коксона. Решим с использованием критерия знаков следующую за- дачу. Результаты измерения уровня тревожности до и после про- ведения тренинга в группе испытуемых отображены в таблице. № испытуемого Уровень тревожности «до» тренинга Уровень тревожности «после» тренинга Сдвиг 1 30 34 +4 2 39 39 0 3 35 26 -9 4 34 33 -1 5 40 34 -6 6 35 40 +5 7 22 25 +3 8 22 23 +1 9 32 33 -1 10 23 24 + 1 11 16 15 -1 12 34 27 -7 13 33 35 +2 14 34 37 +3 Определить, является ли изменение уровня тревожности статистически значимым. Сдвигом называется разность между значениями измеряе- мого параметра «после» и «до» проведения эксперимента. В качестве нулевой гипотезы примем: Но={преобладание типичного направления сдвига является случайным}; альтерна- тивная гипотеза - Н1={преобладание типичного направления сдви- га не является случайным}. Для проверки нулевой гипотезы определяют типичный сдвиг ("+" или "-") и считают число (количество) типичных и не- типичных сдвигов. В примере число положительных сдвигов превосходит ко- личество сдвигов в отрицательном направлении. Поэтому в данной задаче типичным является положительный сдвиг. Из таблицы вид- но, что число п таких сдвигов равно 8. Эмпирическое значение критерия определяется, как число нетипичных сдвигов. В нашем случае Сэмп=5. 58
Критическое значение критерия G^(a;n) определяют по специальной таблице, где п - общее число сдвигов, т.е. объем вы- борки. Пусть уровень значимости а=0,05. Тогда 0^(0,05; 13)=3. Нулевая гипотеза принимается, если Оэмп^Окр^п). По- скольку G3Mn=5>3= Gkp(0,05; 13), то нулевая гипотеза принимается, и типичный сдвиг является случайным на выбранном уровне зна- чимости. Применение критерия знаков можно представить в виде следующей схемы: Заметим, что количество измерений должно быть не мень- ше 5 и не больше 300. При равенстве типичных и нетипичных сдвигов критерий знаков не применим. Критерий Макнамары Этот критерий предназначен для работы с данными, полу- ченными в самой простой из номинальных дихотомической шкале, допускающей два типа ответов - «да» или «нет» (кодиру- ются цифрами 1 и 0 соответственно). Экспериментальные данные (или данные опроса), полу- ченные педагогом в результате двукратного опроса, записываются в четырехпольную таблицу формата 2x2: Второй опрос Да Нет Первый опрос Да А В Нет С D 59
Поля в этих таблицах заполняются числами: А - количество учащихся, которые до и после эксперимента отве- тили «да». В количество учащихся, которые до эксперимента ответили «да», а после эксперимента - «нет». С - количество учащихся, которые до эксперимента ответили «нет», а после эксперимента - «да». D - количество учащихся, которые до и после эксперимента отве- тили «нет». Расчет эмпирического значения Мэмп критерия производит- ся (для В^С) следующим образом: а) если В+С=п<20, то Мэмп находится по таблице M(n,m), где m=min(B,C). б) если В+О20, то Мэмп вычисляется по формуле " в+с При В=С рекомендуется использовать %2-критерий. Опишем алгоритм применения критерия Макнамары сле- дующей схемой: Нулевая гипотеза Но={различие значений исследуемого показателя до и после эксперимента несущественно}; альтерна- тивная гипотеза - Н1={различие показателя до и после экспери- мента существенно}. 60
Рассмотрим применение данного критерия на примере. Проведение пробного тестирования по математике в форме ЕГЭ в первой и второй четверти дало следующие результаты. Второе тестирование Справились Не справились Первое тес- тирование Справились А=50 В-19 Не справи- лись С=31 D=20 Можно ли сказать, что справляемость учащихся измени- лась существенно? В приведенном примере В^С, поэтому применение крите- рия Макнамары допустимо. Вычислим сумму В+С= 19+31 =50>20, поэтому вычисляем: Мэмп (В-С)2 (19-31)2 В + С ~ 19 + 31 Пусть уровень значимости а=0,05. Тогда М1ф=3,84>2,88=МЭЫ11. Следовательно, нулевая гипотеза на данном уровне значимости отклоняется, и различия в уровне справляемо- сти существенны. В предыдущих примерах было показано, каким образом можно оценить существенность изменения того или иного призна- ка на основе сравнения двух выборок. Однако нередко возникают ситуации, когда необходимо оценить различия сразу в нескольких (более двух) выборках. Для такой цели в математической стати- стике также имеется ряд критериев достоверности (критерий Кру- скала-Уоллиса, Фридмана, Пейджа и др.). Критерий Крускала-Уоллиса Н-критерий Крускала-Уоллиса является обобщением U- критерия Манна-Уитни на случай к несвязанных выборок (к>2) и предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака. Нулевая гипотеза Но= {между выборками существует лишь случайные различия по уровню исследуемого признака}. Рассмотрим пример. Одинаковы ли воздействия педагоги- ческого эксперимента на младших и старших школьников, а также на учителей по показателям психологической защищённости после эксперимента. 61
Показатель защищённости (номер) 1 2 3 4 5 6 7 8 9 Младшие подростки 2.8 2.8 2.9 3.1 2.9 2.5 2.7 2.8 2.7 Старшие подростки 3.8 3.1 4.0 3.2 3.8 2.5 3.8 2.9 2.8 Учителя 3.7 3.7 2.8 3.9 3.9 3.6 2.6 3.7 2.7 Проранжируем значения признака для всех групп, как для одной выборки, в порядке возрастания. Далее найдём суммы рангов для каждой группы отдельно (т.е. произведём суммирование рангов по строкам, см. таблицу). Показатель защищённости (номер) 1 2 3 4 5 6 7 8 9 Сумма рангов Младшие подростки 2.8 2.8 2.9 3.1 2.9 2.5 2.7 2.8 2.7 Ранг (мл. под- ростков) 9 9 13 15.5 13 1.5 5 9 5 80 Старшие подростки 3.8 3.1 4.0 3.2 3.8 2.5 3.8 2.9 2.8 Ранг (ст. под- ростки) 23 15.5 27 17 23 1.5 23 13 9 152 Учителя 3.7 3.7 2.8 3.9 3.9 3.6 2.6 3.7 2.7 - Ранг (учителя) 20 20 9 25.5 25.5 18 3 20 5 146 мУле: Найдём эмпирическое значение критерия по следующей фор- 12 т2 --------У —-— 3(N +1), где N - общее количе- N(N + Y) Y ство испытуемых (N=27), Tj - сумма рангов в j-й строке, nj - число испытуемых в j-й группе. нзт=—— мп 27-28 802 1522 146 -----1-------1----- 9 9 9 -3-28-5.63 В рассматривав- мом примере количество испытуемых во всех группах одинаково и равно 9. На практике можно использовать и выборки разных объ- ёмов. По таблице находим критическое значение критерия по уров- ню значимости а и степени свободы к. При этом степень свободы рассчитывается как разность количества групп и единицы. Поэто- му в нашем случае к=3-1=2. Примем, что а = 0.01. Тогда: Л;(0.01;2) = 9.21. Если критическое значение критерия превосходит его эмпири- ческое значение, то на выбранном уровне значимости следует 62
принять нулевую гипотезу, утверждающую о несущественности различий воздействия на разные группы. В противном случае ну- левая гипотеза отвергается. В нашем случае: (0,01;2) = 9,21 > 5,63 = Нэмп и нулевая гипотеза на уровне значимости 0.01 принимается. Т.е. воздействие можно считать практически одинаковым во всех группах. Схема применения критерия Крускала-Уоллиса выглядит следующим образом Критерий Фридмана Критерий применяется для сопоставления показателей, из- меренных в с условиях (с>3) на одной и той же выборке из п испы- туемых. Критерий Фридмана позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений и в этом смысле похож на критерий знаков. Критерий Фридмана является обобщением критерия Вил- коксона на большее, чем два, количество условий измерения, в котором мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения измерений. Нулевая гипотеза Но={ между полученными в разных усло- виях показателями существуют лишь случайные различия}. 63
Рассмотрим использование критерия Фридмана на приме- ре. Пять учащихся исследуются по четырём тестам. Являются ли результаты тестирования случайными? Оценки в баллах по проведённым тестам Номер испытуемого Тест А Тест В Тест С Тест D 1 3.6 4.1 2.9 3.5 2 3.8 4.2 3.7 4.6 3 3.3 3.8 3 3.7 4 3.8 3.3 3.4 2.7 5 4 3.6 1.9 3.1 Проранжируем индивидуальные значения показателей для каждого испытуемого в порядке убывания признака, т.е. произво- дим ранжирование параметров каждой строки представленной таблицы. Найдём суммы рангов по столбцам. В результате получаем: Ранги тестов (по строкам) Номер испытуемого Тест А Тест В Тест С Тест D 1 2 1 4 3 2 3 2 4 1 3 3 1 4 2 4 1 3 2 4 5 1 2 4 3 Сумма рангов: 10 9 18 13 Найдём эмпирическое значение критерия по формуле: 12 %2эмп ---------Vr2-Зи(с + 1), где с количество условий и(с + 1)с J (тестов, т.е. с=4), п - количество испьпуемых (n=5), Tj - сумма рангов по j-му условию (тесту). 12 /L, = (1°2 + 92 +182 +1з2) - 3 • 5 •5 = 5.88. Найдём по таблице критическое значение критерия Х2р{а,к), зависящее от уровня значимости а и степени свободы к=с-1. В нашем случае к=4-1=3 и возьмем а=0,05, получим: /2р(0,05;3) = 7,815. Проверим, можно ли на данном уровне значимости при- нять нулевую гипотезу, утверждающую о несущественности раз- личий результатов тестов. Нулевая гипотеза принимается, если 64
критическое значение превосходит эмпирическое. zL = 5,88 < 7,815 = 4(0,05;3). Вывод: нулевая гипотеза принимается, т.е. результаты тес- та можно считать случайными (различия несущественны). Схема применения критерия имеет вид: Следующий критерий можно рассматривать как продолже- ние критерия Фридмана, поскольку он не только констатирует различия, но и указывает на направление изменений. Критерий Пейджа L-критерий тенденции Пейджа применяется для сопостав- ления показателей, измеряемых в к условиях (3<к<6) на одной и той же выборке из п испытуемых. В качестве нулевой гипотезы Но выдвигается предположе- ние о том, что изменения индивидуальных показателей при пере- ходе от одного условия к другому случайны. Схематично алгоритм применения критерия Пейджа мож- но представить следующим образом: 65
Рассмотрим следующий пример. Установлено, что испы- туемые относятся к наказаниям, которые совершают по отноше- нию к их детям разные люди, по-разному (см. таблицу далее). Оп- ределим тенденцию согласия о допустимости наказаний по ре- зультатам опенки в психогенном эксперименте. Испытуемые «Я сам наказываю» «Бабушка наказывает» «Учительница наказывает» оценка ранг оценка ранг оценка ранг 1 4 1 2 2 1 3 2 5 1 4 2.5 4 2.5 3 1 2 1 2 1 2 4 3 1.5 3 1.5 2 3 5 4 2 5 1 1 3 6 6 1 5 2 3 3 7 5 1 3 3 4 2 8 6 1.5 6 1.5 4 3 9 3 1.5 3 1.5 1 3 10 2 2 2 2 2 2 11 7 1 5 2 4 3 12 5 1.5 5 1.5 3 3 Сумма рангов: - 17 - 22.5 - 32.5 Применим критерий Пейджа: 1. Проранжируем индивидуальные значения каждого испы- туемого (т.е. проведём ранжирование показателей в стро- ках). Ранжируем в порядке убывания. 2. Найдём сумму рангов по столбцам: 17, 22.5, 32.5. Эти сум- мы разместим в порядке возрастания и обозначим: Ti=17, Т2=22.5, Т3=32.5. 66
3. Определим эмпирическое значение критерия: 4^=17 1 + 22.5-2+ 32.5-3 = 159.5. 4. Найдём критическое значение критерия по таблице, ис- пользуя уровень значимости а =0,01, количество испы- туемых п=12 и количество признаков к=3, по которым производится оценка. 4/0.01;12;3) = 15б. 5. Проверим, можно ли принять нулевую гипотезу о несуще- ственности различия между оценками испытуемых по дан- ным параметрам. Поскольку: L = 156 <159.5 = 1 то нулевая гипотеза отклоняется, т.е. влияния родителя, бабушки и учителя различаются существенно. В последующих двух разделах покажем, насколько можно доверять вычисленным коэффициентам корреляции и конкорда- ции, насколько полученные числовые значения доказательно сви- детельствуют о наличии той или иной связи между рассматривае- мыми случайными величинами. 67
Значимость коэффициента корреляции Из двумерной генеральной совокупности (X, Y) извлечена выборка объёма п и по ней найден выборочный коэффициент кор- реляции гв, который оказался отличным от нуля. Поскольку вы- борка отобрана случайно, то нельзя заключить, что коэффициент корреляции генеральной совокупности г также отличен от нуля. Возникает необходимость при данном уровне значимости а прове- рить нулевую гипотезу Но={г=О) о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Hi={r#0}. В качестве критерия проверки нулевой гипотезы применя- ют случайную величину Величина Т при справедливости нулевой гипотезы имеет распределение Стьюдента с k=n-2 степенями свободы. Поэтому вычисляется эмпирическое значение критерия: и по таблице критических точек распределения Стьюдента по вы- бранному уровню значимости а и числу степеней свободы k=n-2 находят критическую точку t^ajk). Если ITsmpIXkp, то нулевую гипотезу отвергают, и выбороч- ный коэффициент корреляции значимо отличается от нуля, а X и Y коррелированны, т.е. связаны линейной зависимостью. Если |ТЭМП|<^, то нет оснований отвергать пулевую гипоте- зу, и говорят, что выборочный коэффициент корреляции не значим, а X и Y некоррелированы, т.е. не связаны линейной зависимостью. Проиллюстрируем использование t-распределения Стью- дента для определения значимости коэффициента корреляции. Для этого воспользуемся рассмотренной ранее задачей и определим, можно ли считать связь между результатами ЕГЭ по русскому языку и математике значимой. В данном примере коэффициент корреляции Спирмена ра- вен rs=0.75. Решим поставленную задачу на уровне значимости а - 0.05. Для этого выдвинем основную гипотезу Но, утверждаю- щую, что связь несущественна: Ho={rs=O} и Н]={г#0}. Чтобы оце- нить истинность этой гипотезы на заданном уровне значимости, необходимо сначала найти критическое значение а ;к) крите- 68
рия, которое определяется по специальной таблице, зависит от уровня значимости и степени свободы к, равной в данном случае п-2, где п - объём выборки. Т.к. а = 0.05 и п=7, то по таблице на- ходим ^(0,05; 5) «2.57. Далее следует воспользоваться формулой: Т эмп Выполнив расчёты, получим: J7-2 Т = о,75 •—,===== ЭМП ’ I ~ Vl-(0,75)2 «2,54 Поскольку Тэмп=2,54<2.57=5tltp(0,05;5), то принимается гипо- теза Но, т.е. можно говорить о несущественности связи на уровне значимости 0.05. В этом случае можно понизить уровень значимо- сти до а = 0.1. ^(0,1; 5) «2.02 и T3Mn=2,54>2,02=tKp(0,l;5) Следовательно, гипотеза Но на уровне значимости а=0,1 отвергается, и связь можно считать существенной. 69
Существенность коэффициента конкордации Существенность коэффициента конкордации определяется по %2- критерию. С этой целью вычисляем -£3tm по формуле: 2 = 125 Хэмп~тп(п + Г) Эмпирическое значение %2ЭМП сравнивается с табличным, соответствующим принятому уровню значимости а и числу степе- ней свободы k=n-l. Если %2ЭМп> Х2кр(а;к), то коэффициент конкордации W суще- ственен на выбранном уровне значимости. Обратимся к ранее рассмотренному примеру, где опреде- лялась множественная связь между оценками, полученными на ЕГЭ в районах Ярославской области: хпредмет город Русский язык (1) Математика (2) Физика (3) История (4) R. Ri2 балл ранг балл ранг балл ранг балл ранг Ярославль 54.90 2 51.89 54.75 1 53.74 3 8 64 Переславль 54.93 1 50.66 3 48.59 6 53.13 4 14 196 Ростов 52.38 4 50.19 4 53.71 2 56.74 1 11 121 Рыбинск 53.06 3 52.14 1 51.55 4 52.92 5 13 169 Тутаев 50.20 6 49.30 5 49.63 5 56.33 2 18 324 Углич 50.80 5 45.43 7 47.67 7 51.14 6 25 625 Ярославский район 49.34 7 48.37 6 53.36 3 39.81 7 23 529 Было показано, что vv~O,52, S=236, m=4 (количество пред- метов), п=7 (количество районов). _ 2 12-236 .... u Тогда %эып = & «12,64. На уровне значимости а=0,05 х2кр(0,05;6)=12,6. %2эмп=12,64>12,6= х2^, следовательно, на выбранном уровне значимости полученный коэффициент конкордации значим, и имеет место связь средней силы. В заключение предоставим читателям опорную таблицу изложенных в пособии основных вероятностно-статистических знаний и возможных умений и навыков. 70
Опорная таблица курса Основные знания, умения и навыки по описанному в книге курсу математической статистики в педагогических исследованиях сведены авторами в следующую опорную таблицу: Основные Знания Умения Навыки Понятия Теоремы Выборка Выборка объема л Вариационный, статисти- ческий ряд Размах варьирования Закон распределения 1 Нахо/ тельн f, щть полигон частот и относи- ых частот > X Показатели положения: выборочная средняя, мода, медиана Показатели разброса: вы- борочная дисперсия, неис- правленная дисперсия, среднее квадратическое от- клонение Асимметрия Выборочные начальные и центральные моменты (х-ку) = х+у (сх) = сх D(C) = 0 D(C-X) = C2D(X) D (X±Y) - D (X) + D (У) ~x) и-1 ^общ = ^внгрЛ ^межгр Омежгр/ -^обш — 1 СтрОР гть гисто ' Л7Г л -hi грам гму в ыборки L X Вычислять показатели положения. Находить центральные моменты/а. как полный вес графа распределе- ния статистического ряда: СЕ) jLxy Доверительный интервал Надежность сг ~ а х -t—j= <а <х + t—f=y л1п yjn где Г0=у S 5 х-/а-7=<а<х+/вТ=, у!п у/п где ta =т(п,а) 5(1-^)<сг <S$ + q) Находить доверительный интервал, который с заданной надежностью а покрывает оцениваемый параметр (математическое ожидание или среднее квадратическое отклонение) Выборочная ковариация k(X,Y) k(X,Y) = ^(x,-x)x *(У,-у)п,, Находить выборочную ковариацию как полный вес ковариационного графа: /—•к i - х/ . \У( -У Пу/п - уУТЛ X ) \^) (Y) х.-А А и /и А/А-^ \xt) 71
Выборочный коэффициент корреляции Выборочное корреляцион- ное отношение Уравнение регрессии У наХ(ХнаУ) Ранговая корреляция Выборочный коэффициент ранговой корреляции Спирмена ^1 ь ° Л Д- n “и * Й •Г 1 " IA q I q sS 'й' 3 О' ,Ь н41 € -м X > J . м а Л ю ы И| Строить графики регрессии = или пользу- ясь методом наименьших квадратов. Находить коэффициент ранговой корреляции Спирмена и область принятия нулевой гипотезы. Обосновать область принятия нуле- вой гипотезы. Статистические гипотезы, t распределение Стью- дента % - критерий Пирсона критерий Колмогорова- Смирнова t - 1эмп 1 — „ 7иД+пД 1пт(п + т-2) } п + т zwn=Ev п,‘’ A = d ,v max i V"l+"x Отыскивать области принятия нуле- вой гипотезы (или конкурирующей) 1 1 > 0 ккр 1<кр '0 ” ' > 1 1 1 > 0 < Т <t эмп кр 2 2 Xэмп ” Xкр яэмп > Л-|ф 2 Критерий Хг Фридмана X'5“" ~ n-c (c + l) ^Tj -Зл(с + 1) 2 2 Хгэмп «Хгкр Критерий L Пейджа J L >L эмп кр Критерий Q Розенбаума QaMn = SI + S2 <2эмп < QKp Критерий Т Вилкоксона Д.„=2Ж т <т эмп кр 72
Критерий знаков GMm'^G,4, Критерий Макнамары (А Iе DJ c + B<20 в+с С + Я£20 Критерий U Манна-Уитни тт Лх’(лх+1) rh и = П. П}+ v х—--Ой 2 и^>и^ Критерий Н Крускала-Уоллиса Я =—- Y^i-3W + ^ + 1) п 73
Библиографический список 1. Айвазян, С.А., Мхитарян, В.С. Прикладная статистика и осно- вы эконометрики [Текст]. -М.: ЮНИТИ, 1998. - 1022 с. 2. Артемьева, Е.Ю., Мартынов, Е.М. Вероятностные методы в психологии [Текст].-М.: МГУ, 1975. 3. Афанасьев, В.В. Непряев, И.Н. Математическая статистика в командных видах спорта [Текст]: монография / В.В. Афанасьев, И.Н. Непряев. 2-е изд., перераб. и доп. - Ярославль: Изд-во ЯГПУ, 2007.-168 с. 4. Афанасьев, В.В. Применение методов математической стати- стики в научных исследованиях [Текст] // Ярославский педагоги- ческий вестник. - 2006. - № 4 (49). - С. 5-12. 5. Афанасьев, В.В. Спортивная метрология [Текст]: учебное по- собие / под ред. В.В. Афанасьева / В.В. Афанасьев, А.В. Муравьев, И.А. Осетров, П.В. Михайлов. - Ярославль: Изд-во ЯГПУ, 2009. 242 с. 6. Афанасьев, В.В. Теория вероятностей [Текст]: учебное пособие для студентов высших учебных заведений, обучающихся по спе- циальности «Математика» / В.В. Афанасьев. - М.: ГИЦ ВЛАДОС, 2007. - 352 с. 7. Афанасьев, В.В. Экспериментальное исследование творческой активности студентов в процессе обучения математике [Текст] / В.В.Афанасьев, Е.И.Смирнов // Ярославский педагогический вест- ник. - 1996. - №3(6).-С.110-115. 8. Боровков, А.А. Математическая статистика. Оценка парамет- ров. Проверка гипотез [Текст] / А.А. Боровков. - М.:Наука,1984. 442 с. 9. Гласс, Дж. Статистические методы в педагогике и психологии [Текст] / Дж. Гласс, Дж. Стенли. - М.: Педагогика, 1976. - 495 с. 10. Гмурман, В.Е. Теория вероятностей и математическая стати- стика [Текст] / В.Е. Гмурман. 7-е изд. - М.: Высшая школа, 2000. -479 с. 11. Грабарь, М.И., Краснятская, К.А. Применение математической статистики в педагогических исследованиях: Непараметрические методы [Текст]. - М.: Педагогика, 1977. - 136 с. 12. Дружинин, В.Н. Экспериментальная психология [Текст] В.Н. Дружинин. - СПб.: Питер, 1998. - 318 с. 13. Ительсон, Л.Б. Математические и кибернетические методы в педагогике [Текст]. - М.: Просвещение, 1964. - 268 с. 14. Крамер, Г Математические методы статистики [Текст]. - М.: Мир, 1975.-648 с. 74
15. Кыверялг, А.А. Методы исследований в профессиональной педагогике [Текст]. - Таллин: Валгус, 1980. - 334 с. 16. Лакин, Г.Ф. Биометрия [Текст]. -М.: Высшая школа, 1980. 17. Манеров, В.Х. Математическое обеспечение психологических исследований [Текст]: учебное пособие. - СПб.: Изд-во РГПУ им. А.И. Герцена, 2005. - 144 с. 18. Никитина, Н.Ш. Математическая статистика для экономистов [Текст]: учебное пособие / Н.Ш. Никитина. - М.: ИНФРА-М, 2001. - 170 с. 19. Новиков, А.М. Методология образования [Текст]. - М.: Эгвес, 2002.-320 с. 20. Новиков, Д.А. Статистические методы в педагогических ис- следованиях [Текст]. - М.: МЗ-Пресс, 2004. - 67 с. 21. Орлов, А.И. Эконометрика [Текст]. - М.: Экзамен, 2003. 576 с. 22. Плохинский, Н.А. Биометрия [Текст]. - М.:МГУ, 1970. - 368 с. 23. Просветов, Г.И. Эконометрика: задачи и решения [Текст]: учебно-практическое пособие. 5-е изд., доп. - М.: Альфа-Пресс, 2008.-192 с. 24. Сидоренко, Е.В. Методы математической обработки в психо- логии [Текст] / Е.В. Сидоренко. - СПб.: Речь, 2000. - 350 с. 25. Суппес, П. Зинес, Д. Основы теории измерений / Психологи- ческие измерения [Текст]. - М.: Мир, 1967. - С. 9-110. 26. Суходольский, Г.В. Основы математической статистики для психологов [Текст]. - Л.: ЛГУ, 1972. - 428 с. 27. Суходольский, Г.В. Основы математической статистики для психологов [Текст] / В. Суходольский. - Л.: Изд-во ЛГУ, 1972. 429 с. 28. Тюрин, Ю.Н, Макаров, А.А. Статистический анализ данных на компьютере [Текст]. - М.: ИНФРА-М, 1998. - 528 с. 29. Урбах, В.Ю. Статистический анализ в биологических и меди- цинских исследованиях [Текст]. - М.: Медицина, 1975. - 295 с. 75
Учебное издание Владимир Васильевич Афанасьев Михаил Александрович Сивов Математическая статистика в педагогике Учебное пособие Редактор Л.К. Шереметьева Компьютерная вёрстка - Ю. В. Машонина Подписано в печать 11.03.10 Формат 60x92i/8. Объем 4,9 п.л. 2,2 уч.-изд. л. Тираж 300 экз. Заказ 60 Издательство ГОУ ВПО «Ярославский государственный педагогический университет им. К. Д. Ушинского» 150000, г. Ярославль, Республиканская ул., 108 Типография ЯГПУ 150000, г. Ярославль, Которосльная наб., 44