/
Текст
ИНСТИТУТ ЦИТОЛОГИИ И ГЕНЕТИКИ СОРАН
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Васильева Л.А.
СТАТИСТИЧЕСКИЕ МЕТОДЫ
В БИОЛОГИИ, МЕДИЦИНЕ
И СЕЛЬСКОМ ХОЗЯЙСТВЕ
Новосибирск, 2007г.
УДК 578.087.1
Настоящее Учебное пособие посвящено описанию некоторых
статистических методов, которые наиболее широко используются для
обработки экспериментальных данных в области биологии, медицины и
сельского хозяйства.
Задачей данного Учебного пособия является научить студентов
использовать различные статистические методы для обработки
экспериментального материала. Знание статистических методов даст
возможность представлять экспериментальные данные в определенной
системе, оценивать параметры выборочных и генеральных
совокупностей. Кроме того, экспериментаторы, использующие
статистические методы, смогут оценить характер корреляционных
связей между признаками, оценить характер распределений и
компоненты фенотипической изменчивости и др.
Учебное пособие предназначено для студентов биологических,
медицинских, зоотехнических и ветеринарных факультетов, а также
аспирантов и научных работников, работающих в области биологии,
медицины и сельского хозяйства.
Работа частично поддержана грантом РФФИ № 06-04-48116,
грантом по Программе «Фундаментальные исследования»
Президиума РАН «Динамика генофондов и биоразнообразие» № 11.4.1
грантом Миннауки « ^традиционная изменчивость структуры генома
- новый подход управления геномами» № 29/2007.
© Новосибирский государственный университет
Институт цитологии и генетики СОРАН
2
Содержание
Глава 1. Совокупности.
§1.1. Биологическая статистика: роль и значение 3
§ 1.2. Выборочные совокупности 5
§ 1.3. Группировка данных выборочной совокупности по
признакам с дискретной изменчивостью 6
§ 1.4. Группировка данных выборочной совокупности по
признакам с непрерывной изменчивостью 10
§ 1.5. Графическое изображение вариационного ряда 11
Глава 2. Оценка статистических показателей выборочных
совокупностей 14
§ 2.1. Мода и медиана 14
§ 2.2. Средняя арифметическая величина и ее свойства 15
§ 2.3. Изменчивость признака, ее оценка 16
§ 2.4. Дисперсия, варианса, среднее квадратическое
отклонение 17
§ 2.5. Оценка параметров выборочной совокупности для
данных, сгруппированных в вариационный ряд 19
§ 2.6. Объединение параметров отдельных
подсовокупностей 27
Глава 3. Закономерности случайной изменчивости в совокупностях .. 28
§3.1. Вероятность 28
Глава 4. Достоверность статистических показателей 35
§ 4.1. Ошибка выборочной совокупности. Доверительные
интервалы 35
§ 4.2. Выборочные ошибки для а 39
§ 4.3. Сравнение двух выборочных совокупностей 40
§ 4.4. Оценка достоверности различий между средними
значениями двух выборочных совокупностей 40
Глава 5. Корреляционные связи между признаками 44
§5.1. Коэффициент корреляции 44
§ 5.2. Ошибка выборочного коэффициента корреляции 51
§ 5.3. Ранговый коэффициент корреляции 53
§ 5.4. Регрессия 56
Глава 6. Сравнение степени соответствия фактических
распределений теоретическим 58
§ 6.1. Анализ характера расщепления в гибридологических
опытах 59
§ 6.2. Сравнение фактических вариационных рядов с
теоретическими, вычисленными в соответствии с
закономерностями нормального распределения 61
104
§ 6.3. Оценка соответствия распределения двух
эмпирических совокупностей 64
§ 6.4. Анализ распределений, сгруппированных в
4-х -польные таблицы 66
Глава 7. Дисперсионный анализ 70
§ 7.1. Общие принципы дисперсионного анализа 71
§ 7.2. Двухфакторный дисперсионный анализ 77
§ 7.3. Иерархическая модель двухфакторного комплекса 80
Глава 8. Статистический анализ качественных (альтернативных)
признаков 84
§ 8.1. Оценка X, о, s* при альтернативной вариации 84
§ 8.2. Оценка корреляции при качественной вариации 88
§ 8.3. Дисперсионный анализ при альтернативной вариации ... 90
Глава 9. Непараметрические критерии различия 94
§ 9.1. Критерий Колмогорова-Смирнова 94
§ 9.2. Критерий Вилкоксона-Манна-Уитни 96
§ 9.3. Критерий Вилкоксона для сопряженных пар 99
Рекомендуемая литература 103
Содержание 104
Приложения 106
105
ГЛАВА 1
совокупности
§ 1.1. Биологическая статистика; роль и здачецие.
Необходимость статистической обработки и представление
экспериментальных данных в соответствии с определенными правилами
возникли сразу как только биологи перешли от описательного метода
анализа биологических явлений к экспериментальному. Эксперименты
стали неотъемлемой частью биологической науки и потребовали
строгого измерения, учета, расчета и анализа.
Первые опыты использования математических знаний для анализа
биологических явлений принадлежат Френсису Гальтону (F.Galton,
1889), который использовал статистический анализ для опенки связи
между отдельными признакацр у людей и степени сходства между
родственниками по такому сложному признаку как рост людей.
Результатом этих исследований явился труд "Закономерности
естественного наследования", где степень сходства между
родственниками оценивалась через коэффициент связи или через
коэффициент корреляции. Гальтон впервые ввел понятие биометрика
в научную литературу.
Исследования Гальтона были продолжены Карлом Пирсоном
(K.Pearson), последователем, учеником, почитателем и пропагандистом
Гальтона. Пирсон внес большой вклад в разработку теории и практики
использования некоторых статистических показателей, в частности,
коэффициента корреляции применительно к описанию биологических
явлений.
Кроме того, некоторые биологические науки, например, генетика
прямо обязана тому, что Грегор Мендель (G.Mendel) в "Опытах над
растительными гибридами" (1865) ввел строгий учет и подсчет
расщепляющихся фенотипических классов у гибридов второго
поколения (/у.
Несмотря на то, что ни Гальтон, ни Пирсон не смогли выделить
генетические компоненты, контролирующие рост человека, своими
3
работами эти авторы привлекли внимание биологов к статистике как к
одному из методов анализа мерных признаков. Позднее большой вклад
именно в оценку отдельных факторов] вносящих вклад в формирование
и развитие признаков, был сделан Робертом Фишером (R.Fisher, 1918,
1921). Фишер разработал теорию Analysis of variance (в русском
переводе "дисперсионный анализ"), позволяющий выделить отдельные
компоненты (факторы), вносящие вклад в общую изменчивость
признаков. С 60-х годов математическая статистика стала обязательным
условием анализа экспериментальных данных в области биологии,
медицины и сельского хозяйства.
Одним из факторов, повлиявшим на необходимость
использования статистических расчетов экспериментальных данных,
является то, что все биологические объекты обладают двумя как бы
противоположными свойствами: наследственностью и изменчивостью.
Широкая амплитуда изменчивости признаков у различных
объектов вынуждает экспериментаторов прибегать как к усреднению
данных, так и к оценке границ изменчивости и силы связи между
признаками.
Другим важным обстоятельством, повлиявшим на процесс
внедрения статистических методов для анализа биологических явлений,
явилось то, что практически все биологические явления и свойства
подчиняются статистическим закономерностям, характерным не
отдельным объектам, а целым совокупностям объектов. Оказалось, что
если сгруппировать данные, полученные путем измерения любых
биологических признаков, в единую совокупность, то эта совокупность
будет иметь вид чисто статистической совокупности. Поэтому
математическую статистику, используемую в приложении к биологии,
стали называть биологической статистикой или биометрией.
Таким образом, биологической статистикой или биометрией
называется область научного знания, охватывающая классификацию,
систематизацию и обработку экспериментальных данных в биологии,
медицине и сельском хозяйстве методами математической статистики.
4
§ 1.2. Выборочные сорокуттости.
Всякое множество идентифицируемых объектов, отличающихся
друг от друга незначительно по конкретному признаку, но сохраняющих
сходство по некоторым существенным характеристикам, называется
совокупностью. Совокупностью можно называть стадо животных,
делянку или поле растений, породу животных или сорт культурных
растений, клоны бактерий, штаммы вирусов и др. Совокупности
представлены отдельными членами или единицами. Совокупность
членов или единиц называется объемом совокупности. Само
измеренное значение каждой единицы совокупности называется
вариантой совокупности. Различия между вариантами совокупности
называются вариацией или дисперсией.
Если объем совокупности обозначить через л, а каждую варианту
совокупности через х, то в таком случае ряд вариант в совокупности
можно записать как xj, X2, *з,...,лгл. Следовательно, если измерен вес 100
зерен пшеницы, то этот пул измерений можно назвать совокупностью,
объем которой п = 100. Вес каждого зерна - это варианта
совокупности.
Если измеренный материал представляет собой только часть от
какого-то общего большого материала, то такая совокупность будет
называться выборочной совокупностью, а весь огромный материал, из
которого взята выборочная совокупность, называется генеральной
совокупностью. Например, если измеренные 100 зерен какого-то сорта
пшеницы представляют собой выборочную совокупность с объемом п =
100, то вес зерна целого сорта пшеницы можно считать генеральной
совокупностью с объемом, равным N -> со.
Обработка данных и интерпретация полученных расчетов зависит
от того, какие признаки были измерены в эксперименте. Признаки
биологаческих объектов в основном представлены тремя категориями.
1. Признаки совокупности, различающиеся определенным
качеством. Такие признаки носят название качественных или
альтернативных. Например, совокупность представлена красными и
белыми цветками гороха, как в опытах Г.Менделя, или совокупность
5
представлена различными окрасками меха норок, или различными
окрасками радужной оболочки глаз и др.
2. Признаки, имеющие количественную меру, но различия
между отдельными вариантами совокупности выражаются целыми
числами. Например, число щенков в пометах многоплодных зверей,
число отложенных яиц у птиц, число зерен в колосе и др. Такая
количественная изменчивость и такие количественные признаки
называются дискретными.
3. Признаки, имеющие количественную меру, но между
отдельными вариантами совокупности нет четко выраженных
(дискретных) границ. Например, живая масса животных, выраженная в
килограммах, но и в граммах, высота - в метрах, сантиметрах, но и в
миллиметрах. Такая изменчивость и такие признаки называются
количественными признаками с непрерывной изменчивостью
(мерные признаки, континьюальные).
§ 1.3. Группировка данных выборочной совокупности
по признакам с дискретной изменчивостью.
Если измерения какого-то признака у изучаемого биологического
объекта произведены, они записаны в журналах в порядке измерения
объектов, т.е. материал представляет собой набор цифр, то при
рассмотрении этих измерений невозможно обнаружить какие-либо
закономерности. Существуют некоторые простые правила упорядоченья
материала.
1. Можно переписать полученные данные в порядке нарастания
их величины или в порядке уменьшения величин. Такой способ
упорядоченья данных называется ранжированием. Ранжирование
данных дает уже некоторое представление о характере
экспериментального материала. Так, строго обозначены минимальное и
максимальное значения вариант, которые носят название лимитов
изменчивости. Самое маленькое значение варианты называется
минимальным значением (min), а самое большое - максимальным
значением (max). Лимиты изменчивости совокупности можно
6
обозначить как min -s- max. Кроме того, в центре такого упорядоченного
(ранжированного) ряда цифр сосредоточено основное количество
вариант со "средним значением" признака.
Пример 1.1. В Экспериментальном хозяйстве Сибирского
Отделения РАН разводится популяция норок с различными генотипами
по окраске меха. Изучалась плодовитость норок различных генотипов
по окраске меха. Подсчитано число щенков в пометах 50 самок,
имеющих "стандартный" генотип окраски меха. Получены следующие
данные:
3, 6, 5, 4, 4, 3, 7, 8, 2, 6, 6, 5, 4, 4, 3, 2, 7, 6, 5, 5, 4, 4, 4, 3, 2, 1, 8, 7,
6, 5, 4, 4, 7, 3, 2, 5, 4, 4, 5, 5, 7, 3, 3, 5, 4, 5, 3, 7, 6, 6.
Ранжируем варианты совокупности в порядке нарастания числа щенков;
в помете:
1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5,
5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8.
Такой ранжированный ряд дает представление о том, что лимиты
изменчивости такого признака, как число щенков в помете
"стандартных" норок, находится в границах min (1); max (8), 1 ч- 8.
Среднее значение числа щенков в помете норок можно приблизительно
оценить равным 5 щенкам.
2. Другой более наглядный способ упорядоченья вариант
совокупности состоит в следующем. Необходимо выписать в столбик
все типы вариант, которые встретились в совокупности. Цифры могут
быть записаны как в порядке нарастания от меньшего значения к
большему, т.е. от 1 до 8, так и в порядке уменьшения, т.е. от 8 до 1.
Запишем цифры в порядке нарастания и определим сколько раз каждая
цифра встречается в распределении. Тогда различные типы вариант,
которые встретились в распределении, будут называться классами и
обозначаться дг/, а числа, соответствующие каждому классу -
численностями или частотами и обозначаться будут буквой /.
Такой ряд чисел, состоящий из классов и частот, называется
вариационным рядом. Вариационный ряд дает более четкую картину
закономерностей распределения по сравнению с простым
ранжированием. Какие это закономерности?
7
1. В центре вариационного ряда
сосредоточено основное число
значений признака.
2. Чем больше (как маленькие, так и
большие) значения вариант
отклоняются от значений вариант,
находящихся в середине рада, тем
меньше таких вариант встречается в
совокупности. Класс, в котором
представлено больше всего вариант,
п = If а 50 I называется модальным классом и
значение варианты этого класса, если распределение симметрично,
близко к среднему значению анализируемого признака в данной
совокупности.
Однако такая группировка признаков с дискретной
изменчивостью возможна тоща, когда признак представлен
сравнительно небольшим числом естественных классов, как это имело
место в примере 1.1. Вместе с тем имеются дискретные
количественные признаки, у которых достаточно большая изменчивость
и, следовательно, большое число классов.
Пример 1.2. Подсчитано число лучей в хвостовых плавниках у
100 рыб. Минимальное значение признака у этой группы равно 45
лучам, максимальное значение равно 63. Следовательно, всего имеется
18 естественных классов. Если их использовать все, то получится очень
растянутое распределение, в котором сложно будет обнаружить какие-
либо статистические закономерности и, кроме того, такой
вариационный ряд сложно обсчитывать. В тех случаях, коша
естественных классов больше 6-7, можно построить вариационный рад,
организовав искусственные классы по следующему принципу. В
предыдущем примере 1.1. между соседними классами разница
составляла 1 (1, 2, 3, 4, 5, 6, 7, 8). Однако имеется возможность
разницу между классами увеличить по мере необходимости до 2, 3 и
т.д. Разница между классами называется шагом или классовым
Классы, дг,
1
2
3
4
5
6
7
1 й
Частоты, /
1
4
9
12
10
7
5
1 1
8
промежутком, обозначается буквой к. Искусственный классовый
промежуток можно организовать следующим образом. Необходимо от
максимального значения признака в данной совокупности вычесть
минимальное значение и разницу разделить на б. Тоща
. max-min 63-45 .
к = = = 3
6 6
Следовательно, для данной совокупности можно организовать
вариационный рад с классовым промежутком между классами, к = 3.
Построим вариационный ряд по числу лучей в хвостовых
плавниках у 100 рыб, имеющих следующие значения:
45
49
50
51
52
54
54
59
52
53
49
50
51
52
53
60
59
55
48
55
50
52
52
53
58
57
55
60
50
56
51
53
53
54
56
56
54
52
54
55
52
62
59
55
55
55
53
54
56
47
53
61
57
55
54
54
52
48
54
50
54
59
56
54
53
53
54
58
57
52
54
57
55
55
52
51
47
57
51
51
63
56
55
54
51
54
54
54
46
55
60
55
54
53
54
49
55
58
54
55
При построении вариационного ряда, коша классы различаются
больше, чем на единицу, необходимо в каждом классе обозначить его
начало и конец так, чтобы цифры строго попадали в свой класс.
Вариационный ряд:
Классы,
Xmin ~ Хтах
1 45-47
48-50
51-53
54-56
57-59
60-62
63-65
Частоты, /
4
10
27
41
12
5
1
л = 100 \
9
§ 1.4. Группировка данных выборочной совокупности по
признакам с непрерывной изменчивостью.
Подобно признакам с такой дискретной изменчивостью, как
представлено в примере 1.2, следует организовывать вариационные
ряды для признаков с непрерывной изменчивостью.
Пример 1.3. Исследуется длина листьев у 100 растений садовой
1НИКИ
гсогаче
9,2
9,0
7,2
7,5
7,0
7,3
9,1
7,4
8,3
6,9
5,2
11,7
7Д
12,0
8,5
9,1
7,7
7,8
8,0
8,0
При
(в см).
(Пример
жкая статистика", 1973).
9,7
10,4
6,4
6,8
7,1
11,0
6,4
8,0
7,2
7,4
8,0
7,8
7,4
8,6
7,8
7,8
9,1
7,0
12,2
7,0
составлении
13,0
7,6
7,7
7,0
8,7
7,7
9,3
8,4
7,2
7,2
7Л
7,2
8,7
7,8
7,9
7,8
7,3
7,6
7,0
6,8
взят из книга П.Ф.Рокицкого
7,4
9,1
9,0
6,4
11,3
11,8
6,5
7,0
6,6
6,2
9,4
9,8
9,9
5,7
7,5
8,2
7,0
11,6
102
10,3
вариационных рядов
8,0
11,8
8,1
7,4
9,6
9,6
9,2
7,1
6,6
6,9
ад
6,6
7,8
8,5
6,7
7,2
7,4
7,5
11,8
8,5
для признаков с
непрерывным характером изменчивости необходимо, прежде всего,
найти величину классового промежутка, т.к. у признаков с такой
изменчивостью вообще нет четко очерченных классовых границ.
Поступать следует также как в примере 1.2.
10
, max-min 13,0-5,2
к = = — — = 1,3
6 6
Следует иметь в вицу, что если при делении получено значение к
неудобное в использовании, его можно округлить в любом направлении
(уменьшить или увеличить) так, чтобы удобно было его использовать в
расчетах.
Вариационный ряд:
Классы,
X/nin " хтах
1 5,2 - 6,4
6,5 - 7,7
7,8 - 9,0
9,1 - 10,3
10,4-11,6
11,7-12,9
13,0 - 14,2
Частоты, /
6
42
26
15
4
6
1
п = 100 J
§ 1.5. Графическое изображение вариационного ряда.
После построения вариационного ряда становится очевидным, что
можно приближенно судить о среднем значении признака и о лимитах
его вариации в данной выборке. Кроме того, вариационные ряды могут
быть изображены графически. Графическое изображение дискретных и
непрерывных количественных признаков имеет некоторое отличие.
Способ построения кривой распределения для признаков с такой
дискретной изменчивостью, как представлено в примере 1.1,
заключается в следующем. На оси абсцисс наносятся естественные
классы от 1 до 8, на оси ординат - частоты (или сколько раз каждый
класс встречается в выборке). На месте пересечения класса и частоты
ставится точка, а затем точки соединяются кривой (см. рис. 1). Такая
кривая носит название полигона распределения.
11
Частоты
12
10,
I
8
в
4
2
0
Классы
Рис. 1. Полигон распределения 50 самок норок
по числу щенков в помете.
Для признаков с дискретным характером изменчивости, но с
искусственными классами, как это имело место в примере 1.2, полигон
распределения строить нельзя, т.к. у каждого класса имеется его начало
и конец. Поэтому на оси абсцесс откладываются классы, ще конец
предыдущего класса является началом следующего класса. На оси
ординат откладываются частоты. Частота каждого класса фиксируется
прямоугольником, в котором одна сторона - это начало класса, а
вторая - конец класса. Такой график называется гистограммой
распределения (рис. 2).
Для признаков с непрерывным характером изменчивости также
строится гистограмма по такому же принципу, как показано на
рисунке 2. Строго говоря, построенную гистограмму можно превратить
в полигон распределения, для этого необходимо точки, расположенные
на срединах верхних сторон прямоугольников (столбиков) соединить
линией (см. рис. 2).
12
40 ■
30
20 -
10 -
1
f
1 i—►
45
48
51
54 57
Признак
60
63
66
Рис. 2. Гистограмма распределения 100 особей - рыб по
числу лучей на хвостовых плавниках.
Графическое изображение вариационных радов дает возможность
визуально оценить качество оцениваемого экспериментального
материала на предмет:
1. Симметричности (асимметричности) распределения.
2. Одно-, многовершинности.
3. Плавности (эксцесса).
Всякое отклонение от симметричной плавной кривой имеет свой
биологический смысл. Так асимметричность может означать, что
отсутствуют некоторые значения признака в выборке, что может
13
свидетельствовать либо о гибели определенных особей, либо о
преднамеренной выбраковке определенных особей. Дву- (много)
вершинность может свидетельствовать о неоднородности материала
(смесь сортов, пород, разных распределений). Эксцесс, т.е. резко
увеличенная численность среднего класса, может свидетельствовать об
отсутствии по каким-то причинам крайних классов распределения.
Таким образом, графическое представление экспериментального
материала, кроме наглядности, дает возможность оценить качество
экспериментального материала.
ГЛАВА 2
ОЦЕНКА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ
ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ
§ 2.1. Мода и медиана.
Группировка данных в вариационные ряды позволяет оценить
выборочную совокупность с точки зрения размаха лимитов вариации и
с точки зрения нахождения класса или классов, в которых
концентрируется максимальное количество частот. Развитие признака,
значение которого находится в центре вариационного ряда, отражает
средний уровень развития этого признака в совокупности. Класс,
который представлен максимальной численностью, называется
модальным классом (Мо). В примере 1.1 - это класс с 4-мя щенками в
помете, Мо = 4. В примере 1.2 - это класс 54-56 лучей в хвостовых
плавниках рыб, т.е. А/0 = = 55. Величина моды демонстрирует
типичного представителя совокупности.
Кроме того, имеется еще одна характеристика среднего уровня
развития признака в совокупности - это медиана. Медиана - это
варианта, находящаяся точно в средине вариационного ряда и
обозначается символом Ме. В примере 1.1 - это 25-ая и 26-ая варианты
и их значение равно 4.
14
Однако лимиты, мода и медиана являются приближенными
характеристиками размаха изменчивости и среднего значения признака.
Более точными характеристиками выборочных совокупностей является
оценка среднего арифметического значения (7) и среднего
квадратического отклонения (о).
§ 2.2. Средняя арифметическая величина и ее свойства.
Если имеется ряд значений признака, представляющих собой ряд
членов совокупности: *;, Х2> jcj,..., Jt/i, то сумма значений всех вариант
есть: xj + Х2 + хз + ... + хп =^xt, или Х + Х+Х + Х + Х.. jf (л р^), или
nZ~, тогда Ух,-пХ, или Т = ^-.
ЛтЛ п
Средняя арифметическая величина обладает рядом свойств.
1. Если к каждой варианте ряда прибавить или отнять одну и ту же
величину, или умножить и разделить на одну и ту же величину, то
средняя арифметическая увеличится или уменьшится на эту же
величину, т.е.
(xj + а), (Х2 + а), (хз + а) ... (дг, + а), то средняя будет равна Х+а,
(xj - а), (Х2 - а), (хз - а)... (xt - а), то средняя будет равна Х-а.
2. Алгебраическая сумма отклонений отдельных вариант совокупности
от средней арифметической этой совокупности равна нулю, т.е.
(*. -*)+fe -*)+fe -*)+... + fo -*)=0.
3. Сумма квадратов отклонений вариант совокупности от средней
арифметической х~ меньше суммы квадратов отклонений от любой
другой величины (А), т.е. £ (х, - xf <£(х, - А)2.
Средняя арифметическая величина является очень важным
параметром, характеризующим выборочную совокупность. Она
используется для характеристики любых совокупностей в технике,
медицине и биологии.
Средняя арифметическая величина является обобщенной
характеристикой совокупности. Часто значение средней
арифметической величины реально не существует, например, 4,5 щенка
и др. В этом смысле средняя арифметическая является абстрактной
15
величиной, но в то же время она и конкретная величина,
характеризующая типичное состояние признака в совокупности.
Следовательно, для примера 1.1 7 = 4,54 шт., для примера 1.2 -
X = 53,98 лучей.
§ 2.3. Изменчивость признака, е£ опенка.
Как видно было из предыдущего параграфа, средняя
арифметическая величина оценивает средний уровень развития
признака или его типичность для данной совокупности. Однако среднее
значение - это не единственная характеристика признака в
совокупности. Представим себе, что имеются три совокупности, у
которых значение среднего арифметического одинаково, но даже при
беглом взгляде на значения вариант видно, что они совершенно
различные, например, число щенков в 5-ти пометах норок.
Пример 2.1. Оценка изменчивости числа щенков в помете 5-ти
норок в 3-х выборочных совокупностях.
I П III
3 1 1
3 2 3
3 3 3
3 4 3
3 5 5
л 5 5 5
2>, 15 15 15
* д 3 3 3
К*,-?)* О 10 8
о* 0 2,5 2
о 0 1,58 1,41
Таким образом, если в данной ситуации совокупности описывать
только средним параметром, то все три выборочные совокупности будут
считаться одинаковыми. Другим очень важным параметром является
16
оценка вариации признака. Как было показано ранее, размах
изменчивости или вариабельности признака можно охарактеризовать
верхним и нижним лимитами. Однако такая характеристика не совсем
точно отражает истинную вариацию. Лучше вариацию измерять
отклонением каждой варианты ряда от какой-либо постоянной
величины. Правильнее всего в качестве такой величины взять среднюю
арифметическую, X. Тогда
(xI-r)+(r2-z)+(x3-7b...+(^-j)=2:^-7).
Однако, как видно было в § 2.2 £(*< -х)=0. Первоначально,
чтобы избежать нулевых значений, использовалась величина "по
модулю", без учета знаков, т.е. £|*-^. Однако и этот показатель не
улавливал истинного значения вариации в совокупности, т.е. рассеяния
вариант вокруг средней арифметической величины.
§ 2.4. Дисперсия. вариансаг среднее квадратическое отклонение.
Более точным показателем, характеризующим вариацию или
рассеяние вариант вокруг среднего арифметического значения, является
сумма квадратов отклонений вариант совокупности от среднего
значения, т.е.
(х, -ху +(*2 -xf +(,3 -хУ +...+(г, -ху =£(*, -*У-
Сумма квадратов отклонений вариант совокупности от средней
обозначается символом S и носит название дисперсии. S = £(*, -х)2.
Для данных, представленных в примере 2.1, значение дисперсий для
совокупностей I, II, Ш, соответственно, равно 0, 10, 8.
Однако можно заметить, что дисперсия накапливается по мере
увеличения численности совокупности так же, как накапливается
значение £*. при оценке среднего арифметического значения. В двух
совокупностях разного объема при одинаковой вариации значение
дисперсии будет выше в той совокупности, в которой численность
больше. Поэтому дисперсию необходимо усреднить, т.е. разделить на
17
число вариаций в совокупности, т.е. <т2 = -. Усредненное значение
дисперсии в биологической литературе получило название вариансы и
обозначается греческой буквой с? (сигма). Корень квадратичный из о2,
4ог =<т - получил название среднего квадратического отклонения.
Как будет видно дальше, а является основным показателем,
характеризующим изменчивость анализируемой выборочной
совокупности. В примере 2.1 значения варианс для I, II и Ш
совокупностей, соответственно, равны 0, 2,5, 2, а средние
квадратические отклонения, соответственно, равны 0, 1,58, 1,41.
Здесь следует остановиться еще на одном моменте. Как вы,
очевидно, заметили, что если бы дисперсия 5 делилась точно на число
вариант п = 5, то для трех совокупностей I, II и III значения варианс
должны бы были быть следующими: 0; 2; 1,6. Разница между
значениями, полученными в примере 2.1, возникает из-за того, что
усреднять дисперсию необходимо не на число вариант в совокупности,
а на число вариант минус единица, т.е. на п - 1, и тогда а = .
п-\
Знаменатель дроби л - 1 получил название "число степеней свободы
вариации". В дальнейшем мы будем ее обозначать двумя латинскими
буквами df (начальные буквы слов "degree of freedom"). Смысл понятия
степени свободы состоит в следующем. Если имеется совокупность с
объемом от xi до хп и если оценено среднее арифметическое значение
этой совокупности, то исходя из информации обо всех членах
совокупности и средней 9 можно оценить значение любого члена
совокупности. Например, в примере 1.1 представлены данные о 50-ти
пометах норок. Среднее значение численности щенков в помете 4,54
шт. Определение одного значения из 50 зависит от значения остальных
49 членов совокупности и средней арифметической, т.е. от л - 1.
Такой способ оценки вариабельности более точный, хотя при
s s
увеличении численности совокупностей грань между — и
л /i-l
сглаживается.
18
§ 2.5. Опенка параметров выборочной совокупности для
данных, сгруппированных в вариационный ряд.
Когда экспериментальные данные сгруппированы в вариационный
ряд, то можно воспользоваться таким способом организации материала
и более точно, чем мода, медиана и лимиты, оценить такие параметры
выборочной совокупности как средняя арифметическая X, дисперсия
(5), варианса (о2), среднее квадратическое отклонение (а) и др.
Существует несколько способов оценки этих параметров.
Способы обработки вариационных рядов разработаны в основном для
того, чтобы облегчить расчеты. Ниже приводится три способа расчета
выборочных параметров для данных, организованных в вариационный
ряд: прямой способ, способ условных отклонений и способ сумм.
Воспользуемся данными, представленными в примере 1.2.
Пример 2.2. Оцениваются параметры выборочной совокупности
по числу лучей на хвостовых плавниках рыб. Данные сгруппированы в
вариационный ряд , как показано в примере 1.2 (таблица 1).
А. Прямой способ расчета параметров
Таблица 1. Оценка параметров выборочной совокупности в
вариационном ряду прямым способом.
1 Xmin " Хтах •
45-47
48-50
51-53
54-56
57-59
60-62
63-65
Xi
I 46
49
52
55
58
61
64
I /
4
10
27
41
12
5
1
2/= 100 j
1 fXi
184
490
1404
2255
696
305
64
2 A =5398 j
1 A2
' 8464
24010
73008
124025
40368
18605
4096
Ztf =292576 |
19
Для оценки параметров выборочной совокупности прямым
способом или методом взвешенных средних необходимо произвести
следующие действия.
1. Рассчитать средние значения классов дг,- следующим образом. Для
первого класса с лимитами 45 - 47, х, =-=*—— = = 46, для
2 2
второго класса х, = —-— = 49 и т.д. Необходимо следить, чтобы
классовый промежуток к = 3 на протяжении всего вариационного
ряда был одним и по началам классов 45, 48, 51, 54, 57, 60, 63, по
концам классов 47, 50, 53, 56, 59, 62, 65 и по срединам классов 46,
49, 52, 55, 58, 61, 64. Средина классов рассчитывается для того,
чтобы параметры не были занижены, как это случилось бы, если бы
расчеты производились по началу классов, или завышенными, если
бы расчеты производились по концам классов.
2. . После того, как оценены средины классов для расчета среднего
арифметического значения необходимо средину каждого класса
умножить на соответствующую частоту, а затем эти произведения
просуммировать по всему вариационному ряду, а затем сумму
— У А 5398
произведении разделить на л, т.е. X = —— = = 53,98 луча.
3. Для оценки дисперсии, вариансы и среднего квадратичного
отклонения воспользуемся некоторым преобразованием.
п п *** ' п
Таким образом, получено эквивалентное выражение:
*=2(*.-*Ь2*.а-^-
Применительно к данным вариационного ряда S = У ficl - ^ .
п
Для оценки дисперсии по этой формуле необходимо средины
классов вариационного ряда возвести в квадрат, затем по строкам
20
перемножить квадраты средин классов на соответствующие частоты и
просуммировать по всем строкам. Такая сумма произведений
обозначается как £# = 292576.
£АУ = 53981 я 29138404 =
^^ л 100 100
5 = ]ГД2 -JfeL^zL = 292576-291384,04 = 1191,96.
^=-5-=,1^ = 12,04.
п-\ 99
сг = д/сг2 = 3,47 луча.
Таким образом, для данного вариационного рада * = 53,98 луча,
os=3,47 луча.
Забегая вперед, определим правильность оценки <т. Как будет
далее видно, нормальное распределение, а данный вариантный ряд
относится к числу нормально распределенных рядов, укладывается в
границах от среднего значения, примерно, в ± Зет. 3<х = 3-3,47 = 10,41.
Следовательно, если <х оценена правильно и ряд нормально
распределен, то минимальная варианта ряда должна примерно быть
равна Х-За = 53,98-10,41 = 43,57, в нашем случае минимальное число
лучей равно 45. Максимальное значение должно быть равно
X+За = 53,98 + 10,41 «64. Фактическое максимальное значение числа
лучей равно 63. Некоторую неточность можно отнести за счет
малочисленности выборки и за счет небольшого отклонения
вариационного ряда от нормального распределения, что также будет
показано далее.
Б. Способ условных отклонений.
Трудоемкость расчетов прямым методом заключается в том, что
необходимо производить громоздкие расчеты с квадратами классовых
значений. Тем труднее это решать, чем большие величины имеет
анализируемый признак (трехзначные, четырехзначные значения, как
это имеет место при анализе живой массы, роста и продуктивности
млекопитающих, дробные, например, концентрация веществ, витаминов
и др.). Поэтому можно воспользоваться методом условных
отклонений, который позволяет резко упростить расчеты.
21
Пример 2.3. Оценивается признак из примера 1.2.
Таблица 2. Оценка параметров выборочной совокупности в
I Xmin " Хтах
45-47
48-50
51-53
54-56
57-59
60-62
63-65
1 1
*'
46
49
52
55
58
61
64
i
1 f
4
10
27
41
12
5
1
^/= 100
а
-3
-2
-1
0
+1
+2
+3
1У~
9
4
1
0
1
4
9
1 ^
-12
-20
-27
0
+12
+10
+3
2>=*4
1 V 1
36
40
27
0
12
20
9
2>2=144 J
Для того, чтобы воспользоваться методом условных отклонений,
заменим двухзначные значения классов условными значениями по
следующему принципу. Условимся считать, что средняя арифметическая
находится в центре вариационного ряда, или класс, в котором больше
всего частот, хотя в принципе в качестве условной средней может быть
взято значение любого класса, в чем мы далее убедимся. Сначала
примем за условную среднюю класс со значением признака 55 и
обозначим его через ноль. Тоща класс со значением 52 будет
отличаться от нулевого класса на 52 - 55 = -3. Классовый промежуток
52 — 55
ряда равен к = 3. Разделим ах = —-— = -i; следующий класс отличается
от нулевого класса на
46-55
49-55 .
a2=—z— = -2;
следующий класс
= -3. В сторону нарастания значений признака от нулевого
класса, классы в условных значениях будут иметь вид:
58-55 f 61-55 . 64-55 ,
Теперь можно вместо значений классов записать полученные условные
значения и вести расчеты с ними как со значениями классов. При
таком способе расчета средняя арифметическая оценивается по
22
Аормуле: Х = А + ——*, ще А - значение нулевого класса, ^/а -
сумма произведений положительных и отрицательных значений fa, к -
величина классового промежутка. Для данного примера:
Х = А +
1^ = 55 + ^3 = 55-
1,02 = 53,98 лучей,
п 100
т.е. получено точно такое же значение средней арифметической, что и
прямым методом.
Формула для оценки дисперсии примет вид:
5 =
I/"2-
ы
к2
144-
(34)2
100
З2 =(144-11,56)-9 = 1191,96 (см.прямоЙ
метод).
а =-
1191,96
= 12,04; а = 4о* = 3,47 лучей.
л-1 99
Из представленных данных видно, что оба метода позволяют получить
одинаковые оценки выборочных параметров, но метод условных
отклонений на много упрощает расчеты.
Для того, чтобы убедиться, что выбор нулевого класса в любом
месте вариационного рада не отражается на конечном результате,
возьмем в качестве условной средней крайнее минимальное значение (I)
и крайнее максимальное значение признака (П).
Таблица 3. Обработка вариационного ряда двумя способами.
LiL.
46
[49
55
L58_
61 j
[ 64 1
Ll
! 4
10
27
41
12
5
1
[ a
Го"
+Г
+2
+3
+4
+5
+6
I
fa
0
10
54
123
48
25
6
2> = 266
1 *
1 0
10
108
369
192
125
36
S>:=840
_g_
ГТ
-5 1
-4
-3
-2
-1
0
~H
fa
! -24
-50
-108
-123
-24
-5
0
I/a = -334
1 ** i
144
' 250
432
369
48
5
0
I/a2 =1248
23
X. =A + ±^k = 46 + — 3 = 53,98 лучей;
1 n 100
- У fa -334
X2 = A + ^-k = 64+-^-3 = 53,98 лучей;
2 n 100 J
52 =
^ /I
100 J
840-^- 9 = (840-707,56)9 = 1191,96;
= fl248-^}
I 100 J
1248-— 9 = (1248-1115,56)9 = 1191,96;
a\ =12,04; a22 =12,04;
o-, =3,47 лучей; <т2 =3,47 лучей.
Кроме того, если в анализ включены признаки разномерные (например,
живая масса в кг, длина в см, концентрация вещества мг/кг) и при этом
необходимо знать по какому из признаков изменчивость выше, следует
выразить изменчивость в относительной мере. Такая мера получила
название коэффициента вариации (CV) и вычисляется по формуле:
X
Тоща для примера 2.2 СУ = ^- = lS^ML = 6,43 %.
V V Xx 53,98
Таким образом, выбор условной средней может быть произведен
произвольно, однако выбор ее в центре ряда резко упрощает расчеты. В
- У fa У fa
формуле расчета среднего значения Х = А + *=±—к член ——к
п п
является поправкой на неточность выбора условной средней А. Если в
процессе выбора А занижена по сравнению с истинной величиной X,
У/а
то ==*—к будет иметь положительный знак и добавит к А
п
У fa
недостающую величину. Если А завыщена, то ==^-А имеет
п
отрицательный знак и уменьшит завышенное значение А.
24
В основу обработки вариационных радов этим методом положена
а умножения частот на условные отклонения суммированием
частот или накапливанием сумм частот.
рассмотрим этот способ обработки в силу того, что он обладает
некоторыми привлекательными чертами. Рассмотрим метод сумм и
метод условных отклонений в общем виде. Выберем ту же условную
среднюю, что и в таблице 2.
Пример 2.4. Оценка параметров выборочной совокупности
(данные примера 1.2) методом сумм.
Таблица 4. Оценка вариационных рядов методом условных отклонений
и методом сумм.
1 Метод условных отклонений
г
\-3fj
\-2f2
\-lfs
+1//
+2//
! +3//
\а
-3
-2
-1
+1
+2
+3
[7
Л = 4
/2=10
h = 27
0 = 41
/,'=12
Л'=5
/,'=1
Значения
признака
|*/
46
49
52
55
58
61
64
Частота
|/
4
10
27
41
12
5
1 |
Метод сумм или ряд
накопленных частот
I/
Л = 0W = 4
f2-(fi+h)-14 I
f3 = (f,+f2+h) = 41 1
0 I
//"(Л'+Л'+/.')=«
/,'=U'+/a')=6
//=(/,')=! 1
Для метода условных отклонений:
2>=(з// +2// +/,')-(*/. +2/2 +/,).
Для метода сумм:
2>=1/(+ЫД-)=(з// +2/2' +/;)-(з/, +2/2 +/,).
25
Как видим, полученная сумма произведений £/а 9 в обоих
случаях имеет одно и то же выражение. Практически метод сумм
состоит в том, что частота крайнего ряда как максимального, так и
минимального класса повторяется в следующем столбце, а затем
частоты последовательно суммируются с частотами следующего класса
и так до нулевого класса. Первый столбец организуется для оценки
поправки на неточно выбранную условную среднюю, т.е. для оценки
^fa, а второй столбец для оценки первого члена в формуле расчета
(
дисперсии 5 =
z/«2-
, <1>П
Таблица 5. Вариационный ряд (обработка способом сумм).
1 х<
46
49
52
55
58
61
64
/
4
10
27
41
12
5
1 |
я = £/ = юо
£/(-)= 59
4
14
41
0
18
6
1
!/(+)= 25 |
[ !/(=)= 22
4
18
0
0
0
7
1
1/0=8 |
^ = ^S/(-b)-Z/(-),, = ss+2Sz59.3 = 5S_j43 = s
/| 100 100 J
s =
te л-К22 л-ы a-hz/(^- k/(+)- z л-у 1
.*=
(44 + 16 + 59 + 25)-
34^
100
9 = 1191,96
Несмотря на некоторую громоздкость формул, для начинающих
проводить статистическую обработку, этот метод заманчив тем, что
содержит в своей основе некоторые элементы самопроверки счета.
26
1. "Окно", состоящее из трех цифр, ограничивающих нуль:
частота нулевого класса + последняя цифра накопленного ряда
цифр сверху + последняя цифра накопленного ряда частот
снизу = л, т.е. ]Г/ = л = 100 = 41+41 + 18.
2. Сумма накопленных частот сверху в первом столбце + сумма
накопленных частот сверху во втором столбце = Щ-). Сумма
накопленных частот снизу в первом столбце + сумма
накопленных частот снизу во втором столбце = 2JT+):
щ.) = 59 = 41 + 18,
Щ+) = 25 = 18 + 7.
Все участки проверки выделены жирными цифрами (табл. 5).
Таким образом, существует ряд способов обработки
вариационных рядов, экспериментатор волен выбрать любой из них,
т.к. все они дают абсолютно одинаковый конечный результат.
§2.6. Объединение параметров отдельных подсовокупностей.
Если имеются данные по отдельным частям совокупности
(отдельные выборки) и их необходимо объединить и оценить
обобщенные параметры в объединенной совокупности, то это можно
сделать, соблюдая определенные правила.
Так, если имеются измерения по отдельным подсовокупностям и
оценены выборочные параметры по этим подсовокупностям, т.е.
имеются T{,X~Z,Y2,...jTk - средние значения к подсовокупностей;
сг,2,<г22,<7з2,...,<тА2 - вариансы к подсовокупностей;
П] + fy + пз + ...+ Пк = N -численность к подсовокупностей, то
взвешенное среднее арифметическое значение для всей совокупности
можно оценить как:
Например, если имеется 3 подсовокупности (3 повторности одних
и тех же опытов или контролей), то если условия проверки опытов и
поддержания контролей были неизмененными, то можно оценить
°бобщенные параметры Хы*, а]^ и 5^ по всем трем повторностям.
27
Пример 2.5. Имеется 3 повторности селекционного эксперимента,
направленного на элиминацию радиальной жилки крыла у Drosophila
melanogaster.
щ = 70 п2 = 70 пз = 70
Jfj = 0,84 мм 1^ = 0,70 мм ^з=0,67 мм
а\ = 0,07 а\ = 0,03 а] = 0,03
<г, =0,26 ММ аг = 0,17мм ст3 =0,17пш.
V 1 Г -v "v> _, v ^ 70 0,84 + 70.0,70 + 700,67
*L = k2(«, -i)+<t22(«2 -i)+a?fo -О]-
ЛГ-3
+[(*, -£«Jf ./i, +fr2 -Хоещ) п2 +(r3 -7J^j.-L- =
= _L (4,83 + 2,07 + 2,07)+ — (0,7 + 0,11 + 0,34) = 0,043 + 0,005 = 0,048 * 0,05
207 209 '
Таким образом, параметры объединенной выборки таковы:
ЛГ=210, 7о*,=0,74лш, 0^=0,05, £^ = 0,22^
ГЛАВА 3
ЗАКОНОМЕРНОСТИ СЛУЧАЙНОЙ ИЗМЕНЧИВОСТИ
В СОВОКУПНОСТЯХ
§ 3.1. Вероятность.
Как уже говорилось ранее, биологические объекты обладают
двумя основными свойствами: наследственностью и изменчивостью.
Последнее свойство особенно важно для данного предмета, т.к. если бы
биологические объекты (вид, сорт, порода) были бы одинаковыми, то
один единственный представитель характеризовал бы всю совокупность
в целом. В таком случае не было бы необходимости в. использовании
28
статистической обработки экспериментальных данных. А так как
биологические объекты, имеющие некоторые различия в характере
проявления тех или иных признаков, представлены не единичными
экземплярами, а совокупностями большего или меньшего размера, то
взятые в целом они должны подчиняться некоторым статистическим
закономерностям. Эти статистические закономерности частично
проявились при составлении вариационных рядов (см. гл. 2), Каждый
отдельный член совокупности подвергается воздействию множества
случайных факторов, поэтому относительно каждого отдельного члена
совокупности приходится говорить только об известной возможности
или вероятности той характеристики, которую этот объект
приобретает в процессе своего формирования. Следовательно, речь
может идти только о малой или большой вероятности осуществления
некоторого определенного события.
Вероятность математически выражается как /> = —, ще р - доля
п
(вероятность, процент) т событий из общего числа п; т - число
"благоприятных" событий; п - общее число событий.
Вероятность рождения особи мужского или женского пола равна:
р * — «о,5, т.к. известно, что рождается приблизительно
100
99 : &У = 1 : 1. Из этого примера видно, что количественной
характеристикой вероятности события является относительная частота
события, определяемая экспериментально.
Для всех вариационных рядов было характерным совершенно
определенное распределение вариант: сгущение частот в центре
вариационного рада и уменьшение частот по мере удаления от центра
вариационного рада.
Если вновь обратиться к примеру 1.1, но с точки зрения оценки
характера распределения 50 норок по числу щенков в помете, то
получаются следующие данные:
Распределение л = 50 норкам по числу щенл&в помете (пример 1.1).
Количество щенков 12 3 4 5 6 7 8
в помете, jc/
Число случаев, т 1 4 9 12 10 7 5 2
29
Вероятность
события, /> = - 0,02 0,08 0,18 0,24 0,20 0,14 0,10 0,04
п
Сумма всех вероятностей равна 1,00.
Если изобразить этот ряд графически, то получим полигон
распределения, который называется биномиальной кривой
распределения, соответствующий коэффициентам разложения бинома
Ньютона. Просто бином Ньютона можно продемонстрировать на
примере подбрасывания монеты. Когда подбрасывание монеты
производится достаточное число раз, вероятность выпадения орла
равна вероятности выпадения решки, p = q = -. Вероятность выпадения
двух орлов одновременно при подбрасывании 2-х монет равна рр=р2>
двух решек qq = q2 и орла и решки pq+ pq = 2pq. Таким образом,
для случая, коша происходит одно событие, можно записать
распределение: (р + q)1 = р + q,
2 события: (р + qf = р2 + 2pq + q2,
3 события: (р + qf= р3 + tfq + 3pq* + cf,
4 события: (р + qf = р4 + 4p3q +6p2q2 + 4p<? + q4 и т.д.
Гальтон в 5-ой главе книга "Natural inheritance", 1889, которая
называется "Черты статистики", предложил прибор для иллюстрации
закономерностей биномиального распределения. Это плоский
продолговатый ящик, в дно которого вбиты в шахматном порядке
гвозди, в нижней части сделаны перегородки, организующие узкие
отсеки. В верхней части ящика узкая щель с воронкой. Ящик стоит
вертикально. В верхней части через воронку, а затем через узкую щель
просыпается дробь. Дробь, ссыпаясь вниз, ударяется о гвоздики и
рассыпается внизу по отсекам. Основная масса дроби
сосредотачивается в центральных отсеках, а чем дальше отсеки от
центра, тем меньше в них попадает дроби (см. рис. 3).
Биномиальное распределение характерно для признаков,
имеющих дискретную вариацию. При биномиальном распределении р и
q могут принимать различные значения: р = 0,5; q = 05; р = 0,2;
q = 0,8 и т.д. Форма полигона при этом меняется(рц с 4J
30
Рис. 3. Прибор Гальтона.
1
1 1
1 2 1
13 3 1
14 6 4 1
1 5 10 10 5 1
1 6 15 20 15 б 1
Рис. 4. Коэффициенты бинома.
Предельным случаем биномиального распределения может
рассматриваться распределение Пуассона, когда р или q имеют
значение близкое к нулю (редкое событие).
Другом вариантом биномиального распределения может быть
такое распределение, коща к стремится к бесконечности, т.е. (p+qf,
тоща распределение становится непрерывным. Полигон превращается в
симметричную плавную кривую, получившую название "кривая
нормального распределения99 (рис. 5).
31
1 1 I 1 Г~
-3<j -2a -1<j X +la +2<7 +3a
Рис. 5. Кривая нормального распределения. Отклонения
вправо и влево от X укладываются в ± 3,3а.
Смысл кривой нормального распределения тот же, что был
продемонстрирован прибором Гальтона. Случайные факторы,
действующие на объект, условно назовем их "положительными" и
"отрицательными", как бы уравновешиваются в своем влиянии на
объект. Поэтому большинство показателей сосредотачиваются вблизи
"среднего показателя" и гораздо реже перевешивают только
положительные или только отрицательные факторы. Поэтому, чем
больше такой индивидуальный перевес, тем дальше значение варианты
будет отклоняться от среднего значения и тем дальше эта варианта
будет занимать место вправо или влево от среднего значения на кривой
нормального распределения.
Закономерности распределения лучше всего описывает
статистический показатель, получивший название нормированное
отклонение. Обозначается показатель латинской буквой t\ часто
называется t-критерием^ _ xt-X ^e
о
32
Xi
- значение г-ои варианты распределения;
у - среднее значение признака в распределении,
£•- среднее квадратическое отклонение, характерное для признака.
Смысл /-критерия состоит в следующем.
Если / = -i--,
то
ь
-X = to.
Пример 3.1. Анализируется распределение длины (см) 100
листьев садовой земляники. Обработка данных вариационного ряда
методом условных отклонений, как в главе 2. (Пример на стр. 10 ).
Таблица 6. Оценка выборочных параметров в вариационном ряду
методом условных отклонений.
\_Xfin " Хтах
Г5.2 - 6,4
6,5-7,7
7,8-9,0
9,1 - 10,3
10,4-11,6
11,7-12,9
13,0 - 14,2
L. i
Xi
1 5,8
7,1
8,4
9,7
11,0
12,3
13,6
/
6
42
26
15
4
6
1
100
а
-3
-2
-1
0
+1
+2
+3
J
9
4
1
0
1
4
9
1 fa
\ -18
-84
-26
0
4
12
3
2>=-109 I
! л» 1
54
168
26
0
4
24
9
2>2 = 285 1
— V fa -409
X = A + ±=*±-.k = 9,7+^. 1,3 = 8,28 См;
п 100
S =
I/-2
6>У"
*2
285-
.в
100
т2 = -А. - 280>86
/1-1 99
= 2,84;
• 1,32 = (285 -118,81)-1,69 = 280,86;
а = То2" = 1,68 СМ.
33
Эти данные означают, что варианта 7,1 находится на расстояние
0,70а от средней влево (в сторону уменьшения признака). Варианта 8,1
- на расстоянии 0,11а от средней влево, а варианта 10,2 - на
расстоянии lf 14сг от средней вправо. Следовательно, нормированное
отклонение дает возможность точно определить местоположение
каждой варианты на кривой нормального распределения.
Распределение вариант в целом отвечает строгом
закономерностям:
1.Нормальное распределение укладывается в пределах ±3,3 «тот
Х- Применительно к рассмотренному примеру границы ряда,
описанного кривой нормального распределения 9 должны быть
ограничены х ±3,3а, т-е- 8>28 см ± 3,3-1,68 см или
Xmin = 8,28 - 5,5 * 2,8 см;
Хтах = 8,28 + 5,5 - 13,8см.
В нашем случае хт\п = 5,2, хтт = 13,0 см. Следовательно,
экспериментаторы избегали измерять самые маленькие листья, и
поэтому кривая нормального распределения несколько скошена в левой
части.
2. Теоретически показано, что на кривой нормального
распределения в пределах ± 1а укладывается ~ 68,3% всех вариант, в
пределах ±2а~ 95,5%, в пределах ± За ~ 99,7%, В пределах ± 3,3а ~
99,9%.
В таком случае г для определенных вариант колеблется в
пределах ± 3,3. Таким образом, различные значения t ограничивают
различные части вариационного ряда, и в то же время распределение
вариант основано на закономерностях распределения вероятностей.
Вероятность любого отклонения от среднего - это функция
нормированного отклонения. На основе этой функции составлена
таблица нормального интеграла вероятностей (см. приложение
табл. I).
В таблице I в левом столбце приведены значения t до
десятичного знака, а на горизонтальной верхней строке - сотые доли,
внутри клеток представлены вероятности, с которыми конкретные
значения t встречаются в распределении, т.е. геометрически
34
вероятности являются долями площади нормальной кривой в границах
от-гдо + /.
Таким образом, если совокупность объемом п = 100, ^ = 8,28 см,
as. 1,68 см, то согласно закономерностям нормального распределения в
пределах ± \одолжно быть - 68,3 особей
±2а ~ 95,5 особей
± За ~ 99,7 особей
Ниже будут продемонстрированы более широкие границы
использования нормированного отклонения для решения задач, для
оценки достоверности параметров выборочных совокупностей и для
оценки достоверности различий двух выборочных совокупностей.
ГЛАВА 4
ДОСТОВЕРНОСТЬ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ
§4.1. Ошибка выборочной совокупности.
Доверительные интервалы.
В предыдущих главах мы показали, что экспериментальные
данные представляют собой выборочные совокупности, взятые из
генеральной совокупности. Генеральная совокупность - это
совокупность, в которой N —> оо. Измерить, проанализировать все
объекты такой совокупности практически невозможно, поэтому
исследователи пользуются изучением выборочных совокупностей
ограниченного объема.
Выборочные совокупности, как было показано ранее, могут быть
охарактеризованы выборочными параметрами X, о2, а
Из одной и той же генеральной совокупности можно организовать
несколько (много) выборочных совокупностей. Эти выборочные
совокупности могут быть разного объема и иметь разные значения
выборочных параметров X и а, несколько отличные друг от друга.
Если из одной генеральной совокупности взято несколько выборочных
совокупностей достаточно большого объема, то среднее значение,
35
оцененное на основе средних выборочных, должно совпадать со
средней генеральной совокупности , // (греческая буква мю). Сказанное
выше можно распространить и на разнообразие, ст.
Представим, что большим кругом обозначена генеральная
а
совокупность с параметрами: N -> а* // и аг.
Из этой совокупности взято несколько выборочных
совокупностей с параметрами:
ГЦ П2 Пз Щ
Х\ Х2 Хъ ... Х(
гч-1 ~2 ~2 гт1
ах а2 <Тз <т,
Отчего будет зависеть несовпадение в оценках параметров
различных выборочных совокупностей?
Прежде всего это зависит от такого свойства анализируемого
признака, как изменчивость. Если бы признаки не варьировали, то
достаточно было бы одного представителя, чтобы оценить всю
А
совокупность. И, наоборот, чем выше изменчивость признака, а2, тем
А _
сложнее оценить параметры /л и а2 по выборочным параметрам X и
</. Кроме того, если признак варьирует, но будет увеличиваться
численность выборочной совокупности, т.е. чем ближе по объему
выборочная совокупность к генеральной совокупности, тем последняя
36
чнее может быть охарактеризована через параметры выборочной
вокупности. Другими словами, с увеличением численности
ыборочной совокупности увеличивается и вероятность приближения
Выборочные средние отдельных подсовокупностей в силу
случайных причин, варьируют вокруг // по тем же законам, что и
отдельные варианты выборочной совокупности вокруг X. Таким
образом, если бы была известна дисперсия средних величин отдельных
выборок, можно было бы оценить границы колебания X вокруг //.
Отталкиваясь от соображений, высказанных в начале главы о
А Л
том, что точность оценки // зависит от а2 и л, причем от а1 эта
зависимость прямо пропорциональная, а от п - обратно
_2
а
пропорциональная, можно выразить так: s^ = —, гае s^ - стандартная
выборочная ошибка, или ошибка выборочности, или ошибка
А
репрезентативности; а2- варианса признака, п - объем выборочной
совокупности.
Стедовательно, s^ - это та же <т, которая оценивала вариацию
отдельных вариант в совокупности вокруг X, но только теперь 5Т
характеризует разнообразие выборочных средних величин вокруг /i.
л
Однако следует заметить, что аг неизвестна и нет возможности
ее оценить, а если бы эта возможность существовала, то не было бы
необходимости оценивать выборочные параметры. Поэтому считается,
А
что с небольшой погрешностью можно вместо <т2 взять выборочные
о <тг а
значения &. Поэтому s\ = —, откуда s7 = -=.
х п ' 4п
Несмотря на то, что s^ носит название стандартной ошибки, это
не означает, что s7 оценивает неточность измерений или неточность
расчетов, s^ оценивает случайную вариацию выборочных средних
вокруг ju по тем же законам вариации, что и а вокруг X. Отсюда
37
следует, что в пределах ± lsP укладывается 68,3% всех выборочных
средних; ± 2s7 - 95,5%; ± 3^ - 99,7%; ± 3,3sT. - 99,9%.
В таком случае, зная значение выборочных параметров
совокупности: л, X, а, можно оценить с определенной вероятностью
границы, в которых находится ix.~X- 1 s^ <* р <J( + 1 sT, - вероятность,
P = 68,3%,
X - 2jx. <, ц <JC + 25?, P = 95,5%,
X - 3sf <> \x <,X + 3jr, P = 99,7%,
3f - 3,3^ <> \i <X + 3,35Г, Р = 99,9%,
В общем виде // находится в границах X - tsT <\i<X + tsx..
Эти границы получили название доверительных границ,
интервал между максимумом и минимумом получил название
доверительного интервала.
Пример 4.1. Анализируется распределение длины (см) 100
листьев садовой земляники (см. пример 1.3).
п = 100,
X = 8,28 см,
а- 1,68 см,
5^=0,168 см «0,17 см
Следовательно, границы ряда с вероятностью Р = 0,955 будут:
2-1,68-8,28 +2-1,68
4,92+ 11,64
Доверительные интервалы для //
20,17 - 8,28 + 20,17
4, 4,
7,94 + 8,62
С вероятностью Р = 0,997 для ряда:
3-1,68-8,28 + 3-1,68
3,24 + 13,32
38
Для/г.
3-0,П - 8,28 + 3-0,17
7,77 н- 8,79
Таким образом, доверительный интервал, в границах которого
может лежать /а зависит от величины Р, с которой предполагается
оценивать //. Чем выше вероятность, тем шире доверительный интервал
для//.
Заметим, что выборочные параметры имеют "точечную" оценку,
т.е. выражаются единственным числом, а генеральные параметры
оцениваются всегда в доверительных интервалах. Уменьшить
доверительные интервалы возможно только путем уменьшения <sP, a
стандартная ошибка s7 может быть уменьшена только за счет
увеличения объема выборочных совокупностей, п.
§ 4.2. Выборочные ошибки для гг.
В некоторых случаях, когда важным параметром для
исследователя является изменчивость, имеется возможность оценить
стандартную ошибку для среднего квадратического отклонения а. Это
можно сделать следующим образом:
а
Следовательно, в примере 4.1
а 1,68 1,68 Л1„
sa = -j= - , = ~-*0,12 СМ.
л/2я ./2^Т00 14,14
Доверительные интервалы для а в общем виде есть:
&-tsa<a<> tsate'.
Для Р = 0,95 границы а есть:
20,12- 1,68 + 2-0,12
I I
1,44 * 1,92
39
§ 4.3-Сравнение двух выборочных совокупностей.
В биологических исследованиях приходится чаще всего име^
дело не с одной, а несколькими выборочными совокупностями. Как
правило - это опыт и контроль, это различные сорта, породы, штаммы
линии и др. Эти совокупности оцениваются через выборочные
параметры Z,<t,s?. Однако различия между параметрами
анализируемых совокупностей могут быть случайными,
незначительными, и этими различиями можно пренебречь, но могут
быть различия и существенными.
В первом случае, когда различия незначительны и их можно
отнести к случайным, такие две выборочные совокупности Moiyr
считаться принадлежащими к одной генеральной совокупности или
взятыми из одной и той же генеральной совокупности.
Во втором случае, когда различия между выборочными
совокупностями значительные или существенные, тогда такие
выборочные совокупности нельзя отнести к одной и той же
генеральной совокупности. Как оценить существенные или
несущественные различия между выборками?
Прежде всего, когда имеются оценки параметров выборочных
совокупностей Х,а, необходимо установить существенность
(достоверность) различий между параметрами этих совокупностей.
§ 4.4. Опенка достоверности различий между средними
значениями двух выборочных совокупностей.
Если бы сравнивались щ и & генеральных совокупностей, то
ясно, что между щ и цг разница всегда достоверна. Однако, когда
сравниваются между собой средние Y{ и Х2 выборочных
совокупностей, то, как мы видим в § 4.1, оценки Л^ и Х2 имеют
статистические ошибки $хг и 57,.
40
Для проведения оценки различий между Хх и Хг примем, что
оазличия между ними случайны или их вовсе не существует. Такой
способ рассуждения называется принятие нулевой гипотезы.
Для того, чтобы принять нулевую гипотезу, т.е. согласиться, что
различия между средними случайны, или отвергнуть нулевую гипотезу,
т.е. считать различия между средними существенными (достоверными),
воспользуемся нормированным отклонением, г:
/.£А
ще
/ - нормированное отклонение;
Тх и Хг - средние значения выборочных совокупностей;
5/-—j - средняя ошибка разнипы между средними;
Если X - Хг =d, то S,- ?-\ = Sd, тоща / = — = —
{ ' г> Sj С2 4- V2
Пример 4.1. Изучалось влияние генотипа норок на плодовитость.
Проанализировано 50 самок каждого генотипа. Составлено 2
вариационных ряда по стандартному и мутантному генотипам норок.
Таблица 7. Оценка достоверности различий средних значений двух
распределений.
pU
ко
в
№_
EL
El
El
К
Стандартный генотип
1-JL.
1
■ 3
10
20
10
5
1
«=50 j
а
г+г
!+2~
+1 1
0
-1
-2
-3 ,
/а
+3
! +6
+10
0
-10
-10
-3
2>«
.. = -4
Е
9
4
1
0
П"
4
9
г~^~
9
12
10
0
10
' 20
9
!>' =
= 70 1
Мутантный генотип
h
1
3
10
30
4
2 j
/i=50|
1 а
г+Г
+2!
+1
0
Т"
-2
/«
+3
+6
+10
0
-4
-4
2>=j
= +п
Го2
~?
4
1
0 ,
1
4
1 *'
9
12
10
0
4
8
2Ж =
= 43 1
41
Xi
s,
of
Ъ
/^ =
Ф
= 5,0-
= (70-
= 1,42;
1,19
=-*Ы
Msxt
..1.1=
50
50j
<>i
= 0,17
■7i .
+4,
4,92 шт;
= 69,68;
= 1,19 шт;
шт;
4,92-4,22
V0,172+0,132
JT2 = 4,0+ —1 = 4,22 шт;
50
5!=(43-f).1 = 40,58:
a\ = 0,83; cr2 = 0,91 шт;
37-2=з,зз.
0,21
Эти 2 вариационных ряда обработаны методом условных
отклонений. Получены все необходимые параметры для оценки
достоверности различий двух выборочных средних Yx и Х2 через
критерий Стыодента, Г. Фактическое значение fy = 3,33. Затем ^
необходимо сравнить со стандартными значениями tst, которые
помещены в таблице II (приложении).
Значения критерия гЛ (критерий Стыодента) для данных степеней
свободы, df = nj + П2 - 2 = 50 + 50 - 2 = 98, равны для вероятностей:
Р £ 0,95; гЛ = 2,0;
Р Ъ 0,99; t5t = 2,6;
Р > 0,999; tst = 3,4.
Сравним фактическое значение гф = 3,33 со стандартными
значениями tst для df = 98. Видно, что фактическое значение t$ < tst
=3.4, но гф > 2,60, что соответствует вероятности Р > 0,99.
Нулевая гипотеза сохранилась бы в том случае, если бы значение
фактического 1ф было бы меньше 1,96 * 2,0 для данного значения df, В
таком случае следовало различия между Х\ и Хг считать
несущественными, недостоверными, случайными. В рассмотренном
примере значение \$ превышает 2, следовательно, нулевая гипотеза не
проходит. В таком случае с вероятностью Р > 0,99 можно утверждать,
что норки стандартного генотипа превышают по плодовитости норок
мутантного генотипа на 0;70 щенка на помет.
Сказанное выше можно представить графически.
42
8
7
6
5
4
3 |-
2
1
+3<7>=8,49
ft JTi = 4,92
I И -3^=1,35
I
+3sF=5,43
-3^=4,41
+3(72=6,95
4,22= Xi
-3cr2=i,49
+35j =4,61
-3sT =3,83
Рис. 6. Величина ожидаемых с вероятностью Р > 0,997 границ
выборочного распределения (< ■ —») и доверительные интервалы
генерального среднего (—и—) в двух выборках (см. пример 4.1).
По такому же принципу можно построить доверительные границы
для а и оценить достоверность различий двух радов распределения для
л
а
Доверительные границы для а:
а А о
л/2л V2w
Оценка достоверности различий:
^-2 л-2
/ 2л, 2я2
Фактическое значение t<p сравнивается со стандартными
Учениями tSt, взятыми из таблицы II (приложения) для данных
степеней свободы, df = п\ + п г - 2.
43
ГЛАВА 5
КОРРЕЛЯЦИОННЫЕ СВЯЗИ МЕЖДУ ПРИЗНАКАМИ
§ 5.1. Коэффициент корреляции.
Анализ выборочных совокупностей, как было показано выше,
дает возможность оценить средний уровень развития признака в
совокупности и оценить характер (величину) вариации признака.
Однако каждый признак у биологических объектов не существует
изолированно, а находится во взаимодействии с другими признаками
организма, связан с ними.
Древние римляне говорили "По ноге узнаешь Геркулеса" или "по
когтю узнаешь льва". Гальтон, изучая связь между ростом людей и
длиной предплечья (расстояние от локтя до кончика среднего пальца),
оценил корреляцию, равную + 0,800.
С одними признаками эта связь более тесная, с другими - менее
тесная. С одними признаками она положительная (прямая), когда с
увеличением одного увеличивается и другой признак, с другими
отрицательная (обратная), когда с увеличением одного признака другой
уменьшается. Примером прямой связи может служить живая масса и
рост животных, отрицательно связаны длина шерстяного покрова и
густота.
Однако, если в физике и математике функция и аргумент
находятся в строгой "функциональной" зависимости, когда конкретному
значению аргумента соответствует строго конкретное значение
функции, то в биологии это не так. Биологические объекты и их
признаки формируются и развиваются под сильным влиянием огромного
количества случайных и неслучайных факторов. Чаще свего это
является причиной того, что определенному значению одного признака
Соответствует несколько значений другого признака, но в среднем оба
признака изменяются как бы в одном направлении. Эту тенденцию
направленного изменения двух средних можно оценить, используя
нормированное отклонение.
44
Пример 5.1. Изучается связь между % жира (jc) и % белка (у) в
молоке коров. Проанализировано 12 проб молока.
Г^П£Об
V;
1
4,0
3,3
2
3,7
3,1
3
3,6
3,0
4
3,6
3,3
5
3,6
3,2
6
3,7
3,3
7
4,1
3,3 ..
8
4,0
3,2
9
3,9
3,3
10
3,8
3,3
11
3,8
3,0
12
3,8
3,1 1
Таким образом, имеются две выборочные совокупности со
следующими параметрами:
пх = 12;
1>( = 45,6;
2Х =173,6;
(Ух J
/>х = ^ (/ =173,28;
5ж=0,32;
0^=0,029;
<Ъ = 0,17%;
Л" = 3,8%;
пу = 12;
1>,= 38,4;
1^=123,04;
_£>J
Sy = 0,16;
^=0,014;
ау = 0,12%;
F = 3,2%.
= 122,88;
Iх'
U
Ъ-*)
E-F)
1 ?v_
Пм>
j 3,3
+0,2
+0,1
+1,18
+0,83
[3/7
3,1
-0,1
-0,1
-0,59
-0,83
Гз^б
3,0
-0,2
-0,2
-1,18
-1,67
[з!б
3,3
-0,2
+0,1
-1,18
+0,83
[з^б
!з,2
-0,2
0
-1,18
0
Гз/7 1
3,3
-0,1
+0,1
-0,59
+0,83
45
W=W
iJL
3,3
3,2
3,3
3,8
3,3
3,8
3,0
0
T^T
+0,3
+0,2
+0,1
+0,1
+0,1
+0,1
-0,2
-0Л
xt-X
+1,76
i-l,18
+0,59
/„ =
у,-у
+0,83
+0,83
+0,83
-1,67
-0.83
(1)
IX', _+3,92
= +0,356.
я-1 11
Из расчетов, приведенных в примере 5.1 видно, что у части пар
знак нормированных отклонений совпадает (+, + или -, -), а у части
пар нормированных отклонений знак не совпадает (+, -; -, +; 0, +; 0, -).
В том случае, когда много однозначных пар, сумма их произведений
будет иметь положительное значение и усредненная сумма
произведений нормированных отклонений даст некоторую величину,
которая и будет характеризовать меру сопряженной изменчивости
двух переменных величин или двух анализируемых признаков.
Величина
_Z'.-',
W-1
получила название коэффициента
корреляции.
В развернутом виде значение коэффициента корреляции
выражается следующим образом:
(2)
.Z'*-',.Zk-*fr,-r)_
+ 0,08
/i-l
{п-\)ахау
+ 0,08
ПОД 7056-0,12060 0,226
= 0,354
Если в числителе раскрыть скобки, перемножить {xt-x) на (y,-Y\
получим эквивалентное выражение:
»
п
тоща:
Zk-Ttr.-rhl.™-'
46
< w -1 /J -1
,., 45,6-38,4
146 iT" +0,08 ^.A
v0,32 0,16 0,226
Следовательно, к оценке коэффициента корреляции можно
подойти различными способами. Варианты (2) и (3) полностью
совпали, а в варианте (1) коэффициент корреляции имеет значение на
0,002 выше - это набежало за счет округления цифр при делении на ст.
Наиболее рациональным способом оценки Ггу, из 3-х
представленных вариантов, является способ (3) как наименее
трудоемкий, однако и этот способ, когда выборки многочисленны и
признак измеряется 2-х, 3-х и более значными цифрами, становится
также трудоемким. По этой причине рекомендуется оценку
коэффициента корреляции осуществлять с помощью корреляционной
матрицы (или корреляционной решетки).
Организовать корреляционную решетку просто. Для этого
необходимо по горизонтали выписать все варианты признака (jc),
которые встретились в выборке, или через определенный классовый
промежуток, если вариантов много (как показано в гл. 2). По вертикали
выписать варианты признака (у).
В клетках проставить соответствующие значения пар
признаков. Затем просуммировать значения частот по строкам (fy) и по
столбцам (fx). Можно заметить, что решетка представляет собой 2
вариационных ряда: цифры в верхней и 6-ой горизонтальных строках -
это классы и частоты признака х> т.е. вариационный ряд для признака
*, а классы и частота двух столбцов (1 и 8) - это вариационный ряд
Для признака у. А дальше необходимо обработать 2 вариационных ряда
ZrJV
2>«-2>.
Jsr sx
47
любым из способов (гл. 2). Сведем данные, полученные при обраб0.
2-х вариационных рядов в корреляционной решетке в таблицу 9.
Таблица 8. Корреляционная решетка для оценки степени связи ме^
% жира (х) и % белка (у).
[X
1 3.3
3,2
3,1
3,0
Л
\ах
\<4
fax
1
4,1
*1
1
+3
9 I
3
9
4,0
|'1
•1
2
+2
4
4
8
3,9
*1
1
+1
1
1
1
1 3,8
•1
•1
•1
3
0 i
0
0
0
3,7
b
•1
2
-1
1 |
-2
2
1 3,6
Ч
1
•1
3
-2
4
-6
12
рГ
6
2
2
2
л=
=12 |
\ау
+1
0
-1
-2
R
1
0
1
4
Z/A = 0
Е/А2=32
\fyOy
6
0
-2
-4
Z/A
=0 |
Гл^
6 ~"
0
2
8
=16
При оценке через корреляционную матрицу формул'
коэффициента корреляции приобретает вид:
(4)
V**4
/3216 22,6
+0,354.
48
Таблица 9. Параметры 2-х вариационных рядов для % жира (г) и % белка
(у) в молоке.
1 Показатели
\п
2>
\тм
L = 2>2-A
■> 5-А:2
<х" =
а
» 1
Признак
х
12
0
32
0
32
0,029
0,17
3,8
У
12
0
16 1
0
16
0,014
0,12
3,2
1
Все члены в формуле уже оценены и записаны в таблице, кроме
члена ^fa/iy. У этого члена /' - это значение частоты в каждой
клеточке матрицы. Чтобы получить полностью член 2/Члу,
необходимо /' в каждой клеточке перемножить на соответствующее
отклонение по горизонтали, ах, и по вертикали, а)Ь и просуммировать с
учетом знака произведения, т.е.
£/Ч*, - К+1Х+3) + К+1Х+2) + K+iX+i)+ о + К-1Х+1) +
+Ь(-2)(+1) +0 -Ю +0 + 1<-1Х-1) +0 + Н-2Х-2) =
= 3 + 2+1-1-2 + 1+4 = +8.
Как видим, цифры в формуле (3) в 10 раз ниже, чем в формуле (4).
Это произошло от того, что ни числитель, ни знаменатель в формуле (4)
не домножались на классовый промежуток к = 0,1.
Таким образом, коэффициент корреляции - параметр, который
измеряет степень совместного варьирования двух признаков. Это
означает, что если один признак не варьирует, а у другого признака
49
очень большая вариация, то числитель в формуле, оценивающей
коэффициент корреляции, будет равен нулю. Например,
Xi 55 5 5 5; п = 5; 5> = 25; 2><2=125
yi 12 345 п = 5; 2> = 15; IX =55.
r = L'y' _ n ^ _L _75-75 -o
В общем, если признаки варьируют в одном направлении, то
коэффициент корреляции может принимать любые значения от 0 до
+1,0. Если увеличение одного признака сопровождается снижением
другого, то такая корреляция отрицательна и значения коэффициента
корреляции могут быть от -1 до 0.
При использовании корреляционной матрицы появляется
дополнительная возможность визуализации корреляции. Так, например,
если в корреляционной матрице частоты лежат строго по диагонали,
проведенной из одного угла матрицы в другой (центральная диагональ),
то такой коэффициент корреляции равен или близок к единице. Если
частоты рассеяны по всем клеткам матрицы, то значения такого
коэффициента корреляции близки к нулю. Знак коэффициента
корреляции зависит от концентрации частот вокруг одной центральной
диагонали или противоположной центральной диагонали (см. рис. 7).
50
Рис. 7. Значение коэффициентов корреляции при различном
распределении частот в корреляционной решетке.
§ 5.2. Ошибка выборочного коэффициента корреляции.
Оценка достоверности. Доверительные границы для генерального
значения /л
Коэффициент корреляции является выборочным параметром и
его значение зависит от ряда случайных факторов, и, главным образом,
от объема выборочной совокупности, взятой из генеральной
совокупности. Поэтому, также как и другие выборочные параметры X
и о; коэффициент корреляции имеет ошибку выборочности (sr)
fTT7"
s, =•/—-, где
v Vw-2
Л,„ * ошибка выборочности коэффициента корреляции;
r.rv - коэффициент корреляции;
п - число пар, на основе которых оценен гху.
51
Согласно нулевой гипотезе о том, что генеральное значение
корреляции р = О, критерий Стьюдента (/) для оценки достоверности
Гху равен:
\ \
Для примера 5. Цще г^ = +0,354, п = 12,
= ДЗ |ЕМ = 0,296.
г* Чя-2 \ 10
, = ^- = ^1 = 1,2.
s,o 0,296
В таблице II (приложения) для df=w-2=12-2=10
tst 2,2 для Р = 0,95
3,2 для Р = 0,99
4,6 для Р = 0,999.
Таким образом, значения коэффициента корреляции г^,
оцененное по 12 парам, недостоверно.
Можно ответить на вопрос, сколько необходимо иметь пар для
того, чтобы такое значение коэффициента корреляции было бы
достоверным. Обратимся к таблице Ш (приложения), где указано
количество пар значений, достаточное для достоверности выборочного
коэффициента корреляции (/>>,).
Например, чтобы г^ = 0,354 был достоверен при Р > 0,95,
необходимо в анализ включить 32 пары, при Р £ 0,99 - п = 53; при
Р > 0,999 - п = 85.
Этой таблицей можно пользоваться и для определения
достоверности гху. По этой таблице, если определенному значению гху
будут соответствовать число пар меньше, указанных в данной строке,
то это будет означать, что данный коэффициент недостоверен.
Коэффициент корреляции достоверен тогда, когда значение п в строке,
соответствующей конкретному значению г^, будет равно фактическому
числу пар, по которым оценивался /уу, или превышать его.
52
5 5.3.Ранг0ВЫЙ коэффициент корреляции
Иногда экспериментальные данные не поддаются
количественной оценке, а представляют собой материал, разбитый
на классы или группы и в таком случае обычный коэффициент
корреляции (пирсоновский коэффициент корреляции) оценить не
представляется возможным. Тогда экспериментальные данные
можно упорядочить, приписав каждому варианту совокупности
порядковый номер или ранг ,записав ранги в порядке увеличения
или уменьшения величин. Такие порядковые номера (ранги) можно
приписать двум признакам, зафиксированным у одной особи и
оценить коэффициент корреляции между двумя рядами рангов.
Поскольку порядковые номера -это ряд натуральных чисел, то
при выведении формулы для оценки коэффициента ранговой
корреляции, можно воспользоваться некоторыми
закономерностями, характерными для ряда натуральных чисел.
Так, среднее значение чисел натурального ряда равно числу
порядковых цифр плюс одно число, деленное на 2 , т.е.( п + 1) / 2,
а дисперсия чисел натурального ряда, S=n(n-l)(n+l)/12 .
Например, имеется ряд натуральных чисел от 1 до 9 :
1,2,3,4,5,6,7,8,9 . Тогда Х= (9+1)/2=5, S=(9x8xl0)/12=60.
Спирмен (Spearman,1904 ),используя ранги при психологических
исследованиях , построил коэффициент , который нашел широкое
использование в биологических исследованиях и носит название
автора -«коеффициент корреляции по Спирмену» и обозначется как
Rs .
В основу построения рангового коэффициента корреляции
положены закономерности , характерные для ряда чисел
натурального ряда Если исходить из закономерностей, положенных
в основу построения коэффициента корреляции Пирсона,
то следует вспомнить,что числитель коэффициента корреляции
Пиросона есть коварианса или варианса совместного вариирования
Двух переменных велечин,а знаменатель - корень квадратный из
произведения двух дисперсий этих величин . Дисперсии двух
ранжированных рядов одинаковы, так как это одни и те же числа
натурального ряда, расположенные в разном порядке по двум
коррелируемым рядам. Следовательно знаменатель рангового
коэффициента корреляции -это просто дисперсия чисел
натурального ряда,а числитель-квадрат различий между рангами,что
и является ковариансой т.е.:
53
R s
= l -
Здесь Z d-это коварианса двух ранжированных рядов чисел
п(п-1)(п+1)/12-это дисперсия чисел натур&тьного ряда.
(см.5.1 формула 3) Из формулы видно, что , если ранги двух Рял
полностью совпадают, то d равно нулю и коэффцц^03
корреляции равен + 1,0
1. Пример 5.2. В качестве примера используем данные , получении
К. Пирсоном при оценке рангового коэффициента корреляции в
Англии работники телеграфных станций должны были сдать 5
экзаменов: по арифметике, орфографии, географии, сочинению на
английском языке, чистописанию. Всего экзамену
подверглось 27 человек. К. Пирсон оценил величину рангового
коэффициента корреляции между знаниями арифметики и всеми
гуманитарными предметами. Уровень знаний по арифметике
был выражен в баллах от 1 до 300 , а знания по каждому из
гуманитарных предметов оценивались в баллах от 1 до 20(Х
Таким образом, по арифметике можно было набрать максимум
300 баллов, а по гуманитарным предметам суммарно можно
было набрать 1000 баллов. Эти данные были представлены
следующим образом:
Баллы по
арифметике
230
158
228
154
162
182
129
164
187
186
151
167
103
146
131
Ранг
I
9
2
10
8
5
14
7
3
4
11
6
20
12
13
Баллы по
гуманитарным
наукам
907
764
748
746
724
718
710
703
677
665
645
643
634
628
580
Ранг
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Разница
между
рангами,<1
0
7
1
6
3
1
7
1
6
6
0
6
7
2
2
54
15
18
22
16
17
19
21
25
26
27
23
24
561
560
532
529
526
515
484
463
444
386
369
288
16
17
18
19
20
21
22
23
24
25
26
27
1
1
4
3
3
2
1
2
2
2
3
3
0
п«
82
125
122
114
93
61
38
37
63
62
Используя выше приведенную формулу рангового коэффициента
корреляции можно получить:
Rs=l-6IcrVn(n-lXn+l)= 1-2292/19656= W), 1166=0,8834.
Следовательно , можно заключтъ,что лица, хорошо владеющие
арифметикой ,так же обладают хорошими знаниями и по
гуманитарным наукам. Если далее анализировать полученные
данные, то можно заметить, что ,начиная с ранга N 14, ранги по
двум рядам практически совпадают. Это наводит на мысль, что
половина всех участников экзаменов , владеющих гуманитарными
знаниями ниже среднего уровня , плохо знают и арифметику. По
первым 13-и рангам картина не столь удручающая и заметны более
значительные несоответствия в рангах, что скорее всего
свидетельствует о том,что лица из верхней части таблицы в целом
более способны к усвоению предметов, чем лица из нижней части
таблицы.
Если оценить отдельно коэффициенты корреляции у первых 13
и У 14-и последующих участников экзаменов, то соответственно Rs
бУДут равны 0,8264 и 0,1676 .Следовательно действительно
Участники экзаменов, занявшие места с 14 по 27-е по гуманитарным
предметам, плохо знают и арифметику.
55
§ 5.4. Регрессия
Коэффициент корреляции - параметр, оценивающий степень
сопряженной изменчивости двух переменных величин» измеренных у
каждой особи выборочной совокупности. Эта статистическая связь
может быть прямой (положительной) и принимать любые значения в
границах от 0 до +1,0 и обратной (отрицательной), т.е. принимать
любые значения от -1,0 до 0.
Однако, часто недостаточно знать величину статистической связи,
а необходимо оценить характер и величину изменения одного признака
(переменной) при изменении другого признака (переменной) на
единицу измерения. Например, насколько изменяется живая масса
животных (кг) при изменении роста на 1 см или насколько увеличится
урожайность растений при увеличении дозы удобрений на 1 гр (1 кг, 1
тонну) на единицу площади посева и др. Такой способ оценки
сопряженного варьирования признаков носит название регрессии, а
параметр, с помощью которого оценивается регрессия, называется
коэффициентом регрессии, &х=г,у—> ще Ьх - коэффициент
~у °у ~у
регрессии признака (переменной) х на признак (переменную) у.
Пример 5.2. Оценить насколько изменяется % белка (х) в молоке
коров при изменении % жира (у) на 1%. (Данные представлены в
примере 5.1.),
В примере 5.1. значение коэффициента корреляции было
оценено, равным +0,356, следовательно:
^=^— = +°,356. — = 0,25
% " °х 0,17
Это означает, что на каждый 1% увеличения % жира в молоке
содержание белка в молоке будет увеличиваться на 0,25%.
Регрессия может быть выражена графически путем построения
линии регрессии, используя уравнение вида: у = а + Ьх, ще
у - значение (для данного примера) % жира;
х - значение % белка;
Ь - коэффициент регрессии;
а - константа.
56
Для построения линии регрессии необходимо упорядочить
значения у (проранжировать) и отложить их на оси абсцисс в
определенном масштабе. Затем в определенном масштабе отложить на
оси ординат значения признака х. После этого точками на графике
отложить значения jc, соответствующим значениям у.
Значения %
белка,
М
3,4
3,3
3,2
3,1
3,0
-4-
3.6 3,7 3,8 3,9 4.0 4,1
Значения % жира в молоке, (у)
Линейное уравнение регрессии решается следующим образом.
Константа а определяется через средние значения признаков х и у (X
и F) и коэффициент регрессии Ь.
а = Х-Ь7 = \2- (3,8 • 0,25) = +2,25
Затем последовательно находим значения jc, для каждого значения >>,.
х} = а + byj = 2,25 + 0,25-3,6 = 3,15
х2 = 2,25 + 0,25-3,7 = 3,18
х3 = 2,25 + 0,25-3,8 = 3,20
х4 = 2,25 + 0,25-3,9 = 3,22
Х5 = 2,25 + 0,25-4,0 = 3,25
х6 = 2,25 + 0,25-4,1 = 3,28
Полученные значения х\ - хв наносим на соответствующей шкале
на график, точки соединяем одной линией. Эта линия будет
характеризовать взаимоотношения двух признаков.
Чем круче угол, образуемый прямой линии регрессии и осью
абсцисс, тем больше зависимость изменения признака х от изменения
признака у на единиц}' измерения.
57
ГЛАВА б
СРАВНЕНИЕ СТЕПЕНИ СООТВЕТСТВИЯ
ФАКТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ ТЕОРЕТИЧЕСКИМ
В биологии при изучении того или иного явления, например, в
генетических исследованиях при анализе характера фенотипического
расщепления в ¥2 в гибридологических экспериментах; при оценке
характера распределения (нормальное, биноминальное и др.),
исследователь a priori задается определенной гипотезой. Например, при
дигабридном скрещивании согласно закону Менделя, в F2
исследователь ожидает иметь соотношение фенотипов 9:3:3:1.
Измеряя какой-либо количественный признак, экспериментатор
ожидает, что выборочная совокупность отвечает закономерностям
нормального распределения, и по этой причине характеризует
распределение параметрами, свойственными этому распределению.
Однако, чаще всего в силу случайных причин между частотами,
которые имеют место в теоретических распределениях и
распределениях фактических, нет полного соответствия. Возникает
задача статистической оценки степени несоответствия между
теоретическим (гипотетическим) и фактическим (экспериментальным)
распределениями.
Эта статистическая оценка должна определить границу, когда
различия между распределениями следует считать случайными, а ковда
эти различия уже существенны и их нельзя относить к разряду
случайных или несущественных различий. В первом случае выдвинутая
гипотеза подтверждается, а во втором случае гипотеза отвергается.
В качестве критерия оценки соответствия теоретических и
эмпирических распределений мы рассмотрим критерий £ (греческая
буква хи), хотя имеются и другае критерии. Иноща этот критерий
называют критерием соответствия, но мы в дальнейшем будем
называть его критерием jf.
Если обозначить теоретические частоты через /г, а фактические
частоты через /^, то общий вид формулы критерия £ будет:
58
JT
Следует обратить внимание, что величина числителя в формуле
возрастает по мере увеличения расхождений между теоретическим и
фактическим распределениями.
Критерий £ нашел широкое применение для решения многих
задач, требующих подтверждения или опровержения гипотезы. Ниже
рассмотрим ряд таких задач.
§ 6.1.Анализ характера расщепления в гибридологических
опытах.
Метод £ активно используется в генетических экспериментах для
доказательства соответствия (несоответствия) теоретического
менделевского расщепления, расщеплению, полученному в конкретном
эксперименте. Рассмотрим решение такой задачи на конкретном
примере.
Пример 6.1. Изучался характер расщепления в F2 по окраске
цветка и форме листьев у примулы. Два признака контролируются
генами, находящимися в разных группах сцепления, т.е. при
независимом расщеплении в соответствии с законом Менделя в Fi
следует ожидать расщепление 9:3:3:1.
В гибридологическом опыте в F2 были получены следующие
данные. Из 617 растений, выращенных в F?, получено:
345 растений с белыми цветками и гладкими листьями;
90 растений с белыми цветками и сморщенными листьями;
142 растения с розовыми цветками и гладкими листьями;
40 растений с розовыми цветками и сморщенными листьями.
Из предыдущих опытов известно, что ген белой окраски цветков
(А) доминирует над розовой окраской цветков (а). Ген тладколистости
(#) доминирует над геном, контролирующим формирование
сморщенного листа (6). Таким образом, выраженные в генетических
символах экспериментальные данные имеют следующий вид:
59
/ф /Г
А- В--
А-ЬЬ -
аа В--
аа ЪЬ -
345
90
142
40
347,06
115,69
115,69
38,56
Пф = 617 rij = 617
В соответствии с гипотезой при дигибридном скрещивании в F2
должно быть расщепление 9:3:3: 1, т.е. всего 16 частей. Определим
сколько растений генотипа ааЬЪ из 617 растений должно было бы
быть, если бы данное фактическое расщепление отвечало бы
менделевскому расщеплению.
617
1 часть от 16 частей = — = 38,56, т.е. теоретически растений с
16
генотипом aabb в выборке должно быть не 40 растений, а 38,56. Долее
для генотипов А - Я- -теоретическое значение должно быть равно:
9-38,56 = 347,06; для генотипа А - bb - 3-38,56 = 115,69; для генотипа
Я- аа -3-38,56= 115,69.
Если сложить новые (теоретические частоты), то получим:
38,56 + 347,06 + 115,69 + 115,69 = 617.
Таким образом, расчет теоретических частот состоит в том, что 617
растений были перераспределены по 4-м классам генотипов так, как
они должны бы были быть, если бы теоретическое и фактическое
распределения полностью совпадали. Подставим полученные значения в
формулу:
Хф
= у(/ф~/тУ ^ (345 - 347,0б)2 | (90-115,69)2 |
^ /т 347,06 ~+ 115,69
(142-115,69)2 (40-38,56)" ЛЛ1 с ^ е по лм ллпл
+ ^ !__L. + v i„_L_ _ ooi + 5,70 + 5,98 + 0,05 = 11,74.
115,69 38,56
Теоретические частоты рассчитывались от 617, всего было 4 класса
генотипов, следовательно, число степеней свободы, на которые следует
ориентироваться в таблице IV (приложений) равно: df = число
расщепляющихся классов -1=4-1=3.
60
В таблице IV находим, что числу степеней свободы, равному 3,
соответствуют стандартные значения xl Для уровня значимости р =
0,05, xl = 7,81; для уровня значимости р = 0,01, xl = П,34.
Напомним, что нулевая гипотеза, Но, сформулирована так:
предположим, что между частотами теоретического и фактического
расщепления отличия отсутствуют. Такая гипотеза будет принята, если.
фактическое значение xl будет иметь значение ниже xl ( в таблице
IV приложении), ниже 7,81. Так как в примере х\ = 11,74, то Щ
следует отвергнуть, т.е. между теоретическим расщеплением и
фактическим расщеплением различия таковы, что их нельзя признать
случайными, а следует считать существенными, т.е. не отвечающими
менделевскому расщеплению 9:3:3:1.
§6.2. Сравнение фактических вариационных рядов
с теоретическими, вычисленными в соответствии
с закономерностями нормального распределения.
Когда полученные экспериментальные данные организованы в
вариационный ряд, в ряде случаев возникает необходимость выяснить,
распределены ли частоты вариационного ряда в соответствии с
закономерностями нормального распределения или нет?
Пример 6.2. Оценивается характер распределения удоя 300 коров.
Оценим параметры вариационного ряда.
;? = л + 2^.* = 45+±1°?.5 = 46)8ц,
м 300
Т*'Ы
П
s 14827,5
п-\ 299
а = ^ = v'49,59 = 7,04 Ц.
• к1 = (632 - 38,9). 25 = 14827,5,
49,59,
61
Таблица 10. Оценка характера распределения удоя за лактацию 300
коров. Данные сгруппированы в вариационный ряд.
\Xi
30
35
40
45
50
55
60
65
/♦
5
20
55
92
61
48
15
4
71=
=300
а
1-3
-2
-1
0
+1
+2
+3
+4
\fa
-15
-40
-55
0
+61
+96
+45
+16
#а=
=108
к
9
4
1
0
1
4
9
16
W
45
80
55
0
61
192
135
64
=632
[71^*
1 а
-2,39
-1,68
-0,96
-0,25
0,45
1,16
1,87
2,58
\ло
0,02294
0,09728
0,25164
0,38667
0,36053
0,20357
0,06943
0,01431
J г -
4,89
20,73
53,62
82,39
76,82
43,37
14,79
3,05
W^
5
21
54
82
77
43
15 I
3
п= i
=300
Далее необходимо оценить теоретические частоты вариационного
ряда, т.е. л = 300 перераспределить по классам вариационного ряда так,
как они должны бы были быть, если бы распределение отвечало
закономерностям нормального распределения.
Для этого воспользуемся нормированным отклонением и
высчитаем нормированное отклонение для каждого класса
вариационного ряда или для каждой строки вариационного ряда по
х -X
формуле: / = — .
а
Например, для первой строки вариационного ряда значение t
оценивается следующим образом: t = -* = —~—- = -2,39, и таким же
а 7,04
образом для всех классов. Затем в таблице I (приложения), в которой
приводятся данные первой функции нормированного отклонения
1 --
/(')= ~т= •* 2 находим значение вероятности г для каждой строки.
Затем вероятности необходимо перевести в численности путем
62
Уложения вероятности на общую численность выборки. Однако, если
классовый промежуток не совпадает со значением сг, тоща f'(t) следует
пк 300-5 Л,„Л„ т>
умножить на выправленное число — = = 213,07. В результате
получается ряд чисел, которые будут являться теоретическими
частотами вариационного ряда, т.е. п = 300 перераспределено по
классам вариационного ряда так, как они должны быть, если бы
вариационный ряд отвечал закономерностям нормального
распределения. Дробные числа можно округлить и получить целые
числа теоретических частот, но можно и не округлять, а рассчитывать
£ с дробными значениями /т.
Теперь можно оценить соответствие частот /ф с частотами /т
через оценку критерия я2.
2л _yk-/J _(5-5Г , (20-21? (55-54? (92-82?
Хф ^ fT 5 21 54 82
| (61-77? ^48-43? |QS-lsy| (4-ЗУ_
77 43 15 3
= 0 + 0,05 + 0,02 +1,22 + 3,32 + 0,58 + 0 + 0,33 = 5,52.
Степени свободы в задаче по проверке нормальности
распределения оцениваются так: от числа классов вариационного ряда
необходимо вычесть три: df = г - 3, где г - число классов
вариационного ряда, т.е. 8 - 3 =5. Тройка вычитается потому, что в
оценке /т принимали участие три параметра nj(9a. Таким образом,
*ф = 5,52. Сравним значение х\ °о стандартным значением xl в
таблице IV (приложение) при df = 5. ^ = 11,1 для р = 0,05;
xl = 15,1 для р = 0,01.
Поскольку xl = 5,52 меньше табличного значения 11,1,
отвечающего уровню значимости 0,05, то нулевая гипотеза, ##,
сохраняется, т.е. некоторое несоответствие /ф и /т следует отнести к
случайному (несущественному), а распределение частот в вариационном
Ряду считать отвечающим закономерностям нормального распределения.
63
§ 6.3. Опенка соответствия распределений двух эмпирических
совокупностей.
Иногда в исследованиях возникает необходимость провести
сравнительный анализ характера распределения частот, а не
параметров, двух эмпирических распределений. Тоща, если
численность двух распределений одинакова, формула £ для такого
случая есть:
/+Л
Пример 6.3. Оценивается соответствие 2-х распределений.
Анализируется характер распределения по удою коров за лактацию в
двух стадах, имеется 2 вариационных ряда:
х'
| 30
1 35
40
45
1 50
1 55
60
65
1 Л
5
20
55
92
61
48
15
4
п = 300
1 Л "1
10
35
95
82 1
43
20
12
3
п = 300 1
«(Л-ЛГ =(5-">У , (20-35)2 { (55-95)' ( (92-82)* ( (61-43)2 ,
15
55
150
174
104
/.+/1
+ (48-20)2 ( (15-12)2 t(4-3)2^
68 27 7
= 1,67 + 4,09 +10,67 + 0,57 + 3,11 +11,53 + 0,33 + 0,14 = 32,11,
df = 8-1=7, т.к. единственным общим элементом двух рядов
является одинаковое число классов. В таблице IV (приложения) х\ дл*
d/=7, есть: 14,1 для р = 0,05; 18,5 для /? = 0,01;
Но - отвергается.
64
Следовательно, в вариационных рядах представлены два
существенно разных распределения.
В том случае, коща численности двух распределений различны в
формуле £, должен быть учтен как бы "вес" каждой частоты.
Пример 6.4. Анализируется характер распределения удоя коров за
лактацию в двух стадах. Имеется 2 вариационных ряда: п\ = 48,
„2 = 71:
Таблица 11. Сравнение двух фактических распределений с разными
численностями.
Ui
Гзо
35
40
[45
50
55
60
1/7
3
5
10
15
7
5
3 |
л/ = 48
/2
5
10
17
25
7
4
3
п2 = 71
/7«2
1213
355
710
1065
497
355
213
f2nj
240
480
816
1200
336
192
144
d
27
125
106 1
135 !
161 j
163
69
Формула £ для такого случая выглядит следующим образом:
^=yMj«AL_L = 9l,i2 + 1041,67 + 416,15 + 455,62 +
/|+/2 "l«2
+ 1851,5 + 2952,11 + 793,5 = 7601,67 • -i- = 2,23.
3408
xl для df= 7-1=6; 12,6 для р = 0,05;
16,8 для р = 0,01.
Следовательно, Но сохраняется 9 в примере 6.4, представлено два
одинаковых распределения.
65
§ 6.4. Анализ распрепелений. сгруппированных
в 4-х-польные таблицы.
В ряде случаев при анализе биологического или медицинского
материала представляется более удобным сгруппировать данные в
таблицы, 2-х (нескольких) строк и 2-х (нескольких) столбцов. Такие
таблицы получили название 4-х, 6-ти, 9-ти и т.д. -польных таблиц.
Чаще всего такие задачи возникают при попытке выявить влияние на
признак того или иного фактора, введенного в эксперимент:
результативность применения того или иного медицинского препарата
при лечении больных, влияние на урожайность культур тех или иных
удобрений и др. При этом нулевая гипотеза. Но, по-прежнему
предусматривает отсутствие значимого влияния изучаемого фактора на
признак. Рассмотрим следующий пример.
Пример 6.5. Изучали частоту возникновения Транспозиций мобильного
генетического элемента Dm 412 у дрозофилы после ^-облучения дозой
1300 р. Сравнивались числа сайтов локализации Dm 412 на
политенных хромосомах до и после ^облучения. Получены следующие
данные:
I Контроль (до облучения)
1 Всего просмотрено ядер, гц = 100,
1 из них 5 ядер имели
дополнительные сайты внедрения
Dm 412 по сравнению с
предыдущим анализом.
Опыт (после ^-облучения)
Всего просмотрено ядер, П2 = 250,
из них 85 ядер имели
дополнительные сайты внедрения
Dm 412.
66
Таблица 12. Проверка влияния ^облучения на транспозиционную
активность МГЭ Dm 412.
1 Гпуппы
L- » *—
(До облучения
[После
[^-облучения
Всего
Число ядер
Число ядер с
транспозициями
5
С 643
85
90
Число ядер без
транспозиций
.-Л
^ 74,3
95
£ 185,7
165
260 !
Всего
100
250
п = 350 1
В клетках таблицы 12 помещены фактические частоты,
полученные в опыте и контроле. Задача состоит в том, чтобы сравнить
эти фактические частоты с теоретическими частотами, но какими?
Если нулевая гипотеза, Но, верна, т.е., если влияние фактора
отсутствует, то распределение частот в клетках должно быть
пропорциональным числам объема совокупностей опыта и контроля,
т.е. цифры в клетках должны быть распределены пропорционально
объемам совокупностей без перевеса каких-либо одних клеток над
другими.
Рассчитаем теоретические частоты, исходя из следующих
аргументов. Из 350 ядер в 90 ядрах обнаружены транспозиции, а
сколько транспозиций должно было бы быть в 100 ядрах, если бы
фактор не влиял? Т.е.
90 х 90100 ^сп
: , х = = 25,7,
350 100 350
т-е. если события случайны, то транспозиций в ядрах без облучения
Должно быть 25,7. Все теоретические частоты впишем в уголках
каждой клетки.
67
Далее:
сколько в контроле должно быть ядер с транспозициями после у-
облучения?:
90 х 90-250 _,
; ; х- =64,3.
350 250 350
Число ожидаемых ядер без транспозиций в контроле:
260 х 260100 _,
: —; х = = 74,3.
350 100 350
Число ожидаемых ядер без транспозиций после /-облучения:
260;JL ,= 260^50
350 250 350
Суммируем полученные теоретические частоты: 25,7 + 64,3 + 74,3 +
185,7 = 350, т.е, если влияние ^облучения отсутсгвует или если оно
незначительно, то частоты должны быть такими, какими они получены
при решении пропорций.
Далее следует использовать £ для оценки существенности или
несущественности отличий фактических частот от теоретических путем
сопоставления fy п/ф в каждой клетке:
2 (5-25,7)2 (95-74,3)2 (85-64,3)2 (165-185/7)2 ^„ со £Щ ^ 0 _г
у* -\ l_Z_ + \ L_'_+b >_/_ + v >_./_ =16,7 + 5,8 + 6,7 + 2,3 = 31,5
25,7 74,3 64,3 185,7
Число степеней свободы в 4-х -польной таблице оценивается как
число строк минус I умноженное на число столбцов минус 1. т.е.
df= (строки - 1)(столбцы - 1) = (2 - 1)(2 - 1) = 1.
В таблице IV (приложений) xl ПРИ df=\, есть:
для р = 0,05 - 3,8
для р = 0,01 - 6,6.
Таким образом, Но отвергается, ^облучение существенно
увеличивает транспозиционную активность мобильного генетического
элемента Dm 412.
68
Четырехпольные таблицы можно обработать и более простым
способом. Так, если обозначить клетки четырехпольной таблицы
буквами латинского алфавита, как показано в таблице 13, то формулу
£ можно записать в следующем вцде.
Таблица 13. Анализ 4-х -польной таблицы в общем виде.
[группы
[До облучения
После
i ^облучения
Ядра с
транспозициями
5 (а)
85 (с)
(а + с)
Ядра без
транспозиций
95 (Ь)
165 (d)
Ф + d)
Всего
(а + Ь)
(с+ 4)
п 1
х2 =
{ad-bcfn _(825-8075У-350_ 72502-350
= 31,45,
{a+c)ip+d\a + b)i£ + dy 90-260-100-250 ~ 90-260-100-250
т.е. получен тот же результат, что и при оценке теоретических частот
через пропорции. Кроме того, когда численности маленькие и в
клетках резкие колебания численностей, следует в формуле £ для 4-х
-польных таблиц учитывать поправку Иейтса. Тогда формула £ имеет
вид:
\ad-bd—
|825-8075(- —
J I 2
•350
70752-350
(a + b\b+d)ia+b)ic+d)~ 90-260-100-250 90-260-100-250
= 29,9.
Прямые скобки \ad - bc\ указывают, что разность берется без учета
знака. Нулевая гипотеза по-прежнему отвергается: у-облучение -
фактор, увеличивающий транспозиционную активность МГЭ Dm 412.
По такому же принципу могут быть организованы и другие виды
польных таблиц 2 х 3; 3 х 3; 4 х 4 и другое.
69
ГЛАВА 7
ПИСПЕРСИОННЫЙ АНАЛИЗ
В предыдущих главах неоднократно подчеркивалось, что
биологические объекты в своем формировании и развитии в сильной
степени зависят от внутренних и внешних факторов. Все внутренние
факторы в своем действии и взаимодействии создают разнообразные
интегрированные генетические системы, а во взаимодействии с
внешней средой создается громадный разнообразный биологический
мир. В исследовательской работе часто возникает потребность в оценке
влияния тех или иных факторов на анализируемый признак или
признаки.
Несмотря на то, что определяющим условием проведения любого
эксперимента является создание максимально выравненных условий для
всех участников опыта, тем не менее случайные колебания имеют
место, и поэтому всегда многочисленные случайные факторы не могут
быть учтены в эксперименте и не могут быть нивелированы. Однако,
используя специальные методы статистического анализа, можно
оценить вклад случайных факторов в признак*
С другой стороны, исследователь специально подвергает объекты
какому-то воздействию, влияние которого он хочет оценить. Тогда
возникает специальная задача по выяснению роли и величины влияния
этого фактора на признак или объект в целом.
Для решения такого рода задач английским математиком и
биологом Робертом Фишером (R.Fisher) был разработан специальный
раздел биологической статистики, названный автором Analysis of
variance - анализ вариансы. В русском переводе этот раздел
статистики известен как дисперсионный анализ. В нашей стране
самой основательной и капитальной книгой является переводная
монография Шеффе Г. Дисперсионный анализ, 1963, требующая от
читателя хорошей математической подготовки. Однако некоторые
главы дисперсионного анализа, специально адаптированные для
биологов, имеются практически во всех учебниках по биологической
статистике.
70
§ 7.1. Общие принципы дисперсионного анализа.
Если организуется специальный эксперимент, в котором ставится
задача по оценке величины вклада того или иного организованного
фактора в анализируемый признак, то кроме действия этого фактора
всегда на признак оказывают влияние неорганизованные факторы или
случайные факторы. В таком случае каждая единица совокупности,
имея конкретное и только для нее характерное значение признака (хф,
будет отклоняться от среднего значения этой совокупности ( X или ju)
на величину вклада изучаемого (организованного) фактора и на
величину вклада неорганизованных (случайных) факторов. Сказанное
выше может быть записано как:
xij = {i±Ai±eiJf ще
Хц - значение признака;
ft - среднее значение для совокупности;
Ai - доля отклонений от //, связанная с действием
организованного фактора;
е^ - отклонения, связанные с действием случайных факторов.
Если исследователь ставит своей целью изучить влияние не
одного организованного фактора, а двух, трех и более факторов, тогаа
анализ усложняется по мере увеличения числа изучаемых факторов.
Например, для изучения 2-х факторов модель будет иметь вид:
xijk = /J ± Aft Bj ± (At x Bj) ± eijk,
rae xijk - анализируемый признак;
// - среднее значение;
Ai - отклонения, связанные с действием фактора А;
Bj - отклонения, связанные с действием фактора В;
(Ai х Bj) -отклонения, связанные с наличием взаимодействия
между факторами А и В;
etjk -случайные отклонения.
Для анализа 3-х факторов строится еще более сложная модель, а
именно:
хт = М ± At ± Bj ±Ск± (Ai х Bj) ± (Bj х Ск) ± (Ai x Ск) ±
± (Ai х Bj х С*) + еды гае
Xijkt -анализируемый признак;
71
// - среднее значение;
Аь Bj% Ck -факторы;
- взаимодействия факторов;
(*, *cj
€ijkt - случайные факторы.
Приведенную схему, относящуюся к опенке отклонений по
одному измеренному признаку, можно перенести на анализ вариации
многих изменений и выразить все в вариансах(о2) как:
2 _ 2 .2
^общая ° фахториалуиы "*" ^ст>-чЛ^«ая ,
При изучении влияния фактора чаще всего исследователь вводит
в эксперимент как бы различные "дозы" фактора. Например, изучаются
различные дозы удобрений на урожайность каких-либо культур,
различные дозы лекарств на ликвидацию заболевания, различные дозы
^облучения на активность транспозиций мобильных генетических
элементов, доля генетического разнообразия в фенотипическом
разнообразии признака. Другими словами, организованный фактор
представлен не одним значением, а несколькими значениями
(градациями).
Градации фактора в одних случаях могут быть точно установлены
(фиксированы), например, когаа изучается влияние сезонов года на
формирование признака, доз удобрения на урожайность, генетические
различия по конкретному признаку между несколькими линиями,
породами, сортами и др. Но иногда в эксперименте различия между
градациями не имеют четких границ (не фиксируются), например, при
изучении генетического разнообразия в популяции, когда берется
случайная выборка генотипов из популяции и устанавливается степень
различий между индивидами, возникающая по генетическим причинам.
В первом случае схема дисперсного комплекса будет называться
фиксированной одно-, двух-, трехфакторной и т.д., во втором случае
также одно-, двух-, трехфакторный и т.д., но случайной моделью
дисперсионного комплекса. Практически при организации этих двух
моделей дисперсного комплекса различий нет, различия появляются
при проведении анализа и интерпретации полученных в анализах
данных.
72
Ниже приведем схему организации одкофакторного
дисперсионного комплекса в общем виде. Пусть имеется i генотипов, у
каждого их которых имеются j потомков, тоща такие данные,
сведенные в таблицу 14, имеют вид:
Таблица 14. Организация однофакторного дисперсионного комплекса.
Ггъадации
— —
1 Признак
гг
пг
\ъ
Г;
7
1
XJ1
Х12
XJ3
;
хп
х* !
2
Х21
Х22
Х23
•
X2i
Xi
3
Х31
Х32
хзз
:
ХЦ
Хъ
...
.,,
...
...
...
...
...
/ |
ХЦ
Xi2
Xi3 1
• 1
хи I
Х* fXoSil
При организации материала в таком виде, как представлено в
таблице 14, видно, что различия между градациями зависят от того,
насколько различны средние значения по градациям (ЛЧЛ'гДз,...Д.).
Дисперсия межгрупповых различий (5лг) есть:
^мг^п^{х,-1Гобщ)\ ще
SMi - дисперсия межгрупловых (межградационных) или
факториальных различий;
Xi - средние значения признака по отдельным градациям;
Хобщ - среднее значение признака в целом по комплексу;
щ - число измерений в отдельной градации.
Дисперсию, оценивающую случайные влияния (5ГЛ), можно
оценить следующим образом. Если X, - есть характеристики градации,
то разнообразие внутри градации можно отнести к категории
случайных колебаний, и тоща:
Ху - значение отдельного измерения признака;
Х{ - среднее значение признака в градации.
Общую дисперсию оцениваем как:
s<*, = E Axv -Xo**)- Тоща Бобщ = Бмг + 50.
73
Рассмотрим конкретный пример.
Пример 7.1. Оценивается генетическое разнообразие по
плодовитости самок-норок стандартного генотипа по 3-м пометам у
каждой самки. Самки выбраны из популяции случайно.
Таблица 15. Однофакторный дисперсионный комплекс (случайная
модель)
Самки
1 Пометы
№ 1
№2
№3
Ш
1 *'
2л
2Х
LE*2 1
п
\
№1
[№2
[№3
Число Щенк<>в в помете
2
3
4
3
3
9
29
27
4
5
6
3
5
15
77
75
3
4
5
3
4
12
50
48 j
Число градаций, г = 3
ЛГ = 2л, = 9
X,*, =4 |
22л,- = 36
II*.2 =156
2я = 150
g-fe2>y ."1-144
ЛГ 9 |
Подставляя значения лт/, Xt и Л^ из таблицы 15 в формулы
получим:
^4з-2)2+(3-3)Ч(4-3)2]44-5)Ч(5-5)Ч(б-5)2]+
+ ^3-4)2+(4-4)2+(5~4)2]=6
^=(2-4)Ч(3-4)Ч(4-4)Ч(4-4)Ч(5-4)2ч-(б~4)2-ь(3-4)Ч
+ (4-4)2+(5-4)2 =4 + 1 + 1 + 4 + 1 + 1 = 12.
Следовательно, £0<ty = SM2 + 5сл = 6 + 6 = 12. Таким образом,
общая изменчивость по плодовитости, 50^, разложена на два
слагаемых:
1. SMe = 6, зависит от того, что между самками имеются различия по
плодовитости, определяемые средними значениями по 3-м пометам.
74
2 Sen = 6, определяемая тем, что между пометами отдельных самок
были обнаружены различия по числу щенков. Если воспользоваться
выражением дисперсии, представленным в главе 2, т.е.
S = £(*, - хУ = ]£ х] - ^^--, то оценка параметров в дисперсионном
комплексе может быть представлена в таблице 16.
Далее, основываясь на данных таблицы 15, произведем анализ
однофакторного дисперсионного комплекса по схеме случайной
модели. Анализ представлен в таблице 16.
Таблица 16. Анализ однофакторного равномерного дисперсионного
комплекса (случайная модель), оценивающего генетическое
разнообразие по числу щенков в помете норок.
Источник
1 изменчивости
Между
градациями
Случайный
Общий
Сумма квадратов
отклонений,S
=150-144=6
= 156-150 = 6
= 156-144=12
Степени
свободы, df
г-1=3-1=2
W-r=9-3 =6
N- 1 =9-1 =8
Средний
квадрат, ms
m-Bki'3 \
ш"" = лЬ = '
F = ^=3,0 1
mScn
Источник
изменчивости
Между
1 градациями
1
L
Случайный
| Строение
среднего
квадрата
2
ms. *0\,
Факториальная
варианса
_2 Л**,,,-/!!*,,,
Ч
= 1--1 = 0,67
3
<=1
Коэффициент
внутриклассовой
1 корреляции, rw I
1 <
^ М? ^ СЛ
0,67 „ ,Л
= —- = 0,40
1,67
< !
"«г va J
= -1- = 0,60
1,67 |
75
^ = 2] F„ 5,1 - P > 0,95
df2 = 6 Г 10,9 -/>>0,99
J 27,0 -P> 0,999
Таким образом, по результатам анализа однофакторного
дисперсного комплекса получено, что между самками 40% различий
следует отнести к факториальным различиям или, в данном примере, к
генетическим различиям, а 60% составляют различия случайные или
любые другие неучтенные факторы.
Достоверность внутриклассового коэффициента корреляции или
достоверность отличия межгруппового среднего квадрата над случайным
средним квадратом оценивается через критерий Фишера, F- ——. Если
msc*
межгрупповой средний квадрат больше случайного среднего квадрата на
величину большую первого табличного значения при данных степенях
свободы (dfj - степень свободы при межгрупповом среднем квадрате, а
dfi - при внутригрупповом среднем квадрате), то такие отличия
считаются достоверными. В нашем примере dfj = 2, dfi = 6. В таблице
V (приложения) F5t 5,1 для Р = =0,95; 10,9 для Р = 0,99; 27,0 для
Р = 0,999.
Другими словами, в примере 7.1 шмг недостоверен. Причина
такого положения заключена в малом числе данных, включенных в
дисперсионный анализ.
Кроме того, в дисперсионном анализе можно, используя F-
критерий, получить оценку достоверности различий любого среднего
значения с любыми другими средними значениями. Например, сравним
Xi = 3 шт. с Х2 = 5 шт. Тогда:
р_$Х,-ХгУ пхп2 J3-5)2 3-3=бД).
msc, и, +п2 1 3 + 3
В таблице V (приложения) для:
76
#/ = 1
#2 = 6
• Fst
6,0 - P - 0,95
13,4 - P = 0,99
35,5 - P = 0,999
Следовательно, два средних значения Zi = 3 шт. и Х2 = 5 шт.
различаются достоверно с вероятностью, Р = 0,95.
При сравнении 2-х средних значений dfj всегда равны 1, a 4fr
равны значению степеней свободы, на основе которых был оценен msc.v
§ 7.2. Двухфакторный дисперсионный комплекс.
Задачи, в которых необходимо выяснить влияние 2-х
организованных факторов, предусматривают использование моделей 2-х
факторных дисперсионных комплексов:
Xijk = fi + Ai Щ +(At x Bj)+eijk.
Пример 7.2. Изучается влияние 2-х различных доз удобрения (В)
на урожайность 3-х сортов риса (А) по результатам нескольких
испытаний.
77
Таблица 17. Организация двухфакторного дисперсионного комплекса
(фиксированная модель).
Опыты
№1
№2
№3
N«4
№5
№6
Iя'
2>.
I*,'
х~
\ А,
1 В!
35
33
31
32
34
5
165
5455
5445
33
в2
37
36
35
36
4
144
5186
5184
36
А2
1 Bi
35
37
38
39
,36..
37
6
222
8224
8214
37
В2
40
41
i 42
41
43
5
207
8575
8569,8
41,4 |
1 Аз
1 Bi
31
34
35
32
35
5
167
5591
5577,8
33,4
в2
40
38
39
40
38
5
195
7609
7605
39
1 а=ПГ]
Ь = 2 ■
1 '*""'
N = 30 1
Ц',= ПО01
££Х =40б40|
2]А = 40595,6
Я = 40333,3 1
Сначала двухфакторный дисперсионный комплекс
обрабатывается также как однофакторнын (как в таблице 15), а далее
проводится анализ по фактору Л и по фактору В:
| Фактор А
[А/
\а2
\А3
| Фактор В
[В!
в2
Wa
9
11
10
пв
16
14
rs;
309
429
362
2лв
554
546
\hA
!10609
16731
13104,4
ZhA = 40444,4
ttB
19182,25
21294,0
3tB = 40476,25
X, ц/га j
34,3 _j
39,0 I
36,2 П
Я, ц/га
ГН6 ^J
39,0 J
J
78
достоверность различий между средними значениями:
4Г| = 1 I
т = 24
FSt 4,3- Р = 0,95
1 7,8- Р = 0,99
14,0-Р =0,999
^-,,=22,2-
^-5, =31,6"*
Таблица 18. Анализ двухфакторного дисперсного неравномерного
комплекса (фиксированная модель).
[Источник
[изменчивости
| Между
сортами риса
\(А)
[Между дозами
| удобрения (В)
Взаимодейств
| не факторов
\АхВ
Случайный
Общий
Сумма квадратов
отклонений, S
! 40444,4-40333,3=
=111,1
SB=BiB-H=
40476,25-40333,3=
=142,95
SAB^Bl'HHBlA'Hh
-(2fo-W=8,25
40640-40595,6 = 44,4
40640-40333,3 = 306,7
Степени
свободы, df
я-1=3-1=2
Ы=2-1=1
<a-l)(b-l)=
2x1=2
ЛГ-д6=30-6=24
ЛМ=30-1=29
Средний
квадрат, ms
\msA = £l = 55,55
1
! msn = -2- = 142,95
* 1
>ws^=^- = 4,12
"* 2
ms =^- = 1,85
- 24
_ л», _ 55,55 J
4 " mSai "" 1,85 1
= 30,03*-
#,=1
#=24
1 ^я 4,3
7,8
14,0
F «b.s 142A5 = 77,27"
* /ns„ 1,85
79
Fst 3,4
^=21 5,6 /г^=^-=_4Л.2 =
d/2=24j AB »**„ 1,85
9,3
В таблице: * - P > 0,95;** - P > 0,99; *** - P > 0,999.
Фиксированная модель дисперсионного комплекса позволяет
произвести оценку средних квадратов и определить достоверность или
недостоверность факториальных средних квадратов, а также оценить
достоверность различий любых интересующих экспериментатора
средних значений. Коэффициент внутриклассовой корреляции в такой
модели оценить не представляется возможным, т.к. градации комплекса
не случайны, а фиксированы.
Обращаясь к результатам оценки, осуществленной в примере 7.2,
можно сделать вывод о том, что 3 сорта риса остаются различными по
урожайности при любой дозе удобрения, но дозы удобрения имеют
неодинаковый эффект на урожай. Как показывают оценки средних
значений, доза удобрения #2 достоверно повышает урожай по
сравнению с дозой В\ на 4,4 ц/га в среднем по 3-ем сортам риса.
Средний квадрат, оценивающий взаимодействие "сорт х доза" очень
низкий и недостоверный, что свидетельствует об аддитивном характере
действия доз удобрения на урожайность трех сортов риса.
§ 7.3. Иерархическая модель двухфакторного дисперсионного
комплекса.
Как видно из § 7.2 9 при оценке влияния 2-х организованных
факторов на признак, экспериментальный материал обрабатывается с
использованием двухфакторной модели дисперсного комплекса. При
этом следует заметить, что число градаций 1-го порядка (А) может быть
любым числом, число градаций П-го порядка (В) также может быть
любым, но строго одинаковым внутри всех градаций (А). Такое правило
должно строго соблюдаться, т.к. все номера градации (В)
сопоставляются друг с другом по всем номерам градации (А), как
показано в примере 7.2. Кроме того, если градации (А) могут быть
выбраны случайно, то градации (В) всегда фиксированы. Более того,
если внутри одной градации (А) по каким-либо причинам выпадает
80*
одна градация (В), то по другим градациям (Л) необходимо исключить
по одной градации (#). Однако выбор градации для исключения не так
просто решить. И, наконец, часто необходимо для анализа, например,
генетического разнообразия в популяции иметь модель со случайными
градациями 1-го и П-го порядка. В таком случае используется, так
называемая, иерархическая модель дисперсного комплекса.
xijk = // + Ai Щ + eijky где:
Хук - признак;
ц - среднее значение;
At - отклонения по фактору А;
By - отклонения по фактору А внутри фактора В;
ецк - случайные отклонения.
Пример 7.3. Оценивается генетическое разнообразие по отцам и
матерям по % жира в молоке коров.
Таблица 19. Двухфакторный иерархический дисперсионный комплекс.
Градации (А) - отцы, градации (В) - матери, анализируемый признак -
% жира в молоке дочерей.
% жира
[дочерей
bi
L№2
fe
&4
5s
Ul
Гл
\TJf
ClJ
1 A1
\Bi
3,5
3,6
3,4
3,6
4
14,1
49.73
49,70
1*
3,7
3,6
3,5
3,6
4
14,4
51,86
51,84
\В3
\3JS
3,7
3,8
3,9
3,8
5
18,7
70,03
69,94
пШ |
pb
Г7
3,7
3,6
3,5
3
10,8
38,9
38,88
L&_
I 4,0
4,1
'4,2
3,9
3,8
5
20,0
80,1
80,0
m(A2)_ \
ТдГ
U_
1 3,8 '
3,9
4,0
3 |
11.7
45,65
45,63
\в2
Rj
[4,2
4,3
4,0
4
16,6
68,94
68,89
пШ 1
Гз5
Ub=7
#=28
XS^ =106,3
ZZ^-405-21
2fc=404,88
#=403,56 1
81
\а,
\а2
Аз
ПЦА)
13
8
7
2лш
47,2
30,8
28,3
hfA>
171,37
118,58
114,41
27»л=404,36
Как видно, фадации второго порядка (В) оцениваются только
внутри своих градаций (Л) и не сопоставляются друг с другом по
различным градациям (Л).
Схема выглядит как дерево:
А1 4.2 di
В j Bi В3 Bj В2 Bj В2
В дереве нижний ярус градаций рассматривается только внутри
градаций верхнего яруса.
При такой схеме дисперсионного комплекса невозможно оценить
взаимодействие факторов, и, если в эксперименте необходимо иметь
информацию о взаимодействии факторов (например, необходимо знать
влияние сочетаемости родителей на продуктивность потомства), то
иерархическая модель не может дать такую информацию.
Таблица 20. Анализ 2-х факторного иерархического дисперсионного
комплекса. Оценка генетического разнообразия отцов (Л) и матерей (В)
по % жира в молоке дочерей.
Источник
изменчивости
Сумма квадратов,
S
Степени
свободы,
4L
Средний квадрат, ms
Между
отцами (А)
2ЙЛ-Я=404,36-
-403,56=0,80
а-1=
=3-1=2
mS(A) =
SA 0,80
а-1 2
= 0,40
Между матеря
ми (В) внутри
отцов (А)
2й-2йд=404,88-
-404,36=0,52
2Ь-д=
=7-3=4
{в) %Ь-а 4
Случайный
I2X-I*-
= 405,21-404,88 = 0,33
28-7=21
S- :М3 =001б|
ЛГ-£* 21
82
Гобпшй ]
= 405,21-403,56 = 1,65
28-1=27
[Источник
изменчивости
(Между отцами
\(Л)
Между матерями
(В) внутри отцов
(А)
Случайный
Общий
Строение
среднего
квадрата
т&^По&н+сг^
ms^cr,-,
Факториальная
варианса, о2
а2 _mSA ~mSB _
А (пт\ "
= 0,030
2 Шв -/?!$„,
ав
"о
= 0,029
о\,= 0,016 |
Коэффициент
внутриклассовой
корреляции, rw
г - "' J
1 =« = 0,400
1 0,075
г - °>
= « = 0,387
0,075
г - °" \
= « = 0,213
0,075
Лп =
2>-i
1
#•
Z"w^
JV
а-1
2 N
Z<0
<Я=2
#=21
Fs,
3,5*
5,8*
9,8*
= lf28-l^l = 3,98
б{ 28 J
= lf28-^U,96
2^ 28 J
df,=4
^2=2lJ
•
Fs,
2,8
4,4"
7,0'
83
F(„ = ^ = 3,l; FiB) = "sJL=sr
Таким образом, показано, что влияние отцов на генетическое
разнообразие %жира дочерей составляет 40,0% (не достоверно), а
влияние матерей внутри отцов, представляющее собой генетическое
разнообразие в широком смысле, равно J8,7% (достоверно при Р >
0,999). Случайные отклонения составляют 21,3%.
ГЛАВА 8
СТАТИСТИЧЕСКИЙ АНАЛИЗ КАЧЕСТВЕННЫХ
(АЛЬТЕРНАТИВНЫХ) ПРИЗНАКОВ
§ 8.1. Опенка X.a.sj, при альтернативной вариации.
В главе 1 была приведена классификация признаков,
встречающихся у биологических объектов: качественные, дискретные
количественные, непрерывные количественные признаки. В главах 1-7
оценивались параметры ?,а,^,/,г^ и дисперсионный анализ
количественных признаков. В этой главе мы продемонстрируем методы,
позволяющие оценить все эти параметры для качественных признаков
или, другими словами, для признаков с альтернативной вариацией.
Наиболее простым случаем качественной вариации является
альтернативная вариация, коща анализируемая совокупность
представлена двумя группами: группа, имеющая данный признак и
группа, не имеющая данный признак (черный - красный; альбинос -
нормальный; белые цветки - розовые цветки и т.д.).
В таком случае вся совокупность, состоящая из п единип
совокупности, имеет Р единиц, у которых данный признак есть (1) и Q
единиц, у которых этот признак отсутствует (0), л = Р + Q. Исходя из
этих рассуждений, составим вариационный ряд и оценим параметры для
признака с альтернативной вариацией. Обрабатываем вариационный
ряд методом условных отклонений (см. гл. 2).
84
Таблица 21. Вариационный ряд и оценка параметров при
альтернативной изменчивости.
[классы, xi
[А^О
1
частоты, /
Q
р
1 P+Q=n 1
а
0
+1
fa
0
Р
За = Р
/а2
0
Р
1 2& = Р 1
Ufa р р
п п п
S =
2>2
Ы
kiJP p2\X2^p{p+Q)~p2 _PQ
г PQ P Q.
a = - у = ,
n n n
P Q i—
если — = a a — = #, то <r = Jpq.
n n
Ошибка выборочного среднего
. _ & _-fpq _ \1щ
Vw yjn V n
Пример 8.1. Оцениваются статистические параметры выборочной
совокупности, состоящей из 100 норок, 25 из которых имеют
мутантный генотип, а 75 - стандартный, т.е.
п = 100; Р = 25; Q = 75.
Для этой совокупности выборочные статистические параметры таковы:
Х = р = — = 0,25;
*100
q = 0,75;
p + q=L
85
с = л1РЯ = °>43i
Если сравниваются две выборочные совокупности на предмет
достоверности или недостоверности отличий, то по аналогии с
оценками, полученными при количественной вариации, критерий t
равен:
Pi-Pi
Рх-Рг
\РхЧх
\РгЧг
Ш "2 У
A?i
Л*1
4Г = л/ + Л2 - 2.
Пример 8.2. Оценивается достоверность различий по частоте
встречаемости рецессивного
анализируемых популяциях.
я/я 1000
иЖ#* (Р/) = 300
pj = 0,30
qj = 0,70
^=0,01
аллеля white у дрозофилы в двух
п2 = 1200
Р2 = 600
р2 = 0,50
q2 = 0,50
sp =0,01
t = -
А -Л
<№.+£&
J0,3-0,5!
0,02
0,2
0,02
= 10,0"
rf/= л/ + п2 - 2 = 1000 + 1200 - 2 = 2198
tst
2,0 - P = 0,95
2,6 - /> = 0,99
3,3 - P = 0,999.
Таким образом, на основании проведенного статистического
анализа можно с вероятностью Р > 0,999 утверждать, что во второй
совокупности частота аллеля white достоверно выше частоты этого
аллеля в первой совокупности на 20%.
Следует заметить, что оценка статистических параметров при
альтернативной изменчивости по вышеуказанным формулам дает
86
достаточно точные результаты, когда р близко к значению 0,5. В тех
случаях, когда р ниже 0,25, a q выше 0,75 или наоборот, стандартная
ошибка, вычисленная по этой формуле, сильно искажается, поэтому
для таких случаев необходимо воспользоваться так называемым
преобразованием Фишера (метод q> (фи)): <р = 2 arcsin Vp.
Определенный таким образом угол <р обладает рядом свойств:
1. Ошибка (s9) выборочного угла <р не зависит от величины этого угла,
а зависит только от численности совокупности. Достоверность
различий оценивается по формуле: F =(p, -<p2)2- l 2 , ще п\ и п2 -
численности сравниваемых совокупностей.
2. Для долей /7 < 0,25, q > 0,75 и соответственно, р > 0,75, # < 0,25
определение достоверности по соответствующим углам <р более
корректно.
3. Определить величину q> по данному значению р можно по таблицам
синусов углов, взяв за синус угла величину р. Можно
воспользоваться готовыми таблицами угла.
Угол <р в радианах - функция доли, определяемая по Фишеру:
о* = —arcsin Jp = 0,0349066 • arcsin Jp.
Значения углов <р можно найти в таблице VI (приложений).
Пример 8.3. Оценивается достоверность различий между
значениями частот (долей) р\ и р2Ъ двух выборочных совокупностях.
пг = 600 п2 = 6000
Pi = 0,007 р2 = 0,0006
qi = 0,993 q2 = 0,9994
(pi = 0,1676 д>2 = 0,0490
F = {<Рх -(Р2)2' ^-^- = 0,11862 • 545,45 = 7,67; df = Л/ + п2 - 2 = 6598.
".+"2
В таблице VI (приложений) находим:
Fst
3,8 - Р = 0,95
6,6 - Р = 0,99
10,8 - Р = 0,999
Следовательно, частоты pj и /72 различаются достоверно с
вероятностью Р > 0,99. Если оценку достоверности при таких низких
87
значениях частот осуществлять обычным способом без <р.
преобразования, а через критерий f, то получим следующие результаты:
Pi - Pi = 0><К>7 ~ О*0006 = °>°°б4 - 2 39
1>&~ p2q2 10,007• 0,993 0,0006•0,9994 0,00339
~wT~ л, \ 600 6000
т.е. частоты различаются недостоверно. Кроме того, при анализе
качественной вариации возможен такой крайний случай, когда в одной
из выборок не встретилось ни одного представителя с анализируемым
признаком, т.е. Р = 0. В таком случае ошибка выборочной доли sp
может быть оценена методом Б.Л. Ван-дер-Вардена (Математическая
статистика. М.: из-во Иностр. литер., 1960). При этом методе:
п+2 р \ п+3
р - частота (доля), оцененная методом Ван-дер-Вардена;
sp - ошибка выборочной доли;
п - численность выборочной совокупности.
В таком случае, если среди 500 растений не обнаружено ни одного
альбиноса, то тоща:
п « 500; р = ft*1)-"» = o,20% или 0,002
_ 502
Г6,20(100 -0,20) _ „ло/ л ,™
S =1-2 1 1__/ =0,20% ШШ 0,002.
р \ 503
Таким образом, несмотря на то, что в конкретной выборочной
совокупности не обнаружено ни одного альбинотического растения,
анализ показывает, что в других выборочных совокупностях можно
ожидать появления альбиносов примерно в 1% случаев (при / = 3,3).
§ 8.2. Опенка корреляции при качественной вариации.
Если рассматривается случай альтернативной вариации, то при
выяснении вопроса о наличии связи, задача ставится следующим
образом: насколько чаще встречается одновременное совпадение
качественных признаков х и у, чем их несовпадение.
В таблице 22 показана организация корреляционной решетки для
альтернативной вариации.
Таблица 22. Корреляционная решетка при альтернативной вариации.
[признак х
[Признак у
[Есть признак
Нет признака
Сумма
Есть
признак
а
с
а + с
Нет
признака
Ь
d
b + d
Сумма
а + Ъ 1
с + d
n=a+b+c+d 1
Коэффициент корреляции рассчитывается по формуле,
напоминающей формулу для оценки критерия £ в 4-х польной
таблице, только отсутствуют квадраты чисел.
(ad-be)
'"-^a + blc + dla + cW^d)'
или с поправкой Йетса:
{ad-bc)-\
" ^p+bJIp + dJIp+cHft+d)
Пример 8.4. Оценивается наличие корреляционной связи между
наличием сережек на шее и ушах у 320 гиссарских овец (пример из
Рокицкого, 1973).
89
Таблица 23. Оценка связи между наличием сережек на шее и ушах
овец.
На шее
У ^^^
нет
есть
Сумма J
нет
41
224
265
На ушах
а
с
есть
^_
14
CL.
41
55
Сумма
55
265
п = 320
(ad-be)
(1681-3136) _ -1455
я ^{а + Ь\с + с1\а + ф^ л/265"-55-55-265 14575
или с поправкой Йетса:
-0,0998 * -0,1,
(«/-*)-§ -1155
г' = 1= = ----- =>О,0888 *Ч),09 ;
* v'265-55-265-55 14575
, VI-г2 1-0,092 ЛЛ^
s' =—p-~ = v' —=0,06;
vw V 320
, = ^ = ^ = 1,5.
s'r 0,06
Очевидно, что связь между наличием сережек на ушах и шее у
гиссарских овец практически отсутствует, т.е. нулевая гипотеза,
гласящая, что между наличием сережек на ушах и шее гиссарских овец
корреляция отсутствует, сохраняется.
§ 8.3. Дисперсионный анализ при альтернативной вариации.
В ряде случаев приходится оценивать факториальную вариацию
по признакам с альтернативной изменчивостью. Например, в
эксперименте анализируются цитологические препараты на предмет
90
обнаружения хромосомных аномалий. Просматривается серия
препаратов и на каждом из них исследуется несколько ядер. На разных
препаратах из числа просмотренных ядер встречается различное число
аномальных ядер и возникает вопрос: какова изменчивость между
отдельными препаратами (межгрупповая изменчивость) и между ядрами
внутри препарата (случайная изменчивость)?
Пример 8.5. Оценивается факториальное разнообразие по 10
препаратам, взятых случайно из экспериментальных данных.
Таблица 24. Схема организации однофакторного дисперсионного
комплекса при альтернативной вариации.
Число
просмотренных
ядер, щ
Наличие
аномальных ядер,
\т
п
\pi
1 Число
просмотренных
Ьщер, щ
Наличие
аномальных ядер,
\I!L
\ьЖ
п
La_ I
Препараты
№1
70
14
2,8
0,2
|№2
20
10
5,0
0,5
|№3
10
6
3,6
0,6
In» 4
10
1
0,1
0,1
|№5
100
30
9,0
0,3
№6
90
45
22,5
0,5 1
Препараты |
№7
10
5
2,5
0,5 1
№8
50
10 1
2,0
0,2 1
№9
25
4
0,64
0,16 1
№10
15
5
1,67
0,33 1
г= 10 1
N = 400
Zm = 130
Di = 49,81
Робш = 0,32 J
91
Я = М=42,25
N
Анализ однофакторного неравномерного дисперсионного
комплекса по качественному признаку приводится в таблице 25.
Таблица 25. Анализ однофакторного дисперсионного комплекса для
признака с альтернативной вариацией (случайная модель).
Источник
изменчи
вости
Между
препаратами
Случайный
Общий
Сумма
квадратов, S
49,81-42,25=
=7,56
=130-49,81=
=80,19
=130-42,25=
=87,75
Г*
г-1=10-1=9
#-/^400-10=
=390
ЛЧ=400-1=
=399
ms
ms„=0,84
АП5сг=0,21
F = ^=- =
= 4,0"
V
I <r2=W5<,-Wgct
"о
= 0,017
°l * ™м =
= 0,21
Коэффициент
внутриклассовой
корреляции, rw
■у
= 0,07
2 2 1
= 0,93
/,=^.и_Ж1 = 1.Г400-^_0] = 1.(400-67,б)=36)9
г-1 [ JV J 9 ^ 400 J 9 V ' '
] Fst 1,9
4Г/ - 9 I 2,5
df2 = 390 Г з,3
Таким образом, с вероятностью Р > 0,999 можно утверждать, что
7% изменчивости следует отнести за счет различий между препаратами
и 93% изменчивости является случайной или внутри препаратов, или
между ядрами. Внутри такого дисперсионного комплекса можно также
как и в случае с анализом количественных признаков оценить
92
достоверность различий между частотами отдельных градаций по
формуле:
msa я, +пг
Таким средним, например, может быть рз = 0,6 в градации № 3 и
Р4 = 0,1 в градации № 4.
г=(Рг-РгУ п,п2 JO,6-OXf 1010 = 0,25 5^59
msa п,+пг 0,21 10 + 10 0,21
df2 = 390
Fs, 3,9
6,7
11,0
Р = 0,95
I. Р = 0,99
Р = 0,999
По такому же принципу могут быть сравнены любые пары
средних значений.
93
ГЛАВА 9
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ
В биологических исследованиях, а чаше всего в медицинских и
физиологических экспериментах, возникают ситуации, когда наиболее
широко используемый непараметрический метод сравнения
распределений, метод х2, не может быть применен к обработке данных.
Такими причинами могут быть малочисленность данных, сопряженность
данных двух сравниваемых распределении и др. Ниже рассмотрим другие
непараметрические критерии различия двух эмпирических распределений,
такие как метод А/(лямбда) Колмогорова-Смирнова, метод Вилкоксона для
двух независимых распределений и метод Вилкоксона для двух
сопряженных по парам распределений.
§ 9.1. Критерий Колмогорова-Смирнова
Критерий Колмогорова-Смирнова используется чаще всего при
малых объемах совокупностей и основан на сравнении рядов накопленных
частот (численностей) обеих сравниваемых совокупностей.
Пусть имеется распределения двух выборочных совокупностей,
разного объема Я/ и п2. Организовав 2 ряда накопленных частот,
поделенных в каждой строке ряда на объем совокупности, находим по
строкам максимальную разницу между двумя рядами, D. Следующий шаг
будет состоять в том, чтобы эту максимальную разницу сравнить с
критическими значениями, Dx, величина которых зависит от принятого
уровня значимости (р = 0.05 или/? = 0.01).
D'--\H
1 1
_+—
Если выражение л/~1п- = Лх,то Вх =Д • LL + J-= i. Г1*"- .
V2 х Уя1 я2 V пГп2
Тогда Лх = -
D,
Возводя в квадрат выражение, получим
94
При этом критические значения, Я*, есть
Л305 =lln— =-In 40 = 1.84 И Aj0I =-1п — = ^1п 200 = 2.65
^°5 2 0.05 2 01 2 0.01 2
Фактическое значение, Л^, оценивается по формуле
П\+П2
и затем сравнивается с критическими значениями Л;.
Если Яф)Яо1)5, то нулевая гипотеза (Но) не подтверждается, если
Ф^оо!» т0 нулевая гипотеза отвергается, если Aj^^w, то нулевая
гипотеза сохраняется.
Пример 9.1. Оценивается характер распределения 2-х эмпирических
совокупностей.
Таблица 26. Сравнение 2-х совокупностей методом Колмогорова-
Смирнова.
|Приз
! -нак,
*'
2
3
4
5
1 6
Г 7 |
8
L 9 1
- 1
Частоты
л
5
20
55
92
61
48
15
4
=300
1 h
1 10
35
95
82
43
20
12
3
=300
1 Ряды
|
накопленных частот
Я
1 5
25
80
172
233
281
296
300
\&:
1 10
45
140
222
265
285
297
300
Sfi'/ni
0,017
0,083
0,267
0,573
0,777 ,
0,937
0,987
1,000
Ц11П2
0,033
0,150
0,467
0,740
0,883
0,950 j
0,990
1,000
__J
0,016
0,067
0,200
0,167
0,106
0,013
0,003 1
0 j
95
Максимальное различие между двумя рядами, D == 0,200. Тогда
Л2 =/)2.А^2. = 02(Х)2, 300-300 =004,150 = 60
* ^/,1+/|2 300 + 300
Критические значения Л2 равны: Л$05 =1,84, Л£01 =2,65.
Поскольку Я^>/^01, то нулевая гипотеза отвергается, т.е. между
распределениями двух совокупностей обнаружены существенные
различия.
Следует отметить, что при равном объеме сравниваемых
выборочных совокупностей, т.е. если щ = ъ, расчеты Л2ф можно резко
упростить, т.к. формула Л2ф = D2 "* '"2 , если л/ = л^имет вид: £ф = D2 -.
71, +Л2 2
Кроме того, ряды накопленных частот не следует делить на nj и w2, т.е. в
таблице 26 не следует организовывать столбцы № 6 и № 7, а расчеты вести
непосредственно с накопленными частотами. Так. в таблице 26
максимальное различие в двух рядах обнаруживается между значениями
80 б первом ряду и 140 во втором ряду и равно, А = 140 -80 = 60. D = — и
,2 „- п А2 п А2
тогда Л2 =/)*- = —- = — .
* 2 /г 2 2л
602
В примере 9.1 Я^ = = 6,0, что соответствует расчетам по данным
таблицы 26.
§ 9.2. Критерий Вилкоксона-Манна- Уитни
Среди большого числа непараметрических критериев, которые
экспериментаторы часто вынуждены применять из-за того, что эти
критерии не требуют нормальности распределения экспериментальных
данных, довольно часто используется непараметрический критерий
Ф.Вилкоксона, разработанный в 1945 году. Однако в 1947 году,
независимо от Вилкоксона, Х.Б.Манн и Д.Р.Уитни разработали статистику,
которая была идентична ранговому критерию Вилкоксона.
В основу критерия Вилкоксона положена замена количественной
меры признака рангами или порядковыми номерами.
Пусть имеются две независимые совокупности
*1, Х2, Х3, ... Xf 1=ПХ И
>7, Уъ Уз, -. Уг i = пу
Расположим оба ряда совместно в порядке возрастания значении
признака, например, так:
96
Xl X2 У1 Уз ХЗ У2.-..
После выстраивания значений признака двух рядов в порядке
увеличения можно каждому значению присвоить порядковый номер фанг)
и тогда будем иметь:
'•х.+'-х, +''*,+••• + '•« =^х
Следует заметить, что ранги - это числа натурального ряда и
поэтому их суммы, Тх+Ту=\ + 2 + 3+...+п = '^п+ '9 где п = пх + пу. Для
каждой пары значений пх и пу можно указать критические значения Г,
отвечающие уровню значимости р = 0.05 или р = 0.01. Критические
значения Toos и То.ои с которыми сравниваются экспериментальные
значения ТХу приведены в таблице VII (приложения). Смысл критерия
Вилкоксона состоит в том, что в условиях нулевой гипотезы суммы Тх и Ту
не должны слишком отличаться от их усредненного значения, т.е.
jl—L = п\п * ' t с критическими значениями T0.os и Том сравнивается
2 4
меньшая сумма, либо это будет в конкретном случае сумма рангов Т»
либо Ту. Если ТХ(ТУ) < Том - нулевая гипотеза не подтверждается; если
Тх(Ту) < Том - нулевая гипотеза отвергается и если ТХ(ТУ) > Т0.о5 - нулевая
гипотеза сохраняется.
Пример 9.2. Сравниваются два распределения урожая пшеницы в
ц/га на 8-ми контрольных (х) и на 8-ми опытных (у) полях в одном году.
х§ 16 26 20 39 32 35 41 19
Уг 46 21 25 34 42 28 31 43
Ранжируем 2 ряда и выставляем ранги (г)
[(хьУд
к?
[Гу_
и*<&Ц
гх
■1^
!16
1
32
9
19
2
34
10
20
3
35 I
гтт ~
21
4
39
12
25
5
41
13
26
6
42
14
28
7
43 I
15
пп
s
46
16
Г*=2А=57
Tv-Zrv=79 |
п=пх + пу=\6\ Тх + Ту = 57 + 79 = 136; ^±il = l^iZ = i36.
В таблице VIII (приложения) находим для пх = 8 и пу = 8 критические
значения 7}ш = 49 и 7Ь.о/ = 43. Поскольку минимальная сумма рангов 57 =
Тх > Том* то нулевая гипотеза не отвергается и следовательно можно
97
сделать вывод о том, что распределения контрольных и опытных полей
практически различимы несущественно.
Проверим полученный выше результат через t-критерий, условно
принимая, что эти 2 ряда распределены согласно закономерностям
нормального распределения.
Гряд II ряд
их = 8
2й = 228
]£х,2=7144
h=^ iJ =6498
п
Sx=]Tx?-h = 646
<т2= — = 92,29
z п-\
0^ = 9,61 ц/га
5-=-^ = 3,4
X = 28,5 ц/га
, 33,75-28,5 _ 5,25
__-^1
Пу = %
23* = 270
ЕЛ2 =9696
(УуУ
h = ^'iJ =9112,5
^=2>2-Л=583>5
^=-^- = 83,36
<Х = 9,13 ц/га
5- = Ц= = 3,23
У = 33,75 ц/га
= 1,12
V3,42+3,232 Vl^ + l0»43 4>69
^Г=8 + 8 - 2 = 14. Из таблицы II (приложения) находим:
tx 2,1 - Р = 0,95 или /7 = 0,05
3.0 - Р = 0,997 /7 = 0,003
4.1 - /> = 0,999 /7 = 0,001
Так как fy <'** при Р = 0,95, можно считать существующие различия
между опытными и контрольными полями случайными.
В основу построения статистики Манна-Уитни, которая идентична
критерию Вилкоксона, и поэтому часто используемый критерий называют
критерием Вилкоксона-Манна-Уитни, положен матричный принцип
сравнения 2-х распределений, gg
Приведем в виде матрицы данные примера 9.2.
[х/У*
П6
[26
[20
[39
[32
[35
41
19
46
-
-
-
-
-
-
-
-
21
-
+
•
+
+
+
+
-
25
-
+
-
+
+
+
+
-
1 34
-
-
-
+
-
+
+
-
42
-
-
-
-
-
-
-
-
28
-
-
-
+
+
+
+
-
31
1
-
-
+
+
+
+
-
! 43
-
-
-
-
|
|
|
|
В клетках знаки минус (-) и плюс (+) означают отрицательную или
положительную разницу между jc, и yi9 т.е. d = xt - yit Затем суммируем
число знаков плюс, здесь оно равно (U*) = 21 и число знаков плюс, здесь
оно равно (U-*) =43. Далее экспериментальная минимальная сумма знаков
+ или - (какая конкретно окажется) сравнивается с критическими
значениями, представленными в таблице VIII (приложения).
Таблица критических значений построена исходя из того, что
матрица сравнения для выборок различного объема может принимать
различные варианты, начиная от матрицы с одними плюсами до матрицы с
одними минусами.
Общее число возможных типов сравнений есть (и/ + n^l/niln^
Вероятность любой их возможных конфигураций матриц есть
ni!n2!/(ni+nj£ т.е. можно получить распределение вероятностей, которое
зависит только от щ и п2.
Нулевая гипотеза (Но) сохраняется (принимается), если U+(U-) >
Uo,os, гипотеза Но не подтверждается, если U+(U-) < Uo,os и отвергается,
если U+(U-) < Uo,oi- В таблице УШ (приложения) находим Щоз (и/=8;
лг=8) = 15; U0,oi ("7=8; nf-%) = 9. Поскольку (Щ = 21 > U0,os = 15, то
нулевая гипотеза (Н0) принимается.
§ 9.3. Критерий Вилкоксона для сопряженных распределений.
В экспериментальных исследованиях возникает необходимость для
каждого варианта опыта иметь и вариант контроля. Часто опыт и контроль
осуществляется на одних и тех же особях. Например, измеряется кровяное
давление у нескольких человек в покое, а затем испытуемым предлагается
определенная одинаковая физическая нагрузка, после чего вновь
измеряется кровяное давление. Поскольку два показателя кровяного
давления измерены у одного и того же человека, то такие варианты
следует считать попарно сопряженными и в таком случае для выявления
99
сходства или различий характера распределения 2-х совокупностей
используется критерий Вилкоксона для сопряженных пар.
Пример 9.3. Изучалось влияние некоего агротехнического приема
(опыт, х) на урожайность пшеницы в течение 9-ти лет. Опыт
сопровождался контролем, (у) в эти же годы. Необходимо выяснить,
имеется ли значимое влияние примененной агротехники на урожай.
Так как климатические и другие условия в различные годы различны, то
опытные данные необходимо соотносить с контрольными данными по
каждому году отдельно. Таким образом образуется два распределения,
сопряженных попарно.
Таблица 27. Сравнение 2-х распределений методом Вилкоксона для
сопряженных пар (признак-урожайность пшеницы (ц/га)
Пара
1
\2
13
4
5
6
7
8
9
n±J
Годы
1992
1993
1994
1995
1996
1997
1998
1999
2000
__.,... J
Опыт,
20,2
22,9
20,2
19,5
30,5
35,6
31,9
27,7
34,4
1
Контроль,;',
' 20,2
19,4
20,7
16,9
29,3
35,8
28,5
28,6
35,4 1
1 Разность,
ХгУ1
0
3,5
-0,5
2,6
1,2
-0,2
3,4
-0,9
-1,0
1 Ранги
разности
|
(+И
1 6
!(+) 3
(+)4
5
(+)2
7
8
77^-10 |
Ранги с
отрицательным
знаком, Т(г.)
6
5
7
8
7^ = 26 |
Из таблицы 27 видно, что сумма рангов, имеющих положительный
знак, равна Т(г+) = 1+3+4+2=10. Полученное значение Т(г+) необходимо
сравнить с критическими значениями Тх из таблицы IX (приложения) для
соответствующего числа взятых в анализ пар. Здесь число пар, я=8 (т.к. в
первой паре разница равна 0, то эта пара исключается). Критическое
значение T0,os для 8-ми пар равно 5; T0,oi = 1.
Так как фактическая минимальная сумма положительных рангов,
Т(н.} = 10, превышает критическое значение, 7Ь^з=5, то нулевая гипотеза не
отвергается, следовательно примененная агротехника не привела к
значительному повышению урожайности.
Воспользуемся /-критерием для проверки полученных через Т-
критерий расчетов. Рассмотрим пример, полагая, что данные попарно
сопряжены, тогда
100
Таблица 28. Оценка достоверности различий 2-х распределений^ попарно
связанными вариантами^ помощью Меритерия.
[Годы
[1992
[1993
[1994
[1995
1996
1997
1998
1999
2000
__________
1 Опыт,*,
20,2
! 22,9
20,2
19,5
30,5
35,6
31,9
27,7
34,4
2*,=242,9
| Контроль,^,
20,2
19,4
20,7
16,9
29,3
35,8
28,5
28,6
35,4
_>,=234,8 |
х= 26,99 I у = 26,09 |
Разность
0
3,5
-0,5
2,6
1,2
-0,2
3,4
-0,9
-1.0
2^=8,1
d = 0,9
1 ^
0
12,25
0,25
6,76
1,44 |
0,04 1
11,56
0,81
1,0
2^=34,11 1
S = У d2 - **-L- = 34>i i ______ = 34jl i _ 7j29 = 26,82.
I S /26,82 ..,
,#_1___U,48.
* 5d 0,61
Для df=n — 1=9—1=8 Из таблицы П (приложения)
имеем:
tst 2>3 - Р = 0,95 или /? = 0,05
3,4 . />-= 0,997 /? = 0,003
5,0 - Р = 0,999 /7-0,001
Поскольку fy < (я при р = 0,05 нулевая гипотеза принимается, т.е.
использованное агротехническое мероприятие не оказало существенного
влияния на урожай пшеницы.
101
В заключении необходимо высказать следующее замечание.
Использование того или иного метода математической статистики
определяется, во-первых, i-ем, что каждый из методов имеет определенные
границы применимости. Использование же методов вне границ их
возможностей приводит к ошибочным выводам. Поэтому важным
моментом при обработке экспериментального материала является выбор
адекватной математической модели, а для этого экспериментатору
необходимо ясно представлять, с одной стороны, цели и задачи
исследования, а, с другой стороны, смысл применяемых методов
математической обработки.
В настоящем учебном пособии изложены как бы базовые методы
статистического анализа биологического экспериментального материала.
Конечно приведенные методы анализа не исчерпывают всего
математического арсенала, который может быть использован при
статистическом анализе данных. Так, в биологии часто используются
частные коэффициенты корреляции и регрессии, ранговые коэффициенты
корреляции и другие. В непараметрической статистике, кроме метода х2,
метода Колмогорова-Смирнова и метода Вилкоксона также существуют и
другие методы.
Однако овладение основными, наиболее используемыми методами
статистической обработки экспериментального материала, является
обязательным условием для освоения других менее общих методов. Ниже
приводится список книг по математической и биологической статистике, в
которых более полно представлены методы статистической обработки
экспериментального материала.
102
Рекомендуемая литература
1. Рокицкий П.Ф. Биологическая статистика. Минск: Изд-во
"Вышейшая школа". 1973. 319 с.
2. Плохинский Н.А. Биометрия. Новосибирск: Изд-во Наука. СО АН
СССР. 1961.364 с.
3. Снедекор Дж.У. Статистические методы в приложении к
исследованиям в сельском хозяйстве и биологии. М: Изд-во
Сельхозиздат. 1961. 503 с.
4. Урбах В.Ю. Биометрические методы. М: Наука. 1964. 415 с.
5. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов
Н.Н. Биометрия. Ленинград: Изд-во ЛГУ. 1982. 463 с.
6. Ван дер Варден Б Л. Математическая статистика. М.: ИЛ. 1960.
434 с.
7. Шеффе Г. Дисперсионный анализ. М.: Изд-во Физико-
математической литературы. 1963. 625 с.
103
Содержание
Глава 1. Совокупности.
§1.1. Биологическая статистика: роль и значение 3
§ 1.2. Выборочные совокупности 5
§ 1.3. Группировка данных выборочной совокупности по
признакам с дискретной изменчивостью 6
§ 1.4. Группировка данных выборочной совокупности по
признакам с непрерывной изменчивостью 10
§ 1.5. Графическое изображение вариационного ряда 11
Глава 2. Оценка статистических показателей выборочных
совокупностей 14
§ 2.1. Мода и медиана 14
§ 2.2. Средняя арифметическая величина и ее свойства 15
§ 2.3. Изменчивость признака, ее оценка 16
§ 2.4. Дисперсия, варианса, среднее квадратическое
отклонение 17
§ 2.5. Оценка параметров выборочной совокупности для
данных, сгруппированных в вариационный ряд 19
§ 2.6. Объединение параметров отдельных
подсовокупностей 27
Глава 3. Закономерности случайной изменчивости в совокупностях .. 28
§3.1. Вероятность 28
Глава 4. Достоверность статистических показателей 35
§ 4.1. Ошибка выборочной совокупности. Доверительные
интервалы 35
§ 4.2. Выборочные ошибки для а 39
§ 4.3. Сравнение двух выборочных совокупностей 40
§ 4.4. Оценка достоверности различий между средними
значениями двух выборочных совокупностей 40
Глава 5. Корреляционные связи между признаками 44
§5.1. Коэффициент корреляции 44
§ 5.2. Ошибка выборочного коэффициента корреляции 51
§ 5.3. Ранговый коэффициент корреляции 53
§ 5.4. Регрессия 56
Глава 6. Сравнение степени соответствия фактических
распределений теоретическим 58
§ 6.1. Анализ характера расщепления в гибридологических
опытах 59
§ 6.2. Сравнение фактических вариационных рядов с
теоретическими, вычисленными в соответствии с
закономерностями нормального распределения 61
104
§ 6.3. Оценка соответствия распределения двух
эмпирических совокупностей 64
§ 6.4. Анализ распределений, сгруппированных в
4-х -польные таблицы 66
Глава 7. Дисперсионный анализ 70
§ 7.1. Общие принципы дисперсионного анализа 71
§ 7.2. Двухфакторный дисперсионный анализ 77
§ 7.3. Иерархическая модель двухфакторного комплекса 80
Глава 8. Статистический анализ качественных (альтернативных)
признаков 84
§ 8.1. Оценка X, о, s* при альтернативной вариации 84
§ 8.2. Оценка корреляции при качественной вариации 88
§ 8.3. Дисперсионный анализ при альтернативной вариации ... 90
Глава 9. Непараметрические критерии различия 94
§ 9.1. Критерий Колмогорова-Смирнова 94
§ 9.2. Критерий Вилкоксона-Манна-Уитни 96
§ 9.3. Критерий Вилкоксона для сопряженных пар 99
Рекомендуемая литература 103
Содержание 104
Приложения 106
105
ПРИЛОЖЕНИЯ
106
Первая функция нормированного отклонения
Таблица!
Alt
' = W<
(ординаты нормальной кривой)
_t
0.0
0,1
0,2
о.з
0.4
0.5
0.6
0.7
0.8
0,9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
.1,8
1.9
2,0
2,1
2.2
2,3
2.4;
2.5 i
2.6
2,7
2.8
2.9
30
3.1
3,2
3,3
3,4
3.5
3.6
3.7
3.8
3.9
4,0|
0
39894
39 695
39 104
38 139
1 36S27
35 207
33 322
31 225
2* 969
26 609
24 197
21 785
19419
17 137.
14 973
12 952
1
39892
39 654
39 024
3S023
36 678
35 029
33121
31 006
28 737
26 369
23955
21 546
19186
16915
14 764
12 758
11 092! 10915
! 09405
07895
06 562
05 399
04 39S
03 547
02 233
02 239
01 753 j
01358
01 042
СО 792
00 595
00443
00327
00238
00172
00 123
00087
00061
00 042
00 029
00 020
00013
I 09246
07 754
1 06438
05292
04 307
03470
02 76Ь
02 1861
01709
01323
01014
00 7701
00578
00430
00317
00231
00167
00119
00084
00059
00 041
00028
00 019
00009
2
39 886
39 60S
33 940
37 903
36 526
34$4У
32 918
30 785
2S504
26 129
23 713
21 307
3
39 876
39 559
3S 853
37 760
36 371
34 667
32 713
30563
2d 269
25 888
23 471
21 069
18 954» 15 724
16 694! 16 474
14 556" 14 350
12566 12 376
10 741- 10 567
09 089
! 07614
06 316
05 1?6
04 217
03 394
02 7о5
02 134 i
01 667
01289
00 987
0074S
00562
00 417
СО 307
00224
00 161
00115
O00S1
00057
00 039
09027
0001S
00 006
• 1
j 08 933
1 07 477
06195
05 082
04 12S
03 319
02 643
02 083 j
01 6251
01256
00961
00-7271
00545
00 405
00298
00216
00156
00111
00079
00055
00 038
00 026
00 018
00004
4
39 362
39505
38762
37 654
36 213
34 4S2
32506
30339
.28 034
25 647
23230
20631
18494
16 256
14 146
12168
10396
08780
1 07341
06 077
04 980
04 041
5
39 844
39 448
3$ 667
37 524
36 053
34 294
32 297
30114
27 798
25 406
22 983
20 594
18 265
16 038
13 943
12 001
1 10 226
| 08 628
1 07 206
05959
04 879
03 955
03246 03 174
02532 02 522
02 033 j
01535
01223
00935
00707
00530
00393
00288
00210
00 151
00107
00076
00053
00037
00025
00017
00002
01 984
01 545
01 191
00909
00 687 1
00514
00 381
00279
00203
00146
00104
00 073
00051
00 035
00 024 .
00 016
00002
6
39 822
39 387
Г 33 568
37 391
35 889
34 105
32 086
29 887
27 562
25 164
22 747
20 357
IS 037
15S22
13 742
11816
10 059
08 478
07 074
05 844
04 750
03 871
03 103
02 463
0I936|
015061
01 160
00885
00 668
00 499
00 370
00271
00 196
00141
00 100
00 071
00 049
00 034
00 023
00 016
00 001
7
39 797
39 322
38 466
37 255
35 723
33 912
31 874
29 659
27 324
24 923
22506
20121
17810
15 603
13 542
11632
1 09 893
08 329
06 943
05 730
04 682
8
39 767
39 253
38 361
37 115
35 553
33 718
31 659
29430
27 0S6
24 681
22 265
19 886
17 565
15 395
13 344
1 11450
9
39 733
39 181
38 251
36 973
35 381
33 521
31 443
29 200
26 848
2-: 439
22 025
19 652
17 360
15183
13 147
11270
I 097231 09 566
1 OS 183
06 814
05618
04 556
03 788 03 706
03 034 02 955
1 OS 038
06 687
1 05508
04 491
03 626
02S98
02 406 02 3491 02 294
01 8S8
01 463
01130
00S61
006491
004851
00 358
00262
00190
00136
00097
00 068
00047
00 033
00 022
00 015
00 001
01 642 01797
01 431 01 394
01 100
00S37
00 631
00470
00 348
00254
00 IS4
00 132
00 094
00 066
00 046
00 031
00021
00014
00 000
01071
00814
00 613
00457
00 337
00246
00178
00127
00 090
00 063
00 044
00030
00021
00014
00 000
107
Стандартные значении критерия Стьюлента^}
Таблица
7Г
лК
1
2
3
4
5
6
7
8
9
10
11
12
о, 95
12,7
4.3
3.2
2,8
2.6
2.4
2.4
2,3
2.3
2.2
2,2
2,2
о, 99
63,7
9.9
5.8
4.6
4.0
3.7
3.5
3,4
! 3,3
. 3,2
3.1
3.1
а, 999
636,6
31,6
12,9
S.6
6.9
.6,0
5.4
! 5,0
\ 4.8
4.6
4,4
4.3
Л-
13
14—15
16-17
18—20
21—24
25—28
29—30
31—34
35—42
1 43—62
63—175
176 и больше
1
t.
о, 95 1
2.2
2,1
; 2.1
2.1
2.1
2,1
2,0
2.0
2,0
2,0
2.0
2,0
о. 93 !
3.0
3.0
2.9
2.9
2,8
2.8
2.8
2.7
2.7
2.7
2.6
2.6
о, 995
4.2
4.1
4.0
3.9
3.8
| 3.7
3.7
3.7
3,6
3.5
3.4
3.3
Таблица Ml
Количество пар значений К, достаточное для достоверности выборочного
коэффициента корреляции
—
г
0,01
'02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18 |
19 !
20 1
• 21
22
23
24
25
26
27
28
29
30
I ю
1 °
1 °>
К
1 °5
38407
9603
4269
2403
1539
1069
! 787
604
477
383
317
267
228
196
171
151
133
119
107
97
S7i
80
73
6S
62
57
53
49
46
43
• iv
( <*»
1 °*
! ®
1 w
1 °^
66 503
16 628
7392
4159
2263
1850
1360
1042
624
661
548
462
392
337
295
259
22S
204
163
165
149,
136
124
114
105
97
90
83
7S
73
J
1 я
1 °1
1 °*
ii
1 **
108 903
27 228
12 103
6S09
4359
3028
2225
1704
1347
1031
8S6
754
640
550
4S1
422
373
332
297
270
242
211
202
185
170
157
145
135
125
117
1 г
*31
Г 32
33
34
35
36
37
38
39
1 40
41
42
43
44
45
46 -
47
48 |
49 1
50 1
51
52
53
54
55
56
57
58
59
60
1 ">
1 °l
о
II
1 *
40
38
36
34
32
30
28
27
26
1 24
23
22
21
20
19
19
18
17 |
16 1
16
15
15
14
14
13
13
12
12
11
11
N
1 с»
1 °>-
1 °*
И
1 *
68
63
60
55
53
50
47
44
! 42
1 40
38
36
34
33
31
30
29
27
26 ,
25 :
24
23
22
21
20
20
19
18
18
17
1 е>
1 о
1 °1
I о
И
1 ^
109
102
96
90
85
80
75
71
67
64
60
57
55'
52
49
47
45
43
41
39
37
36
34
33
32
30
29
28
27
26
1 г
1
4 61
Г 62
63
64
65
66
67
68
69
1 70
71
72
73
74
75
76
77
78 1
79
80
81
82
S3
84
85
86
87
88
89
90
1 v>
1 °1
1 сэ
II
1 **
и
10
10
10
^
9
9
9
8
8
8
8
7
7
7
7
7
7
6
6
6 1
6
6
6
5
5
5
5
5
5
N
1 о>
1 «Л
1 €>
II '
1 **
16
16
15
15
14
14
13
13
12
12
! 11
11
11
10
10
10
9
9
9
9
8
8.
8
7
7
7
7
7
6
6
1
1 <я
I с>
1 °1
1 <э
1 "
1 **
1 25
24
23
22
21
20
20
19
18
IS
! 17
16
i6
15
15
14
14
13
13
12
12
11
11
10
10
10
9
9
8
8
Стандартные значения критерия ^
Т a 6J иц а
IV
0,05
X'.
Q,Oi
х'>
0,001
d&
$05.
0,01
0,001
if
до5
o,oi
I 3,8
6,0
7.8
9.5
П.1
12.6
14.1
15.5
16,9
18,3
19,7
21.0
22,4
23,7
25,0
26.3
27.6
6,6
9.2
11,3
13,3
15,1
16,8
18,5
20.1
21.7
23.2
24,7
26,2
27,7
29,1
30.6
32,0
33,4
10,8
13,8
16.3
IS.5
20.5
22.5
24,3
26,1
27.9
29.6
31,3
32,9
34,5
36,1
37,7
39.3
40,8
18
19
20
21
22
23
24
25
26'
27
28
29
30
32
34
36.
38- '
28,9
30.1
31.4
32.7
33,9
35.2
36.4
37,7
3S.9
40,1
41,3
42.6
43,S
46,2
4S.6
51.0
53,4
34, S
36,2
37,6
3S.9
40.3
41.6
43,0
44,3
45,6
47,0
48,3
49.6
50.9
53.5
56,0
58.6
61,1
42,3
43.S
45.3
46.S
4S.3
49.7
51.2
52,6
54.1
55,5
56.9
5S.3
59,7
02,5
65,2
67,9
70,7
40 !
42
44
46
48
50
55 1
60 1
65
70
75 |
SO
85 1
90
95
100 1
55,8 63,7
53.1
60,5,
62.8
65.2
67.5'
73,3!
79
S4
90
96
101
107.5!
113.1i
118.7,
124,3 135,S
66
6S,
71
73,
76,
S2.
S8,
94,
100,
106,
112,
118,
124,
130,
Таблица V
Критерий F Р.Фишер (R.Fisher)
111
СТАНДАРТНЫЕ ЗНАЧЕНИЯ ПРЕОБРАЗОВАННОГО
КРИТЕРИЯ ФИШЕРА F = c]h\
*Щ i
3
4
5
6
7
8
9
ю
11 j
12
13 1
14 1
1
2
167,5|148.
34.
74.
21,5
7.7
47.С
16,3
6.0
35.5
13,4
6.0
1 30.
1 9,1
61,:
Ц ISA
6,<
36,С
13.2
5,fc
27.0
10.У
5,1
1 29.2J 21,7
12,3
Ь.6
25,4
п.з
5,3
22,9
10,6
5,1
21,0|
ю.о
У,6
4.7
18,5
8.7
4.6
16,4
8.0
4.3
14,9
7.9i
5,0 4,11
19, l\
9,7
4.8
IS.6
9,3
4,8
17.8
9,1
4,7
17.1
8,9
4.6
13,8
7,2
4.0
12.3
6.9
3.9
12.3
6,7
3,8
11,5
6.5
3,7
3
5 141,
4
1 137,
В 29,5| 28,
3 .9,
г\ 56",
3 У.
1 53,<
Ц 16,7| 16,(
)\ 6,(
> 33,2
\\ 12.1
5.4
23,7
9.8
4.Ь
18,8
«,Ь
4,4
15,8
7,6
4,1
13,9
7,0
3,6
12,3
6,6
3.7
11.6
6.2
3,6
10,8
6.0
3.5
10,2
5,7
3,4
9,7
5.6
3.3
> 6.'
1 31,1
П.4
6.i
21 ,S
9.^
4,Ь
I 17.2
| 7.У
4.1
14.4
7.0
3.8
12,6
6.4
3,6
П.З
6.0
3,5!
10,4
5,7
3.4
9,6
5.4
3.3
9.1
5.2
3,2
8.61
5,0
3,1
!•
6
7
8
9
10
1!
12
1 134,6 132,9 131,8 130,б|'130,0 129.5 128.91 128
7 28.2 27,9 27.7 27,7 27,4 27,5 27.
1 9,0 8,
J 51,7 50,!
9 8,8 8.^
)| 49,8 49.1
3 8,8 8,8 8,1
) 48,6 48,2 47.?
I 27,
9 8,
j| 47..
) 15.5 15,21 15,0| 14,8| 14,7| 14.7\ 14,5| 14 <
1 6,3 6,2 6.
1- - 1 1
1 29,*
\\ и л
' 5,1
20,5
8.8
4.4
16.2
ЛЬ
4.U
' 13.5
6,6
3,7
11.7
6,1
3.5
10,5
5,6,
3.3
9,6
5.3
3,2
8.9
5,1
3.1
8.4
4.9
3.0
7.9
4.7
3.0
Ц 28,E
) Ю,V
5,t
20,0
8,5
4.3
i 15.5
Л2
З.У
12.9
6.4
3,6
11J
5,8
3.4
9.91
5,4
3.2
9,1
5,1
3.1
8,4
4,8
3.0
7.9
4,6
2,9
7.4
4.5
2.9
6.0 6.0 6.0 5Л
I 28.2| 27.б| 27.3J 27,o| 26.7
1 10.1
»j 4.S
1 19.5
S,3
> io,:
> 4Л
1 19.C
8.J
Ч Ю.5
4 4,*
18,£
3,0
4,2/ 4.11 4.1
15,1
i 7,0
3,8
12.5
6,2
3,5
. 10,8
5,6
3,3
9.6
5.2!
3,1
8,8]
4.9
3.0
8,1
4.7
2.9
7,6
4.4
2,8
7,1
4.3
2.8
1
1 14.6
6/8
3,7
12,0
6.0
3.4
10.4
5.5
3.2
9.2J
5.l!
3,1
1 14,4
6,7
! 3,7
1Г.8
5,9
3.4
10,2
5,4
3.2
9.0!
5,0
3,0
8,4* 8,2[
4.7
3,0
7j\
4.5
2,9
7.2
4,3
2,8
"6.8*
.4.1
2,7
.4-6
2,9
7,5
4.4
2t8\
7.0
4.2
2.7
6.6
4.0
2.7
1
Ц Ю.1
И 4.7
10,с
r 4,7
J I8.5J 18.3
7.9
4,1
14,2
6,6
3,6
11,6
•5.8
3,3
10,0
7.8
4,0
13.9
6.5
3.6
! 11,4
5,7
3.1
9.8
5,3! 5.2
3.1
"8.9
4.9!
3,0
8,0
4.5
2.9
7»4
4.3
2.8
6,9
4.1
2,7
6,5
3.9
2.6
1
3,1|
8.7
4.81
2,9
7,в|
4,5
2,8
7.г|
4.2
2.7
6.7
4,0
2,6
6.3
3,9
2,6
J
1
7
Ц
)l
)\ 5,9
4 26,41
Ц 9,1
4,7
1 18.C
7,7
4,С
13,7
)
6.51
3.6|
11,2
5.7
3.3
9,6
5,1
3,1
S,5
4,7j
2,9
7,б|
4,4
2,8
7,o|
4,2
2,7
6.5
4.0
2,6
6.1
3.8
2,5
1
\
H
127,7
26,9
8,7
47,0
14.2
5.9
26.1
9 7
4,6
17.7
7.6
4.0
13,5
6,4
3,5
11.0
5.6
3.2
9,4
5.0
3,0
8.3
4.6
2,9
7,4
4.3
2.7
6.8
4.1,
2.6
6.3
3.9
2.6
5.9
3.7
2,5
16
127.1
26.8
8,7
46.6
14.1
5.8
25.8
9,6
4.6
17.5
7.5
3.9
13,2
6,3
3,5
10,S
5.5
3,2
9.2
4,9
3,0
8.1
4,5
2,8
7,3
4.2
2.7
6.7
4,0
2,6
6,2
3.8
2,5
5.8
3,6
2.4
20
126,5
26,7
8,7
46,2
14,0
5,8
25,4
[ 9,5
| 4,6
! 17,2
7,4
3,9
13,0
6,2
3,4
10.5
5,4
3,2
8 9
4,8
2,9
7,8
4,4
2,8
7,1
4,1
2.7
6,5
3,9
2.5.
6,0
3,7
2.5
5,6
3,5
2,4
24
125.9
26.6
8.6
45,8
13.9
5,8
' 25,1
9,4
4,5
! 16.9
7,3
j '3,8
12,7
6.1
3.4
10,3
5,3
3.1
8,7
4.7
2.9
7.6
4,3
2.7
6.9
4,0
2,6
6,3
3.8
2,5:
5.8
3,6
2,5
5.4
3.4
2.4
20
125.6
26.5
8.6
45,6
13,8
5,8
24,9
9,3
4.5
' 16.S
7.2
3.8
12,6
6,0
3,4
10.2
5,2
3,1
8.6
4.6
2.8
7.5
4.3
2,7
6.S
3.9
2,6
6.2
3,7
2.5
5,7
3,5
2,4
5,3
3.3
2,3
40
125.3
26,4
8.6
45,4
13,7
5.7
24.8
9.2
4,5
' 16,6
7,1
3.8
12.5
5,9
3,3
10.1
5,1
3.1
8.5
4,6
2.8
7,4
4.2
2.7
6.7
3,9
2.5
6,1
3,6
2.4
5,6
3.4
2.4
5.2
3.3
2.3
50
125.0
26,4
8,6
1 45,2
13,7
5,7
24,6
9.1
4,4,
16.5
7.1
3,8
12,3
5.9
3,3
Ю.о;
5,lj
3.0
8,4
4,5
2,8]
7,з|
4.M
2,6
6,6
3,8
2,5
6.0
3.6
2.4
5.5
3.4
2,3
5.1
3,2
2.2
1
75
124,7
26,3
b.6
45.0
13,6
5,7
24.5
9,1
4,4
16,4
7,0
3,7
12.2
5,8j
3.3
9,9
5.01
3,0
8.3
4.5
2,5
7,2
4.1
2,6
6,5
3.7
2,5
5,9
3,5
2.4
5.4
3.3
2.3
5.0
3.1
2 2
I 100
124,4
1 26,2
8,6
44,7
13.5
5.7
\
24,3
9,1
4,4
16,2
7,0
3,7
12.1
5.8
3,3
9,7
5.0
3.0
8.1
4.4
2.8
7.1
4,0
.2,6
6,3
3,7
2,4
5.7
3.5
2,4
5,3
3.3
2.3
4,9
3,1
2.2
20Э
124,1
26.2
8.5
1 44,5
13.5
5.7
24,1
\ 9,1
1 4'4
16,1
6.9
3,7
12.0
5,7
3.3
9.6
4.9
3.0
8.0
4,4
2.7
7.0.
4.0,
2.6
6.2
3,7
2,4
5,6
3.4
2,3
5,21
3.2
2,3
■ ■ 1
4.8|
З.1!
2 2'
1
50Э
123,8
26,1
8,5
1 44.3
13,5
5,6
24.0
'9.0
4.4
15.9
6 9
. 3,7
11.8
5,7
3,2
9.5
4.9
2.1
7.9
4.3
2.7
6.9
3.9
2.6
6.1
3.6
2,4
5.5
3.4
2.3
5.1
3,2
2.2
4,7i
3.0
2,1
-
123.5
26.1
8,5
44,1
13,5
5.6
23,8
9,0
! 4,4
1
! 15.8
6,9
3,7
1 11.7
5.7
3,2
9,4
4,9
2,9
7,8
4,3
2,7
6.S
3.9
V
3
■ 4
5
6
7
8
9
10
2.5
6.0 11
3,6
2,4
5.4
3.4
2,3
5.0
3.2
2.2
4,6
12
13
14
3,0
2,1
112
113
Продолжение табл. £
<уМ| i
J5
IG
17
18
19
20
21
22
23 1
24 1
25 1
26 |
27 1
1
16.
8.
4.
16.
8.,
4..
15.'
8,'
4,f
15.4
8.2
4.4
15.2
8.2
4.4
14.8
1 8.1
4.3
14.6
8.0
4,3
14,4
7,9
4,3|
14.2
7.9
4.3
14,0
7.Щ
4.3
13,9
7.8
4.2
13.7
7,7
4.2
13.6
2
6 П,
7 6,
5 3.
1 1).
5 6.
3 3,(
Ц 10./
II 6.
> 3.(
10.4
И 6.С
3,5
1 Ю,2
5,9
3,5
10,0
! 5,8
3.5
9.S
5.8
3.5|
9,6
5,7
3.4
9.5
3
3 9.3
4 5,4
7 3,3
Щ 9.0
2 5,3
5 3,2
1 8.7
5.2
) 3.2
8.5
> 5.1
3.2
8',3
5.0
3.1
8,1
4.9
3.1
7.9
4.9
3.1
7.8 ]
4 8
3,0
7.7
5.7 4,8 1
3.41 3.0
9.3 7.6 1
5.6*47
3.4
9,2
5.6
3.4
9,1
5.5
3.4
9.0
7.7 5.5|
4.2|
3.3
3.0
7.5 |
4.7
3.0
7.4
4.6
3.0
7.3
4.6
3.1
4
1 8.3
4.9
3,1
7,9
4,8
3.0
7.7
4.7
3,0
7.5
4,6
2,9
7,3
4.5
2,9
7.1
4.4
1 2.9
7,0
4.4
2.6*
6.8
4,3
2 8
6.7
4,3 1
2.8 1
6.6
4.2
2.8
6.5
4.2
2,8
6.4
4.1
2,7 1
6.3
4.1
2.7
5
G
7,6 • 7,1
4,6
2,9
7.3
4,4
2.9
7.0
4,3
2,8
6.8
4.2
2,8
6.6
4.2
2,7
6.5
4.1
! 2.7
6.3
4,0
2.7
1 4,3
2,8
6.8
4.2
1 2,7
6,6
4,1
2.7
6.4
4.0
2,7
6,2
3.9
2,6
6.0
| 3.9
2,6
5.9
3.8
2.6
6,2 ! 5.8
4.0
2.7
6.1
4.0
2.6
6.0
3,9
2,6
5,9
3,9
2.6
5.8
3.8
2.6
5.7
3.8
2,6
3.8
2.6
5.6
3.7
2.5
5.6
3,7
2,5
5.5
3.6
2.5
5.4
3.6
2.5
5,3
3.6
2.5
7
6.8
4.1
2.7
I 6.5
4.0
2,7
6.3
3 9
2.6
6.1
3.8
2,6
5,9
3.8
2,5
5.7
3.7
! 2.5
5.6
3.6
2,5
5,5 1
3,6
2.5
5,4 |
35
2.4
5.3
3.5
2,4
5.2
3.5
2.4
5.1
3.4
2.4
5.1
3.4
2.4
1
6
6.5
4,0
2.6
1 6,2
3,9
2.6
1 6.0
3.8
2.5
1 5.8
3.7
2.5
5.6
•3.6
2,5
5,4
3.6
! 2.4
5,3
3.5
2.4
5.2 1
3.4
2.4
5,1
3,4
2,4
5.0-
3.4 J
2.4 1
4.9
3.3
2.3
4.8
3.3
2.3
4.8.
3.3
2,3
9
6.3
1 3.9
[ 2,6
6.1
3.8
2.5
5,8
3.7
2.5
1 5,6
3.6
2,7
5,5
3.5
2.4
5.3
3.4
! 2.4
5.2
3,4
2.4
5.1
3.3
2.4
5.0
3.3
2,3
.4.9 1
3.2
2,3
4.8 1
3.2
2.3
4,7 I
3,2
2,3
4,7 1
3,1
2.2 |
10
6.2
3,8
2,6
1 5.9
3.7
2,5
5.7
3.6
2,4
1 5,5
3,5
2,4
5.3
3,4
2,4
5.1
3,4
2,3
5.0
3.3
и
6.0
3,7
2.5
5,8
3.6
2,5
5.5
3 5
2,4
5,3
12
5,8
3,7
2,5
5,6
3.5
2,4
5.3
3.5
2,3
5.1
3.4 | 3.4 1
2.4
5,2
3.4
2,3
5.0
3.3
1 2,3
4,9
3,2
2,3 2,3
4.9J 4,8 |
3,3 3,2 1
2.3
4,8
3,2
2,3
4.7.
3,2
2.3
4.6
3,1
2,2
4.5
3.1
2.2
4,5 1
2,3
4.7
3.1
2,2
4.6 1
3.1
2,2
4,5
3,0
2,2
4,4 1
3,0
2,2
4.4 I
3,1 3.0 |
2,2
2.2
2.3
1 5.0 1
3.3
2,3
4.8
3.2
2,3
4,7 1
3,2
2,2 J
4.6 1
3.1
2,2
4,5
3,1
2.2
4,4
3,0
2,2
4,3
3,0
2,2
4,2
3,0
_2.М
4.2
2.9
2.1 J
14
5.6
3.6
2,4
5.4
3,5
2,4
5.1
3.4
2,3
5.0
3.3
2,3
4,8
3.2
2,3
1 4.7
3.1
2,2
4.5
3.1
2,2
1 4,4
3,0
2,2 ,
4.3
3.0
2'1
Щ
1 2'9
2.1
4.2
2.9
2.1
4.1
2,9
2,1
1 4.0
J 2.8
Н
!Г,
5,5
3,5
2,4
5,3
3.4
2,3
1 5,0
3.3
2.2
4.8
3,2
2.2
1 4.7
3,1
2,2
4.5
3.0
2,2
4,4
3.0
2.1
4.3
2,9
2,1 |
4.2
2.9
2.1 J
4.1 1
2.8
2.1
4.0 1
2,8
2,1
3.9
2,8
2.0 J
3,9 1
2.7
2,0
20
5,3
1 3,4
1 2,3
5.1
3,3
2.3
4,8
3.2
2,2
4.7
3,1
2,2
4,5
3,0
2,1
4,4
2.9
2,1
4,2
2.9
2,1
4,1
2,8
2,1
4.0
2,8
2.0
3.9
2 J
2.0
3.9
2.7
2,0
3.3
2.7
2,0
3.7
2.6
2,0
24
5,1
3.3
2,3
1 4,9
3.2
2 2
4.6
3.1
2;2
4,5
3.0
2,1
4,4
2,9
2.1
4,2
1 2,9
2.1
4,0
2.8
2.0
30
5,0
3,2
2,3
4,8
3,1
2,2
Г4.5
3.0
2,1
1 4,4
2 9
2,1
1 4.2
! 2,9
2,1
4.1
2,8
2.0
3.9
2.7
2,0
3,9 j 3,3
2.7 ! 2,7
2.0 1
3.8
2.7
2.0
3,7
2.7
2.0
3.7
2.6
2.0
3.6
2.6
1.9
3.5
2.5
1.9 |
2.0 |
3.7
2.6
2.0 1
3.6
2.6
1.9
3.6
2,5
1.9
3.5
2.5
1.9
3.4
2.5
1.9
40
4.9
Зг1
2Г2
4.7
3,0
2,2
4.4
2,9
2.1
4.3
2,8
2;1
1 4.1
2,3
2,0
4,0
2.7
2.0
3,8
2.6
2,0
3,7
2,6 1
1.9
3,6
2.5
1.9
3.5
2,5
1.9
3.5
2.4
1.9
3.4
2.4
1,8
3.3
2,4
1,8
50
4,8
3.1
2,2
4.6
3,0
2,1
4.3
2,9
2.1
1 4.2
2,8
2,0
4,0
2,7
2.0
3,9
2,6
2.0
3.7
2.6
1,9
3.6
2.5
.1.9
3.5
2.5
1.9
3.4
2.4
1,9
3.4
2,4
1.8
3.3
2.4
1.8
3,2
2.3
1,8
75
4,7
3,0
2,2
4.5
2,9
2,1
1 4.3
2.8
2,0
4.1
2,7
2.0
| 3,9
2.6
2,0
3,8
2,6
1 *'9
3,5
2.5
1,9
3,5
2,5
1,8
3,5 '
2.4
1,8
3.4 1
2.4
1,8
3.3
2.3
1.8
3.2
2.3
1.8
3.2
2,2
1.8
100
4 6
3.0
2.1
4,4
2.9
2.1
4.2
2,8
2,0
1 4,0
2,7
2,0
3,8
2.6
1.9
3,7
2,5
1,9
3,6
2.5
1.9
3.5
2.4
1.3
3.4
2.4
1.6
3.3
2,3
1,8
3,2
2.3
1,8
3,1
2,2
1,8
3.1
2.2
1.7 |
200
4,5
2.9
2,1
4.3
2.8
2,0
/•4.1
2,7
2,0
3.9
2.6
1.9
3.7
2,5
! 1.9
3.6
2.5
1,9
'3,5
2.4
'1.8
3.4
2.4
1.3
3.3
'2,3 |
1.8
•3,2 I
2.3
1.8
3.1
2.2
1,7
•3.0
2,2
1,7
3.0
2.2
1.7 |
500
4.4
2.9
2,1
1 4.2
2.8
2,0
1 4.0
•2,7
2,0
3.8
2.6
1.9
1 3.6
2,5
1,9
3,5
2.4
1,8
3,4
2,4
1.8
3,3
2,3 i
1.8Sj
3.2
2.3
1.8
3,1
2.2
1,7
3.0
2.2
1.7
2,9 1
2.1
1,7
2.9 1
2.1
1,7
l-i/
4,3
2.9
2,1
4.1
2,8
2,0
3.9
2,7
' 2.0
1 3.7
2.6
1.9
: з.5
2.5
1.9
3.4
2,4
1.8
3,3
2,4
1.8
3.2
2.3
1.8
3.1 ,
2,3
1,8
3.0 1
2.2
1.7
2,9
2,2
1.7
2.8
2.1
1,7
2.8
2.1
1,7
15
1 16
1 l?
I ,3
19
20
21
22
23
24
25
26
27
114
115
Продолжение табл. £
»
м
4.0
2.8
2,1
4,0
2,8
2,0
3,9
2,7
2,0
3.8
2.7
2,0
1 3.8
2,7
2.0
3,7
2.6
2.0
3.7
2,6
2.0
3,6
2,6
1,9 .
3,6
2,5
1.9 j
3.5 1
2.5
1.9
3,4
2.5
1.9
3.4
2,5
1.9
з.з
2.5
1.9
16
3.8
2.7
2.0
3,8
2.7
2.0
3.7
2.7
2.0
3.7
2.6
2.0
3,6
2,6
1.9
3,6
2,5
1.9
3,5
2.5
1,9
3.5
2,5
1.9
3.4
2,5
1.9
3.4
2.4
1,9
3,3
2,4
1.9
3.3
2,4
1.9
3,2
2.4
1.8
20
3.7
2.6
2.0
3.6
2,6
1.9
3.6
2.5
1.9
3.5
2,4
|.,9
1 3,5
2,5
1.9
3.4
|2.4
1.9
3.4
2.4
1.9
з.з
2,4
1.8 1
3.3
2.3
1,8
3.2
2.3
1,8
3.1
2,3
1.8
3.1
2.3
1.8
3,0
2.3
1.8
24
3.5
2.5
1.9
3.4
2.5
1.9
3.4
2.5
1.9
3.4
2,3
1.9
з.з
2,4
1,8
3.3
12,3
1.S
3,2
2,3
1.8
3,2 |
2,3
1.8
3.1
2.3
1.8
3*1
2.2
1,8
3.0
2,2
1.7
3.0
2,2
1.7
2,9
2,2
1.7
30
3.4
2.4
1.9
з.з
2.4
1.8
3,3
2.4
1.8
3.2
2,3
1.8
1 3.2
2.3
1.8
3,1
2.3
1.8
3,1
2,2
1,8
3,0 j
2,2
1,7
3,0
2,2
1.7
2,9
2.1
1,7
2.8
2.1
1.7
2.8
2.1 1
1.7
2,7
2,1
1.7 |
40
3,3
2,3
1.8
3.2
2.3
1.8
3.2
2.3
1.8
3.2
2.2
1.8
3,1
2.2*
1.7
! з.1
2.2
1.7
3.0
2.1
1,7
з:о
2.1
1.7
2,9
2.1
1.7
2,9
2,1
1.7
2.8
2,0
1.5
2,8
2.0
1.6
2.7
2.0
1.6
50 j 75
3,2
2,3
1.8
1 3,1
2,3
1.8
1 3,1
2,2
1.8
I 3.1
2.2
1,7
I 3,0
2,1
1.7
3.0
2,1
1.7
2,9
2,1
1.7
2.9 j
2,0
1.7
2.8
2.0
1.6
2.8
2,0
1.6
2,7 1
2,0
1.6
2.7 1
2,0
1,6
2.6
1.9
1.6 |
3.1
2,2
1.7
3,0
2,2
1.7
3,0
2,2
1.7
3,0
2.1
1.7
2.9
2.1
1,6
! 2.9
2,0
1,6
2.S
2.0
1,6
2.8
2.0
1.6
2J\
1,9
1.6
2,7
1.9
1,6
2,6
1.9
1.6
2.6
1.9
1.6
2,5 1
1.9
1.5
100
3.0
2,2
1.7
2.9
2.1
1.7
1 2.9
2,1
1,7
2,8
2,1
1.7
2,8
2,0
1.6
2.7
2.0
1.6
2.7
2.0
1,6
2.6
1.9
1.6
2.6
1.9
1.6
2.5
1.9
1.6
2,4
1.9
1,5 1
2.4
1.8
1.5
2.3
1.8
1.5 -
200
l
1 2.9
2.1
1.7
! 2.8
2.1
1,7
1 2,8
2.1
1.7
2.7
2.0
1.6
2,6
2,0
1,6
2,6
1,9
1.6
2,6
1.9
1.6 ,
2.5
1.9
1.5
'2,4
1.8
1,5
2.4 1
1,8
1.5
2.3
1.8
1,5
2,3
1.8
1.5
2.2
1.8
1,5
500
2.8
2.1
1,7
2,7
2.1
1.6
1 2.7
1 2.0
1,6
1 2.6
2.0
1.6
1 2.6
1,9
1,6
2.5
1,9
1.6
2,5!
1,9 j
1.5
2.4 1
1.8
1.5
2.4 1
1.8
1.5
2.3 1
1.8
1.5
2.2
1,8
1.5
2,2 1
1.7
1_.5_
2.1
1.7
1.5 |
l-l/
2,7
2.1
1.6
1 2.6
2,0
1.6
2.6
2.0
1.6
I 2.5
2.0
1,6
2.5
1,9
1,5
2.4
1.9
1.5
2.4
1.8
1.5 .
2.3
1.8
1.5
2.3
1.8
1.5
2.2
1.7
1.5
2.1
1.7
1,5
2,1
1,7
1.4
2.0
1.7
1,4
28
1 29
1 30
32
34
36
38
40
42
44
46
48 '
50
117
Продолжение табл. ?
! J2
3.4
2.5 '
1.9
'" ~
3.3
2,5
1,9
3,2
2.5
1,9
3,2
2Л
1,9
3,1 1
2.4
1,9
3.1 1
2,4
1.8-
3.0*1
2.34
1,8
2.9 1
2,3
1,8
'2,9 j
2,3'
1.8
2.8
2.2'
1.8
2.8-1
2,3'
',81
2,74
2.2
1.7;'
14 16
3,3
2.4
1.9
3,2
2,4
1.9
3,1
2.4
1,8
3,1
2.3
1.8
3,0
2,3
1.8
3,0
2,3
1,8
._
2,9
2,2
1.8
2,8
2,2
1.3
2.8
2,2
1.7
2,7
2,1
1,7
2,7 1
2,2
1,7
2,6
2.1
1.7
20
3,2 | 3,0
2.3 1 2,2
1 1.8 1 1.8
1 3,1 » 2,9
2,3
1.3
3.0
2.3
1.8
3.0
2.3
1.8
2,9
2,2
1.8
; 2.8
2.2
1.7
2,8
2,1
! 1«7
2,7
2,1
1.7
2,6
2.1
1,7
2.5
2,0
1.7
2.5
2.1
1.6
2,4
2,0
1.6
2,2
1.7
•2,3
2,2
1 XJ
1 2,8
2,1
1.7
I 2.7
2.1
1.7
2,7
2,1
1.7
2.6
2,0
1.6
2,5
2,0
1,6
2,5
2,0
1.6
2,4
1,9
1,6
2,4
2,0
1.6
2,3
1.9
1.6
21
Ь,9
2,1
1.7
1 2,8
2,1
1,7
2,7
2.1
1.7
30
I 2,7
2.1
1.7
2.6
2.0
1.6
2.5
2,0
1.6
2,7 2.5
2,1 , 2,0
1,7 j 1.6
|2,6
! 2,0
1.6
2,5
2,0
1 '*6
2,5
1 1.9
1.6
2.4
1,9
1.6
2.3
1.9
1.6 1
2,2
1.8
1.5
2.2
1.9
1.5
2,1
1.8
1,5
1 2.4
•1,9
1.6
1 2,4
1.9
1,6
2,3
1.8
1.5
2,2
1.S
1.5
2.2 '
1.8
1,5
2,1 1
1.7
1,5
2,1
1,8
1,5
2.0
1.7
1,5
40
2,7
2,0
1.6
2,6
1.9
1.6
2,5
1.9
|'!.6
2.5
1,9
1.6
2,4
1,8
1,5
2.3
1.8
1,5
2 3
1.7
1,5
2.2
1.7
1.5
2,1 j
1.7
1.4
2.0
1.6
М
2,0
1.7
1,4
1.9
1.6
1,4
1
50
2,6
1.9
1.6
1 2,5
1.9
1.6
1 2.4
1.8
1.5
2,3
1.S
1.5
2.3
1.8
1.5
2,2
1.7
1.5
2,1
1,7
1.4
2,0
1.7
1.4
. 1.9 j
I.6
1.4
1,9
1.6
1.4
1,8
1,6
1.4
1.7 1
1.5
1.3
75
2,5
1.8
1.5
2.4
1.8
1.5
1 2,3
1.8
1,5
2,2
1,7
1,5
1 2.2
1.7
1.4
2,1
1,6
1,4
I 2,0
! 1.6
1.4
1.9
1.6
1,4
1.8
1.5
1.3
1.8 1
1.5
1,3
Г.7
1.5
1.3
1.6 I
1,4
1,3
I
100
2,3
1.8
1.5
1 2,2
1.7
1.5
2.1
I.7
1.5
2,1
1.7
1.4
2.0
1.5
1.4
1.9
1,6
1,4
• 1.9
1.5
1,4
Л.8
1,5
1.3
1.7
1.5
1,3
1.6
1.4
1.3
1.6
1,4
1.3
1,5
1.4
1.2
20О
'2,2
1.7
1.5
1 2,1
I.7
.1.4
2,0
1.6
1.4
1 2,0
'1.6
1.4
1.9
1.6
1,4
1.8
1,5
1.3
1,8
1,5
1.3
1,7
1.4
1.3
1,6
•1..4
1.3
1,5 1
1.3
• *».2
1.5 1
1,4
1,2
М
1.2
.1.2
500
2. '■
1.7
1.4
2.0
1.6
1.9
1.6
1.4
1 1.8
I.6
1.4
1,8
1,5
1 1.3
1,7
1,5
1.3
1.6
1,4
1.3
1.5
1.4
1,2
1,4
1.3
I..2
.1.4
1,2
1,2
1,3
1.2
1.1
1.2
1,1
1.1
1-1/
2.0
1.5
1.4
1.9
1.6
1.4
1.3
1.6
1.4
1 I»7'
1.5
1,3
1.7
1.5
1,3
1,6
1,4
1,3
1,5
1.4
1.2
1.4
1,3
;я
•Mi
1,ч
.Ы
• "ti
i,2
■йА\
U
1.1
i 1
l.i
•1.0
1.0
1
55
1 60
1 65
70
80
100
125
150
200
400
'1000
'со
119
л*
УГЛЫ ф В РАДИАНАХ, ср ~^г- arcsin {/■ р-
у;
Таблица 2/
р
0.0000
0,0001
0,0002
0,0003
• 0,0004%
0,0005
0,0006 j
0,0007
0.0008
0,0009
0,001
0,002
0.003
0,004
0,005
0,006
0,007
0,008
0.009
0,01
0.02
0.03
0,04
0.05
0,06
0.07
0.08
0.09 1
0,10
0.11
0.12
0.J3
0,14
0,15
0,16
0,17
0,18
0,19
0.20
0,21
0.22
0,23
0.24
0,25
0,26
0,27
0.28
0,29
0.30
0.31
0,32
0.33
0.34
0.35 .
0.36* •
0.37
0.38
0.39
0.40
0
0.0000
0.0200
0,0283
' 0.0346
* 0.0400
0.0448
0.0490
0,0529
0.0566
0.0600
0,0632
0.0S95
0,1096
0.1266
0.1415
'0.1551
0,1676
0,1791
0.1900
0.2003
0.2838
0.3482
0.4027
0.4510
0.4949
0.5355
0.5735
0.6094
0.6435
0.6761
0.7075
0.7377
0,7670
0,7954
0.5230
0,8500
#0,8763
0,9021
0.9273
0.9521
0,9764
1.0004
I.0240
1.0472
I.0701
1 1.0928
1.1152
1.1374
1.1593
1.1810
1.2025
1.2239
I.24^1
1.2661
Г (.2870
1.3078
1.3284
1.3490
1,3694
1
0,0063
0.0210
0.0290
0.0352
0,(405 !
0.0452 !
0.0494
0.0533
0.0569
0,0604
0.0664
0.0917
0.1114
0.1282
0,1429
0,1563
0,1687
0,1803
0,1911
0,2102
0.2909
0,3540
0.4078
0.4556
0.4991
0.5394
0,5772
0.6129
0.6468
0,6793
0.7107
0.7407
0,7699
0.79Н2
0,8258
0,8526
0.8789
0,9046
0.9298
0,9545
1 0.9788
I 1,0027
1.0262
1.0195
1.0724
1.0951
1.1174
1.1396
1.1615
1.1832
1.2U45
I,2260
1.2472
1.26*2
1.2891"
1.3093
1.3305
1.3510
1.3715
2
0.00S9
0,0220
0.0297
0.0358
0.0410
0.0456
0.0498
0.0537
0,0573.!
0.0607
0.0693
0.0939
0,1132
0.1297
0,1443
0.1576
0.1G99
• 0.1814
0.1921
0.2195
0.2978
0.3597
0.4128
0,4601
0.5033
0,5433
0.5808
0.6163
0,6501
0,6*25
0,7136
1.7437
0.7727
0.8010
0.82S5
0.8553
0.8815
0.9071
0.9323
0.9570
0.9813
j l.0051
1.0286
1.0518
I.0747
1.0973
1,1197
1.1418
1.1636
1.1853
1.2068
. 1.2281
1.2493
1.2703
1.2912
1.3119
1.3326
1.3531
1,3735
' Последние цифры
3
0,0110
0.02SS
0.0303
0,0363
0.0415
0.0460
0.0502
0.0540
0.0576
0.0610
0,0721
0.0959
0.1149
0.1312
0.1457
0.1589
0.1711
0.1825
0 1932
0.2285
0.3045
0.3654
0.4178
0.4646
0,5074
0.5472
0.5845
0.6198
0.6534
0.6857
0.7167
0.7466
0.7756
0,8038
0,8312
0.8579
0.8841
! 0,9097
1 0.9348
| 0,9594
0,9830
1.0075
1,0310
1.0541
1.0770
1.0996
1.1219
1,1440
1.1658
1,1875
1.2090
.1.2303
1.2514
1.2724
1.2933
1.3140
■1.334G
1,3551
1.3/56
4
0,0126
0.0236
0.0310
0.0369
0.0420
0.0165
0.0506
0.0543
0,0580
0,0613 !
0,0748
0,0979
0,1167
0.1328
0,1471
'0,1602
0,1723
0.1S36
0.1942
0,2372
0.3111
0,3709
0,4227
0.4690
0.5115
0,5510
0.5881
0.6232
0.6567
0.6S.XS
0,7197
0,7495
0.7785
0,8065
0,8339
0,8606
! 0.8807
1 0,9122
0,9373
0,9619
0.9860
1.0098
1,0333
1.056»
1,0793
1.1018
1.1241
1,1462
1.1С80
1,1896
1.2111
1.2324
1.2535
1.2745
1.2953
1.3161
1.3367
1,3572
1,3776
доли и процентл
5
0.0142
0,0245
0,0317
0.0374
0.0425
0.0469
0.0510
0,0547
0.0583 !
0.0610
0.0775
0.1000
0.1184
0,1313
0,1 «185
0,1614
0.1734
0.1847
0,1953
0,2456
0,3176
0,3764
0,4275
0.4735
0.5156
0.5543
0,5917
0,6267
0.6600
0,6920
0 7227
0.7525
0,7813
0.8093
0,5366
0,8632
0.8892
1 0,9147
0.9397
0,9643
0,9884
1.0122
1.0356
!.0587
1,0815
1,1040
1,1263
1,1483
1.1702
1.1918
1,2132
1.2345.
1,2556
1.2766
1.2974
1.3151
1 3387
1.3592
1,3796
G
0.0155
0.0253
0.0323
0.0379.
0,0429
0,0473
0.0514
0.0551
0.05S7
0.0620.
0.0800 1
0.1020
0,1200
0.135S
0.1495 {
0.1624
0,1746
0.1857
0 1963
0.2537
0.3239
0.3SI8
0,4323
0.47.8
0,5196
0.55S6
0.-5953
0.G301
0,6632
0,6951
0,7258
0,7554
0.7541
0.5121
0,8393
0,3658
| 0.8918
0,9173
0,9422
| 0,9667
0,9905
1,0146
1.0379
1.0610
1,0838
1.1063
1.1285
1 1505
1.1723
1.1939
1,2154
1 23% •
1,2577
1.27*7
1.2995
1.3202
1,ЗШ
1,3613
1.3817
•
7
0.0167
0.0261
0.0329 |
0.03S5
0,0434
0.047S
0,0518
0,0555
0,0590
0.0623
0,0824
0,1039
0.1213
0,1373
0.1511
0.1639
0.1757
0.1563
0.1973
0.2615
0.3301
0,3871
0.4371
0.4822
0,5237
0,5624
0.59S8
0.6334
0,6665
0,6982
0.7283
0.75N3
0.7800
0.3143
0.8420
0.8685
0.8944
0,9198
0.9447
0.9692
0,9932
i 1.0169
1.0103
1,0633
1.0560
1.1055
1.1307
1.1527
1.1745
1.1961
1.2175
1.2387
1,2598
1.2508
| 1,3016
1.3222
1.3428
'1,3633
1,3837
8
0,0179
• 0,0269
0.0335
0.0390
0.0438
0.0452
0,0522
0,0559
• 0.0593
0,0626
0.0S49
0.1059
0.1234
0.13S7
0.1525
0.1651
0,1769
0.1579
0.1953
0.2691
0.3363
0,3921
0.441S
0.4565
0.5276
0,5661
0.6024
0.6365
0.6697
0.7013
0.7318
0.7612
0,7598
0.5176
0.S446
0.S711
0.8970
0.9223
0.9422
0,9716
0,9956
1,0193
1,0426
1.0656
1,0533
1.1107
1.1329
! 1,1549
1.1767
1 1.1932
; 1.2196
1,2405
| 1.2619
I,252S
1,3036
1.3243
1.3449
1,3654
1.3357
1
9
0.0190
0,0276
0.0341
0.0394
0,0443
0.0486
0,0^25
. 0.0562
0,0597
0.0629
0.0S72
0;1075
0.1250
0.1401
0,1535
0,1664
0 1780
0.1S90
0.1993
0.2765
0.3423
0.3976
0.4464
0,4907
0.5316
0.569S
0,6059
0.6402
0,6729
0.7044
0.7348
0.7641
0,7926
0.5203
0.S473
0.8737
0,S995
0,9243
0.9496
0,9740
0.99S0
1.0216
1.0449
1.0679
1.0906.
I 1 .ИЗО
1,1352
1.1571
.1.1788
I 1.2004
1.2218
1 1.2430
I 1.2610
1,2849
1.3057
1.3264
1.3409
1,3674-
1.3877
P % ■
0,00
0,01
0.02
0.03
0.04
0.05
• 0.06
0,07
0,08
0.09
0.1
0,2
0,3
0.4
0.5
0.6
0.7
0.8
0,9
1.
2.
3.
4,
5.
6,
7,
8,
9.
Ю.
11,
12.
! 13.
14.
. lo.
16.
17.
18,
19.
20.
21.
22.
23,
24.
25.
26.
27.
2S,
29.
30.
31.
32.
33.
34,
35,
36.
37.
35.
39,
! 40.
Продолжение табл. У}
Р 1 ° 1 ' 1 2 1 3 |- ' Л |
0.41
0.42
0,43
0,44
0.45
0.4G
0.47
0,48
0,49
0.50
0.51
0.52
0,53
0,54
0,55
0.56
0,57
3 0.58
о 0,59
0.60
0,61
0.G2
0.G3
0,64
0.65
O.oG
0.67
0,68
0.6У
0,70
1,3898'
1.4101
1,4303
1.4505
1.470G
1.4907
1.5108
1.5308
1,5508
1.5780
1,5908
1,6108
1.G308
1.6509
1.6710
1.6911
1.7113
1.7315
1.7518
1.7722
1.7926 '
1.8132
1.8338
1,8516
1,8755
1,8965
1,9177
1.9391
1.9600
1.9823
0.71 1
0,72
0,73
0.74 |
0,75 |
0,76
0,77 1
0,78
0.79 |
0.80
0,81
0.82 !
0.83
0.84
0.85
0.86
0.87
0.88
0,89
5 °'П?
и> 0.91
0.92
0.93
0,94
0,95 •"
0.96
0.97
0,98
. 0.990
0.991
0,992
0,993
0.994
0.995
1,3918
1.4121
1,4324
1.4525
1.4726
1,4927
1.5128
1.5328
1,5528
1.5728
1.5928
1,6128
•1,6328 j
1.6530
1.6730
1.6931
1.7133
1.7335
1.7538
1.7742
1.7947
1.8152
1.8359
1.8567
1 1.8776
! 1.8986
| 1,9198
1.9412
1.9628
1.9845
1,3939
1,4142
1.43Н
1,4515
1.4748
1.4917
1.5145
1,5348
1.5548
1.5748 |
1.5948
1.6148
1.634S
1.6549
1.6750
6.6951
1,7153
1.7355
6.7559
1.7762
1.7967
1.«172
-1.8380
1 .8588
1,8797
1,900S
1,9220
1,9434
| 1,9650
1,9867
2.0042 ! 2.0065
2.0264 |
2.0488
2.0715
2.0944
2.1177
2,1412
2,1652
2.1895
2,2143
2.2395 -
2.2653
2.2916
2.318G
2,3462
2.374G
2.4039
2.4341
2,4655
2.4981
2.5322
2.5681
2.6061
2.6467
2.6966
2.7380
2.7934
1 2.8578
2.94126
2,95157
2.96247
2.97406
2.98652
3.00С
105
2.0286 1
2.0511
2.0373
2.0967
2.1200
2.1436
2.1676
2.1920
2.2168
2,2421 1
2.2680
2.2943 |
2.3213
2,3490
2.3775
2.4068
2.4372
2.4687
2.5014
2 5357
2.5718
2.6100
2.6509
2.6952 '
2,7440
2.7993
2,8650
2.94229
2,9г266
2.96363
2.97531
2.98787
3.001
55
1,3959
1.4102
1.4364 .
1.4566
1.4767
1.4967
1.5168
1.5368
1.556S
1.5768
1.5968
1.6168 '
1.6368
1,6569
1.6770
1.6971
1,7173
1,7376
l.7.>7tf
1.7753
1,7988
1,8194
1.8400
i 1,8609
1,8818
1,9029
1.92U
1.9455
1,9671
1.98S9
2.00S7
2,0309
2.0533
2.0760
2,0990
2.1223
2,1-160
2.1700
2.1944
2.2193
2.2447
2.2705
2,2970
2.3240
2.351S
2.3S04
2.4098
2.4403
2.4719
2.5048
2.5392 '
2.5755
2.61^0-.
2.6552
2.6995
j 2,7492
2.8054
1 2.8725 *
2.94332
2.95375
2.96479
2,97655
2.9892*'*
з,ооз<
J4
2,0109
2.0331
2.0556'
2,0783
2.1013
2,1247
2.1484
2.1724
2.19G9
2,2218
2,2472
2.2731
2.2996
2.3268
2.3546
2.3833
2.4128
2,4136
2.4751
2,5082
2.5428
2.5792
2.6179
1 2.6594
2.7045
2.7545
2.8115
2.8>01
2.914 И
2,9.1484
2.93595
2,97780
2.99058
3,00454
1.3979
1,4182
1,4384
1,4586
1,4787
1.4987
Г.5188
1.5388
1.558S
1,5788
1,5988
1,6188
1,6388
1,6589
1,6790
1.6992
1.7193
1.73VI6-
1.7599
1.7803
1,8008
1.8214
1,8421
1,8629
1.8839
1,9050
1.9262
1,9477
1,9693
1,9911
( 2,0131
2,0353
2,0578
2,0806
2.1037
2,12/0
2.1508
2,1749
2,1994
2.2243
2.2498
2.2759
2,3023
2.3295
2,3575
2.3S62
2.4158
2,4465
2.47S4
2.5115
2.5463
2.5830
2.6220
J 2.6638
2,7093
2.7598
2.8177
2,8-79
2.94538
2 95593
2,96711
2.99904
2.99193
3,00(304
« Г
1.39S0 1
1,4202
1,4404
1.4606
1,4807
1.5007
1,5205
1,5408
U560S
1.580S
i;6003
1,6208
1.6409
1.6>09
1.6810
1,7012
1.7214
1,7416
1.762C
1,7824
-1,8029
1.S2I4
1.S442
1.S650
1.M69
1.9071 |
1,9284
1,9498
1.9714
1.9933
2.0153
2.0376
2.0601
2.0829
2.1060
2,1294
2.1532
2,1773
2.2019
2,2269
2.2524
2,2784
2.3050
2.3*23
2.3603
2.3891
2.4189
2.4496
2.4816
2.5150
2,5500
2.5863
2.6256
2.6681
2.7141'
2.7652
2.8240
2.Ь960
2.91642
2.95702
2.96827
2.98029
2.99329
3.00751
—I_I
1.4020
1.4223
1,4424
1.4627
1,4827
1.5027
1.5228
1,5428
1.5628
1,5828
1,6023
1,6228
1.6428
1.6629
1,6830
1,7032
1,7234
1,7437
1,7640
1,7844 1
1,8049 i
1,8255
1,8463
1,8671
1.SSS1
1,9092
1,9305
1,9520
.1,9736
1,9954
2,0175
2,0398
2.0624
2.0S52
2,1053
2,1388
2,1556
2.1797
2.2043
! 2,2294
2,2549
2,2810
2,3077 .
2.3351
2,2631
2.3921
2,4219
2,4528
2,4849 •
2.5164
2.5535
2.5906
2,6301
2,6726
2.7189
2.7707
2.8305
2.9044
2,91745
2,95811
2.96942
2.98155
2.99464
3,00903
* 1
1,4040
1,4243
1.4445
1,4646
1.4847
1,5048
1,5248
1,5448
1.5648 I
1 .-584S
1,6048
1.6248
1.6449
1,6649
1.6S50
1.7052
1.7254
1.7457
1,7660
1.7865
1,8070 *
:1,827G
1.84S4
1.8692
1.8902
1,9113
1.9326
1.9541
1.9756
1,9976
2,0197 1
2.0421*
2.0646
2.0S75
2,1106 i
.2,1341
2.15S0
2,1822 1
2,2068
2,2319 !
2.2575
2.2037
2.3104
i 2,3373%*
2,3660
2,3950
2.4249
2,4559
2,4882
2.5218
2.5571
2.5944
2.6342
2.6770
2.7238
2.7763
2.S371
2.9131
2:91846
2.95920
2.99058
2.9S278
2.99599
3.01053
8
1,4061
1,4263
1,4465
1,4666
1,4S67
1.506S
1,5268
1.5468
1.5668
. 1,5S68
1,6068
1.626S
1.6469
1 ,b669
1,6871
1,7076
1.7274
1,7477
1,7681
1.7SS5
1,8090
1,8297
1.8504
1.5713
1,S923
1,9135
1.934S
1.9563
1,9780
1.9998
2.0220 1
2,0443
2,0669
2,0898
2.1130
2.1365
2,1604
2.1846
2.2093
2.2345
2.2(501
2.2863
2,3131
2.3406
2.3689
2.3979
! 2.4250-
2.4591
2.4915 !
2.5253
2.560S
2.59S3
2.G3S3
2-.6Ч15
2.728S
2.7819
2.S439
2.9221
2.94951
2.96029
2.97174
2.98403
2,99731
3.01203
9
1.40S0
1,4283
1.44S5
1.4686 "
1.4SS7
1.50S8
1,5288
i 1.548S
i;56ss
1.55S8
1,6088
1.62S8
1.6489
1.6689
1.6S91
1,7092
1.7295
1.7498
1.7701 *
1.7906
1.8111
1.8315
1,8525
1.8734
1.S944
1,9156
1,9369
1.9584
1.9S01
2,0020
2,0242 I
2,0465
2.0692
2.0921
2.1153
2,1339
2.162S
2.1S71
2,2115
2,2370
2.2627 .1
2,2870
2.315S *
2.3434
2.3717
2.4009
2,4310
2.4624
2.4948
2.5237
2,5644
2.6C22
2.6125
2.6S53
2.7335 1
2,7876 1
2,8507
2.9314
2.95054
2.96136
2,97290
2,98527
2,99870
3,01352
1 P%
41,
42,
43,
44,
• 45,
Г 46.
47.
# 48.
49.
• 50. -
51.
52,
53,
54.
55,
56.
57,
58,
59,
60,
61,
62,
• 63.
64,
65,
66.
67,
6S,
69.
70.
571
70
73,
74.
75.'
76',
77.
78,
79.
80,
81.
82,
• 83.
84,
85,
86.
37.
5S.
89.
90.
91'
92.
93,
94.
S3.
96.
97.
93,
99.
99.0
99.1
99 2
99.3
99.4
Продолжение табл. %
0,996
0.997
0.998
0.9990
0.9991
0.9992
0,9993
0.9994
0.9995
0.9996
0,9997
0.9998
0.9999
1,0000
3,01502 1
3.03200 !
3,05212
3.07834
1 3,08467
0,09099
3,09732
3,10364
3.10997
3.11629
3,12262
3,12894
3,13526
3.14159
3,01672
3,03401
3,05474
3.07897
3 08530
3,09162
3,09795
3.10427
3.11060
3,11692
3.12325
3,12957
i 3,13589
3 01842 '
3.03602
3,05736
3.07961 '
3.08593
3.09226
3,09858 .
3,10491 |
3,11123
3,11756 ,
3.12388
3.13020
3,13653
3,02011
3,03804
3,05999
3.08024
3.08657
3.092s9
3.09922
3.10554
11187
11819
12152
13084
13716
3.021S1 !
3,04005 !
3.06261 !
3,08087
3.08720
3,09'-52
3.09985
3.10617
3,11250
3,118Ь2
3,12515
3.13147
3.13779
3,02351
3,04206
3.06523
3.06151
3,08783
3,09416
3,10048
3,10681
3.11313
3.11946
3.12078
3.13210
3,13343
3.02521
3.04407
3.06*55
3,0.ч214
3.0>816
3.09179
3.10111
3,10074
3.11376
3.12009
3.12641
3.1.273
3.13906
3.02691
3.04608
3.07047
3.08277
3.08909
3.09542
3,10174
3,10807
3,11439
3,12072
3.12704
3.13336
3.13969
3.02860
3,01810
3.07310
3,08340
3,08973
3,09605
3,10236
3.10870
3.11503
3.12135
3.12768
3.13399
3,140 2
3.03030
3,05011
3.07572
3.03404
3 09036
3,09669
3,10301
3.10934
3.11566
3,12199
3,12*31
3,13463
3,14096
Таблица . VII
Критические значения Г (критерия Вилкоксона)
\ПУ ^\
4
1 5
6
7
8
9
10
\
10
5
И
17 15
G
12 Ю
18 16
20 23
7
13 Ю
20 17
27 24
36 32
8
14 И
21 17
29 25
38 34
49- 43
9
15 11
22 18
31 2(5
40 35
51 45
63 5В
10
15 12
23 19
32 27
42 37
53 47 1
05 58
78 71
Число для р = 0,05 напечатано обычным шрифтом, а для р=0,01 —
жирны м ш р ифт ом.
Нуленая гипотеза принимается при 7J ^'Ли и отмергается при ТК'Лп-
125
Таблица VIII
Критерий Вилкоксона-Манна-Уитни
1 Щ
?
1 3
4
1 °2
5
6
7
8
9
10
3
4
5
6
7
8
9
10
4
5
6
7
8
9
10 1
1 Уровень значимости
0,05
0
0
0
1 1
1
1
0
0
1
2
2
3
4
4
1
2
3 j
4
5
6
7 1
1 0,01
1
1
0
0
1 ;
1
2
3
з 1
п,
5
6
7
8
9
10 1
п2
5
6
7
8
1 9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10 j
1 Уровень значимости
0,05
4
5
6
8
9
11
7
8
10
12
14
И
13
15
17
15
18
20
21
24
27 |
/Г01
""1
2
3 I
4
5
6
3
4 |
6 |
7
8
6
7
9
11
9
11
13
14
16
19 |
126
Таблица JX
Критические значения Т (критерия Внлкокеона для сопряженных пар)
п
! 6
7
8
^
! 10
fl
12
5%
1
3
5
7
9
12
15
1%
—
1
3
4
6
8
п
13
14
15
16
17
18
19
5%
18
22
26
31
36
41
47
1%
11
14
17
21
24
29
33
п
20
21
22
23
24
25
5%
53
60
67
74
82
90
1% |
39
44
50
56
62
69
Нулевая гипотеза принимается при Т^ ^.Tq5 ц отвергается при
тг<т01.
127
>
Л.А. ВАСИЛЬЕВА
Статистические методы в биологии, медицине
и сельском хозяйстве
Учебное пособие к курсу лекций «Биометрия»
Подписано к печати 21. 08.2007 Формат 60x90 1/16
Тираж 300 экз. Заказ 97 Усл.п.л. 7,9 Уч.издл. 5,7
Отпечатано на ротапринте Института цитологии и генетики СО РАН
630090, Новосибирск, пр. Лаврентьев, 10