Текст
                    ИНСТИТУТ ЦИТОЛОГИИ И ГЕНЕТИКИ СОРАН
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Васильева Л.А.
СТАТИСТИЧЕСКИЕ МЕТОДЫ
В БИОЛОГИИ, МЕДИЦИНЕ
И СЕЛЬСКОМ ХОЗЯЙСТВЕ
Новосибирск, 2007г.


УДК 578.087.1 Настоящее Учебное пособие посвящено описанию некоторых статистических методов, которые наиболее широко используются для обработки экспериментальных данных в области биологии, медицины и сельского хозяйства. Задачей данного Учебного пособия является научить студентов использовать различные статистические методы для обработки экспериментального материала. Знание статистических методов даст возможность представлять экспериментальные данные в определенной системе, оценивать параметры выборочных и генеральных совокупностей. Кроме того, экспериментаторы, использующие статистические методы, смогут оценить характер корреляционных связей между признаками, оценить характер распределений и компоненты фенотипической изменчивости и др. Учебное пособие предназначено для студентов биологических, медицинских, зоотехнических и ветеринарных факультетов, а также аспирантов и научных работников, работающих в области биологии, медицины и сельского хозяйства. Работа частично поддержана грантом РФФИ № 06-04-48116, грантом по Программе «Фундаментальные исследования» Президиума РАН «Динамика генофондов и биоразнообразие» № 11.4.1 грантом Миннауки « ^традиционная изменчивость структуры генома - новый подход управления геномами» № 29/2007. © Новосибирский государственный университет Институт цитологии и генетики СОРАН 2
Содержание Глава 1. Совокупности. §1.1. Биологическая статистика: роль и значение 3 § 1.2. Выборочные совокупности 5 § 1.3. Группировка данных выборочной совокупности по признакам с дискретной изменчивостью 6 § 1.4. Группировка данных выборочной совокупности по признакам с непрерывной изменчивостью 10 § 1.5. Графическое изображение вариационного ряда 11 Глава 2. Оценка статистических показателей выборочных совокупностей 14 § 2.1. Мода и медиана 14 § 2.2. Средняя арифметическая величина и ее свойства 15 § 2.3. Изменчивость признака, ее оценка 16 § 2.4. Дисперсия, варианса, среднее квадратическое отклонение 17 § 2.5. Оценка параметров выборочной совокупности для данных, сгруппированных в вариационный ряд 19 § 2.6. Объединение параметров отдельных подсовокупностей 27 Глава 3. Закономерности случайной изменчивости в совокупностях .. 28 §3.1. Вероятность 28 Глава 4. Достоверность статистических показателей 35 § 4.1. Ошибка выборочной совокупности. Доверительные интервалы 35 § 4.2. Выборочные ошибки для а 39 § 4.3. Сравнение двух выборочных совокупностей 40 § 4.4. Оценка достоверности различий между средними значениями двух выборочных совокупностей 40 Глава 5. Корреляционные связи между признаками 44 §5.1. Коэффициент корреляции 44 § 5.2. Ошибка выборочного коэффициента корреляции 51 § 5.3. Ранговый коэффициент корреляции 53 § 5.4. Регрессия 56 Глава 6. Сравнение степени соответствия фактических распределений теоретическим 58 § 6.1. Анализ характера расщепления в гибридологических опытах 59 § 6.2. Сравнение фактических вариационных рядов с теоретическими, вычисленными в соответствии с закономерностями нормального распределения 61 104
§ 6.3. Оценка соответствия распределения двух эмпирических совокупностей 64 § 6.4. Анализ распределений, сгруппированных в 4-х -польные таблицы 66 Глава 7. Дисперсионный анализ 70 § 7.1. Общие принципы дисперсионного анализа 71 § 7.2. Двухфакторный дисперсионный анализ 77 § 7.3. Иерархическая модель двухфакторного комплекса 80 Глава 8. Статистический анализ качественных (альтернативных) признаков 84 § 8.1. Оценка X, о, s* при альтернативной вариации 84 § 8.2. Оценка корреляции при качественной вариации 88 § 8.3. Дисперсионный анализ при альтернативной вариации ... 90 Глава 9. Непараметрические критерии различия 94 § 9.1. Критерий Колмогорова-Смирнова 94 § 9.2. Критерий Вилкоксона-Манна-Уитни 96 § 9.3. Критерий Вилкоксона для сопряженных пар 99 Рекомендуемая литература 103 Содержание 104 Приложения 106 105
ГЛАВА 1 совокупности § 1.1. Биологическая статистика; роль и здачецие. Необходимость статистической обработки и представление экспериментальных данных в соответствии с определенными правилами возникли сразу как только биологи перешли от описательного метода анализа биологических явлений к экспериментальному. Эксперименты стали неотъемлемой частью биологической науки и потребовали строгого измерения, учета, расчета и анализа. Первые опыты использования математических знаний для анализа биологических явлений принадлежат Френсису Гальтону (F.Galton, 1889), который использовал статистический анализ для опенки связи между отдельными признакацр у людей и степени сходства между родственниками по такому сложному признаку как рост людей. Результатом этих исследований явился труд "Закономерности естественного наследования", где степень сходства между родственниками оценивалась через коэффициент связи или через коэффициент корреляции. Гальтон впервые ввел понятие биометрика в научную литературу. Исследования Гальтона были продолжены Карлом Пирсоном (K.Pearson), последователем, учеником, почитателем и пропагандистом Гальтона. Пирсон внес большой вклад в разработку теории и практики использования некоторых статистических показателей, в частности, коэффициента корреляции применительно к описанию биологических явлений. Кроме того, некоторые биологические науки, например, генетика прямо обязана тому, что Грегор Мендель (G.Mendel) в "Опытах над растительными гибридами" (1865) ввел строгий учет и подсчет расщепляющихся фенотипических классов у гибридов второго поколения (/у. Несмотря на то, что ни Гальтон, ни Пирсон не смогли выделить генетические компоненты, контролирующие рост человека, своими 3
работами эти авторы привлекли внимание биологов к статистике как к одному из методов анализа мерных признаков. Позднее большой вклад именно в оценку отдельных факторов] вносящих вклад в формирование и развитие признаков, был сделан Робертом Фишером (R.Fisher, 1918, 1921). Фишер разработал теорию Analysis of variance (в русском переводе "дисперсионный анализ"), позволяющий выделить отдельные компоненты (факторы), вносящие вклад в общую изменчивость признаков. С 60-х годов математическая статистика стала обязательным условием анализа экспериментальных данных в области биологии, медицины и сельского хозяйства. Одним из факторов, повлиявшим на необходимость использования статистических расчетов экспериментальных данных, является то, что все биологические объекты обладают двумя как бы противоположными свойствами: наследственностью и изменчивостью. Широкая амплитуда изменчивости признаков у различных объектов вынуждает экспериментаторов прибегать как к усреднению данных, так и к оценке границ изменчивости и силы связи между признаками. Другим важным обстоятельством, повлиявшим на процесс внедрения статистических методов для анализа биологических явлений, явилось то, что практически все биологические явления и свойства подчиняются статистическим закономерностям, характерным не отдельным объектам, а целым совокупностям объектов. Оказалось, что если сгруппировать данные, полученные путем измерения любых биологических признаков, в единую совокупность, то эта совокупность будет иметь вид чисто статистической совокупности. Поэтому математическую статистику, используемую в приложении к биологии, стали называть биологической статистикой или биометрией. Таким образом, биологической статистикой или биометрией называется область научного знания, охватывающая классификацию, систематизацию и обработку экспериментальных данных в биологии, медицине и сельском хозяйстве методами математической статистики. 4
§ 1.2. Выборочные сорокуттости. Всякое множество идентифицируемых объектов, отличающихся друг от друга незначительно по конкретному признаку, но сохраняющих сходство по некоторым существенным характеристикам, называется совокупностью. Совокупностью можно называть стадо животных, делянку или поле растений, породу животных или сорт культурных растений, клоны бактерий, штаммы вирусов и др. Совокупности представлены отдельными членами или единицами. Совокупность членов или единиц называется объемом совокупности. Само измеренное значение каждой единицы совокупности называется вариантой совокупности. Различия между вариантами совокупности называются вариацией или дисперсией. Если объем совокупности обозначить через л, а каждую варианту совокупности через х, то в таком случае ряд вариант в совокупности можно записать как xj, X2, *з,...,лгл. Следовательно, если измерен вес 100 зерен пшеницы, то этот пул измерений можно назвать совокупностью, объем которой п = 100. Вес каждого зерна - это варианта совокупности. Если измеренный материал представляет собой только часть от какого-то общего большого материала, то такая совокупность будет называться выборочной совокупностью, а весь огромный материал, из которого взята выборочная совокупность, называется генеральной совокупностью. Например, если измеренные 100 зерен какого-то сорта пшеницы представляют собой выборочную совокупность с объемом п = 100, то вес зерна целого сорта пшеницы можно считать генеральной совокупностью с объемом, равным N -> со. Обработка данных и интерпретация полученных расчетов зависит от того, какие признаки были измерены в эксперименте. Признаки биологаческих объектов в основном представлены тремя категориями. 1. Признаки совокупности, различающиеся определенным качеством. Такие признаки носят название качественных или альтернативных. Например, совокупность представлена красными и белыми цветками гороха, как в опытах Г.Менделя, или совокупность 5
представлена различными окрасками меха норок, или различными окрасками радужной оболочки глаз и др. 2. Признаки, имеющие количественную меру, но различия между отдельными вариантами совокупности выражаются целыми числами. Например, число щенков в пометах многоплодных зверей, число отложенных яиц у птиц, число зерен в колосе и др. Такая количественная изменчивость и такие количественные признаки называются дискретными. 3. Признаки, имеющие количественную меру, но между отдельными вариантами совокупности нет четко выраженных (дискретных) границ. Например, живая масса животных, выраженная в килограммах, но и в граммах, высота - в метрах, сантиметрах, но и в миллиметрах. Такая изменчивость и такие признаки называются количественными признаками с непрерывной изменчивостью (мерные признаки, континьюальные). § 1.3. Группировка данных выборочной совокупности по признакам с дискретной изменчивостью. Если измерения какого-то признака у изучаемого биологического объекта произведены, они записаны в журналах в порядке измерения объектов, т.е. материал представляет собой набор цифр, то при рассмотрении этих измерений невозможно обнаружить какие-либо закономерности. Существуют некоторые простые правила упорядоченья материала. 1. Можно переписать полученные данные в порядке нарастания их величины или в порядке уменьшения величин. Такой способ упорядоченья данных называется ранжированием. Ранжирование данных дает уже некоторое представление о характере экспериментального материала. Так, строго обозначены минимальное и максимальное значения вариант, которые носят название лимитов изменчивости. Самое маленькое значение варианты называется минимальным значением (min), а самое большое - максимальным значением (max). Лимиты изменчивости совокупности можно 6
обозначить как min -s- max. Кроме того, в центре такого упорядоченного (ранжированного) ряда цифр сосредоточено основное количество вариант со "средним значением" признака. Пример 1.1. В Экспериментальном хозяйстве Сибирского Отделения РАН разводится популяция норок с различными генотипами по окраске меха. Изучалась плодовитость норок различных генотипов по окраске меха. Подсчитано число щенков в пометах 50 самок, имеющих "стандартный" генотип окраски меха. Получены следующие данные: 3, 6, 5, 4, 4, 3, 7, 8, 2, 6, 6, 5, 4, 4, 3, 2, 7, 6, 5, 5, 4, 4, 4, 3, 2, 1, 8, 7, 6, 5, 4, 4, 7, 3, 2, 5, 4, 4, 5, 5, 7, 3, 3, 5, 4, 5, 3, 7, 6, 6. Ранжируем варианты совокупности в порядке нарастания числа щенков; в помете: 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8. Такой ранжированный ряд дает представление о том, что лимиты изменчивости такого признака, как число щенков в помете "стандартных" норок, находится в границах min (1); max (8), 1 ч- 8. Среднее значение числа щенков в помете норок можно приблизительно оценить равным 5 щенкам. 2. Другой более наглядный способ упорядоченья вариант совокупности состоит в следующем. Необходимо выписать в столбик все типы вариант, которые встретились в совокупности. Цифры могут быть записаны как в порядке нарастания от меньшего значения к большему, т.е. от 1 до 8, так и в порядке уменьшения, т.е. от 8 до 1. Запишем цифры в порядке нарастания и определим сколько раз каждая цифра встречается в распределении. Тогда различные типы вариант, которые встретились в распределении, будут называться классами и обозначаться дг/, а числа, соответствующие каждому классу - численностями или частотами и обозначаться будут буквой /. Такой ряд чисел, состоящий из классов и частот, называется вариационным рядом. Вариационный ряд дает более четкую картину закономерностей распределения по сравнению с простым ранжированием. Какие это закономерности? 7
1. В центре вариационного ряда сосредоточено основное число значений признака. 2. Чем больше (как маленькие, так и большие) значения вариант отклоняются от значений вариант, находящихся в середине рада, тем меньше таких вариант встречается в совокупности. Класс, в котором представлено больше всего вариант, п = If а 50 I называется модальным классом и значение варианты этого класса, если распределение симметрично, близко к среднему значению анализируемого признака в данной совокупности. Однако такая группировка признаков с дискретной изменчивостью возможна тоща, когда признак представлен сравнительно небольшим числом естественных классов, как это имело место в примере 1.1. Вместе с тем имеются дискретные количественные признаки, у которых достаточно большая изменчивость и, следовательно, большое число классов. Пример 1.2. Подсчитано число лучей в хвостовых плавниках у 100 рыб. Минимальное значение признака у этой группы равно 45 лучам, максимальное значение равно 63. Следовательно, всего имеется 18 естественных классов. Если их использовать все, то получится очень растянутое распределение, в котором сложно будет обнаружить какие- либо статистические закономерности и, кроме того, такой вариационный ряд сложно обсчитывать. В тех случаях, коша естественных классов больше 6-7, можно построить вариационный рад, организовав искусственные классы по следующему принципу. В предыдущем примере 1.1. между соседними классами разница составляла 1 (1, 2, 3, 4, 5, 6, 7, 8). Однако имеется возможность разницу между классами увеличить по мере необходимости до 2, 3 и т.д. Разница между классами называется шагом или классовым Классы, дг, 1 2 3 4 5 6 7 1 й Частоты, / 1 4 9 12 10 7 5 1 1 8
промежутком, обозначается буквой к. Искусственный классовый промежуток можно организовать следующим образом. Необходимо от максимального значения признака в данной совокупности вычесть минимальное значение и разницу разделить на б. Тоща . max-min 63-45 . к = = = 3 6 6 Следовательно, для данной совокупности можно организовать вариационный рад с классовым промежутком между классами, к = 3. Построим вариационный ряд по числу лучей в хвостовых плавниках у 100 рыб, имеющих следующие значения: 45 49 50 51 52 54 54 59 52 53 49 50 51 52 53 60 59 55 48 55 50 52 52 53 58 57 55 60 50 56 51 53 53 54 56 56 54 52 54 55 52 62 59 55 55 55 53 54 56 47 53 61 57 55 54 54 52 48 54 50 54 59 56 54 53 53 54 58 57 52 54 57 55 55 52 51 47 57 51 51 63 56 55 54 51 54 54 54 46 55 60 55 54 53 54 49 55 58 54 55 При построении вариационного ряда, коша классы различаются больше, чем на единицу, необходимо в каждом классе обозначить его начало и конец так, чтобы цифры строго попадали в свой класс. Вариационный ряд: Классы, Xmin ~ Хтах 1 45-47 48-50 51-53 54-56 57-59 60-62 63-65 Частоты, / 4 10 27 41 12 5 1 л = 100 \ 9
§ 1.4. Группировка данных выборочной совокупности по признакам с непрерывной изменчивостью. Подобно признакам с такой дискретной изменчивостью, как представлено в примере 1.2, следует организовывать вариационные ряды для признаков с непрерывной изменчивостью. Пример 1.3. Исследуется длина листьев у 100 растений садовой 1НИКИ гсогаче 9,2 9,0 7,2 7,5 7,0 7,3 9,1 7,4 8,3 6,9 5,2 11,7 7Д 12,0 8,5 9,1 7,7 7,8 8,0 8,0 При (в см). (Пример жкая статистика", 1973). 9,7 10,4 6,4 6,8 7,1 11,0 6,4 8,0 7,2 7,4 8,0 7,8 7,4 8,6 7,8 7,8 9,1 7,0 12,2 7,0 составлении 13,0 7,6 7,7 7,0 8,7 7,7 9,3 8,4 7,2 7,2 7Л 7,2 8,7 7,8 7,9 7,8 7,3 7,6 7,0 6,8 взят из книга П.Ф.Рокицкого 7,4 9,1 9,0 6,4 11,3 11,8 6,5 7,0 6,6 6,2 9,4 9,8 9,9 5,7 7,5 8,2 7,0 11,6 102 10,3 вариационных рядов 8,0 11,8 8,1 7,4 9,6 9,6 9,2 7,1 6,6 6,9 ад 6,6 7,8 8,5 6,7 7,2 7,4 7,5 11,8 8,5 для признаков с непрерывным характером изменчивости необходимо, прежде всего, найти величину классового промежутка, т.к. у признаков с такой изменчивостью вообще нет четко очерченных классовых границ. Поступать следует также как в примере 1.2. 10
, max-min 13,0-5,2 к = = — — = 1,3 6 6 Следует иметь в вицу, что если при делении получено значение к неудобное в использовании, его можно округлить в любом направлении (уменьшить или увеличить) так, чтобы удобно было его использовать в расчетах. Вариационный ряд: Классы, X/nin " хтах 1 5,2 - 6,4 6,5 - 7,7 7,8 - 9,0 9,1 - 10,3 10,4-11,6 11,7-12,9 13,0 - 14,2 Частоты, / 6 42 26 15 4 6 1 п = 100 J § 1.5. Графическое изображение вариационного ряда. После построения вариационного ряда становится очевидным, что можно приближенно судить о среднем значении признака и о лимитах его вариации в данной выборке. Кроме того, вариационные ряды могут быть изображены графически. Графическое изображение дискретных и непрерывных количественных признаков имеет некоторое отличие. Способ построения кривой распределения для признаков с такой дискретной изменчивостью, как представлено в примере 1.1, заключается в следующем. На оси абсцисс наносятся естественные классы от 1 до 8, на оси ординат - частоты (или сколько раз каждый класс встречается в выборке). На месте пересечения класса и частоты ставится точка, а затем точки соединяются кривой (см. рис. 1). Такая кривая носит название полигона распределения. 11
Частоты 12 10, I 8 в 4 2 0 Классы Рис. 1. Полигон распределения 50 самок норок по числу щенков в помете. Для признаков с дискретным характером изменчивости, но с искусственными классами, как это имело место в примере 1.2, полигон распределения строить нельзя, т.к. у каждого класса имеется его начало и конец. Поэтому на оси абсцесс откладываются классы, ще конец предыдущего класса является началом следующего класса. На оси ординат откладываются частоты. Частота каждого класса фиксируется прямоугольником, в котором одна сторона - это начало класса, а вторая - конец класса. Такой график называется гистограммой распределения (рис. 2). Для признаков с непрерывным характером изменчивости также строится гистограмма по такому же принципу, как показано на рисунке 2. Строго говоря, построенную гистограмму можно превратить в полигон распределения, для этого необходимо точки, расположенные на срединах верхних сторон прямоугольников (столбиков) соединить линией (см. рис. 2). 12
40 ■ 30 20 - 10 - 1 f 1 i—► 45 48 51 54 57 Признак 60 63 66 Рис. 2. Гистограмма распределения 100 особей - рыб по числу лучей на хвостовых плавниках. Графическое изображение вариационных радов дает возможность визуально оценить качество оцениваемого экспериментального материала на предмет: 1. Симметричности (асимметричности) распределения. 2. Одно-, многовершинности. 3. Плавности (эксцесса). Всякое отклонение от симметричной плавной кривой имеет свой биологический смысл. Так асимметричность может означать, что отсутствуют некоторые значения признака в выборке, что может 13
свидетельствовать либо о гибели определенных особей, либо о преднамеренной выбраковке определенных особей. Дву- (много) вершинность может свидетельствовать о неоднородности материала (смесь сортов, пород, разных распределений). Эксцесс, т.е. резко увеличенная численность среднего класса, может свидетельствовать об отсутствии по каким-то причинам крайних классов распределения. Таким образом, графическое представление экспериментального материала, кроме наглядности, дает возможность оценить качество экспериментального материала. ГЛАВА 2 ОЦЕНКА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ § 2.1. Мода и медиана. Группировка данных в вариационные ряды позволяет оценить выборочную совокупность с точки зрения размаха лимитов вариации и с точки зрения нахождения класса или классов, в которых концентрируется максимальное количество частот. Развитие признака, значение которого находится в центре вариационного ряда, отражает средний уровень развития этого признака в совокупности. Класс, который представлен максимальной численностью, называется модальным классом (Мо). В примере 1.1 - это класс с 4-мя щенками в помете, Мо = 4. В примере 1.2 - это класс 54-56 лучей в хвостовых плавниках рыб, т.е. А/0 = = 55. Величина моды демонстрирует типичного представителя совокупности. Кроме того, имеется еще одна характеристика среднего уровня развития признака в совокупности - это медиана. Медиана - это варианта, находящаяся точно в средине вариационного ряда и обозначается символом Ме. В примере 1.1 - это 25-ая и 26-ая варианты и их значение равно 4. 14
Однако лимиты, мода и медиана являются приближенными характеристиками размаха изменчивости и среднего значения признака. Более точными характеристиками выборочных совокупностей является оценка среднего арифметического значения (7) и среднего квадратического отклонения (о). § 2.2. Средняя арифметическая величина и ее свойства. Если имеется ряд значений признака, представляющих собой ряд членов совокупности: *;, Х2> jcj,..., Jt/i, то сумма значений всех вариант есть: xj + Х2 + хз + ... + хп =^xt, или Х + Х+Х + Х + Х.. jf (л р^), или nZ~, тогда Ух,-пХ, или Т = ^-. ЛтЛ п Средняя арифметическая величина обладает рядом свойств. 1. Если к каждой варианте ряда прибавить или отнять одну и ту же величину, или умножить и разделить на одну и ту же величину, то средняя арифметическая увеличится или уменьшится на эту же величину, т.е. (xj + а), (Х2 + а), (хз + а) ... (дг, + а), то средняя будет равна Х+а, (xj - а), (Х2 - а), (хз - а)... (xt - а), то средняя будет равна Х-а. 2. Алгебраическая сумма отклонений отдельных вариант совокупности от средней арифметической этой совокупности равна нулю, т.е. (*. -*)+fe -*)+fe -*)+... + fo -*)=0. 3. Сумма квадратов отклонений вариант совокупности от средней арифметической х~ меньше суммы квадратов отклонений от любой другой величины (А), т.е. £ (х, - xf <£(х, - А)2. Средняя арифметическая величина является очень важным параметром, характеризующим выборочную совокупность. Она используется для характеристики любых совокупностей в технике, медицине и биологии. Средняя арифметическая величина является обобщенной характеристикой совокупности. Часто значение средней арифметической величины реально не существует, например, 4,5 щенка и др. В этом смысле средняя арифметическая является абстрактной 15
величиной, но в то же время она и конкретная величина, характеризующая типичное состояние признака в совокупности. Следовательно, для примера 1.1 7 = 4,54 шт., для примера 1.2 - X = 53,98 лучей. § 2.3. Изменчивость признака, е£ опенка. Как видно было из предыдущего параграфа, средняя арифметическая величина оценивает средний уровень развития признака или его типичность для данной совокупности. Однако среднее значение - это не единственная характеристика признака в совокупности. Представим себе, что имеются три совокупности, у которых значение среднего арифметического одинаково, но даже при беглом взгляде на значения вариант видно, что они совершенно различные, например, число щенков в 5-ти пометах норок. Пример 2.1. Оценка изменчивости числа щенков в помете 5-ти норок в 3-х выборочных совокупностях. I П III 3 1 1 3 2 3 3 3 3 3 4 3 3 5 5 л 5 5 5 2>, 15 15 15 * д 3 3 3 К*,-?)* О 10 8 о* 0 2,5 2 о 0 1,58 1,41 Таким образом, если в данной ситуации совокупности описывать только средним параметром, то все три выборочные совокупности будут считаться одинаковыми. Другим очень важным параметром является 16
оценка вариации признака. Как было показано ранее, размах изменчивости или вариабельности признака можно охарактеризовать верхним и нижним лимитами. Однако такая характеристика не совсем точно отражает истинную вариацию. Лучше вариацию измерять отклонением каждой варианты ряда от какой-либо постоянной величины. Правильнее всего в качестве такой величины взять среднюю арифметическую, X. Тогда (xI-r)+(r2-z)+(x3-7b...+(^-j)=2:^-7). Однако, как видно было в § 2.2 £(*< -х)=0. Первоначально, чтобы избежать нулевых значений, использовалась величина "по модулю", без учета знаков, т.е. £|*-^. Однако и этот показатель не улавливал истинного значения вариации в совокупности, т.е. рассеяния вариант вокруг средней арифметической величины. § 2.4. Дисперсия. вариансаг среднее квадратическое отклонение. Более точным показателем, характеризующим вариацию или рассеяние вариант вокруг среднего арифметического значения, является сумма квадратов отклонений вариант совокупности от среднего значения, т.е. (х, -ху +(*2 -xf +(,3 -хУ +...+(г, -ху =£(*, -*У- Сумма квадратов отклонений вариант совокупности от средней обозначается символом S и носит название дисперсии. S = £(*, -х)2. Для данных, представленных в примере 2.1, значение дисперсий для совокупностей I, II, Ш, соответственно, равно 0, 10, 8. Однако можно заметить, что дисперсия накапливается по мере увеличения численности совокупности так же, как накапливается значение £*. при оценке среднего арифметического значения. В двух совокупностях разного объема при одинаковой вариации значение дисперсии будет выше в той совокупности, в которой численность больше. Поэтому дисперсию необходимо усреднить, т.е. разделить на 17
число вариаций в совокупности, т.е. <т2 = -. Усредненное значение дисперсии в биологической литературе получило название вариансы и обозначается греческой буквой с? (сигма). Корень квадратичный из о2, 4ог =<т - получил название среднего квадратического отклонения. Как будет видно дальше, а является основным показателем, характеризующим изменчивость анализируемой выборочной совокупности. В примере 2.1 значения варианс для I, II и Ш совокупностей, соответственно, равны 0, 2,5, 2, а средние квадратические отклонения, соответственно, равны 0, 1,58, 1,41. Здесь следует остановиться еще на одном моменте. Как вы, очевидно, заметили, что если бы дисперсия 5 делилась точно на число вариант п = 5, то для трех совокупностей I, II и III значения варианс должны бы были быть следующими: 0; 2; 1,6. Разница между значениями, полученными в примере 2.1, возникает из-за того, что усреднять дисперсию необходимо не на число вариант в совокупности, а на число вариант минус единица, т.е. на п - 1, и тогда а = . п-\ Знаменатель дроби л - 1 получил название "число степеней свободы вариации". В дальнейшем мы будем ее обозначать двумя латинскими буквами df (начальные буквы слов "degree of freedom"). Смысл понятия степени свободы состоит в следующем. Если имеется совокупность с объемом от xi до хп и если оценено среднее арифметическое значение этой совокупности, то исходя из информации обо всех членах совокупности и средней 9 можно оценить значение любого члена совокупности. Например, в примере 1.1 представлены данные о 50-ти пометах норок. Среднее значение численности щенков в помете 4,54 шт. Определение одного значения из 50 зависит от значения остальных 49 членов совокупности и средней арифметической, т.е. от л - 1. Такой способ оценки вариабельности более точный, хотя при s s увеличении численности совокупностей грань между — и л /i-l сглаживается. 18
§ 2.5. Опенка параметров выборочной совокупности для данных, сгруппированных в вариационный ряд. Когда экспериментальные данные сгруппированы в вариационный ряд, то можно воспользоваться таким способом организации материала и более точно, чем мода, медиана и лимиты, оценить такие параметры выборочной совокупности как средняя арифметическая X, дисперсия (5), варианса (о2), среднее квадратическое отклонение (а) и др. Существует несколько способов оценки этих параметров. Способы обработки вариационных рядов разработаны в основном для того, чтобы облегчить расчеты. Ниже приводится три способа расчета выборочных параметров для данных, организованных в вариационный ряд: прямой способ, способ условных отклонений и способ сумм. Воспользуемся данными, представленными в примере 1.2. Пример 2.2. Оцениваются параметры выборочной совокупности по числу лучей на хвостовых плавниках рыб. Данные сгруппированы в вариационный ряд , как показано в примере 1.2 (таблица 1). А. Прямой способ расчета параметров Таблица 1. Оценка параметров выборочной совокупности в вариационном ряду прямым способом. 1 Xmin " Хтах • 45-47 48-50 51-53 54-56 57-59 60-62 63-65 Xi I 46 49 52 55 58 61 64 I / 4 10 27 41 12 5 1 2/= 100 j 1 fXi 184 490 1404 2255 696 305 64 2 A =5398 j 1 A2 ' 8464 24010 73008 124025 40368 18605 4096 Ztf =292576 | 19
Для оценки параметров выборочной совокупности прямым способом или методом взвешенных средних необходимо произвести следующие действия. 1. Рассчитать средние значения классов дг,- следующим образом. Для первого класса с лимитами 45 - 47, х, =-=*—— = = 46, для 2 2 второго класса х, = —-— = 49 и т.д. Необходимо следить, чтобы классовый промежуток к = 3 на протяжении всего вариационного ряда был одним и по началам классов 45, 48, 51, 54, 57, 60, 63, по концам классов 47, 50, 53, 56, 59, 62, 65 и по срединам классов 46, 49, 52, 55, 58, 61, 64. Средина классов рассчитывается для того, чтобы параметры не были занижены, как это случилось бы, если бы расчеты производились по началу классов, или завышенными, если бы расчеты производились по концам классов. 2. . После того, как оценены средины классов для расчета среднего арифметического значения необходимо средину каждого класса умножить на соответствующую частоту, а затем эти произведения просуммировать по всему вариационному ряду, а затем сумму — У А 5398 произведении разделить на л, т.е. X = —— = = 53,98 луча. 3. Для оценки дисперсии, вариансы и среднего квадратичного отклонения воспользуемся некоторым преобразованием. п п *** ' п Таким образом, получено эквивалентное выражение: *=2(*.-*Ь2*.а-^- Применительно к данным вариационного ряда S = У ficl - ^ . п Для оценки дисперсии по этой формуле необходимо средины классов вариационного ряда возвести в квадрат, затем по строкам 20
перемножить квадраты средин классов на соответствующие частоты и просуммировать по всем строкам. Такая сумма произведений обозначается как £# = 292576. £АУ = 53981 я 29138404 = ^^ л 100 100 5 = ]ГД2 -JfeL^zL = 292576-291384,04 = 1191,96. ^=-5-=,1^ = 12,04. п-\ 99 сг = д/сг2 = 3,47 луча. Таким образом, для данного вариационного рада * = 53,98 луча, os=3,47 луча. Забегая вперед, определим правильность оценки <т. Как будет далее видно, нормальное распределение, а данный вариантный ряд относится к числу нормально распределенных рядов, укладывается в границах от среднего значения, примерно, в ± Зет. 3<х = 3-3,47 = 10,41. Следовательно, если <х оценена правильно и ряд нормально распределен, то минимальная варианта ряда должна примерно быть равна Х-За = 53,98-10,41 = 43,57, в нашем случае минимальное число лучей равно 45. Максимальное значение должно быть равно X+За = 53,98 + 10,41 «64. Фактическое максимальное значение числа лучей равно 63. Некоторую неточность можно отнести за счет малочисленности выборки и за счет небольшого отклонения вариационного ряда от нормального распределения, что также будет показано далее. Б. Способ условных отклонений. Трудоемкость расчетов прямым методом заключается в том, что необходимо производить громоздкие расчеты с квадратами классовых значений. Тем труднее это решать, чем большие величины имеет анализируемый признак (трехзначные, четырехзначные значения, как это имеет место при анализе живой массы, роста и продуктивности млекопитающих, дробные, например, концентрация веществ, витаминов и др.). Поэтому можно воспользоваться методом условных отклонений, который позволяет резко упростить расчеты. 21
Пример 2.3. Оценивается признак из примера 1.2. Таблица 2. Оценка параметров выборочной совокупности в I Xmin " Хтах 45-47 48-50 51-53 54-56 57-59 60-62 63-65 1 1 *' 46 49 52 55 58 61 64 i 1 f 4 10 27 41 12 5 1 ^/= 100 а -3 -2 -1 0 +1 +2 +3 1У~ 9 4 1 0 1 4 9 1 ^ -12 -20 -27 0 +12 +10 +3 2>=*4 1 V 1 36 40 27 0 12 20 9 2>2=144 J Для того, чтобы воспользоваться методом условных отклонений, заменим двухзначные значения классов условными значениями по следующему принципу. Условимся считать, что средняя арифметическая находится в центре вариационного ряда, или класс, в котором больше всего частот, хотя в принципе в качестве условной средней может быть взято значение любого класса, в чем мы далее убедимся. Сначала примем за условную среднюю класс со значением признака 55 и обозначим его через ноль. Тоща класс со значением 52 будет отличаться от нулевого класса на 52 - 55 = -3. Классовый промежуток 52 — 55 ряда равен к = 3. Разделим ах = —-— = -i; следующий класс отличается от нулевого класса на 46-55 49-55 . a2=—z— = -2; следующий класс = -3. В сторону нарастания значений признака от нулевого класса, классы в условных значениях будут иметь вид: 58-55 f 61-55 . 64-55 , Теперь можно вместо значений классов записать полученные условные значения и вести расчеты с ними как со значениями классов. При таком способе расчета средняя арифметическая оценивается по 22
Аормуле: Х = А + ——*, ще А - значение нулевого класса, ^/а - сумма произведений положительных и отрицательных значений fa, к - величина классового промежутка. Для данного примера: Х = А + 1^ = 55 + ^3 = 55- 1,02 = 53,98 лучей, п 100 т.е. получено точно такое же значение средней арифметической, что и прямым методом. Формула для оценки дисперсии примет вид: 5 = I/"2- ы к2 144- (34)2 100 З2 =(144-11,56)-9 = 1191,96 (см.прямоЙ метод). а =- 1191,96 = 12,04; а = 4о* = 3,47 лучей. л-1 99 Из представленных данных видно, что оба метода позволяют получить одинаковые оценки выборочных параметров, но метод условных отклонений на много упрощает расчеты. Для того, чтобы убедиться, что выбор нулевого класса в любом месте вариационного рада не отражается на конечном результате, возьмем в качестве условной средней крайнее минимальное значение (I) и крайнее максимальное значение признака (П). Таблица 3. Обработка вариационного ряда двумя способами. LiL. 46 [49 55 L58_ 61 j [ 64 1 Ll ! 4 10 27 41 12 5 1 [ a Го" +Г +2 +3 +4 +5 +6 I fa 0 10 54 123 48 25 6 2> = 266 1 * 1 0 10 108 369 192 125 36 S>:=840 _g_ ГТ -5 1 -4 -3 -2 -1 0 ~H fa ! -24 -50 -108 -123 -24 -5 0 I/a = -334 1 ** i 144 ' 250 432 369 48 5 0 I/a2 =1248 23
X. =A + ±^k = 46 + — 3 = 53,98 лучей; 1 n 100 - У fa -334 X2 = A + ^-k = 64+-^-3 = 53,98 лучей; 2 n 100 J 52 = ^ /I 100 J 840-^- 9 = (840-707,56)9 = 1191,96; = fl248-^} I 100 J 1248-— 9 = (1248-1115,56)9 = 1191,96; a\ =12,04; a22 =12,04; o-, =3,47 лучей; <т2 =3,47 лучей. Кроме того, если в анализ включены признаки разномерные (например, живая масса в кг, длина в см, концентрация вещества мг/кг) и при этом необходимо знать по какому из признаков изменчивость выше, следует выразить изменчивость в относительной мере. Такая мера получила название коэффициента вариации (CV) и вычисляется по формуле: X Тоща для примера 2.2 СУ = ^- = lS^ML = 6,43 %. V V Xx 53,98 Таким образом, выбор условной средней может быть произведен произвольно, однако выбор ее в центре ряда резко упрощает расчеты. В - У fa У fa формуле расчета среднего значения Х = А + *=±—к член ——к п п является поправкой на неточность выбора условной средней А. Если в процессе выбора А занижена по сравнению с истинной величиной X, У/а то ==*—к будет иметь положительный знак и добавит к А п У fa недостающую величину. Если А завыщена, то ==^-А имеет п отрицательный знак и уменьшит завышенное значение А. 24
В основу обработки вариационных радов этим методом положена а умножения частот на условные отклонения суммированием частот или накапливанием сумм частот. рассмотрим этот способ обработки в силу того, что он обладает некоторыми привлекательными чертами. Рассмотрим метод сумм и метод условных отклонений в общем виде. Выберем ту же условную среднюю, что и в таблице 2. Пример 2.4. Оценка параметров выборочной совокупности (данные примера 1.2) методом сумм. Таблица 4. Оценка вариационных рядов методом условных отклонений и методом сумм. 1 Метод условных отклонений г \-3fj \-2f2 \-lfs +1// +2// ! +3// \а -3 -2 -1 +1 +2 +3 [7 Л = 4 /2=10 h = 27 0 = 41 /,'=12 Л'=5 /,'=1 Значения признака |*/ 46 49 52 55 58 61 64 Частота |/ 4 10 27 41 12 5 1 | Метод сумм или ряд накопленных частот I/ Л = 0W = 4 f2-(fi+h)-14 I f3 = (f,+f2+h) = 41 1 0 I //"(Л'+Л'+/.')=« /,'=U'+/a')=6 //=(/,')=! 1 Для метода условных отклонений: 2>=(з// +2// +/,')-(*/. +2/2 +/,). Для метода сумм: 2>=1/(+ЫД-)=(з// +2/2' +/;)-(з/, +2/2 +/,). 25
Как видим, полученная сумма произведений £/а 9 в обоих случаях имеет одно и то же выражение. Практически метод сумм состоит в том, что частота крайнего ряда как максимального, так и минимального класса повторяется в следующем столбце, а затем частоты последовательно суммируются с частотами следующего класса и так до нулевого класса. Первый столбец организуется для оценки поправки на неточно выбранную условную среднюю, т.е. для оценки ^fa, а второй столбец для оценки первого члена в формуле расчета ( дисперсии 5 = z/«2- , <1>П Таблица 5. Вариационный ряд (обработка способом сумм). 1 х< 46 49 52 55 58 61 64 / 4 10 27 41 12 5 1 | я = £/ = юо £/(-)= 59 4 14 41 0 18 6 1 !/(+)= 25 | [ !/(=)= 22 4 18 0 0 0 7 1 1/0=8 | ^ = ^S/(-b)-Z/(-),, = ss+2Sz59.3 = 5S_j43 = s /| 100 100 J s = te л-К22 л-ы a-hz/(^- k/(+)- z л-у 1 .*= (44 + 16 + 59 + 25)- 34^ 100 9 = 1191,96 Несмотря на некоторую громоздкость формул, для начинающих проводить статистическую обработку, этот метод заманчив тем, что содержит в своей основе некоторые элементы самопроверки счета. 26
1. "Окно", состоящее из трех цифр, ограничивающих нуль: частота нулевого класса + последняя цифра накопленного ряда цифр сверху + последняя цифра накопленного ряда частот снизу = л, т.е. ]Г/ = л = 100 = 41+41 + 18. 2. Сумма накопленных частот сверху в первом столбце + сумма накопленных частот сверху во втором столбце = Щ-). Сумма накопленных частот снизу в первом столбце + сумма накопленных частот снизу во втором столбце = 2JT+): щ.) = 59 = 41 + 18, Щ+) = 25 = 18 + 7. Все участки проверки выделены жирными цифрами (табл. 5). Таким образом, существует ряд способов обработки вариационных рядов, экспериментатор волен выбрать любой из них, т.к. все они дают абсолютно одинаковый конечный результат. §2.6. Объединение параметров отдельных подсовокупностей. Если имеются данные по отдельным частям совокупности (отдельные выборки) и их необходимо объединить и оценить обобщенные параметры в объединенной совокупности, то это можно сделать, соблюдая определенные правила. Так, если имеются измерения по отдельным подсовокупностям и оценены выборочные параметры по этим подсовокупностям, т.е. имеются T{,X~Z,Y2,...jTk - средние значения к подсовокупностей; сг,2,<г22,<7з2,...,<тА2 - вариансы к подсовокупностей; П] + fy + пз + ...+ Пк = N -численность к подсовокупностей, то взвешенное среднее арифметическое значение для всей совокупности можно оценить как: Например, если имеется 3 подсовокупности (3 повторности одних и тех же опытов или контролей), то если условия проверки опытов и поддержания контролей были неизмененными, то можно оценить °бобщенные параметры Хы*, а]^ и 5^ по всем трем повторностям. 27
Пример 2.5. Имеется 3 повторности селекционного эксперимента, направленного на элиминацию радиальной жилки крыла у Drosophila melanogaster. щ = 70 п2 = 70 пз = 70 Jfj = 0,84 мм 1^ = 0,70 мм ^з=0,67 мм а\ = 0,07 а\ = 0,03 а] = 0,03 <г, =0,26 ММ аг = 0,17мм ст3 =0,17пш. V 1 Г -v "v> _, v ^ 70 0,84 + 70.0,70 + 700,67 *L = k2(«, -i)+<t22(«2 -i)+a?fo -О]- ЛГ-3 +[(*, -£«Jf ./i, +fr2 -Хоещ) п2 +(r3 -7J^j.-L- = = _L (4,83 + 2,07 + 2,07)+ — (0,7 + 0,11 + 0,34) = 0,043 + 0,005 = 0,048 * 0,05 207 209 ' Таким образом, параметры объединенной выборки таковы: ЛГ=210, 7о*,=0,74лш, 0^=0,05, £^ = 0,22^ ГЛАВА 3 ЗАКОНОМЕРНОСТИ СЛУЧАЙНОЙ ИЗМЕНЧИВОСТИ В СОВОКУПНОСТЯХ § 3.1. Вероятность. Как уже говорилось ранее, биологические объекты обладают двумя основными свойствами: наследственностью и изменчивостью. Последнее свойство особенно важно для данного предмета, т.к. если бы биологические объекты (вид, сорт, порода) были бы одинаковыми, то один единственный представитель характеризовал бы всю совокупность в целом. В таком случае не было бы необходимости в. использовании 28
статистической обработки экспериментальных данных. А так как биологические объекты, имеющие некоторые различия в характере проявления тех или иных признаков, представлены не единичными экземплярами, а совокупностями большего или меньшего размера, то взятые в целом они должны подчиняться некоторым статистическим закономерностям. Эти статистические закономерности частично проявились при составлении вариационных рядов (см. гл. 2), Каждый отдельный член совокупности подвергается воздействию множества случайных факторов, поэтому относительно каждого отдельного члена совокупности приходится говорить только об известной возможности или вероятности той характеристики, которую этот объект приобретает в процессе своего формирования. Следовательно, речь может идти только о малой или большой вероятности осуществления некоторого определенного события. Вероятность математически выражается как /> = —, ще р - доля п (вероятность, процент) т событий из общего числа п; т - число "благоприятных" событий; п - общее число событий. Вероятность рождения особи мужского или женского пола равна: р * — «о,5, т.к. известно, что рождается приблизительно 100 99 : &У = 1 : 1. Из этого примера видно, что количественной характеристикой вероятности события является относительная частота события, определяемая экспериментально. Для всех вариационных рядов было характерным совершенно определенное распределение вариант: сгущение частот в центре вариационного рада и уменьшение частот по мере удаления от центра вариационного рада. Если вновь обратиться к примеру 1.1, но с точки зрения оценки характера распределения 50 норок по числу щенков в помете, то получаются следующие данные: Распределение л = 50 норкам по числу щенл&в помете (пример 1.1). Количество щенков 12 3 4 5 6 7 8 в помете, jc/ Число случаев, т 1 4 9 12 10 7 5 2 29
Вероятность события, /> = - 0,02 0,08 0,18 0,24 0,20 0,14 0,10 0,04 п Сумма всех вероятностей равна 1,00. Если изобразить этот ряд графически, то получим полигон распределения, который называется биномиальной кривой распределения, соответствующий коэффициентам разложения бинома Ньютона. Просто бином Ньютона можно продемонстрировать на примере подбрасывания монеты. Когда подбрасывание монеты производится достаточное число раз, вероятность выпадения орла равна вероятности выпадения решки, p = q = -. Вероятность выпадения двух орлов одновременно при подбрасывании 2-х монет равна рр=р2> двух решек qq = q2 и орла и решки pq+ pq = 2pq. Таким образом, для случая, коша происходит одно событие, можно записать распределение: (р + q)1 = р + q, 2 события: (р + qf = р2 + 2pq + q2, 3 события: (р + qf= р3 + tfq + 3pq* + cf, 4 события: (р + qf = р4 + 4p3q +6p2q2 + 4p<? + q4 и т.д. Гальтон в 5-ой главе книга "Natural inheritance", 1889, которая называется "Черты статистики", предложил прибор для иллюстрации закономерностей биномиального распределения. Это плоский продолговатый ящик, в дно которого вбиты в шахматном порядке гвозди, в нижней части сделаны перегородки, организующие узкие отсеки. В верхней части ящика узкая щель с воронкой. Ящик стоит вертикально. В верхней части через воронку, а затем через узкую щель просыпается дробь. Дробь, ссыпаясь вниз, ударяется о гвоздики и рассыпается внизу по отсекам. Основная масса дроби сосредотачивается в центральных отсеках, а чем дальше отсеки от центра, тем меньше в них попадает дроби (см. рис. 3). Биномиальное распределение характерно для признаков, имеющих дискретную вариацию. При биномиальном распределении р и q могут принимать различные значения: р = 0,5; q = 05; р = 0,2; q = 0,8 и т.д. Форма полигона при этом меняется(рц с 4J 30
Рис. 3. Прибор Гальтона. 1 1 1 1 2 1 13 3 1 14 6 4 1 1 5 10 10 5 1 1 6 15 20 15 б 1 Рис. 4. Коэффициенты бинома. Предельным случаем биномиального распределения может рассматриваться распределение Пуассона, когда р или q имеют значение близкое к нулю (редкое событие). Другом вариантом биномиального распределения может быть такое распределение, коща к стремится к бесконечности, т.е. (p+qf, тоща распределение становится непрерывным. Полигон превращается в симметричную плавную кривую, получившую название "кривая нормального распределения99 (рис. 5). 31
1 1 I 1 Г~ -3<j -2a -1<j X +la +2<7 +3a Рис. 5. Кривая нормального распределения. Отклонения вправо и влево от X укладываются в ± 3,3а. Смысл кривой нормального распределения тот же, что был продемонстрирован прибором Гальтона. Случайные факторы, действующие на объект, условно назовем их "положительными" и "отрицательными", как бы уравновешиваются в своем влиянии на объект. Поэтому большинство показателей сосредотачиваются вблизи "среднего показателя" и гораздо реже перевешивают только положительные или только отрицательные факторы. Поэтому, чем больше такой индивидуальный перевес, тем дальше значение варианты будет отклоняться от среднего значения и тем дальше эта варианта будет занимать место вправо или влево от среднего значения на кривой нормального распределения. Закономерности распределения лучше всего описывает статистический показатель, получивший название нормированное отклонение. Обозначается показатель латинской буквой t\ часто называется t-критерием^ _ xt-X ^e о 32
Xi - значение г-ои варианты распределения; у - среднее значение признака в распределении, £•- среднее квадратическое отклонение, характерное для признака. Смысл /-критерия состоит в следующем. Если / = -i--, то ь -X = to. Пример 3.1. Анализируется распределение длины (см) 100 листьев садовой земляники. Обработка данных вариационного ряда методом условных отклонений, как в главе 2. (Пример на стр. 10 ). Таблица 6. Оценка выборочных параметров в вариационном ряду методом условных отклонений. \_Xfin " Хтах Г5.2 - 6,4 6,5-7,7 7,8-9,0 9,1 - 10,3 10,4-11,6 11,7-12,9 13,0 - 14,2 L. i Xi 1 5,8 7,1 8,4 9,7 11,0 12,3 13,6 / 6 42 26 15 4 6 1 100 а -3 -2 -1 0 +1 +2 +3 J 9 4 1 0 1 4 9 1 fa \ -18 -84 -26 0 4 12 3 2>=-109 I ! л» 1 54 168 26 0 4 24 9 2>2 = 285 1 — V fa -409 X = A + ±=*±-.k = 9,7+^. 1,3 = 8,28 См; п 100 S = I/-2 6>У" *2 285- .в 100 т2 = -А. - 280>86 /1-1 99 = 2,84; • 1,32 = (285 -118,81)-1,69 = 280,86; а = То2" = 1,68 СМ. 33
Эти данные означают, что варианта 7,1 находится на расстояние 0,70а от средней влево (в сторону уменьшения признака). Варианта 8,1 - на расстоянии 0,11а от средней влево, а варианта 10,2 - на расстоянии lf 14сг от средней вправо. Следовательно, нормированное отклонение дает возможность точно определить местоположение каждой варианты на кривой нормального распределения. Распределение вариант в целом отвечает строгом закономерностям: 1.Нормальное распределение укладывается в пределах ±3,3 «тот Х- Применительно к рассмотренному примеру границы ряда, описанного кривой нормального распределения 9 должны быть ограничены х ±3,3а, т-е- 8>28 см ± 3,3-1,68 см или Xmin = 8,28 - 5,5 * 2,8 см; Хтах = 8,28 + 5,5 - 13,8см. В нашем случае хт\п = 5,2, хтт = 13,0 см. Следовательно, экспериментаторы избегали измерять самые маленькие листья, и поэтому кривая нормального распределения несколько скошена в левой части. 2. Теоретически показано, что на кривой нормального распределения в пределах ± 1а укладывается ~ 68,3% всех вариант, в пределах ±2а~ 95,5%, в пределах ± За ~ 99,7%, В пределах ± 3,3а ~ 99,9%. В таком случае г для определенных вариант колеблется в пределах ± 3,3. Таким образом, различные значения t ограничивают различные части вариационного ряда, и в то же время распределение вариант основано на закономерностях распределения вероятностей. Вероятность любого отклонения от среднего - это функция нормированного отклонения. На основе этой функции составлена таблица нормального интеграла вероятностей (см. приложение табл. I). В таблице I в левом столбце приведены значения t до десятичного знака, а на горизонтальной верхней строке - сотые доли, внутри клеток представлены вероятности, с которыми конкретные значения t встречаются в распределении, т.е. геометрически 34
вероятности являются долями площади нормальной кривой в границах от-гдо + /. Таким образом, если совокупность объемом п = 100, ^ = 8,28 см, as. 1,68 см, то согласно закономерностям нормального распределения в пределах ± \одолжно быть - 68,3 особей ±2а ~ 95,5 особей ± За ~ 99,7 особей Ниже будут продемонстрированы более широкие границы использования нормированного отклонения для решения задач, для оценки достоверности параметров выборочных совокупностей и для оценки достоверности различий двух выборочных совокупностей. ГЛАВА 4 ДОСТОВЕРНОСТЬ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ §4.1. Ошибка выборочной совокупности. Доверительные интервалы. В предыдущих главах мы показали, что экспериментальные данные представляют собой выборочные совокупности, взятые из генеральной совокупности. Генеральная совокупность - это совокупность, в которой N —> оо. Измерить, проанализировать все объекты такой совокупности практически невозможно, поэтому исследователи пользуются изучением выборочных совокупностей ограниченного объема. Выборочные совокупности, как было показано ранее, могут быть охарактеризованы выборочными параметрами X, о2, а Из одной и той же генеральной совокупности можно организовать несколько (много) выборочных совокупностей. Эти выборочные совокупности могут быть разного объема и иметь разные значения выборочных параметров X и а, несколько отличные друг от друга. Если из одной генеральной совокупности взято несколько выборочных совокупностей достаточно большого объема, то среднее значение, 35
оцененное на основе средних выборочных, должно совпадать со средней генеральной совокупности , // (греческая буква мю). Сказанное выше можно распространить и на разнообразие, ст. Представим, что большим кругом обозначена генеральная а совокупность с параметрами: N -> а* // и аг. Из этой совокупности взято несколько выборочных совокупностей с параметрами: ГЦ П2 Пз Щ Х\ Х2 Хъ ... Х( гч-1 ~2 ~2 гт1 ах а2 <Тз <т, Отчего будет зависеть несовпадение в оценках параметров различных выборочных совокупностей? Прежде всего это зависит от такого свойства анализируемого признака, как изменчивость. Если бы признаки не варьировали, то достаточно было бы одного представителя, чтобы оценить всю А совокупность. И, наоборот, чем выше изменчивость признака, а2, тем А _ сложнее оценить параметры /л и а2 по выборочным параметрам X и </. Кроме того, если признак варьирует, но будет увеличиваться численность выборочной совокупности, т.е. чем ближе по объему выборочная совокупность к генеральной совокупности, тем последняя 36
чнее может быть охарактеризована через параметры выборочной вокупности. Другими словами, с увеличением численности ыборочной совокупности увеличивается и вероятность приближения Выборочные средние отдельных подсовокупностей в силу случайных причин, варьируют вокруг // по тем же законам, что и отдельные варианты выборочной совокупности вокруг X. Таким образом, если бы была известна дисперсия средних величин отдельных выборок, можно было бы оценить границы колебания X вокруг //. Отталкиваясь от соображений, высказанных в начале главы о А Л том, что точность оценки // зависит от а2 и л, причем от а1 эта зависимость прямо пропорциональная, а от п - обратно _2 а пропорциональная, можно выразить так: s^ = —, гае s^ - стандартная выборочная ошибка, или ошибка выборочности, или ошибка А репрезентативности; а2- варианса признака, п - объем выборочной совокупности. Стедовательно, s^ - это та же <т, которая оценивала вариацию отдельных вариант в совокупности вокруг X, но только теперь 5Т характеризует разнообразие выборочных средних величин вокруг /i. л Однако следует заметить, что аг неизвестна и нет возможности ее оценить, а если бы эта возможность существовала, то не было бы необходимости оценивать выборочные параметры. Поэтому считается, А что с небольшой погрешностью можно вместо <т2 взять выборочные о <тг а значения &. Поэтому s\ = —, откуда s7 = -=. х п ' 4п Несмотря на то, что s^ носит название стандартной ошибки, это не означает, что s7 оценивает неточность измерений или неточность расчетов, s^ оценивает случайную вариацию выборочных средних вокруг ju по тем же законам вариации, что и а вокруг X. Отсюда 37
следует, что в пределах ± lsP укладывается 68,3% всех выборочных средних; ± 2s7 - 95,5%; ± 3^ - 99,7%; ± 3,3sT. - 99,9%. В таком случае, зная значение выборочных параметров совокупности: л, X, а, можно оценить с определенной вероятностью границы, в которых находится ix.~X- 1 s^ <* р <J( + 1 sT, - вероятность, P = 68,3%, X - 2jx. <, ц <JC + 25?, P = 95,5%, X - 3sf <> \x <,X + 3jr, P = 99,7%, 3f - 3,3^ <> \i <X + 3,35Г, Р = 99,9%, В общем виде // находится в границах X - tsT <\i<X + tsx.. Эти границы получили название доверительных границ, интервал между максимумом и минимумом получил название доверительного интервала. Пример 4.1. Анализируется распределение длины (см) 100 листьев садовой земляники (см. пример 1.3). п = 100, X = 8,28 см, а- 1,68 см, 5^=0,168 см «0,17 см Следовательно, границы ряда с вероятностью Р = 0,955 будут: 2-1,68-8,28 +2-1,68 4,92+ 11,64 Доверительные интервалы для // 20,17 - 8,28 + 20,17 4, 4, 7,94 + 8,62 С вероятностью Р = 0,997 для ряда: 3-1,68-8,28 + 3-1,68 3,24 + 13,32 38
Для/г. 3-0,П - 8,28 + 3-0,17 7,77 н- 8,79 Таким образом, доверительный интервал, в границах которого может лежать /а зависит от величины Р, с которой предполагается оценивать //. Чем выше вероятность, тем шире доверительный интервал для//. Заметим, что выборочные параметры имеют "точечную" оценку, т.е. выражаются единственным числом, а генеральные параметры оцениваются всегда в доверительных интервалах. Уменьшить доверительные интервалы возможно только путем уменьшения <sP, a стандартная ошибка s7 может быть уменьшена только за счет увеличения объема выборочных совокупностей, п. § 4.2. Выборочные ошибки для гг. В некоторых случаях, когда важным параметром для исследователя является изменчивость, имеется возможность оценить стандартную ошибку для среднего квадратического отклонения а. Это можно сделать следующим образом: а Следовательно, в примере 4.1 а 1,68 1,68 Л1„ sa = -j= - , = ~-*0,12 СМ. л/2я ./2^Т00 14,14 Доверительные интервалы для а в общем виде есть: &-tsa<a<> tsate'. Для Р = 0,95 границы а есть: 20,12- 1,68 + 2-0,12 I I 1,44 * 1,92 39
§ 4.3-Сравнение двух выборочных совокупностей. В биологических исследованиях приходится чаще всего име^ дело не с одной, а несколькими выборочными совокупностями. Как правило - это опыт и контроль, это различные сорта, породы, штаммы линии и др. Эти совокупности оцениваются через выборочные параметры Z,<t,s?. Однако различия между параметрами анализируемых совокупностей могут быть случайными, незначительными, и этими различиями можно пренебречь, но могут быть различия и существенными. В первом случае, когда различия незначительны и их можно отнести к случайным, такие две выборочные совокупности Moiyr считаться принадлежащими к одной генеральной совокупности или взятыми из одной и той же генеральной совокупности. Во втором случае, когда различия между выборочными совокупностями значительные или существенные, тогда такие выборочные совокупности нельзя отнести к одной и той же генеральной совокупности. Как оценить существенные или несущественные различия между выборками? Прежде всего, когда имеются оценки параметров выборочных совокупностей Х,а, необходимо установить существенность (достоверность) различий между параметрами этих совокупностей. § 4.4. Опенка достоверности различий между средними значениями двух выборочных совокупностей. Если бы сравнивались щ и & генеральных совокупностей, то ясно, что между щ и цг разница всегда достоверна. Однако, когда сравниваются между собой средние Y{ и Х2 выборочных совокупностей, то, как мы видим в § 4.1, оценки Л^ и Х2 имеют статистические ошибки $хг и 57,. 40
Для проведения оценки различий между Хх и Хг примем, что оазличия между ними случайны или их вовсе не существует. Такой способ рассуждения называется принятие нулевой гипотезы. Для того, чтобы принять нулевую гипотезу, т.е. согласиться, что различия между средними случайны, или отвергнуть нулевую гипотезу, т.е. считать различия между средними существенными (достоверными), воспользуемся нормированным отклонением, г: /.£А ще / - нормированное отклонение; Тх и Хг - средние значения выборочных совокупностей; 5/-—j - средняя ошибка разнипы между средними; Если X - Хг =d, то S,- ?-\ = Sd, тоща / = — = — { ' г> Sj С2 4- V2 Пример 4.1. Изучалось влияние генотипа норок на плодовитость. Проанализировано 50 самок каждого генотипа. Составлено 2 вариационных ряда по стандартному и мутантному генотипам норок. Таблица 7. Оценка достоверности различий средних значений двух распределений. pU ко в №_ EL El El К Стандартный генотип 1-JL. 1 ■ 3 10 20 10 5 1 «=50 j а г+г !+2~ +1 1 0 -1 -2 -3 , /а +3 ! +6 +10 0 -10 -10 -3 2>« .. = -4 Е 9 4 1 0 П" 4 9 г~^~ 9 12 10 0 10 ' 20 9 !>' = = 70 1 Мутантный генотип h 1 3 10 30 4 2 j /i=50| 1 а г+Г +2! +1 0 Т" -2 /« +3 +6 +10 0 -4 -4 2>=j = +п Го2 ~? 4 1 0 , 1 4 1 *' 9 12 10 0 4 8 2Ж = = 43 1 41
Xi s, of Ъ /^ = Ф = 5,0- = (70- = 1,42; 1,19 =-*Ы Msxt ..1.1= 50 50j <>i = 0,17 ■7i . +4, 4,92 шт; = 69,68; = 1,19 шт; шт; 4,92-4,22 V0,172+0,132 JT2 = 4,0+ —1 = 4,22 шт; 50 5!=(43-f).1 = 40,58: a\ = 0,83; cr2 = 0,91 шт; 37-2=з,зз. 0,21 Эти 2 вариационных ряда обработаны методом условных отклонений. Получены все необходимые параметры для оценки достоверности различий двух выборочных средних Yx и Х2 через критерий Стыодента, Г. Фактическое значение fy = 3,33. Затем ^ необходимо сравнить со стандартными значениями tst, которые помещены в таблице II (приложении). Значения критерия гЛ (критерий Стыодента) для данных степеней свободы, df = nj + П2 - 2 = 50 + 50 - 2 = 98, равны для вероятностей: Р £ 0,95; гЛ = 2,0; Р Ъ 0,99; t5t = 2,6; Р > 0,999; tst = 3,4. Сравним фактическое значение гф = 3,33 со стандартными значениями tst для df = 98. Видно, что фактическое значение t$ < tst =3.4, но гф > 2,60, что соответствует вероятности Р > 0,99. Нулевая гипотеза сохранилась бы в том случае, если бы значение фактического 1ф было бы меньше 1,96 * 2,0 для данного значения df, В таком случае следовало различия между Х\ и Хг считать несущественными, недостоверными, случайными. В рассмотренном примере значение \$ превышает 2, следовательно, нулевая гипотеза не проходит. В таком случае с вероятностью Р > 0,99 можно утверждать, что норки стандартного генотипа превышают по плодовитости норок мутантного генотипа на 0;70 щенка на помет. Сказанное выше можно представить графически. 42
8 7 6 5 4 3 |- 2 1 +3<7>=8,49 ft JTi = 4,92 I И -3^=1,35 I +3sF=5,43 -3^=4,41 +3(72=6,95 4,22= Xi -3cr2=i,49 +35j =4,61 -3sT =3,83 Рис. 6. Величина ожидаемых с вероятностью Р > 0,997 границ выборочного распределения (< ■ —») и доверительные интервалы генерального среднего (—и—) в двух выборках (см. пример 4.1). По такому же принципу можно построить доверительные границы для а и оценить достоверность различий двух радов распределения для л а Доверительные границы для а: а А о л/2л V2w Оценка достоверности различий: ^-2 л-2 / 2л, 2я2 Фактическое значение t<p сравнивается со стандартными Учениями tSt, взятыми из таблицы II (приложения) для данных степеней свободы, df = п\ + п г - 2. 43
ГЛАВА 5 КОРРЕЛЯЦИОННЫЕ СВЯЗИ МЕЖДУ ПРИЗНАКАМИ § 5.1. Коэффициент корреляции. Анализ выборочных совокупностей, как было показано выше, дает возможность оценить средний уровень развития признака в совокупности и оценить характер (величину) вариации признака. Однако каждый признак у биологических объектов не существует изолированно, а находится во взаимодействии с другими признаками организма, связан с ними. Древние римляне говорили "По ноге узнаешь Геркулеса" или "по когтю узнаешь льва". Гальтон, изучая связь между ростом людей и длиной предплечья (расстояние от локтя до кончика среднего пальца), оценил корреляцию, равную + 0,800. С одними признаками эта связь более тесная, с другими - менее тесная. С одними признаками она положительная (прямая), когда с увеличением одного увеличивается и другой признак, с другими отрицательная (обратная), когда с увеличением одного признака другой уменьшается. Примером прямой связи может служить живая масса и рост животных, отрицательно связаны длина шерстяного покрова и густота. Однако, если в физике и математике функция и аргумент находятся в строгой "функциональной" зависимости, когда конкретному значению аргумента соответствует строго конкретное значение функции, то в биологии это не так. Биологические объекты и их признаки формируются и развиваются под сильным влиянием огромного количества случайных и неслучайных факторов. Чаще свего это является причиной того, что определенному значению одного признака Соответствует несколько значений другого признака, но в среднем оба признака изменяются как бы в одном направлении. Эту тенденцию направленного изменения двух средних можно оценить, используя нормированное отклонение. 44
Пример 5.1. Изучается связь между % жира (jc) и % белка (у) в молоке коров. Проанализировано 12 проб молока. Г^П£Об V; 1 4,0 3,3 2 3,7 3,1 3 3,6 3,0 4 3,6 3,3 5 3,6 3,2 6 3,7 3,3 7 4,1 3,3 .. 8 4,0 3,2 9 3,9 3,3 10 3,8 3,3 11 3,8 3,0 12 3,8 3,1 1 Таким образом, имеются две выборочные совокупности со следующими параметрами: пх = 12; 1>( = 45,6; 2Х =173,6; (Ух J />х = ^ (/ =173,28; 5ж=0,32; 0^=0,029; <Ъ = 0,17%; Л" = 3,8%; пу = 12; 1>,= 38,4; 1^=123,04; _£>J Sy = 0,16; ^=0,014; ау = 0,12%; F = 3,2%. = 122,88; Iх' U Ъ-*) E-F) 1 ?v_ Пм> j 3,3 +0,2 +0,1 +1,18 +0,83 [3/7 3,1 -0,1 -0,1 -0,59 -0,83 Гз^б 3,0 -0,2 -0,2 -1,18 -1,67 [з!б 3,3 -0,2 +0,1 -1,18 +0,83 [з^б !з,2 -0,2 0 -1,18 0 Гз/7 1 3,3 -0,1 +0,1 -0,59 +0,83 45
W=W iJL 3,3 3,2 3,3 3,8 3,3 3,8 3,0 0 T^T +0,3 +0,2 +0,1 +0,1 +0,1 +0,1 -0,2 -0Л xt-X +1,76 i-l,18 +0,59 /„ = у,-у +0,83 +0,83 +0,83 -1,67 -0.83 (1) IX', _+3,92 = +0,356. я-1 11 Из расчетов, приведенных в примере 5.1 видно, что у части пар знак нормированных отклонений совпадает (+, + или -, -), а у части пар нормированных отклонений знак не совпадает (+, -; -, +; 0, +; 0, -). В том случае, когда много однозначных пар, сумма их произведений будет иметь положительное значение и усредненная сумма произведений нормированных отклонений даст некоторую величину, которая и будет характеризовать меру сопряженной изменчивости двух переменных величин или двух анализируемых признаков. Величина _Z'.-', W-1 получила название коэффициента корреляции. В развернутом виде значение коэффициента корреляции выражается следующим образом: (2) .Z'*-',.Zk-*fr,-r)_ + 0,08 /i-l {п-\)ахау + 0,08 ПОД 7056-0,12060 0,226 = 0,354 Если в числителе раскрыть скобки, перемножить {xt-x) на (y,-Y\ получим эквивалентное выражение: » п тоща: Zk-Ttr.-rhl.™-' 46
< w -1 /J -1 ,., 45,6-38,4 146 iT" +0,08 ^.A v0,32 0,16 0,226 Следовательно, к оценке коэффициента корреляции можно подойти различными способами. Варианты (2) и (3) полностью совпали, а в варианте (1) коэффициент корреляции имеет значение на 0,002 выше - это набежало за счет округления цифр при делении на ст. Наиболее рациональным способом оценки Ггу, из 3-х представленных вариантов, является способ (3) как наименее трудоемкий, однако и этот способ, когда выборки многочисленны и признак измеряется 2-х, 3-х и более значными цифрами, становится также трудоемким. По этой причине рекомендуется оценку коэффициента корреляции осуществлять с помощью корреляционной матрицы (или корреляционной решетки). Организовать корреляционную решетку просто. Для этого необходимо по горизонтали выписать все варианты признака (jc), которые встретились в выборке, или через определенный классовый промежуток, если вариантов много (как показано в гл. 2). По вертикали выписать варианты признака (у). В клетках проставить соответствующие значения пар признаков. Затем просуммировать значения частот по строкам (fy) и по столбцам (fx). Можно заметить, что решетка представляет собой 2 вариационных ряда: цифры в верхней и 6-ой горизонтальных строках - это классы и частоты признака х> т.е. вариационный ряд для признака *, а классы и частота двух столбцов (1 и 8) - это вариационный ряд Для признака у. А дальше необходимо обработать 2 вариационных ряда ZrJV 2>«-2>. Jsr sx 47
любым из способов (гл. 2). Сведем данные, полученные при обраб0. 2-х вариационных рядов в корреляционной решетке в таблицу 9. Таблица 8. Корреляционная решетка для оценки степени связи ме^ % жира (х) и % белка (у). [X 1 3.3 3,2 3,1 3,0 Л \ах \<4 fax 1 4,1 *1 1 +3 9 I 3 9 4,0 |'1 •1 2 +2 4 4 8 3,9 *1 1 +1 1 1 1 1 3,8 •1 •1 •1 3 0 i 0 0 0 3,7 b •1 2 -1 1 | -2 2 1 3,6 Ч 1 •1 3 -2 4 -6 12 рГ 6 2 2 2 л= =12 | \ау +1 0 -1 -2 R 1 0 1 4 Z/A = 0 Е/А2=32 \fyOy 6 0 -2 -4 Z/A =0 | Гл^ 6 ~" 0 2 8 =16 При оценке через корреляционную матрицу формул' коэффициента корреляции приобретает вид: (4) V**4 /3216 22,6 +0,354. 48
Таблица 9. Параметры 2-х вариационных рядов для % жира (г) и % белка (у) в молоке. 1 Показатели \п 2> \тм L = 2>2-A ■> 5-А:2 <х" = а » 1 Признак х 12 0 32 0 32 0,029 0,17 3,8 У 12 0 16 1 0 16 0,014 0,12 3,2 1 Все члены в формуле уже оценены и записаны в таблице, кроме члена ^fa/iy. У этого члена /' - это значение частоты в каждой клеточке матрицы. Чтобы получить полностью член 2/Члу, необходимо /' в каждой клеточке перемножить на соответствующее отклонение по горизонтали, ах, и по вертикали, а)Ь и просуммировать с учетом знака произведения, т.е. £/Ч*, - К+1Х+3) + К+1Х+2) + K+iX+i)+ о + К-1Х+1) + +Ь(-2)(+1) +0 -Ю +0 + 1<-1Х-1) +0 + Н-2Х-2) = = 3 + 2+1-1-2 + 1+4 = +8. Как видим, цифры в формуле (3) в 10 раз ниже, чем в формуле (4). Это произошло от того, что ни числитель, ни знаменатель в формуле (4) не домножались на классовый промежуток к = 0,1. Таким образом, коэффициент корреляции - параметр, который измеряет степень совместного варьирования двух признаков. Это означает, что если один признак не варьирует, а у другого признака 49
очень большая вариация, то числитель в формуле, оценивающей коэффициент корреляции, будет равен нулю. Например, Xi 55 5 5 5; п = 5; 5> = 25; 2><2=125 yi 12 345 п = 5; 2> = 15; IX =55. r = L'y' _ n ^ _L _75-75 -o В общем, если признаки варьируют в одном направлении, то коэффициент корреляции может принимать любые значения от 0 до +1,0. Если увеличение одного признака сопровождается снижением другого, то такая корреляция отрицательна и значения коэффициента корреляции могут быть от -1 до 0. При использовании корреляционной матрицы появляется дополнительная возможность визуализации корреляции. Так, например, если в корреляционной матрице частоты лежат строго по диагонали, проведенной из одного угла матрицы в другой (центральная диагональ), то такой коэффициент корреляции равен или близок к единице. Если частоты рассеяны по всем клеткам матрицы, то значения такого коэффициента корреляции близки к нулю. Знак коэффициента корреляции зависит от концентрации частот вокруг одной центральной диагонали или противоположной центральной диагонали (см. рис. 7). 50
Рис. 7. Значение коэффициентов корреляции при различном распределении частот в корреляционной решетке. § 5.2. Ошибка выборочного коэффициента корреляции. Оценка достоверности. Доверительные границы для генерального значения /л Коэффициент корреляции является выборочным параметром и его значение зависит от ряда случайных факторов, и, главным образом, от объема выборочной совокупности, взятой из генеральной совокупности. Поэтому, также как и другие выборочные параметры X и о; коэффициент корреляции имеет ошибку выборочности (sr) fTT7" s, =•/—-, где v Vw-2 Л,„ * ошибка выборочности коэффициента корреляции; r.rv - коэффициент корреляции; п - число пар, на основе которых оценен гху. 51
Согласно нулевой гипотезе о том, что генеральное значение корреляции р = О, критерий Стьюдента (/) для оценки достоверности Гху равен: \ \ Для примера 5. Цще г^ = +0,354, п = 12, = ДЗ |ЕМ = 0,296. г* Чя-2 \ 10 , = ^- = ^1 = 1,2. s,o 0,296 В таблице II (приложения) для df=w-2=12-2=10 tst 2,2 для Р = 0,95 3,2 для Р = 0,99 4,6 для Р = 0,999. Таким образом, значения коэффициента корреляции г^, оцененное по 12 парам, недостоверно. Можно ответить на вопрос, сколько необходимо иметь пар для того, чтобы такое значение коэффициента корреляции было бы достоверным. Обратимся к таблице Ш (приложения), где указано количество пар значений, достаточное для достоверности выборочного коэффициента корреляции (/>>,). Например, чтобы г^ = 0,354 был достоверен при Р > 0,95, необходимо в анализ включить 32 пары, при Р £ 0,99 - п = 53; при Р > 0,999 - п = 85. Этой таблицей можно пользоваться и для определения достоверности гху. По этой таблице, если определенному значению гху будут соответствовать число пар меньше, указанных в данной строке, то это будет означать, что данный коэффициент недостоверен. Коэффициент корреляции достоверен тогда, когда значение п в строке, соответствующей конкретному значению г^, будет равно фактическому числу пар, по которым оценивался /уу, или превышать его. 52
5 5.3.Ранг0ВЫЙ коэффициент корреляции Иногда экспериментальные данные не поддаются количественной оценке, а представляют собой материал, разбитый на классы или группы и в таком случае обычный коэффициент корреляции (пирсоновский коэффициент корреляции) оценить не представляется возможным. Тогда экспериментальные данные можно упорядочить, приписав каждому варианту совокупности порядковый номер или ранг ,записав ранги в порядке увеличения или уменьшения величин. Такие порядковые номера (ранги) можно приписать двум признакам, зафиксированным у одной особи и оценить коэффициент корреляции между двумя рядами рангов. Поскольку порядковые номера -это ряд натуральных чисел, то при выведении формулы для оценки коэффициента ранговой корреляции, можно воспользоваться некоторыми закономерностями, характерными для ряда натуральных чисел. Так, среднее значение чисел натурального ряда равно числу порядковых цифр плюс одно число, деленное на 2 , т.е.( п + 1) / 2, а дисперсия чисел натурального ряда, S=n(n-l)(n+l)/12 . Например, имеется ряд натуральных чисел от 1 до 9 : 1,2,3,4,5,6,7,8,9 . Тогда Х= (9+1)/2=5, S=(9x8xl0)/12=60. Спирмен (Spearman,1904 ),используя ранги при психологических исследованиях , построил коэффициент , который нашел широкое использование в биологических исследованиях и носит название автора -«коеффициент корреляции по Спирмену» и обозначется как Rs . В основу построения рангового коэффициента корреляции положены закономерности , характерные для ряда чисел натурального ряда Если исходить из закономерностей, положенных в основу построения коэффициента корреляции Пирсона, то следует вспомнить,что числитель коэффициента корреляции Пиросона есть коварианса или варианса совместного вариирования Двух переменных велечин,а знаменатель - корень квадратный из произведения двух дисперсий этих величин . Дисперсии двух ранжированных рядов одинаковы, так как это одни и те же числа натурального ряда, расположенные в разном порядке по двум коррелируемым рядам. Следовательно знаменатель рангового коэффициента корреляции -это просто дисперсия чисел натурального ряда,а числитель-квадрат различий между рангами,что и является ковариансой т.е.: 53
R s = l - Здесь Z d-это коварианса двух ранжированных рядов чисел п(п-1)(п+1)/12-это дисперсия чисел натур&тьного ряда. (см.5.1 формула 3) Из формулы видно, что , если ранги двух Рял полностью совпадают, то d равно нулю и коэффцц^03 корреляции равен + 1,0 1. Пример 5.2. В качестве примера используем данные , получении К. Пирсоном при оценке рангового коэффициента корреляции в Англии работники телеграфных станций должны были сдать 5 экзаменов: по арифметике, орфографии, географии, сочинению на английском языке, чистописанию. Всего экзамену подверглось 27 человек. К. Пирсон оценил величину рангового коэффициента корреляции между знаниями арифметики и всеми гуманитарными предметами. Уровень знаний по арифметике был выражен в баллах от 1 до 300 , а знания по каждому из гуманитарных предметов оценивались в баллах от 1 до 20(Х Таким образом, по арифметике можно было набрать максимум 300 баллов, а по гуманитарным предметам суммарно можно было набрать 1000 баллов. Эти данные были представлены следующим образом: Баллы по арифметике 230 158 228 154 162 182 129 164 187 186 151 167 103 146 131 Ранг I 9 2 10 8 5 14 7 3 4 11 6 20 12 13 Баллы по гуманитарным наукам 907 764 748 746 724 718 710 703 677 665 645 643 634 628 580 Ранг 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Разница между рангами,<1 0 7 1 6 3 1 7 1 6 6 0 6 7 2 2 54
15 18 22 16 17 19 21 25 26 27 23 24 561 560 532 529 526 515 484 463 444 386 369 288 16 17 18 19 20 21 22 23 24 25 26 27 1 1 4 3 3 2 1 2 2 2 3 3 0 п« 82 125 122 114 93 61 38 37 63 62 Используя выше приведенную формулу рангового коэффициента корреляции можно получить: Rs=l-6IcrVn(n-lXn+l)= 1-2292/19656= W), 1166=0,8834. Следовательно , можно заключтъ,что лица, хорошо владеющие арифметикой ,так же обладают хорошими знаниями и по гуманитарным наукам. Если далее анализировать полученные данные, то можно заметить, что ,начиная с ранга N 14, ранги по двум рядам практически совпадают. Это наводит на мысль, что половина всех участников экзаменов , владеющих гуманитарными знаниями ниже среднего уровня , плохо знают и арифметику. По первым 13-и рангам картина не столь удручающая и заметны более значительные несоответствия в рангах, что скорее всего свидетельствует о том,что лица из верхней части таблицы в целом более способны к усвоению предметов, чем лица из нижней части таблицы. Если оценить отдельно коэффициенты корреляции у первых 13 и У 14-и последующих участников экзаменов, то соответственно Rs бУДут равны 0,8264 и 0,1676 .Следовательно действительно Участники экзаменов, занявшие места с 14 по 27-е по гуманитарным предметам, плохо знают и арифметику. 55
§ 5.4. Регрессия Коэффициент корреляции - параметр, оценивающий степень сопряженной изменчивости двух переменных величин» измеренных у каждой особи выборочной совокупности. Эта статистическая связь может быть прямой (положительной) и принимать любые значения в границах от 0 до +1,0 и обратной (отрицательной), т.е. принимать любые значения от -1,0 до 0. Однако, часто недостаточно знать величину статистической связи, а необходимо оценить характер и величину изменения одного признака (переменной) при изменении другого признака (переменной) на единицу измерения. Например, насколько изменяется живая масса животных (кг) при изменении роста на 1 см или насколько увеличится урожайность растений при увеличении дозы удобрений на 1 гр (1 кг, 1 тонну) на единицу площади посева и др. Такой способ оценки сопряженного варьирования признаков носит название регрессии, а параметр, с помощью которого оценивается регрессия, называется коэффициентом регрессии, &х=г,у—> ще Ьх - коэффициент ~у °у ~у регрессии признака (переменной) х на признак (переменную) у. Пример 5.2. Оценить насколько изменяется % белка (х) в молоке коров при изменении % жира (у) на 1%. (Данные представлены в примере 5.1.), В примере 5.1. значение коэффициента корреляции было оценено, равным +0,356, следовательно: ^=^— = +°,356. — = 0,25 % " °х 0,17 Это означает, что на каждый 1% увеличения % жира в молоке содержание белка в молоке будет увеличиваться на 0,25%. Регрессия может быть выражена графически путем построения линии регрессии, используя уравнение вида: у = а + Ьх, ще у - значение (для данного примера) % жира; х - значение % белка; Ь - коэффициент регрессии; а - константа. 56
Для построения линии регрессии необходимо упорядочить значения у (проранжировать) и отложить их на оси абсцисс в определенном масштабе. Затем в определенном масштабе отложить на оси ординат значения признака х. После этого точками на графике отложить значения jc, соответствующим значениям у. Значения % белка, М 3,4 3,3 3,2 3,1 3,0 -4- 3.6 3,7 3,8 3,9 4.0 4,1 Значения % жира в молоке, (у) Линейное уравнение регрессии решается следующим образом. Константа а определяется через средние значения признаков х и у (X и F) и коэффициент регрессии Ь. а = Х-Ь7 = \2- (3,8 • 0,25) = +2,25 Затем последовательно находим значения jc, для каждого значения >>,. х} = а + byj = 2,25 + 0,25-3,6 = 3,15 х2 = 2,25 + 0,25-3,7 = 3,18 х3 = 2,25 + 0,25-3,8 = 3,20 х4 = 2,25 + 0,25-3,9 = 3,22 Х5 = 2,25 + 0,25-4,0 = 3,25 х6 = 2,25 + 0,25-4,1 = 3,28 Полученные значения х\ - хв наносим на соответствующей шкале на график, точки соединяем одной линией. Эта линия будет характеризовать взаимоотношения двух признаков. Чем круче угол, образуемый прямой линии регрессии и осью абсцисс, тем больше зависимость изменения признака х от изменения признака у на единиц}' измерения. 57
ГЛАВА б СРАВНЕНИЕ СТЕПЕНИ СООТВЕТСТВИЯ ФАКТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ ТЕОРЕТИЧЕСКИМ В биологии при изучении того или иного явления, например, в генетических исследованиях при анализе характера фенотипического расщепления в ¥2 в гибридологических экспериментах; при оценке характера распределения (нормальное, биноминальное и др.), исследователь a priori задается определенной гипотезой. Например, при дигабридном скрещивании согласно закону Менделя, в F2 исследователь ожидает иметь соотношение фенотипов 9:3:3:1. Измеряя какой-либо количественный признак, экспериментатор ожидает, что выборочная совокупность отвечает закономерностям нормального распределения, и по этой причине характеризует распределение параметрами, свойственными этому распределению. Однако, чаще всего в силу случайных причин между частотами, которые имеют место в теоретических распределениях и распределениях фактических, нет полного соответствия. Возникает задача статистической оценки степени несоответствия между теоретическим (гипотетическим) и фактическим (экспериментальным) распределениями. Эта статистическая оценка должна определить границу, когда различия между распределениями следует считать случайными, а ковда эти различия уже существенны и их нельзя относить к разряду случайных или несущественных различий. В первом случае выдвинутая гипотеза подтверждается, а во втором случае гипотеза отвергается. В качестве критерия оценки соответствия теоретических и эмпирических распределений мы рассмотрим критерий £ (греческая буква хи), хотя имеются и другае критерии. Иноща этот критерий называют критерием соответствия, но мы в дальнейшем будем называть его критерием jf. Если обозначить теоретические частоты через /г, а фактические частоты через /^, то общий вид формулы критерия £ будет: 58
JT Следует обратить внимание, что величина числителя в формуле возрастает по мере увеличения расхождений между теоретическим и фактическим распределениями. Критерий £ нашел широкое применение для решения многих задач, требующих подтверждения или опровержения гипотезы. Ниже рассмотрим ряд таких задач. § 6.1.Анализ характера расщепления в гибридологических опытах. Метод £ активно используется в генетических экспериментах для доказательства соответствия (несоответствия) теоретического менделевского расщепления, расщеплению, полученному в конкретном эксперименте. Рассмотрим решение такой задачи на конкретном примере. Пример 6.1. Изучался характер расщепления в F2 по окраске цветка и форме листьев у примулы. Два признака контролируются генами, находящимися в разных группах сцепления, т.е. при независимом расщеплении в соответствии с законом Менделя в Fi следует ожидать расщепление 9:3:3:1. В гибридологическом опыте в F2 были получены следующие данные. Из 617 растений, выращенных в F?, получено: 345 растений с белыми цветками и гладкими листьями; 90 растений с белыми цветками и сморщенными листьями; 142 растения с розовыми цветками и гладкими листьями; 40 растений с розовыми цветками и сморщенными листьями. Из предыдущих опытов известно, что ген белой окраски цветков (А) доминирует над розовой окраской цветков (а). Ген тладколистости (#) доминирует над геном, контролирующим формирование сморщенного листа (6). Таким образом, выраженные в генетических символах экспериментальные данные имеют следующий вид: 59
/ф /Г А- В-- А-ЬЬ - аа В-- аа ЪЬ - 345 90 142 40 347,06 115,69 115,69 38,56 Пф = 617 rij = 617 В соответствии с гипотезой при дигибридном скрещивании в F2 должно быть расщепление 9:3:3: 1, т.е. всего 16 частей. Определим сколько растений генотипа ааЬЪ из 617 растений должно было бы быть, если бы данное фактическое расщепление отвечало бы менделевскому расщеплению. 617 1 часть от 16 частей = — = 38,56, т.е. теоретически растений с 16 генотипом aabb в выборке должно быть не 40 растений, а 38,56. Долее для генотипов А - Я- -теоретическое значение должно быть равно: 9-38,56 = 347,06; для генотипа А - bb - 3-38,56 = 115,69; для генотипа Я- аа -3-38,56= 115,69. Если сложить новые (теоретические частоты), то получим: 38,56 + 347,06 + 115,69 + 115,69 = 617. Таким образом, расчет теоретических частот состоит в том, что 617 растений были перераспределены по 4-м классам генотипов так, как они должны бы были быть, если бы теоретическое и фактическое распределения полностью совпадали. Подставим полученные значения в формулу: Хф = у(/ф~/тУ ^ (345 - 347,0б)2 | (90-115,69)2 | ^ /т 347,06 ~+ 115,69 (142-115,69)2 (40-38,56)" ЛЛ1 с ^ е по лм ллпл + ^ !__L. + v i„_L_ _ ooi + 5,70 + 5,98 + 0,05 = 11,74. 115,69 38,56 Теоретические частоты рассчитывались от 617, всего было 4 класса генотипов, следовательно, число степеней свободы, на которые следует ориентироваться в таблице IV (приложений) равно: df = число расщепляющихся классов -1=4-1=3. 60
В таблице IV находим, что числу степеней свободы, равному 3, соответствуют стандартные значения xl Для уровня значимости р = 0,05, xl = 7,81; для уровня значимости р = 0,01, xl = П,34. Напомним, что нулевая гипотеза, Но, сформулирована так: предположим, что между частотами теоретического и фактического расщепления отличия отсутствуют. Такая гипотеза будет принята, если. фактическое значение xl будет иметь значение ниже xl ( в таблице IV приложении), ниже 7,81. Так как в примере х\ = 11,74, то Щ следует отвергнуть, т.е. между теоретическим расщеплением и фактическим расщеплением различия таковы, что их нельзя признать случайными, а следует считать существенными, т.е. не отвечающими менделевскому расщеплению 9:3:3:1. §6.2. Сравнение фактических вариационных рядов с теоретическими, вычисленными в соответствии с закономерностями нормального распределения. Когда полученные экспериментальные данные организованы в вариационный ряд, в ряде случаев возникает необходимость выяснить, распределены ли частоты вариационного ряда в соответствии с закономерностями нормального распределения или нет? Пример 6.2. Оценивается характер распределения удоя 300 коров. Оценим параметры вариационного ряда. ;? = л + 2^.* = 45+±1°?.5 = 46)8ц, м 300 Т*'Ы П s 14827,5 п-\ 299 а = ^ = v'49,59 = 7,04 Ц. • к1 = (632 - 38,9). 25 = 14827,5, 49,59, 61
Таблица 10. Оценка характера распределения удоя за лактацию 300 коров. Данные сгруппированы в вариационный ряд. \Xi 30 35 40 45 50 55 60 65 /♦ 5 20 55 92 61 48 15 4 71= =300 а 1-3 -2 -1 0 +1 +2 +3 +4 \fa -15 -40 -55 0 +61 +96 +45 +16 #а= =108 к 9 4 1 0 1 4 9 16 W 45 80 55 0 61 192 135 64 =632 [71^* 1 а -2,39 -1,68 -0,96 -0,25 0,45 1,16 1,87 2,58 \ло 0,02294 0,09728 0,25164 0,38667 0,36053 0,20357 0,06943 0,01431 J г - 4,89 20,73 53,62 82,39 76,82 43,37 14,79 3,05 W^ 5 21 54 82 77 43 15 I 3 п= i =300 Далее необходимо оценить теоретические частоты вариационного ряда, т.е. л = 300 перераспределить по классам вариационного ряда так, как они должны бы были быть, если бы распределение отвечало закономерностям нормального распределения. Для этого воспользуемся нормированным отклонением и высчитаем нормированное отклонение для каждого класса вариационного ряда или для каждой строки вариационного ряда по х -X формуле: / = — . а Например, для первой строки вариационного ряда значение t оценивается следующим образом: t = -* = —~—- = -2,39, и таким же а 7,04 образом для всех классов. Затем в таблице I (приложения), в которой приводятся данные первой функции нормированного отклонения 1 -- /(')= ~т= •* 2 находим значение вероятности г для каждой строки. Затем вероятности необходимо перевести в численности путем 62
Уложения вероятности на общую численность выборки. Однако, если классовый промежуток не совпадает со значением сг, тоща f'(t) следует пк 300-5 Л,„Л„ т> умножить на выправленное число — = = 213,07. В результате получается ряд чисел, которые будут являться теоретическими частотами вариационного ряда, т.е. п = 300 перераспределено по классам вариационного ряда так, как они должны быть, если бы вариационный ряд отвечал закономерностям нормального распределения. Дробные числа можно округлить и получить целые числа теоретических частот, но можно и не округлять, а рассчитывать £ с дробными значениями /т. Теперь можно оценить соответствие частот /ф с частотами /т через оценку критерия я2. 2л _yk-/J _(5-5Г , (20-21? (55-54? (92-82? Хф ^ fT 5 21 54 82 | (61-77? ^48-43? |QS-lsy| (4-ЗУ_ 77 43 15 3 = 0 + 0,05 + 0,02 +1,22 + 3,32 + 0,58 + 0 + 0,33 = 5,52. Степени свободы в задаче по проверке нормальности распределения оцениваются так: от числа классов вариационного ряда необходимо вычесть три: df = г - 3, где г - число классов вариационного ряда, т.е. 8 - 3 =5. Тройка вычитается потому, что в оценке /т принимали участие три параметра nj(9a. Таким образом, *ф = 5,52. Сравним значение х\ °о стандартным значением xl в таблице IV (приложение) при df = 5. ^ = 11,1 для р = 0,05; xl = 15,1 для р = 0,01. Поскольку xl = 5,52 меньше табличного значения 11,1, отвечающего уровню значимости 0,05, то нулевая гипотеза, ##, сохраняется, т.е. некоторое несоответствие /ф и /т следует отнести к случайному (несущественному), а распределение частот в вариационном Ряду считать отвечающим закономерностям нормального распределения. 63
§ 6.3. Опенка соответствия распределений двух эмпирических совокупностей. Иногда в исследованиях возникает необходимость провести сравнительный анализ характера распределения частот, а не параметров, двух эмпирических распределений. Тоща, если численность двух распределений одинакова, формула £ для такого случая есть: /+Л Пример 6.3. Оценивается соответствие 2-х распределений. Анализируется характер распределения по удою коров за лактацию в двух стадах, имеется 2 вариационных ряда: х' | 30 1 35 40 45 1 50 1 55 60 65 1 Л 5 20 55 92 61 48 15 4 п = 300 1 Л "1 10 35 95 82 1 43 20 12 3 п = 300 1 «(Л-ЛГ =(5-">У , (20-35)2 { (55-95)' ( (92-82)* ( (61-43)2 , 15 55 150 174 104 /.+/1 + (48-20)2 ( (15-12)2 t(4-3)2^ 68 27 7 = 1,67 + 4,09 +10,67 + 0,57 + 3,11 +11,53 + 0,33 + 0,14 = 32,11, df = 8-1=7, т.к. единственным общим элементом двух рядов является одинаковое число классов. В таблице IV (приложения) х\ дл* d/=7, есть: 14,1 для р = 0,05; 18,5 для /? = 0,01; Но - отвергается. 64
Следовательно, в вариационных рядах представлены два существенно разных распределения. В том случае, коща численности двух распределений различны в формуле £, должен быть учтен как бы "вес" каждой частоты. Пример 6.4. Анализируется характер распределения удоя коров за лактацию в двух стадах. Имеется 2 вариационных ряда: п\ = 48, „2 = 71: Таблица 11. Сравнение двух фактических распределений с разными численностями. Ui Гзо 35 40 [45 50 55 60 1/7 3 5 10 15 7 5 3 | л/ = 48 /2 5 10 17 25 7 4 3 п2 = 71 /7«2 1213 355 710 1065 497 355 213 f2nj 240 480 816 1200 336 192 144 d 27 125 106 1 135 ! 161 j 163 69 Формула £ для такого случая выглядит следующим образом: ^=yMj«AL_L = 9l,i2 + 1041,67 + 416,15 + 455,62 + /|+/2 "l«2 + 1851,5 + 2952,11 + 793,5 = 7601,67 • -i- = 2,23. 3408 xl для df= 7-1=6; 12,6 для р = 0,05; 16,8 для р = 0,01. Следовательно, Но сохраняется 9 в примере 6.4, представлено два одинаковых распределения. 65
§ 6.4. Анализ распрепелений. сгруппированных в 4-х-польные таблицы. В ряде случаев при анализе биологического или медицинского материала представляется более удобным сгруппировать данные в таблицы, 2-х (нескольких) строк и 2-х (нескольких) столбцов. Такие таблицы получили название 4-х, 6-ти, 9-ти и т.д. -польных таблиц. Чаще всего такие задачи возникают при попытке выявить влияние на признак того или иного фактора, введенного в эксперимент: результативность применения того или иного медицинского препарата при лечении больных, влияние на урожайность культур тех или иных удобрений и др. При этом нулевая гипотеза. Но, по-прежнему предусматривает отсутствие значимого влияния изучаемого фактора на признак. Рассмотрим следующий пример. Пример 6.5. Изучали частоту возникновения Транспозиций мобильного генетического элемента Dm 412 у дрозофилы после ^-облучения дозой 1300 р. Сравнивались числа сайтов локализации Dm 412 на политенных хромосомах до и после ^облучения. Получены следующие данные: I Контроль (до облучения) 1 Всего просмотрено ядер, гц = 100, 1 из них 5 ядер имели дополнительные сайты внедрения Dm 412 по сравнению с предыдущим анализом. Опыт (после ^-облучения) Всего просмотрено ядер, П2 = 250, из них 85 ядер имели дополнительные сайты внедрения Dm 412. 66
Таблица 12. Проверка влияния ^облучения на транспозиционную активность МГЭ Dm 412. 1 Гпуппы L- » *— (До облучения [После [^-облучения Всего Число ядер Число ядер с транспозициями 5 С 643 85 90 Число ядер без транспозиций .-Л ^ 74,3 95 £ 185,7 165 260 ! Всего 100 250 п = 350 1 В клетках таблицы 12 помещены фактические частоты, полученные в опыте и контроле. Задача состоит в том, чтобы сравнить эти фактические частоты с теоретическими частотами, но какими? Если нулевая гипотеза, Но, верна, т.е., если влияние фактора отсутствует, то распределение частот в клетках должно быть пропорциональным числам объема совокупностей опыта и контроля, т.е. цифры в клетках должны быть распределены пропорционально объемам совокупностей без перевеса каких-либо одних клеток над другими. Рассчитаем теоретические частоты, исходя из следующих аргументов. Из 350 ядер в 90 ядрах обнаружены транспозиции, а сколько транспозиций должно было бы быть в 100 ядрах, если бы фактор не влиял? Т.е. 90 х 90100 ^сп : , х = = 25,7, 350 100 350 т-е. если события случайны, то транспозиций в ядрах без облучения Должно быть 25,7. Все теоретические частоты впишем в уголках каждой клетки. 67
Далее: сколько в контроле должно быть ядер с транспозициями после у- облучения?: 90 х 90-250 _, ; ; х- =64,3. 350 250 350 Число ожидаемых ядер без транспозиций в контроле: 260 х 260100 _, : —; х = = 74,3. 350 100 350 Число ожидаемых ядер без транспозиций после /-облучения: 260;JL ,= 260^50 350 250 350 Суммируем полученные теоретические частоты: 25,7 + 64,3 + 74,3 + 185,7 = 350, т.е, если влияние ^облучения отсутсгвует или если оно незначительно, то частоты должны быть такими, какими они получены при решении пропорций. Далее следует использовать £ для оценки существенности или несущественности отличий фактических частот от теоретических путем сопоставления fy п/ф в каждой клетке: 2 (5-25,7)2 (95-74,3)2 (85-64,3)2 (165-185/7)2 ^„ со £Щ ^ 0 _г у* -\ l_Z_ + \ L_'_+b >_/_ + v >_./_ =16,7 + 5,8 + 6,7 + 2,3 = 31,5 25,7 74,3 64,3 185,7 Число степеней свободы в 4-х -польной таблице оценивается как число строк минус I умноженное на число столбцов минус 1. т.е. df= (строки - 1)(столбцы - 1) = (2 - 1)(2 - 1) = 1. В таблице IV (приложений) xl ПРИ df=\, есть: для р = 0,05 - 3,8 для р = 0,01 - 6,6. Таким образом, Но отвергается, ^облучение существенно увеличивает транспозиционную активность мобильного генетического элемента Dm 412. 68
Четырехпольные таблицы можно обработать и более простым способом. Так, если обозначить клетки четырехпольной таблицы буквами латинского алфавита, как показано в таблице 13, то формулу £ можно записать в следующем вцде. Таблица 13. Анализ 4-х -польной таблицы в общем виде. [группы [До облучения После i ^облучения Ядра с транспозициями 5 (а) 85 (с) (а + с) Ядра без транспозиций 95 (Ь) 165 (d) Ф + d) Всего (а + Ь) (с+ 4) п 1 х2 = {ad-bcfn _(825-8075У-350_ 72502-350 = 31,45, {a+c)ip+d\a + b)i£ + dy 90-260-100-250 ~ 90-260-100-250 т.е. получен тот же результат, что и при оценке теоретических частот через пропорции. Кроме того, когда численности маленькие и в клетках резкие колебания численностей, следует в формуле £ для 4-х -польных таблиц учитывать поправку Иейтса. Тогда формула £ имеет вид: \ad-bd— |825-8075(- — J I 2 •350 70752-350 (a + b\b+d)ia+b)ic+d)~ 90-260-100-250 90-260-100-250 = 29,9. Прямые скобки \ad - bc\ указывают, что разность берется без учета знака. Нулевая гипотеза по-прежнему отвергается: у-облучение - фактор, увеличивающий транспозиционную активность МГЭ Dm 412. По такому же принципу могут быть организованы и другие виды польных таблиц 2 х 3; 3 х 3; 4 х 4 и другое. 69
ГЛАВА 7 ПИСПЕРСИОННЫЙ АНАЛИЗ В предыдущих главах неоднократно подчеркивалось, что биологические объекты в своем формировании и развитии в сильной степени зависят от внутренних и внешних факторов. Все внутренние факторы в своем действии и взаимодействии создают разнообразные интегрированные генетические системы, а во взаимодействии с внешней средой создается громадный разнообразный биологический мир. В исследовательской работе часто возникает потребность в оценке влияния тех или иных факторов на анализируемый признак или признаки. Несмотря на то, что определяющим условием проведения любого эксперимента является создание максимально выравненных условий для всех участников опыта, тем не менее случайные колебания имеют место, и поэтому всегда многочисленные случайные факторы не могут быть учтены в эксперименте и не могут быть нивелированы. Однако, используя специальные методы статистического анализа, можно оценить вклад случайных факторов в признак* С другой стороны, исследователь специально подвергает объекты какому-то воздействию, влияние которого он хочет оценить. Тогда возникает специальная задача по выяснению роли и величины влияния этого фактора на признак или объект в целом. Для решения такого рода задач английским математиком и биологом Робертом Фишером (R.Fisher) был разработан специальный раздел биологической статистики, названный автором Analysis of variance - анализ вариансы. В русском переводе этот раздел статистики известен как дисперсионный анализ. В нашей стране самой основательной и капитальной книгой является переводная монография Шеффе Г. Дисперсионный анализ, 1963, требующая от читателя хорошей математической подготовки. Однако некоторые главы дисперсионного анализа, специально адаптированные для биологов, имеются практически во всех учебниках по биологической статистике. 70
§ 7.1. Общие принципы дисперсионного анализа. Если организуется специальный эксперимент, в котором ставится задача по оценке величины вклада того или иного организованного фактора в анализируемый признак, то кроме действия этого фактора всегда на признак оказывают влияние неорганизованные факторы или случайные факторы. В таком случае каждая единица совокупности, имея конкретное и только для нее характерное значение признака (хф, будет отклоняться от среднего значения этой совокупности ( X или ju) на величину вклада изучаемого (организованного) фактора и на величину вклада неорганизованных (случайных) факторов. Сказанное выше может быть записано как: xij = {i±Ai±eiJf ще Хц - значение признака; ft - среднее значение для совокупности; Ai - доля отклонений от //, связанная с действием организованного фактора; е^ - отклонения, связанные с действием случайных факторов. Если исследователь ставит своей целью изучить влияние не одного организованного фактора, а двух, трех и более факторов, тогаа анализ усложняется по мере увеличения числа изучаемых факторов. Например, для изучения 2-х факторов модель будет иметь вид: xijk = /J ± Aft Bj ± (At x Bj) ± eijk, rae xijk - анализируемый признак; // - среднее значение; Ai - отклонения, связанные с действием фактора А; Bj - отклонения, связанные с действием фактора В; (Ai х Bj) -отклонения, связанные с наличием взаимодействия между факторами А и В; etjk -случайные отклонения. Для анализа 3-х факторов строится еще более сложная модель, а именно: хт = М ± At ± Bj ±Ск± (Ai х Bj) ± (Bj х Ск) ± (Ai x Ск) ± ± (Ai х Bj х С*) + еды гае Xijkt -анализируемый признак; 71
// - среднее значение; Аь Bj% Ck -факторы; - взаимодействия факторов; (*, *cj €ijkt - случайные факторы. Приведенную схему, относящуюся к опенке отклонений по одному измеренному признаку, можно перенести на анализ вариации многих изменений и выразить все в вариансах(о2) как: 2 _ 2 .2 ^общая ° фахториалуиы "*" ^ст>-чЛ^«ая , При изучении влияния фактора чаще всего исследователь вводит в эксперимент как бы различные "дозы" фактора. Например, изучаются различные дозы удобрений на урожайность каких-либо культур, различные дозы лекарств на ликвидацию заболевания, различные дозы ^облучения на активность транспозиций мобильных генетических элементов, доля генетического разнообразия в фенотипическом разнообразии признака. Другими словами, организованный фактор представлен не одним значением, а несколькими значениями (градациями). Градации фактора в одних случаях могут быть точно установлены (фиксированы), например, когаа изучается влияние сезонов года на формирование признака, доз удобрения на урожайность, генетические различия по конкретному признаку между несколькими линиями, породами, сортами и др. Но иногда в эксперименте различия между градациями не имеют четких границ (не фиксируются), например, при изучении генетического разнообразия в популяции, когда берется случайная выборка генотипов из популяции и устанавливается степень различий между индивидами, возникающая по генетическим причинам. В первом случае схема дисперсного комплекса будет называться фиксированной одно-, двух-, трехфакторной и т.д., во втором случае также одно-, двух-, трехфакторный и т.д., но случайной моделью дисперсионного комплекса. Практически при организации этих двух моделей дисперсного комплекса различий нет, различия появляются при проведении анализа и интерпретации полученных в анализах данных. 72
Ниже приведем схему организации одкофакторного дисперсионного комплекса в общем виде. Пусть имеется i генотипов, у каждого их которых имеются j потомков, тоща такие данные, сведенные в таблицу 14, имеют вид: Таблица 14. Организация однофакторного дисперсионного комплекса. Ггъадации — — 1 Признак гг пг \ъ Г; 7 1 XJ1 Х12 XJ3 ; хп х* ! 2 Х21 Х22 Х23 • X2i Xi 3 Х31 Х32 хзз : ХЦ Хъ ... .,, ... ... ... ... ... / | ХЦ Xi2 Xi3 1 • 1 хи I Х* fXoSil При организации материала в таком виде, как представлено в таблице 14, видно, что различия между градациями зависят от того, насколько различны средние значения по градациям (ЛЧЛ'гДз,...Д.). Дисперсия межгрупповых различий (5лг) есть: ^мг^п^{х,-1Гобщ)\ ще SMi - дисперсия межгрупловых (межградационных) или факториальных различий; Xi - средние значения признака по отдельным градациям; Хобщ - среднее значение признака в целом по комплексу; щ - число измерений в отдельной градации. Дисперсию, оценивающую случайные влияния (5ГЛ), можно оценить следующим образом. Если X, - есть характеристики градации, то разнообразие внутри градации можно отнести к категории случайных колебаний, и тоща: Ху - значение отдельного измерения признака; Х{ - среднее значение признака в градации. Общую дисперсию оцениваем как: s<*, = E Axv -Xo**)- Тоща Бобщ = Бмг + 50. 73
Рассмотрим конкретный пример. Пример 7.1. Оценивается генетическое разнообразие по плодовитости самок-норок стандартного генотипа по 3-м пометам у каждой самки. Самки выбраны из популяции случайно. Таблица 15. Однофакторный дисперсионный комплекс (случайная модель) Самки 1 Пометы № 1 №2 №3 Ш 1 *' 2л 2Х LE*2 1 п \ №1 [№2 [№3 Число Щенк<>в в помете 2 3 4 3 3 9 29 27 4 5 6 3 5 15 77 75 3 4 5 3 4 12 50 48 j Число градаций, г = 3 ЛГ = 2л, = 9 X,*, =4 | 22л,- = 36 II*.2 =156 2я = 150 g-fe2>y ."1-144 ЛГ 9 | Подставляя значения лт/, Xt и Л^ из таблицы 15 в формулы получим: ^4з-2)2+(3-3)Ч(4-3)2]44-5)Ч(5-5)Ч(б-5)2]+ + ^3-4)2+(4-4)2+(5~4)2]=6 ^=(2-4)Ч(3-4)Ч(4-4)Ч(4-4)Ч(5-4)2ч-(б~4)2-ь(3-4)Ч + (4-4)2+(5-4)2 =4 + 1 + 1 + 4 + 1 + 1 = 12. Следовательно, £0<ty = SM2 + 5сл = 6 + 6 = 12. Таким образом, общая изменчивость по плодовитости, 50^, разложена на два слагаемых: 1. SMe = 6, зависит от того, что между самками имеются различия по плодовитости, определяемые средними значениями по 3-м пометам. 74
2 Sen = 6, определяемая тем, что между пометами отдельных самок были обнаружены различия по числу щенков. Если воспользоваться выражением дисперсии, представленным в главе 2, т.е. S = £(*, - хУ = ]£ х] - ^^--, то оценка параметров в дисперсионном комплексе может быть представлена в таблице 16. Далее, основываясь на данных таблицы 15, произведем анализ однофакторного дисперсионного комплекса по схеме случайной модели. Анализ представлен в таблице 16. Таблица 16. Анализ однофакторного равномерного дисперсионного комплекса (случайная модель), оценивающего генетическое разнообразие по числу щенков в помете норок. Источник 1 изменчивости Между градациями Случайный Общий Сумма квадратов отклонений,S =150-144=6 = 156-150 = 6 = 156-144=12 Степени свободы, df г-1=3-1=2 W-r=9-3 =6 N- 1 =9-1 =8 Средний квадрат, ms m-Bki'3 \ ш"" = лЬ = ' F = ^=3,0 1 mScn Источник изменчивости Между 1 градациями 1 L Случайный | Строение среднего квадрата 2 ms. *0\, Факториальная варианса _2 Л**,,,-/!!*,,, Ч = 1--1 = 0,67 3 <=1 Коэффициент внутриклассовой 1 корреляции, rw I 1 < ^ М? ^ СЛ 0,67 „ ,Л = —- = 0,40 1,67 < ! "«г va J = -1- = 0,60 1,67 | 75
^ = 2] F„ 5,1 - P > 0,95 df2 = 6 Г 10,9 -/>>0,99 J 27,0 -P> 0,999 Таким образом, по результатам анализа однофакторного дисперсного комплекса получено, что между самками 40% различий следует отнести к факториальным различиям или, в данном примере, к генетическим различиям, а 60% составляют различия случайные или любые другие неучтенные факторы. Достоверность внутриклассового коэффициента корреляции или достоверность отличия межгруппового среднего квадрата над случайным средним квадратом оценивается через критерий Фишера, F- ——. Если msc* межгрупповой средний квадрат больше случайного среднего квадрата на величину большую первого табличного значения при данных степенях свободы (dfj - степень свободы при межгрупповом среднем квадрате, а dfi - при внутригрупповом среднем квадрате), то такие отличия считаются достоверными. В нашем примере dfj = 2, dfi = 6. В таблице V (приложения) F5t 5,1 для Р = =0,95; 10,9 для Р = 0,99; 27,0 для Р = 0,999. Другими словами, в примере 7.1 шмг недостоверен. Причина такого положения заключена в малом числе данных, включенных в дисперсионный анализ. Кроме того, в дисперсионном анализе можно, используя F- критерий, получить оценку достоверности различий любого среднего значения с любыми другими средними значениями. Например, сравним Xi = 3 шт. с Х2 = 5 шт. Тогда: р_$Х,-ХгУ пхп2 J3-5)2 3-3=бД). msc, и, +п2 1 3 + 3 В таблице V (приложения) для: 76
#/ = 1 #2 = 6 • Fst 6,0 - P - 0,95 13,4 - P = 0,99 35,5 - P = 0,999 Следовательно, два средних значения Zi = 3 шт. и Х2 = 5 шт. различаются достоверно с вероятностью, Р = 0,95. При сравнении 2-х средних значений dfj всегда равны 1, a 4fr равны значению степеней свободы, на основе которых был оценен msc.v § 7.2. Двухфакторный дисперсионный комплекс. Задачи, в которых необходимо выяснить влияние 2-х организованных факторов, предусматривают использование моделей 2-х факторных дисперсионных комплексов: Xijk = fi + Ai Щ +(At x Bj)+eijk. Пример 7.2. Изучается влияние 2-х различных доз удобрения (В) на урожайность 3-х сортов риса (А) по результатам нескольких испытаний. 77
Таблица 17. Организация двухфакторного дисперсионного комплекса (фиксированная модель). Опыты №1 №2 №3 N«4 №5 №6 Iя' 2>. I*,' х~ \ А, 1 В! 35 33 31 32 34 5 165 5455 5445 33 в2 37 36 35 36 4 144 5186 5184 36 А2 1 Bi 35 37 38 39 ,36.. 37 6 222 8224 8214 37 В2 40 41 i 42 41 43 5 207 8575 8569,8 41,4 | 1 Аз 1 Bi 31 34 35 32 35 5 167 5591 5577,8 33,4 в2 40 38 39 40 38 5 195 7609 7605 39 1 а=ПГ] Ь = 2 ■ 1 '*""' N = 30 1 Ц',= ПО01 ££Х =40б40| 2]А = 40595,6 Я = 40333,3 1 Сначала двухфакторный дисперсионный комплекс обрабатывается также как однофакторнын (как в таблице 15), а далее проводится анализ по фактору Л и по фактору В: | Фактор А [А/ \а2 \А3 | Фактор В [В! в2 Wa 9 11 10 пв 16 14 rs; 309 429 362 2лв 554 546 \hA !10609 16731 13104,4 ZhA = 40444,4 ttB 19182,25 21294,0 3tB = 40476,25 X, ц/га j 34,3 _j 39,0 I 36,2 П Я, ц/га ГН6 ^J 39,0 J J 78
достоверность различий между средними значениями: 4Г| = 1 I т = 24 FSt 4,3- Р = 0,95 1 7,8- Р = 0,99 14,0-Р =0,999 ^-,,=22,2- ^-5, =31,6"* Таблица 18. Анализ двухфакторного дисперсного неравномерного комплекса (фиксированная модель). [Источник [изменчивости | Между сортами риса \(А) [Между дозами | удобрения (В) Взаимодейств | не факторов \АхВ Случайный Общий Сумма квадратов отклонений, S ! 40444,4-40333,3= =111,1 SB=BiB-H= 40476,25-40333,3= =142,95 SAB^Bl'HHBlA'Hh -(2fo-W=8,25 40640-40595,6 = 44,4 40640-40333,3 = 306,7 Степени свободы, df я-1=3-1=2 Ы=2-1=1 <a-l)(b-l)= 2x1=2 ЛГ-д6=30-6=24 ЛМ=30-1=29 Средний квадрат, ms \msA = £l = 55,55 1 ! msn = -2- = 142,95 * 1 >ws^=^- = 4,12 "* 2 ms =^- = 1,85 - 24 _ л», _ 55,55 J 4 " mSai "" 1,85 1 = 30,03*- #,=1 #=24 1 ^я 4,3 7,8 14,0 F «b.s 142A5 = 77,27" * /ns„ 1,85 79
Fst 3,4 ^=21 5,6 /г^=^-=_4Л.2 = d/2=24j AB »**„ 1,85 9,3 В таблице: * - P > 0,95;** - P > 0,99; *** - P > 0,999. Фиксированная модель дисперсионного комплекса позволяет произвести оценку средних квадратов и определить достоверность или недостоверность факториальных средних квадратов, а также оценить достоверность различий любых интересующих экспериментатора средних значений. Коэффициент внутриклассовой корреляции в такой модели оценить не представляется возможным, т.к. градации комплекса не случайны, а фиксированы. Обращаясь к результатам оценки, осуществленной в примере 7.2, можно сделать вывод о том, что 3 сорта риса остаются различными по урожайности при любой дозе удобрения, но дозы удобрения имеют неодинаковый эффект на урожай. Как показывают оценки средних значений, доза удобрения #2 достоверно повышает урожай по сравнению с дозой В\ на 4,4 ц/га в среднем по 3-ем сортам риса. Средний квадрат, оценивающий взаимодействие "сорт х доза" очень низкий и недостоверный, что свидетельствует об аддитивном характере действия доз удобрения на урожайность трех сортов риса. § 7.3. Иерархическая модель двухфакторного дисперсионного комплекса. Как видно из § 7.2 9 при оценке влияния 2-х организованных факторов на признак, экспериментальный материал обрабатывается с использованием двухфакторной модели дисперсного комплекса. При этом следует заметить, что число градаций 1-го порядка (А) может быть любым числом, число градаций П-го порядка (В) также может быть любым, но строго одинаковым внутри всех градаций (А). Такое правило должно строго соблюдаться, т.к. все номера градации (В) сопоставляются друг с другом по всем номерам градации (А), как показано в примере 7.2. Кроме того, если градации (А) могут быть выбраны случайно, то градации (В) всегда фиксированы. Более того, если внутри одной градации (А) по каким-либо причинам выпадает 80*
одна градация (В), то по другим градациям (Л) необходимо исключить по одной градации (#). Однако выбор градации для исключения не так просто решить. И, наконец, часто необходимо для анализа, например, генетического разнообразия в популяции иметь модель со случайными градациями 1-го и П-го порядка. В таком случае используется, так называемая, иерархическая модель дисперсного комплекса. xijk = // + Ai Щ + eijky где: Хук - признак; ц - среднее значение; At - отклонения по фактору А; By - отклонения по фактору А внутри фактора В; ецк - случайные отклонения. Пример 7.3. Оценивается генетическое разнообразие по отцам и матерям по % жира в молоке коров. Таблица 19. Двухфакторный иерархический дисперсионный комплекс. Градации (А) - отцы, градации (В) - матери, анализируемый признак - % жира в молоке дочерей. % жира [дочерей bi L№2 fe &4 5s Ul Гл \TJf ClJ 1 A1 \Bi 3,5 3,6 3,4 3,6 4 14,1 49.73 49,70 1* 3,7 3,6 3,5 3,6 4 14,4 51,86 51,84 \В3 \3JS 3,7 3,8 3,9 3,8 5 18,7 70,03 69,94 пШ | pb Г7 3,7 3,6 3,5 3 10,8 38,9 38,88 L&_ I 4,0 4,1 '4,2 3,9 3,8 5 20,0 80,1 80,0 m(A2)_ \ ТдГ U_ 1 3,8 ' 3,9 4,0 3 | 11.7 45,65 45,63 \в2 Rj [4,2 4,3 4,0 4 16,6 68,94 68,89 пШ 1 Гз5 Ub=7 #=28 XS^ =106,3 ZZ^-405-21 2fc=404,88 #=403,56 1 81
\а, \а2 Аз ПЦА) 13 8 7 2лш 47,2 30,8 28,3 hfA> 171,37 118,58 114,41 27»л=404,36 Как видно, фадации второго порядка (В) оцениваются только внутри своих градаций (Л) и не сопоставляются друг с другом по различным градациям (Л). Схема выглядит как дерево: А1 4.2 di В j Bi В3 Bj В2 Bj В2 В дереве нижний ярус градаций рассматривается только внутри градаций верхнего яруса. При такой схеме дисперсионного комплекса невозможно оценить взаимодействие факторов, и, если в эксперименте необходимо иметь информацию о взаимодействии факторов (например, необходимо знать влияние сочетаемости родителей на продуктивность потомства), то иерархическая модель не может дать такую информацию. Таблица 20. Анализ 2-х факторного иерархического дисперсионного комплекса. Оценка генетического разнообразия отцов (Л) и матерей (В) по % жира в молоке дочерей. Источник изменчивости Сумма квадратов, S Степени свободы, 4L Средний квадрат, ms Между отцами (А) 2ЙЛ-Я=404,36- -403,56=0,80 а-1= =3-1=2 mS(A) = SA 0,80 а-1 2 = 0,40 Между матеря ми (В) внутри отцов (А) 2й-2йд=404,88- -404,36=0,52 2Ь-д= =7-3=4 {в) %Ь-а 4 Случайный I2X-I*- = 405,21-404,88 = 0,33 28-7=21 S- :М3 =001б| ЛГ-£* 21 82
Гобпшй ] = 405,21-403,56 = 1,65 28-1=27 [Источник изменчивости (Между отцами \(Л) Между матерями (В) внутри отцов (А) Случайный Общий Строение среднего квадрата т&^По&н+сг^ ms^cr,-, Факториальная варианса, о2 а2 _mSA ~mSB _ А (пт\ " = 0,030 2 Шв -/?!$„, ав "о = 0,029 о\,= 0,016 | Коэффициент внутриклассовой корреляции, rw г - "' J 1 =« = 0,400 1 0,075 г - °> = « = 0,387 0,075 г - °" \ = « = 0,213 0,075 Лп = 2>-i 1 #• Z"w^ JV а-1 2 N Z<0 <Я=2 #=21 Fs, 3,5* 5,8* 9,8* = lf28-l^l = 3,98 б{ 28 J = lf28-^U,96 2^ 28 J df,=4 ^2=2lJ • Fs, 2,8 4,4" 7,0' 83
F(„ = ^ = 3,l; FiB) = "sJL=sr Таким образом, показано, что влияние отцов на генетическое разнообразие %жира дочерей составляет 40,0% (не достоверно), а влияние матерей внутри отцов, представляющее собой генетическое разнообразие в широком смысле, равно J8,7% (достоверно при Р > 0,999). Случайные отклонения составляют 21,3%. ГЛАВА 8 СТАТИСТИЧЕСКИЙ АНАЛИЗ КАЧЕСТВЕННЫХ (АЛЬТЕРНАТИВНЫХ) ПРИЗНАКОВ § 8.1. Опенка X.a.sj, при альтернативной вариации. В главе 1 была приведена классификация признаков, встречающихся у биологических объектов: качественные, дискретные количественные, непрерывные количественные признаки. В главах 1-7 оценивались параметры ?,а,^,/,г^ и дисперсионный анализ количественных признаков. В этой главе мы продемонстрируем методы, позволяющие оценить все эти параметры для качественных признаков или, другими словами, для признаков с альтернативной вариацией. Наиболее простым случаем качественной вариации является альтернативная вариация, коща анализируемая совокупность представлена двумя группами: группа, имеющая данный признак и группа, не имеющая данный признак (черный - красный; альбинос - нормальный; белые цветки - розовые цветки и т.д.). В таком случае вся совокупность, состоящая из п единип совокупности, имеет Р единиц, у которых данный признак есть (1) и Q единиц, у которых этот признак отсутствует (0), л = Р + Q. Исходя из этих рассуждений, составим вариационный ряд и оценим параметры для признака с альтернативной вариацией. Обрабатываем вариационный ряд методом условных отклонений (см. гл. 2). 84
Таблица 21. Вариационный ряд и оценка параметров при альтернативной изменчивости. [классы, xi [А^О 1 частоты, / Q р 1 P+Q=n 1 а 0 +1 fa 0 Р За = Р /а2 0 Р 1 2& = Р 1 Ufa р р п п п S = 2>2 Ы kiJP p2\X2^p{p+Q)~p2 _PQ г PQ P Q. a = - у = , n n n P Q i— если — = a a — = #, то <r = Jpq. n n Ошибка выборочного среднего . _ & _-fpq _ \1щ Vw yjn V n Пример 8.1. Оцениваются статистические параметры выборочной совокупности, состоящей из 100 норок, 25 из которых имеют мутантный генотип, а 75 - стандартный, т.е. п = 100; Р = 25; Q = 75. Для этой совокупности выборочные статистические параметры таковы: Х = р = — = 0,25; *100 q = 0,75; p + q=L 85
с = л1РЯ = °>43i Если сравниваются две выборочные совокупности на предмет достоверности или недостоверности отличий, то по аналогии с оценками, полученными при количественной вариации, критерий t равен: Pi-Pi Рх-Рг \РхЧх \РгЧг Ш "2 У A?i Л*1 4Г = л/ + Л2 - 2. Пример 8.2. Оценивается достоверность различий по частоте встречаемости рецессивного анализируемых популяциях. я/я 1000 иЖ#* (Р/) = 300 pj = 0,30 qj = 0,70 ^=0,01 аллеля white у дрозофилы в двух п2 = 1200 Р2 = 600 р2 = 0,50 q2 = 0,50 sp =0,01 t = - А -Л <№.+£& J0,3-0,5! 0,02 0,2 0,02 = 10,0" rf/= л/ + п2 - 2 = 1000 + 1200 - 2 = 2198 tst 2,0 - P = 0,95 2,6 - /> = 0,99 3,3 - P = 0,999. Таким образом, на основании проведенного статистического анализа можно с вероятностью Р > 0,999 утверждать, что во второй совокупности частота аллеля white достоверно выше частоты этого аллеля в первой совокупности на 20%. Следует заметить, что оценка статистических параметров при альтернативной изменчивости по вышеуказанным формулам дает 86
достаточно точные результаты, когда р близко к значению 0,5. В тех случаях, когда р ниже 0,25, a q выше 0,75 или наоборот, стандартная ошибка, вычисленная по этой формуле, сильно искажается, поэтому для таких случаев необходимо воспользоваться так называемым преобразованием Фишера (метод q> (фи)): <р = 2 arcsin Vp. Определенный таким образом угол <р обладает рядом свойств: 1. Ошибка (s9) выборочного угла <р не зависит от величины этого угла, а зависит только от численности совокупности. Достоверность различий оценивается по формуле: F =(p, -<p2)2- l 2 , ще п\ и п2 - численности сравниваемых совокупностей. 2. Для долей /7 < 0,25, q > 0,75 и соответственно, р > 0,75, # < 0,25 определение достоверности по соответствующим углам <р более корректно. 3. Определить величину q> по данному значению р можно по таблицам синусов углов, взяв за синус угла величину р. Можно воспользоваться готовыми таблицами угла. Угол <р в радианах - функция доли, определяемая по Фишеру: о* = —arcsin Jp = 0,0349066 • arcsin Jp. Значения углов <р можно найти в таблице VI (приложений). Пример 8.3. Оценивается достоверность различий между значениями частот (долей) р\ и р2Ъ двух выборочных совокупностях. пг = 600 п2 = 6000 Pi = 0,007 р2 = 0,0006 qi = 0,993 q2 = 0,9994 (pi = 0,1676 д>2 = 0,0490 F = {<Рх -(Р2)2' ^-^- = 0,11862 • 545,45 = 7,67; df = Л/ + п2 - 2 = 6598. ".+"2 В таблице VI (приложений) находим: Fst 3,8 - Р = 0,95 6,6 - Р = 0,99 10,8 - Р = 0,999 Следовательно, частоты pj и /72 различаются достоверно с вероятностью Р > 0,99. Если оценку достоверности при таких низких 87
значениях частот осуществлять обычным способом без <р. преобразования, а через критерий f, то получим следующие результаты: Pi - Pi = 0><К>7 ~ О*0006 = °>°°б4 - 2 39 1>&~ p2q2 10,007• 0,993 0,0006•0,9994 0,00339 ~wT~ л, \ 600 6000 т.е. частоты различаются недостоверно. Кроме того, при анализе качественной вариации возможен такой крайний случай, когда в одной из выборок не встретилось ни одного представителя с анализируемым признаком, т.е. Р = 0. В таком случае ошибка выборочной доли sp может быть оценена методом Б.Л. Ван-дер-Вардена (Математическая статистика. М.: из-во Иностр. литер., 1960). При этом методе: п+2 р \ п+3 р - частота (доля), оцененная методом Ван-дер-Вардена; sp - ошибка выборочной доли; п - численность выборочной совокупности. В таком случае, если среди 500 растений не обнаружено ни одного альбиноса, то тоща: п « 500; р = ft*1)-"» = o,20% или 0,002 _ 502 Г6,20(100 -0,20) _ „ло/ л ,™ S =1-2 1 1__/ =0,20% ШШ 0,002. р \ 503 Таким образом, несмотря на то, что в конкретной выборочной совокупности не обнаружено ни одного альбинотического растения, анализ показывает, что в других выборочных совокупностях можно ожидать появления альбиносов примерно в 1% случаев (при / = 3,3). § 8.2. Опенка корреляции при качественной вариации. Если рассматривается случай альтернативной вариации, то при выяснении вопроса о наличии связи, задача ставится следующим образом: насколько чаще встречается одновременное совпадение качественных признаков х и у, чем их несовпадение.
В таблице 22 показана организация корреляционной решетки для альтернативной вариации. Таблица 22. Корреляционная решетка при альтернативной вариации. [признак х [Признак у [Есть признак Нет признака Сумма Есть признак а с а + с Нет признака Ь d b + d Сумма а + Ъ 1 с + d n=a+b+c+d 1 Коэффициент корреляции рассчитывается по формуле, напоминающей формулу для оценки критерия £ в 4-х польной таблице, только отсутствуют квадраты чисел. (ad-be) '"-^a + blc + dla + cW^d)' или с поправкой Йетса: {ad-bc)-\ " ^p+bJIp + dJIp+cHft+d) Пример 8.4. Оценивается наличие корреляционной связи между наличием сережек на шее и ушах у 320 гиссарских овец (пример из Рокицкого, 1973). 89
Таблица 23. Оценка связи между наличием сережек на шее и ушах овец. На шее У ^^^ нет есть Сумма J нет 41 224 265 На ушах а с есть ^_ 14 CL. 41 55 Сумма 55 265 п = 320 (ad-be) (1681-3136) _ -1455 я ^{а + Ь\с + с1\а + ф^ л/265"-55-55-265 14575 или с поправкой Йетса: -0,0998 * -0,1, («/-*)-§ -1155 г' = 1= = ----- =>О,0888 *Ч),09 ; * v'265-55-265-55 14575 , VI-г2 1-0,092 ЛЛ^ s' =—p-~ = v' —=0,06; vw V 320 , = ^ = ^ = 1,5. s'r 0,06 Очевидно, что связь между наличием сережек на ушах и шее у гиссарских овец практически отсутствует, т.е. нулевая гипотеза, гласящая, что между наличием сережек на ушах и шее гиссарских овец корреляция отсутствует, сохраняется. § 8.3. Дисперсионный анализ при альтернативной вариации. В ряде случаев приходится оценивать факториальную вариацию по признакам с альтернативной изменчивостью. Например, в эксперименте анализируются цитологические препараты на предмет 90
обнаружения хромосомных аномалий. Просматривается серия препаратов и на каждом из них исследуется несколько ядер. На разных препаратах из числа просмотренных ядер встречается различное число аномальных ядер и возникает вопрос: какова изменчивость между отдельными препаратами (межгрупповая изменчивость) и между ядрами внутри препарата (случайная изменчивость)? Пример 8.5. Оценивается факториальное разнообразие по 10 препаратам, взятых случайно из экспериментальных данных. Таблица 24. Схема организации однофакторного дисперсионного комплекса при альтернативной вариации. Число просмотренных ядер, щ Наличие аномальных ядер, \т п \pi 1 Число просмотренных Ьщер, щ Наличие аномальных ядер, \I!L \ьЖ п La_ I Препараты №1 70 14 2,8 0,2 |№2 20 10 5,0 0,5 |№3 10 6 3,6 0,6 In» 4 10 1 0,1 0,1 |№5 100 30 9,0 0,3 №6 90 45 22,5 0,5 1 Препараты | №7 10 5 2,5 0,5 1 №8 50 10 1 2,0 0,2 1 №9 25 4 0,64 0,16 1 №10 15 5 1,67 0,33 1 г= 10 1 N = 400 Zm = 130 Di = 49,81 Робш = 0,32 J 91
Я = М=42,25 N Анализ однофакторного неравномерного дисперсионного комплекса по качественному признаку приводится в таблице 25. Таблица 25. Анализ однофакторного дисперсионного комплекса для признака с альтернативной вариацией (случайная модель). Источник изменчи вости Между препаратами Случайный Общий Сумма квадратов, S 49,81-42,25= =7,56 =130-49,81= =80,19 =130-42,25= =87,75 Г* г-1=10-1=9 #-/^400-10= =390 ЛЧ=400-1= =399 ms ms„=0,84 АП5сг=0,21 F = ^=- = = 4,0" V I <r2=W5<,-Wgct "о = 0,017 °l * ™м = = 0,21 Коэффициент внутриклассовой корреляции, rw ■у = 0,07 2 2 1 = 0,93 /,=^.и_Ж1 = 1.Г400-^_0] = 1.(400-67,б)=36)9 г-1 [ JV J 9 ^ 400 J 9 V ' ' ] Fst 1,9 4Г/ - 9 I 2,5 df2 = 390 Г з,3 Таким образом, с вероятностью Р > 0,999 можно утверждать, что 7% изменчивости следует отнести за счет различий между препаратами и 93% изменчивости является случайной или внутри препаратов, или между ядрами. Внутри такого дисперсионного комплекса можно также как и в случае с анализом количественных признаков оценить 92
достоверность различий между частотами отдельных градаций по формуле: msa я, +пг Таким средним, например, может быть рз = 0,6 в градации № 3 и Р4 = 0,1 в градации № 4. г=(Рг-РгУ п,п2 JO,6-OXf 1010 = 0,25 5^59 msa п,+пг 0,21 10 + 10 0,21 df2 = 390 Fs, 3,9 6,7 11,0 Р = 0,95 I. Р = 0,99 Р = 0,999 По такому же принципу могут быть сравнены любые пары средних значений. 93
ГЛАВА 9 НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ В биологических исследованиях, а чаше всего в медицинских и физиологических экспериментах, возникают ситуации, когда наиболее широко используемый непараметрический метод сравнения распределений, метод х2, не может быть применен к обработке данных. Такими причинами могут быть малочисленность данных, сопряженность данных двух сравниваемых распределении и др. Ниже рассмотрим другие непараметрические критерии различия двух эмпирических распределений, такие как метод А/(лямбда) Колмогорова-Смирнова, метод Вилкоксона для двух независимых распределений и метод Вилкоксона для двух сопряженных по парам распределений. § 9.1. Критерий Колмогорова-Смирнова Критерий Колмогорова-Смирнова используется чаще всего при малых объемах совокупностей и основан на сравнении рядов накопленных частот (численностей) обеих сравниваемых совокупностей. Пусть имеется распределения двух выборочных совокупностей, разного объема Я/ и п2. Организовав 2 ряда накопленных частот, поделенных в каждой строке ряда на объем совокупности, находим по строкам максимальную разницу между двумя рядами, D. Следующий шаг будет состоять в том, чтобы эту максимальную разницу сравнить с критическими значениями, Dx, величина которых зависит от принятого уровня значимости (р = 0.05 или/? = 0.01). D'--\H 1 1 _+— Если выражение л/~1п- = Лх,то Вх =Д • LL + J-= i. Г1*"- . V2 х Уя1 я2 V пГп2 Тогда Лх = - D, Возводя в квадрат выражение, получим 94
При этом критические значения, Я*, есть Л305 =lln— =-In 40 = 1.84 И Aj0I =-1п — = ^1п 200 = 2.65 ^°5 2 0.05 2 01 2 0.01 2 Фактическое значение, Л^, оценивается по формуле П\+П2 и затем сравнивается с критическими значениями Л;. Если Яф)Яо1)5, то нулевая гипотеза (Но) не подтверждается, если Ф^оо!» т0 нулевая гипотеза отвергается, если Aj^^w, то нулевая гипотеза сохраняется. Пример 9.1. Оценивается характер распределения 2-х эмпирических совокупностей. Таблица 26. Сравнение 2-х совокупностей методом Колмогорова- Смирнова. |Приз ! -нак, *' 2 3 4 5 1 6 Г 7 | 8 L 9 1 - 1 Частоты л 5 20 55 92 61 48 15 4 =300 1 h 1 10 35 95 82 43 20 12 3 =300 1 Ряды | накопленных частот Я 1 5 25 80 172 233 281 296 300 \&: 1 10 45 140 222 265 285 297 300 Sfi'/ni 0,017 0,083 0,267 0,573 0,777 , 0,937 0,987 1,000 Ц11П2 0,033 0,150 0,467 0,740 0,883 0,950 j 0,990 1,000 __J 0,016 0,067 0,200 0,167 0,106 0,013 0,003 1 0 j 95
Максимальное различие между двумя рядами, D == 0,200. Тогда Л2 =/)2.А^2. = 02(Х)2, 300-300 =004,150 = 60 * ^/,1+/|2 300 + 300 Критические значения Л2 равны: Л$05 =1,84, Л£01 =2,65. Поскольку Я^>/^01, то нулевая гипотеза отвергается, т.е. между распределениями двух совокупностей обнаружены существенные различия. Следует отметить, что при равном объеме сравниваемых выборочных совокупностей, т.е. если щ = ъ, расчеты Л2ф можно резко упростить, т.к. формула Л2ф = D2 "* '"2 , если л/ = л^имет вид: £ф = D2 -. 71, +Л2 2 Кроме того, ряды накопленных частот не следует делить на nj и w2, т.е. в таблице 26 не следует организовывать столбцы № 6 и № 7, а расчеты вести непосредственно с накопленными частотами. Так. в таблице 26 максимальное различие в двух рядах обнаруживается между значениями 80 б первом ряду и 140 во втором ряду и равно, А = 140 -80 = 60. D = — и ,2 „- п А2 п А2 тогда Л2 =/)*- = —- = — . * 2 /г 2 2л 602 В примере 9.1 Я^ = = 6,0, что соответствует расчетам по данным таблицы 26. § 9.2. Критерий Вилкоксона-Манна- Уитни Среди большого числа непараметрических критериев, которые экспериментаторы часто вынуждены применять из-за того, что эти критерии не требуют нормальности распределения экспериментальных данных, довольно часто используется непараметрический критерий Ф.Вилкоксона, разработанный в 1945 году. Однако в 1947 году, независимо от Вилкоксона, Х.Б.Манн и Д.Р.Уитни разработали статистику, которая была идентична ранговому критерию Вилкоксона. В основу критерия Вилкоксона положена замена количественной меры признака рангами или порядковыми номерами. Пусть имеются две независимые совокупности *1, Х2, Х3, ... Xf 1=ПХ И >7, Уъ Уз, -. Уг i = пу Расположим оба ряда совместно в порядке возрастания значении признака, например, так: 96
Xl X2 У1 Уз ХЗ У2.-.. После выстраивания значений признака двух рядов в порядке увеличения можно каждому значению присвоить порядковый номер фанг) и тогда будем иметь: '•х.+'-х, +''*,+••• + '•« =^х Следует заметить, что ранги - это числа натурального ряда и поэтому их суммы, Тх+Ту=\ + 2 + 3+...+п = '^п+ '9 где п = пх + пу. Для каждой пары значений пх и пу можно указать критические значения Г, отвечающие уровню значимости р = 0.05 или р = 0.01. Критические значения Toos и То.ои с которыми сравниваются экспериментальные значения ТХу приведены в таблице VII (приложения). Смысл критерия Вилкоксона состоит в том, что в условиях нулевой гипотезы суммы Тх и Ту не должны слишком отличаться от их усредненного значения, т.е. jl—L = п\п * ' t с критическими значениями T0.os и Том сравнивается 2 4 меньшая сумма, либо это будет в конкретном случае сумма рангов Т» либо Ту. Если ТХ(ТУ) < Том - нулевая гипотеза не подтверждается; если Тх(Ту) < Том - нулевая гипотеза отвергается и если ТХ(ТУ) > Т0.о5 - нулевая гипотеза сохраняется. Пример 9.2. Сравниваются два распределения урожая пшеницы в ц/га на 8-ми контрольных (х) и на 8-ми опытных (у) полях в одном году. х§ 16 26 20 39 32 35 41 19 Уг 46 21 25 34 42 28 31 43 Ранжируем 2 ряда и выставляем ранги (г) [(хьУд к? [Гу_ и*<&Ц гх ■1^ !16 1 32 9 19 2 34 10 20 3 35 I гтт ~ 21 4 39 12 25 5 41 13 26 6 42 14 28 7 43 I 15 пп s 46 16 Г*=2А=57 Tv-Zrv=79 | п=пх + пу=\6\ Тх + Ту = 57 + 79 = 136; ^±il = l^iZ = i36. В таблице VIII (приложения) находим для пх = 8 и пу = 8 критические значения 7}ш = 49 и 7Ь.о/ = 43. Поскольку минимальная сумма рангов 57 = Тх > Том* то нулевая гипотеза не отвергается и следовательно можно 97
сделать вывод о том, что распределения контрольных и опытных полей практически различимы несущественно. Проверим полученный выше результат через t-критерий, условно принимая, что эти 2 ряда распределены согласно закономерностям нормального распределения. Гряд II ряд их = 8 2й = 228 ]£х,2=7144 h=^ iJ =6498 п Sx=]Tx?-h = 646 <т2= — = 92,29 z п-\ 0^ = 9,61 ц/га 5-=-^ = 3,4 X = 28,5 ц/га , 33,75-28,5 _ 5,25 __-^1 Пу = % 23* = 270 ЕЛ2 =9696 (УуУ h = ^'iJ =9112,5 ^=2>2-Л=583>5 ^=-^- = 83,36 <Х = 9,13 ц/га 5- = Ц= = 3,23 У = 33,75 ц/га = 1,12 V3,42+3,232 Vl^ + l0»43 4>69 ^Г=8 + 8 - 2 = 14. Из таблицы II (приложения) находим: tx 2,1 - Р = 0,95 или /7 = 0,05 3.0 - Р = 0,997 /7 = 0,003 4.1 - /> = 0,999 /7 = 0,001 Так как fy <'** при Р = 0,95, можно считать существующие различия между опытными и контрольными полями случайными. В основу построения статистики Манна-Уитни, которая идентична критерию Вилкоксона, и поэтому часто используемый критерий называют критерием Вилкоксона-Манна-Уитни, положен матричный принцип сравнения 2-х распределений, gg
Приведем в виде матрицы данные примера 9.2. [х/У* П6 [26 [20 [39 [32 [35 41 19 46 - - - - - - - - 21 - + • + + + + - 25 - + - + + + + - 1 34 - - - + - + + - 42 - - - - - - - - 28 - - - + + + + - 31 1 - - + + + + - ! 43 - - - - | | | | В клетках знаки минус (-) и плюс (+) означают отрицательную или положительную разницу между jc, и yi9 т.е. d = xt - yit Затем суммируем число знаков плюс, здесь оно равно (U*) = 21 и число знаков плюс, здесь оно равно (U-*) =43. Далее экспериментальная минимальная сумма знаков + или - (какая конкретно окажется) сравнивается с критическими значениями, представленными в таблице VIII (приложения). Таблица критических значений построена исходя из того, что матрица сравнения для выборок различного объема может принимать различные варианты, начиная от матрицы с одними плюсами до матрицы с одними минусами. Общее число возможных типов сравнений есть (и/ + n^l/niln^ Вероятность любой их возможных конфигураций матриц есть ni!n2!/(ni+nj£ т.е. можно получить распределение вероятностей, которое зависит только от щ и п2. Нулевая гипотеза (Но) сохраняется (принимается), если U+(U-) > Uo,os, гипотеза Но не подтверждается, если U+(U-) < Uo,os и отвергается, если U+(U-) < Uo,oi- В таблице УШ (приложения) находим Щоз (и/=8; лг=8) = 15; U0,oi ("7=8; nf-%) = 9. Поскольку (Щ = 21 > U0,os = 15, то нулевая гипотеза (Н0) принимается. § 9.3. Критерий Вилкоксона для сопряженных распределений. В экспериментальных исследованиях возникает необходимость для каждого варианта опыта иметь и вариант контроля. Часто опыт и контроль осуществляется на одних и тех же особях. Например, измеряется кровяное давление у нескольких человек в покое, а затем испытуемым предлагается определенная одинаковая физическая нагрузка, после чего вновь измеряется кровяное давление. Поскольку два показателя кровяного давления измерены у одного и того же человека, то такие варианты следует считать попарно сопряженными и в таком случае для выявления 99
сходства или различий характера распределения 2-х совокупностей используется критерий Вилкоксона для сопряженных пар. Пример 9.3. Изучалось влияние некоего агротехнического приема (опыт, х) на урожайность пшеницы в течение 9-ти лет. Опыт сопровождался контролем, (у) в эти же годы. Необходимо выяснить, имеется ли значимое влияние примененной агротехники на урожай. Так как климатические и другие условия в различные годы различны, то опытные данные необходимо соотносить с контрольными данными по каждому году отдельно. Таким образом образуется два распределения, сопряженных попарно. Таблица 27. Сравнение 2-х распределений методом Вилкоксона для сопряженных пар (признак-урожайность пшеницы (ц/га) Пара 1 \2 13 4 5 6 7 8 9 n±J Годы 1992 1993 1994 1995 1996 1997 1998 1999 2000 __.,... J Опыт, 20,2 22,9 20,2 19,5 30,5 35,6 31,9 27,7 34,4 1 Контроль,;', ' 20,2 19,4 20,7 16,9 29,3 35,8 28,5 28,6 35,4 1 1 Разность, ХгУ1 0 3,5 -0,5 2,6 1,2 -0,2 3,4 -0,9 -1,0 1 Ранги разности | (+И 1 6 !(+) 3 (+)4 5 (+)2 7 8 77^-10 | Ранги с отрицательным знаком, Т(г.) 6 5 7 8 7^ = 26 | Из таблицы 27 видно, что сумма рангов, имеющих положительный знак, равна Т(г+) = 1+3+4+2=10. Полученное значение Т(г+) необходимо сравнить с критическими значениями Тх из таблицы IX (приложения) для соответствующего числа взятых в анализ пар. Здесь число пар, я=8 (т.к. в первой паре разница равна 0, то эта пара исключается). Критическое значение T0,os для 8-ми пар равно 5; T0,oi = 1. Так как фактическая минимальная сумма положительных рангов, Т(н.} = 10, превышает критическое значение, 7Ь^з=5, то нулевая гипотеза не отвергается, следовательно примененная агротехника не привела к значительному повышению урожайности. Воспользуемся /-критерием для проверки полученных через Т- критерий расчетов. Рассмотрим пример, полагая, что данные попарно сопряжены, тогда 100
Таблица 28. Оценка достоверности различий 2-х распределений^ попарно связанными вариантами^ помощью Меритерия. [Годы [1992 [1993 [1994 [1995 1996 1997 1998 1999 2000 __________ 1 Опыт,*, 20,2 ! 22,9 20,2 19,5 30,5 35,6 31,9 27,7 34,4 2*,=242,9 | Контроль,^, 20,2 19,4 20,7 16,9 29,3 35,8 28,5 28,6 35,4 _>,=234,8 | х= 26,99 I у = 26,09 | Разность 0 3,5 -0,5 2,6 1,2 -0,2 3,4 -0,9 -1.0 2^=8,1 d = 0,9 1 ^ 0 12,25 0,25 6,76 1,44 | 0,04 1 11,56 0,81 1,0 2^=34,11 1 S = У d2 - **-L- = 34>i i ______ = 34jl i _ 7j29 = 26,82. I S /26,82 .., ,#_1___U,48. * 5d 0,61 Для df=n — 1=9—1=8 Из таблицы П (приложения) имеем: tst 2>3 - Р = 0,95 или /? = 0,05 3,4 . />-= 0,997 /? = 0,003 5,0 - Р = 0,999 /7-0,001 Поскольку fy < (я при р = 0,05 нулевая гипотеза принимается, т.е. использованное агротехническое мероприятие не оказало существенного влияния на урожай пшеницы. 101
В заключении необходимо высказать следующее замечание. Использование того или иного метода математической статистики определяется, во-первых, i-ем, что каждый из методов имеет определенные границы применимости. Использование же методов вне границ их возможностей приводит к ошибочным выводам. Поэтому важным моментом при обработке экспериментального материала является выбор адекватной математической модели, а для этого экспериментатору необходимо ясно представлять, с одной стороны, цели и задачи исследования, а, с другой стороны, смысл применяемых методов математической обработки. В настоящем учебном пособии изложены как бы базовые методы статистического анализа биологического экспериментального материала. Конечно приведенные методы анализа не исчерпывают всего математического арсенала, который может быть использован при статистическом анализе данных. Так, в биологии часто используются частные коэффициенты корреляции и регрессии, ранговые коэффициенты корреляции и другие. В непараметрической статистике, кроме метода х2, метода Колмогорова-Смирнова и метода Вилкоксона также существуют и другие методы. Однако овладение основными, наиболее используемыми методами статистической обработки экспериментального материала, является обязательным условием для освоения других менее общих методов. Ниже приводится список книг по математической и биологической статистике, в которых более полно представлены методы статистической обработки экспериментального материала. 102
Рекомендуемая литература 1. Рокицкий П.Ф. Биологическая статистика. Минск: Изд-во "Вышейшая школа". 1973. 319 с. 2. Плохинский Н.А. Биометрия. Новосибирск: Изд-во Наука. СО АН СССР. 1961.364 с. 3. Снедекор Дж.У. Статистические методы в приложении к исследованиям в сельском хозяйстве и биологии. М: Изд-во Сельхозиздат. 1961. 503 с. 4. Урбах В.Ю. Биометрические методы. М: Наука. 1964. 415 с. 5. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия. Ленинград: Изд-во ЛГУ. 1982. 463 с. 6. Ван дер Варден Б Л. Математическая статистика. М.: ИЛ. 1960. 434 с. 7. Шеффе Г. Дисперсионный анализ. М.: Изд-во Физико- математической литературы. 1963. 625 с. 103
Содержание Глава 1. Совокупности. §1.1. Биологическая статистика: роль и значение 3 § 1.2. Выборочные совокупности 5 § 1.3. Группировка данных выборочной совокупности по признакам с дискретной изменчивостью 6 § 1.4. Группировка данных выборочной совокупности по признакам с непрерывной изменчивостью 10 § 1.5. Графическое изображение вариационного ряда 11 Глава 2. Оценка статистических показателей выборочных совокупностей 14 § 2.1. Мода и медиана 14 § 2.2. Средняя арифметическая величина и ее свойства 15 § 2.3. Изменчивость признака, ее оценка 16 § 2.4. Дисперсия, варианса, среднее квадратическое отклонение 17 § 2.5. Оценка параметров выборочной совокупности для данных, сгруппированных в вариационный ряд 19 § 2.6. Объединение параметров отдельных подсовокупностей 27 Глава 3. Закономерности случайной изменчивости в совокупностях .. 28 §3.1. Вероятность 28 Глава 4. Достоверность статистических показателей 35 § 4.1. Ошибка выборочной совокупности. Доверительные интервалы 35 § 4.2. Выборочные ошибки для а 39 § 4.3. Сравнение двух выборочных совокупностей 40 § 4.4. Оценка достоверности различий между средними значениями двух выборочных совокупностей 40 Глава 5. Корреляционные связи между признаками 44 §5.1. Коэффициент корреляции 44 § 5.2. Ошибка выборочного коэффициента корреляции 51 § 5.3. Ранговый коэффициент корреляции 53 § 5.4. Регрессия 56 Глава 6. Сравнение степени соответствия фактических распределений теоретическим 58 § 6.1. Анализ характера расщепления в гибридологических опытах 59 § 6.2. Сравнение фактических вариационных рядов с теоретическими, вычисленными в соответствии с закономерностями нормального распределения 61 104
§ 6.3. Оценка соответствия распределения двух эмпирических совокупностей 64 § 6.4. Анализ распределений, сгруппированных в 4-х -польные таблицы 66 Глава 7. Дисперсионный анализ 70 § 7.1. Общие принципы дисперсионного анализа 71 § 7.2. Двухфакторный дисперсионный анализ 77 § 7.3. Иерархическая модель двухфакторного комплекса 80 Глава 8. Статистический анализ качественных (альтернативных) признаков 84 § 8.1. Оценка X, о, s* при альтернативной вариации 84 § 8.2. Оценка корреляции при качественной вариации 88 § 8.3. Дисперсионный анализ при альтернативной вариации ... 90 Глава 9. Непараметрические критерии различия 94 § 9.1. Критерий Колмогорова-Смирнова 94 § 9.2. Критерий Вилкоксона-Манна-Уитни 96 § 9.3. Критерий Вилкоксона для сопряженных пар 99 Рекомендуемая литература 103 Содержание 104 Приложения 106 105
ПРИЛОЖЕНИЯ 106
Первая функция нормированного отклонения Таблица! Alt ' = W< (ординаты нормальной кривой) _t 0.0 0,1 0,2 о.з 0.4 0.5 0.6 0.7 0.8 0,9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 .1,8 1.9 2,0 2,1 2.2 2,3 2.4; 2.5 i 2.6 2,7 2.8 2.9 30 3.1 3,2 3,3 3,4 3.5 3.6 3.7 3.8 3.9 4,0| 0 39894 39 695 39 104 38 139 1 36S27 35 207 33 322 31 225 2* 969 26 609 24 197 21 785 19419 17 137. 14 973 12 952 1 39892 39 654 39 024 3S023 36 678 35 029 33121 31 006 28 737 26 369 23955 21 546 19186 16915 14 764 12 758 11 092! 10915 ! 09405 07895 06 562 05 399 04 39S 03 547 02 233 02 239 01 753 j 01358 01 042 СО 792 00 595 00443 00327 00238 00172 00 123 00087 00061 00 042 00 029 00 020 00013 I 09246 07 754 1 06438 05292 04 307 03470 02 76Ь 02 1861 01709 01323 01014 00 7701 00578 00430 00317 00231 00167 00119 00084 00059 00 041 00028 00 019 00009 2 39 886 39 60S 33 940 37 903 36 526 34$4У 32 918 30 785 2S504 26 129 23 713 21 307 3 39 876 39 559 3S 853 37 760 36 371 34 667 32 713 30563 2d 269 25 888 23 471 21 069 18 954» 15 724 16 694! 16 474 14 556" 14 350 12566 12 376 10 741- 10 567 09 089 ! 07614 06 316 05 1?6 04 217 03 394 02 7о5 02 134 i 01 667 01289 00 987 0074S 00562 00 417 СО 307 00224 00 161 00115 O00S1 00057 00 039 09027 0001S 00 006 • 1 j 08 933 1 07 477 06195 05 082 04 12S 03 319 02 643 02 083 j 01 6251 01256 00961 00-7271 00545 00 405 00298 00216 00156 00111 00079 00055 00 038 00 026 00 018 00004 4 39 362 39505 38762 37 654 36 213 34 4S2 32506 30339 .28 034 25 647 23230 20631 18494 16 256 14 146 12168 10396 08780 1 07341 06 077 04 980 04 041 5 39 844 39 448 3$ 667 37 524 36 053 34 294 32 297 30114 27 798 25 406 22 983 20 594 18 265 16 038 13 943 12 001 1 10 226 | 08 628 1 07 206 05959 04 879 03 955 03246 03 174 02532 02 522 02 033 j 01535 01223 00935 00707 00530 00393 00288 00210 00 151 00107 00076 00053 00037 00025 00017 00002 01 984 01 545 01 191 00909 00 687 1 00514 00 381 00279 00203 00146 00104 00 073 00051 00 035 00 024 . 00 016 00002 6 39 822 39 387 Г 33 568 37 391 35 889 34 105 32 086 29 887 27 562 25 164 22 747 20 357 IS 037 15S22 13 742 11816 10 059 08 478 07 074 05 844 04 750 03 871 03 103 02 463 0I936| 015061 01 160 00885 00 668 00 499 00 370 00271 00 196 00141 00 100 00 071 00 049 00 034 00 023 00 016 00 001 7 39 797 39 322 38 466 37 255 35 723 33 912 31 874 29 659 27 324 24 923 22506 20121 17810 15 603 13 542 11632 1 09 893 08 329 06 943 05 730 04 682 8 39 767 39 253 38 361 37 115 35 553 33 718 31 659 29430 27 0S6 24 681 22 265 19 886 17 565 15 395 13 344 1 11450 9 39 733 39 181 38 251 36 973 35 381 33 521 31 443 29 200 26 848 2-: 439 22 025 19 652 17 360 15183 13 147 11270 I 097231 09 566 1 OS 183 06 814 05618 04 556 03 788 03 706 03 034 02 955 1 OS 038 06 687 1 05508 04 491 03 626 02S98 02 406 02 3491 02 294 01 8S8 01 463 01130 00S61 006491 004851 00 358 00262 00190 00136 00097 00 068 00047 00 033 00 022 00 015 00 001 01 642 01797 01 431 01 394 01 100 00S37 00 631 00470 00 348 00254 00 IS4 00 132 00 094 00 066 00 046 00 031 00021 00014 00 000 01071 00814 00 613 00457 00 337 00246 00178 00127 00 090 00 063 00 044 00030 00021 00014 00 000 107
Стандартные значении критерия Стьюлента^} Таблица 7Г лК 1 2 3 4 5 6 7 8 9 10 11 12 о, 95 12,7 4.3 3.2 2,8 2.6 2.4 2.4 2,3 2.3 2.2 2,2 2,2 о, 99 63,7 9.9 5.8 4.6 4.0 3.7 3.5 3,4 ! 3,3 . 3,2 3.1 3.1 а, 999 636,6 31,6 12,9 S.6 6.9 .6,0 5.4 ! 5,0 \ 4.8 4.6 4,4 4.3 Л- 13 14—15 16-17 18—20 21—24 25—28 29—30 31—34 35—42 1 43—62 63—175 176 и больше 1 t. о, 95 1 2.2 2,1 ; 2.1 2.1 2.1 2,1 2,0 2.0 2,0 2,0 2.0 2,0 о. 93 ! 3.0 3.0 2.9 2.9 2,8 2.8 2.8 2.7 2.7 2.7 2.6 2.6 о, 995 4.2 4.1 4.0 3.9 3.8 | 3.7 3.7 3.7 3,6 3.5 3.4 3.3
Таблица Ml Количество пар значений К, достаточное для достоверности выборочного коэффициента корреляции — г 0,01 '02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 | 19 ! 20 1 • 21 22 23 24 25 26 27 28 29 30 I ю 1 ° 1 °> К 1 °5 38407 9603 4269 2403 1539 1069 ! 787 604 477 383 317 267 228 196 171 151 133 119 107 97 S7i 80 73 6S 62 57 53 49 46 43 • iv ( <*» 1 °* ! ® 1 w 1 °^ 66 503 16 628 7392 4159 2263 1850 1360 1042 624 661 548 462 392 337 295 259 22S 204 163 165 149, 136 124 114 105 97 90 83 7S 73 J 1 я 1 °1 1 °* ii 1 ** 108 903 27 228 12 103 6S09 4359 3028 2225 1704 1347 1031 8S6 754 640 550 4S1 422 373 332 297 270 242 211 202 185 170 157 145 135 125 117 1 г *31 Г 32 33 34 35 36 37 38 39 1 40 41 42 43 44 45 46 - 47 48 | 49 1 50 1 51 52 53 54 55 56 57 58 59 60 1 "> 1 °l о II 1 * 40 38 36 34 32 30 28 27 26 1 24 23 22 21 20 19 19 18 17 | 16 1 16 15 15 14 14 13 13 12 12 11 11 N 1 с» 1 °>- 1 °* И 1 * 68 63 60 55 53 50 47 44 ! 42 1 40 38 36 34 33 31 30 29 27 26 , 25 : 24 23 22 21 20 20 19 18 18 17 1 е> 1 о 1 °1 I о И 1 ^ 109 102 96 90 85 80 75 71 67 64 60 57 55' 52 49 47 45 43 41 39 37 36 34 33 32 30 29 28 27 26 1 г 1 4 61 Г 62 63 64 65 66 67 68 69 1 70 71 72 73 74 75 76 77 78 1 79 80 81 82 S3 84 85 86 87 88 89 90 1 v> 1 °1 1 сэ II 1 ** и 10 10 10 ^ 9 9 9 8 8 8 8 7 7 7 7 7 7 6 6 6 1 6 6 6 5 5 5 5 5 5 N 1 о> 1 «Л 1 €> II ' 1 ** 16 16 15 15 14 14 13 13 12 12 ! 11 11 11 10 10 10 9 9 9 9 8 8. 8 7 7 7 7 7 6 6 1 1 <я I с> 1 °1 1 <э 1 " 1 ** 1 25 24 23 22 21 20 20 19 18 IS ! 17 16 i6 15 15 14 14 13 13 12 12 11 11 10 10 10 9 9 8 8
Стандартные значения критерия ^ Т a 6J иц а IV 0,05 X'. Q,Oi х'> 0,001 d& $05. 0,01 0,001 if до5 o,oi I 3,8 6,0 7.8 9.5 П.1 12.6 14.1 15.5 16,9 18,3 19,7 21.0 22,4 23,7 25,0 26.3 27.6 6,6 9.2 11,3 13,3 15,1 16,8 18,5 20.1 21.7 23.2 24,7 26,2 27,7 29,1 30.6 32,0 33,4 10,8 13,8 16.3 IS.5 20.5 22.5 24,3 26,1 27.9 29.6 31,3 32,9 34,5 36,1 37,7 39.3 40,8 18 19 20 21 22 23 24 25 26' 27 28 29 30 32 34 36. 38- ' 28,9 30.1 31.4 32.7 33,9 35.2 36.4 37,7 3S.9 40,1 41,3 42.6 43,S 46,2 4S.6 51.0 53,4 34, S 36,2 37,6 3S.9 40.3 41.6 43,0 44,3 45,6 47,0 48,3 49.6 50.9 53.5 56,0 58.6 61,1 42,3 43.S 45.3 46.S 4S.3 49.7 51.2 52,6 54.1 55,5 56.9 5S.3 59,7 02,5 65,2 67,9 70,7 40 ! 42 44 46 48 50 55 1 60 1 65 70 75 | SO 85 1 90 95 100 1 55,8 63,7 53.1 60,5, 62.8 65.2 67.5' 73,3! 79 S4 90 96 101 107.5! 113.1i 118.7, 124,3 135,S 66 6S, 71 73, 76, S2. S8, 94, 100, 106, 112, 118, 124, 130,
Таблица V Критерий F Р.Фишер (R.Fisher) 111
СТАНДАРТНЫЕ ЗНАЧЕНИЯ ПРЕОБРАЗОВАННОГО КРИТЕРИЯ ФИШЕРА F = c]h\ *Щ i 3 4 5 6 7 8 9 ю 11 j 12 13 1 14 1 1 2 167,5|148. 34. 74. 21,5 7.7 47.С 16,3 6.0 35.5 13,4 6.0 1 30. 1 9,1 61,: Ц ISA 6,< 36,С 13.2 5,fc 27.0 10.У 5,1 1 29.2J 21,7 12,3 Ь.6 25,4 п.з 5,3 22,9 10,6 5,1 21,0| ю.о У,6 4.7 18,5 8.7 4.6 16,4 8.0 4.3 14,9 7.9i 5,0 4,11 19, l\ 9,7 4.8 IS.6 9,3 4,8 17.8 9,1 4,7 17.1 8,9 4.6 13,8 7,2 4.0 12.3 6.9 3.9 12.3 6,7 3,8 11,5 6.5 3,7 3 5 141, 4 1 137, В 29,5| 28, 3 .9, г\ 56", 3 У. 1 53,< Ц 16,7| 16,( )\ 6,( > 33,2 \\ 12.1 5.4 23,7 9.8 4.Ь 18,8 «,Ь 4,4 15,8 7,6 4,1 13,9 7,0 3,6 12,3 6,6 3.7 11.6 6.2 3,6 10,8 6.0 3.5 10,2 5,7 3,4 9,7 5.6 3.3 > 6.' 1 31,1 П.4 6.i 21 ,S 9.^ 4,Ь I 17.2 | 7.У 4.1 14.4 7.0 3.8 12,6 6.4 3,6 П.З 6.0 3,5! 10,4 5,7 3.4 9,6 5.4 3.3 9.1 5.2 3,2 8.61 5,0 3,1 !• 6 7 8 9 10 1! 12 1 134,6 132,9 131,8 130,б|'130,0 129.5 128.91 128 7 28.2 27,9 27.7 27,7 27,4 27,5 27. 1 9,0 8, J 51,7 50,! 9 8,8 8.^ )| 49,8 49.1 3 8,8 8,8 8,1 ) 48,6 48,2 47.? I 27, 9 8, j| 47.. ) 15.5 15,21 15,0| 14,8| 14,7| 14.7\ 14,5| 14 < 1 6,3 6,2 6. 1- - 1 1 1 29,* \\ и л ' 5,1 20,5 8.8 4.4 16.2 ЛЬ 4.U ' 13.5 6,6 3,7 11.7 6,1 3.5 10,5 5,6, 3.3 9,6 5.3 3,2 8.9 5,1 3.1 8.4 4.9 3.0 7.9 4.7 3.0 Ц 28,E ) Ю,V 5,t 20,0 8,5 4.3 i 15.5 Л2 З.У 12.9 6.4 3,6 11J 5,8 3.4 9.91 5,4 3.2 9,1 5,1 3.1 8,4 4,8 3.0 7.9 4,6 2,9 7.4 4.5 2.9 6.0 6.0 6.0 5Л I 28.2| 27.б| 27.3J 27,o| 26.7 1 10.1 »j 4.S 1 19.5 S,3 > io,: > 4Л 1 19.C 8.J Ч Ю.5 4 4,* 18,£ 3,0 4,2/ 4.11 4.1 15,1 i 7,0 3,8 12.5 6,2 3,5 . 10,8 5,6 3,3 9.6 5.2! 3,1 8,8] 4.9 3.0 8,1 4.7 2.9 7,6 4.4 2,8 7,1 4.3 2.8 1 1 14.6 6/8 3,7 12,0 6.0 3.4 10.4 5.5 3.2 9.2J 5.l! 3,1 1 14,4 6,7 ! 3,7 1Г.8 5,9 3.4 10,2 5,4 3.2 9.0! 5,0 3,0 8,4* 8,2[ 4.7 3,0 7j\ 4.5 2,9 7.2 4,3 2,8 "6.8* .4.1 2,7 .4-6 2,9 7,5 4.4 2t8\ 7.0 4.2 2.7 6.6 4.0 2.7 1 Ц Ю.1 И 4.7 10,с r 4,7 J I8.5J 18.3 7.9 4,1 14,2 6,6 3,6 11,6 •5.8 3,3 10,0 7.8 4,0 13.9 6.5 3.6 ! 11,4 5,7 3.1 9.8 5,3! 5.2 3.1 "8.9 4.9! 3,0 8,0 4.5 2.9 7»4 4.3 2.8 6,9 4.1 2,7 6,5 3.9 2.6 1 3,1| 8.7 4.81 2,9 7,в| 4,5 2,8 7.г| 4.2 2.7 6.7 4,0 2,6 6.3 3,9 2,6 J 1 7 Ц )l )\ 5,9 4 26,41 Ц 9,1 4,7 1 18.C 7,7 4,С 13,7 ) 6.51 3.6| 11,2 5.7 3.3 9,6 5,1 3,1 S,5 4,7j 2,9 7,б| 4,4 2,8 7,o| 4,2 2,7 6.5 4.0 2,6 6.1 3.8 2,5 1 \ H 127,7 26,9 8,7 47,0 14.2 5.9 26.1 9 7 4,6 17.7 7.6 4.0 13,5 6,4 3,5 11.0 5.6 3.2 9,4 5.0 3,0 8.3 4.6 2,9 7,4 4.3 2.7 6.8 4.1, 2.6 6.3 3.9 2.6 5.9 3.7 2,5 16 127.1 26.8 8,7 46.6 14.1 5.8 25.8 9,6 4.6 17.5 7.5 3.9 13,2 6,3 3,5 10,S 5.5 3,2 9.2 4,9 3,0 8.1 4,5 2,8 7,3 4.2 2.7 6.7 4,0 2,6 6,2 3.8 2,5 5.8 3,6 2.4 20 126,5 26,7 8,7 46,2 14,0 5,8 25,4 [ 9,5 | 4,6 ! 17,2 7,4 3,9 13,0 6,2 3,4 10.5 5,4 3,2 8 9 4,8 2,9 7,8 4,4 2,8 7,1 4,1 2.7 6,5 3,9 2.5. 6,0 3,7 2.5 5,6 3,5 2,4 24 125.9 26.6 8.6 45,8 13.9 5,8 ' 25,1 9,4 4,5 ! 16.9 7,3 j '3,8 12,7 6.1 3.4 10,3 5,3 3.1 8,7 4.7 2.9 7.6 4,3 2.7 6.9 4,0 2,6 6,3 3.8 2,5: 5.8 3,6 2,5 5.4 3.4 2.4 20 125.6 26.5 8.6 45,6 13,8 5,8 24,9 9,3 4.5 ' 16.S 7.2 3.8 12,6 6,0 3,4 10.2 5,2 3,1 8.6 4.6 2.8 7.5 4.3 2,7 6.S 3.9 2,6 6.2 3,7 2.5 5,7 3,5 2,4 5,3 3.3 2,3 40 125.3 26,4 8.6 45,4 13,7 5.7 24.8 9.2 4,5 ' 16,6 7,1 3.8 12.5 5,9 3,3 10.1 5,1 3.1 8.5 4,6 2.8 7,4 4.2 2.7 6.7 3,9 2.5 6,1 3,6 2.4 5,6 3.4 2.4 5.2 3.3 2.3 50 125.0 26,4 8,6 1 45,2 13,7 5,7 24,6 9.1 4,4, 16.5 7.1 3,8 12,3 5.9 3,3 Ю.о; 5,lj 3.0 8,4 4,5 2,8] 7,з| 4.M 2,6 6,6 3,8 2,5 6.0 3.6 2.4 5.5 3.4 2,3 5.1 3,2 2.2 1 75 124,7 26,3 b.6 45.0 13,6 5,7 24.5 9,1 4,4 16,4 7,0 3,7 12.2 5,8j 3.3 9,9 5.01 3,0 8.3 4.5 2,5 7,2 4.1 2,6 6,5 3.7 2,5 5,9 3,5 2.4 5.4 3.3 2.3 5.0 3.1 2 2 I 100 124,4 1 26,2 8,6 44,7 13.5 5.7 \ 24,3 9,1 4,4 16,2 7,0 3,7 12.1 5.8 3,3 9,7 5.0 3.0 8.1 4.4 2.8 7.1 4,0 .2,6 6,3 3,7 2,4 5.7 3.5 2,4 5,3 3.3 2.3 4,9 3,1 2.2 20Э 124,1 26.2 8.5 1 44,5 13.5 5.7 24,1 \ 9,1 1 4'4 16,1 6.9 3,7 12.0 5,7 3.3 9.6 4.9 3.0 8.0 4,4 2.7 7.0. 4.0, 2.6 6.2 3,7 2,4 5,6 3.4 2,3 5,21 3.2 2,3 ■ ■ 1 4.8| З.1! 2 2' 1 50Э 123,8 26,1 8,5 1 44.3 13,5 5,6 24.0 '9.0 4.4 15.9 6 9 . 3,7 11.8 5,7 3,2 9.5 4.9 2.1 7.9 4.3 2.7 6.9 3.9 2.6 6.1 3.6 2,4 5.5 3.4 2.3 5.1 3,2 2.2 4,7i 3.0 2,1 - 123.5 26.1 8,5 44,1 13,5 5.6 23,8 9,0 ! 4,4 1 ! 15.8 6,9 3,7 1 11.7 5.7 3,2 9,4 4,9 2,9 7,8 4,3 2,7 6.S 3.9 V 3 ■ 4 5 6 7 8 9 10 2.5 6.0 11 3,6 2,4 5.4 3.4 2,3 5.0 3.2 2.2 4,6 12 13 14 3,0 2,1 112 113
Продолжение табл. £ <уМ| i J5 IG 17 18 19 20 21 22 23 1 24 1 25 1 26 | 27 1 1 16. 8. 4. 16. 8., 4.. 15.' 8,' 4,f 15.4 8.2 4.4 15.2 8.2 4.4 14.8 1 8.1 4.3 14.6 8.0 4,3 14,4 7,9 4,3| 14.2 7.9 4.3 14,0 7.Щ 4.3 13,9 7.8 4.2 13.7 7,7 4.2 13.6 2 6 П, 7 6, 5 3. 1 1). 5 6. 3 3,( Ц 10./ II 6. > 3.( 10.4 И 6.С 3,5 1 Ю,2 5,9 3,5 10,0 ! 5,8 3.5 9.S 5.8 3.5| 9,6 5,7 3.4 9.5 3 3 9.3 4 5,4 7 3,3 Щ 9.0 2 5,3 5 3,2 1 8.7 5.2 ) 3.2 8.5 > 5.1 3.2 8',3 5.0 3.1 8,1 4.9 3.1 7.9 4.9 3.1 7.8 ] 4 8 3,0 7.7 5.7 4,8 1 3.41 3.0 9.3 7.6 1 5.6*47 3.4 9,2 5.6 3.4 9,1 5.5 3.4 9.0 7.7 5.5| 4.2| 3.3 3.0 7.5 | 4.7 3.0 7.4 4.6 3.0 7.3 4.6 3.1 4 1 8.3 4.9 3,1 7,9 4,8 3.0 7.7 4.7 3,0 7.5 4,6 2,9 7,3 4.5 2,9 7.1 4.4 1 2.9 7,0 4.4 2.6* 6.8 4,3 2 8 6.7 4,3 1 2.8 1 6.6 4.2 2.8 6.5 4.2 2,8 6.4 4.1 2,7 1 6.3 4.1 2.7 5 G 7,6 • 7,1 4,6 2,9 7.3 4,4 2.9 7.0 4,3 2,8 6.8 4.2 2,8 6.6 4.2 2,7 6.5 4.1 ! 2.7 6.3 4,0 2.7 1 4,3 2,8 6.8 4.2 1 2,7 6,6 4,1 2.7 6.4 4.0 2,7 6,2 3.9 2,6 6.0 | 3.9 2,6 5.9 3.8 2.6 6,2 ! 5.8 4.0 2.7 6.1 4.0 2.6 6.0 3,9 2,6 5,9 3,9 2.6 5.8 3.8 2.6 5.7 3.8 2,6 3.8 2.6 5.6 3.7 2.5 5.6 3,7 2,5 5.5 3.6 2.5 5.4 3.6 2.5 5,3 3.6 2.5 7 6.8 4.1 2.7 I 6.5 4.0 2,7 6.3 3 9 2.6 6.1 3.8 2,6 5,9 3.8 2,5 5.7 3.7 ! 2.5 5.6 3.6 2,5 5,5 1 3,6 2.5 5,4 | 35 2.4 5.3 3.5 2,4 5.2 3.5 2.4 5.1 3.4 2.4 5.1 3.4 2.4 1 6 6.5 4,0 2.6 1 6,2 3,9 2.6 1 6.0 3.8 2.5 1 5.8 3.7 2.5 5.6 •3.6 2,5 5,4 3.6 ! 2.4 5,3 3.5 2.4 5.2 1 3.4 2.4 5,1 3,4 2,4 5.0- 3.4 J 2.4 1 4.9 3.3 2.3 4.8 3.3 2.3 4.8. 3.3 2,3 9 6.3 1 3.9 [ 2,6 6.1 3.8 2.5 5,8 3.7 2.5 1 5,6 3.6 2,7 5,5 3.5 2.4 5.3 3.4 ! 2.4 5.2 3,4 2.4 5.1 3.3 2.4 5.0 3.3 2,3 .4.9 1 3.2 2,3 4.8 1 3.2 2.3 4,7 I 3,2 2,3 4,7 1 3,1 2.2 | 10 6.2 3,8 2,6 1 5.9 3.7 2,5 5.7 3.6 2,4 1 5,5 3,5 2,4 5.3 3,4 2,4 5.1 3,4 2,3 5.0 3.3 и 6.0 3,7 2.5 5,8 3.6 2,5 5.5 3 5 2,4 5,3 12 5,8 3,7 2,5 5,6 3.5 2,4 5.3 3.5 2,3 5.1 3.4 | 3.4 1 2.4 5,2 3.4 2,3 5.0 3.3 1 2,3 4,9 3,2 2,3 2,3 4.9J 4,8 | 3,3 3,2 1 2.3 4,8 3,2 2,3 4.7. 3,2 2.3 4.6 3,1 2,2 4.5 3.1 2.2 4,5 1 2,3 4.7 3.1 2,2 4.6 1 3.1 2,2 4,5 3,0 2,2 4,4 1 3,0 2,2 4.4 I 3,1 3.0 | 2,2 2.2 2.3 1 5.0 1 3.3 2,3 4.8 3.2 2,3 4,7 1 3,2 2,2 J 4.6 1 3.1 2,2 4,5 3,1 2.2 4,4 3,0 2,2 4,3 3,0 2,2 4,2 3,0 _2.М 4.2 2.9 2.1 J 14 5.6 3.6 2,4 5.4 3,5 2,4 5.1 3.4 2,3 5.0 3.3 2,3 4,8 3.2 2,3 1 4.7 3.1 2,2 4.5 3.1 2,2 1 4,4 3,0 2,2 , 4.3 3.0 2'1 Щ 1 2'9 2.1 4.2 2.9 2.1 4.1 2,9 2,1 1 4.0 J 2.8 Н !Г, 5,5 3,5 2,4 5,3 3.4 2,3 1 5,0 3.3 2.2 4.8 3,2 2.2 1 4.7 3,1 2,2 4.5 3.0 2,2 4,4 3.0 2.1 4.3 2,9 2,1 | 4.2 2.9 2.1 J 4.1 1 2.8 2.1 4.0 1 2,8 2,1 3.9 2,8 2.0 J 3,9 1 2.7 2,0 20 5,3 1 3,4 1 2,3 5.1 3,3 2.3 4,8 3.2 2,2 4.7 3,1 2,2 4,5 3,0 2,1 4,4 2.9 2,1 4,2 2.9 2,1 4,1 2,8 2,1 4.0 2,8 2.0 3.9 2 J 2.0 3.9 2.7 2,0 3.3 2.7 2,0 3.7 2.6 2,0 24 5,1 3.3 2,3 1 4,9 3.2 2 2 4.6 3.1 2;2 4,5 3.0 2,1 4,4 2,9 2.1 4,2 1 2,9 2.1 4,0 2.8 2.0 30 5,0 3,2 2,3 4,8 3,1 2,2 Г4.5 3.0 2,1 1 4,4 2 9 2,1 1 4.2 ! 2,9 2,1 4.1 2,8 2.0 3.9 2.7 2,0 3,9 j 3,3 2.7 ! 2,7 2.0 1 3.8 2.7 2.0 3,7 2.7 2.0 3.7 2.6 2.0 3.6 2.6 1.9 3.5 2.5 1.9 | 2.0 | 3.7 2.6 2.0 1 3.6 2.6 1.9 3.6 2,5 1.9 3.5 2.5 1.9 3.4 2.5 1.9 40 4.9 Зг1 2Г2 4.7 3,0 2,2 4.4 2,9 2.1 4.3 2,8 2;1 1 4.1 2,3 2,0 4,0 2.7 2.0 3,8 2.6 2,0 3,7 2,6 1 1.9 3,6 2.5 1.9 3.5 2,5 1.9 3.5 2.4 1.9 3.4 2.4 1,8 3.3 2,4 1,8 50 4,8 3.1 2,2 4.6 3,0 2,1 4.3 2,9 2.1 1 4.2 2,8 2,0 4,0 2,7 2.0 3,9 2,6 2.0 3.7 2.6 1,9 3.6 2.5 .1.9 3.5 2.5 1.9 3.4 2.4 1,9 3.4 2,4 1.8 3.3 2.4 1.8 3,2 2.3 1,8 75 4,7 3,0 2,2 4.5 2,9 2,1 1 4.3 2.8 2,0 4.1 2,7 2.0 | 3,9 2.6 2,0 3,8 2,6 1 *'9 3,5 2.5 1,9 3,5 2,5 1,8 3,5 ' 2.4 1,8 3.4 1 2.4 1,8 3.3 2.3 1.8 3.2 2.3 1.8 3.2 2,2 1.8 100 4 6 3.0 2.1 4,4 2.9 2.1 4.2 2,8 2,0 1 4,0 2,7 2,0 3,8 2.6 1.9 3,7 2,5 1,9 3,6 2.5 1.9 3.5 2.4 1.3 3.4 2.4 1.6 3.3 2,3 1,8 3,2 2.3 1,8 3,1 2,2 1,8 3.1 2.2 1.7 | 200 4,5 2.9 2,1 4.3 2.8 2,0 /•4.1 2,7 2,0 3.9 2.6 1.9 3.7 2,5 ! 1.9 3.6 2.5 1,9 '3,5 2.4 '1.8 3.4 2.4 1.3 3.3 '2,3 | 1.8 •3,2 I 2.3 1.8 3.1 2.2 1,7 •3.0 2,2 1,7 3.0 2.2 1.7 | 500 4.4 2.9 2,1 1 4.2 2.8 2,0 1 4.0 •2,7 2,0 3.8 2.6 1.9 1 3.6 2,5 1,9 3,5 2.4 1,8 3,4 2,4 1.8 3,3 2,3 i 1.8Sj 3.2 2.3 1.8 3,1 2.2 1,7 3.0 2.2 1.7 2,9 1 2.1 1,7 2.9 1 2.1 1,7 l-i/ 4,3 2.9 2,1 4.1 2,8 2,0 3.9 2,7 ' 2.0 1 3.7 2.6 1.9 : з.5 2.5 1.9 3.4 2,4 1.8 3,3 2,4 1.8 3.2 2.3 1.8 3.1 , 2,3 1,8 3.0 1 2.2 1.7 2,9 2,2 1.7 2.8 2.1 1,7 2.8 2.1 1,7 15 1 16 1 l? I ,3 19 20 21 22 23 24 25 26 27 114 115
Продолжение табл. £ » м 4.0 2.8 2,1 4,0 2,8 2,0 3,9 2,7 2,0 3.8 2.7 2,0 1 3.8 2,7 2.0 3,7 2.6 2.0 3.7 2,6 2.0 3,6 2,6 1,9 . 3,6 2,5 1.9 j 3.5 1 2.5 1.9 3,4 2.5 1.9 3.4 2,5 1.9 з.з 2.5 1.9 16 3.8 2.7 2.0 3,8 2.7 2.0 3.7 2.7 2.0 3.7 2.6 2.0 3,6 2,6 1.9 3,6 2,5 1.9 3,5 2.5 1,9 3.5 2,5 1.9 3.4 2,5 1.9 3.4 2.4 1,9 3,3 2,4 1.9 3.3 2,4 1.9 3,2 2.4 1.8 20 3.7 2.6 2.0 3.6 2,6 1.9 3.6 2.5 1.9 3.5 2,4 |.,9 1 3,5 2,5 1.9 3.4 |2.4 1.9 3.4 2.4 1.9 з.з 2,4 1.8 1 3.3 2.3 1,8 3.2 2.3 1,8 3.1 2,3 1.8 3.1 2.3 1.8 3,0 2.3 1.8 24 3.5 2.5 1.9 3.4 2.5 1.9 3.4 2.5 1.9 3.4 2,3 1.9 з.з 2,4 1,8 3.3 12,3 1.S 3,2 2,3 1.8 3,2 | 2,3 1.8 3.1 2.3 1.8 3*1 2.2 1,8 3.0 2,2 1.7 3.0 2,2 1.7 2,9 2,2 1.7 30 3.4 2.4 1.9 з.з 2.4 1.8 3,3 2.4 1.8 3.2 2,3 1.8 1 3.2 2.3 1.8 3,1 2.3 1.8 3,1 2,2 1,8 3,0 j 2,2 1,7 3,0 2,2 1.7 2,9 2.1 1,7 2.8 2.1 1.7 2.8 2.1 1 1.7 2,7 2,1 1.7 | 40 3,3 2,3 1.8 3.2 2.3 1.8 3.2 2.3 1.8 3.2 2.2 1.8 3,1 2.2* 1.7 ! з.1 2.2 1.7 3.0 2.1 1,7 з:о 2.1 1.7 2,9 2.1 1.7 2,9 2,1 1.7 2.8 2,0 1.5 2,8 2.0 1.6 2.7 2.0 1.6 50 j 75 3,2 2,3 1.8 1 3,1 2,3 1.8 1 3,1 2,2 1.8 I 3.1 2.2 1,7 I 3,0 2,1 1.7 3.0 2,1 1.7 2,9 2,1 1.7 2.9 j 2,0 1.7 2.8 2.0 1.6 2.8 2,0 1.6 2,7 1 2,0 1.6 2.7 1 2,0 1,6 2.6 1.9 1.6 | 3.1 2,2 1.7 3,0 2,2 1.7 3,0 2,2 1.7 3,0 2.1 1.7 2.9 2.1 1,6 ! 2.9 2,0 1,6 2.S 2.0 1,6 2.8 2.0 1.6 2J\ 1,9 1.6 2,7 1.9 1,6 2,6 1.9 1.6 2.6 1.9 1.6 2,5 1 1.9 1.5 100 3.0 2,2 1.7 2.9 2.1 1.7 1 2.9 2,1 1,7 2,8 2,1 1.7 2,8 2,0 1.6 2.7 2.0 1.6 2.7 2.0 1,6 2.6 1.9 1.6 2.6 1.9 1.6 2.5 1.9 1.6 2,4 1.9 1,5 1 2.4 1.8 1.5 2.3 1.8 1.5 - 200 l 1 2.9 2.1 1.7 ! 2.8 2.1 1,7 1 2,8 2.1 1.7 2.7 2.0 1.6 2,6 2,0 1,6 2,6 1,9 1.6 2,6 1.9 1.6 , 2.5 1.9 1.5 '2,4 1.8 1,5 2.4 1 1,8 1.5 2.3 1.8 1,5 2,3 1.8 1.5 2.2 1.8 1,5 500 2.8 2.1 1,7 2,7 2.1 1.6 1 2.7 1 2.0 1,6 1 2.6 2.0 1.6 1 2.6 1,9 1,6 2.5 1,9 1.6 2,5! 1,9 j 1.5 2.4 1 1.8 1.5 2.4 1 1.8 1.5 2.3 1 1.8 1.5 2.2 1,8 1.5 2,2 1 1.7 1_.5_ 2.1 1.7 1.5 | l-l/ 2,7 2.1 1.6 1 2.6 2,0 1.6 2.6 2.0 1.6 I 2.5 2.0 1,6 2.5 1,9 1,5 2.4 1.9 1.5 2.4 1.8 1.5 . 2.3 1.8 1.5 2.3 1.8 1.5 2.2 1.7 1.5 2.1 1.7 1,5 2,1 1,7 1.4 2.0 1.7 1,4 28 1 29 1 30 32 34 36 38 40 42 44 46 48 ' 50 117
Продолжение табл. ? ! J2 3.4 2.5 ' 1.9 '" ~ 3.3 2,5 1,9 3,2 2.5 1,9 3,2 2Л 1,9 3,1 1 2.4 1,9 3.1 1 2,4 1.8- 3.0*1 2.34 1,8 2.9 1 2,3 1,8 '2,9 j 2,3' 1.8 2.8 2.2' 1.8 2.8-1 2,3' ',81 2,74 2.2 1.7;' 14 16 3,3 2.4 1.9 3,2 2,4 1.9 3,1 2.4 1,8 3,1 2.3 1.8 3,0 2,3 1.8 3,0 2,3 1,8 ._ 2,9 2,2 1.8 2,8 2,2 1.3 2.8 2,2 1.7 2,7 2,1 1,7 2,7 1 2,2 1,7 2,6 2.1 1.7 20 3,2 | 3,0 2.3 1 2,2 1 1.8 1 1.8 1 3,1 » 2,9 2,3 1.3 3.0 2.3 1.8 3.0 2.3 1.8 2,9 2,2 1.8 ; 2.8 2.2 1.7 2,8 2,1 ! 1«7 2,7 2,1 1.7 2,6 2.1 1,7 2.5 2,0 1.7 2.5 2.1 1.6 2,4 2,0 1.6 2,2 1.7 •2,3 2,2 1 XJ 1 2,8 2,1 1.7 I 2.7 2.1 1.7 2,7 2,1 1.7 2.6 2,0 1.6 2,5 2,0 1,6 2,5 2,0 1.6 2,4 1,9 1,6 2,4 2,0 1.6 2,3 1.9 1.6 21 Ь,9 2,1 1.7 1 2,8 2,1 1,7 2,7 2.1 1.7 30 I 2,7 2.1 1.7 2.6 2.0 1.6 2.5 2,0 1.6 2,7 2.5 2,1 , 2,0 1,7 j 1.6 |2,6 ! 2,0 1.6 2,5 2,0 1 '*6 2,5 1 1.9 1.6 2.4 1,9 1.6 2.3 1.9 1.6 1 2,2 1.8 1.5 2.2 1.9 1.5 2,1 1.8 1,5 1 2.4 •1,9 1.6 1 2,4 1.9 1,6 2,3 1.8 1.5 2,2 1.S 1.5 2.2 ' 1.8 1,5 2,1 1 1.7 1,5 2,1 1,8 1,5 2.0 1.7 1,5 40 2,7 2,0 1.6 2,6 1.9 1.6 2,5 1.9 |'!.6 2.5 1,9 1.6 2,4 1,8 1,5 2.3 1.8 1,5 2 3 1.7 1,5 2.2 1.7 1.5 2,1 j 1.7 1.4 2.0 1.6 М 2,0 1.7 1,4 1.9 1.6 1,4 1 50 2,6 1.9 1.6 1 2,5 1.9 1.6 1 2.4 1.8 1.5 2,3 1.S 1.5 2.3 1.8 1.5 2,2 1.7 1.5 2,1 1,7 1.4 2,0 1.7 1.4 . 1.9 j I.6 1.4 1,9 1.6 1.4 1,8 1,6 1.4 1.7 1 1.5 1.3 75 2,5 1.8 1.5 2.4 1.8 1.5 1 2,3 1.8 1,5 2,2 1,7 1,5 1 2.2 1.7 1.4 2,1 1,6 1,4 I 2,0 ! 1.6 1.4 1.9 1.6 1,4 1.8 1.5 1.3 1.8 1 1.5 1,3 Г.7 1.5 1.3 1.6 I 1,4 1,3 I 100 2,3 1.8 1.5 1 2,2 1.7 1.5 2.1 I.7 1.5 2,1 1.7 1.4 2.0 1.5 1.4 1.9 1,6 1,4 • 1.9 1.5 1,4 Л.8 1,5 1.3 1.7 1.5 1,3 1.6 1.4 1.3 1.6 1,4 1.3 1,5 1.4 1.2 20О '2,2 1.7 1.5 1 2,1 I.7 .1.4 2,0 1.6 1.4 1 2,0 '1.6 1.4 1.9 1.6 1,4 1.8 1,5 1.3 1,8 1,5 1.3 1,7 1.4 1.3 1,6 •1..4 1.3 1,5 1 1.3 • *».2 1.5 1 1,4 1,2 М 1.2 .1.2 500 2. '■ 1.7 1.4 2.0 1.6 1.9 1.6 1.4 1 1.8 I.6 1.4 1,8 1,5 1 1.3 1,7 1,5 1.3 1.6 1,4 1.3 1.5 1.4 1,2 1,4 1.3 I..2 .1.4 1,2 1,2 1,3 1.2 1.1 1.2 1,1 1.1 1-1/ 2.0 1.5 1.4 1.9 1.6 1.4 1.3 1.6 1.4 1 I»7' 1.5 1,3 1.7 1.5 1,3 1,6 1,4 1,3 1,5 1.4 1.2 1.4 1,3 ;я •Mi 1,ч .Ы • "ti i,2 ■йА\ U 1.1 i 1 l.i •1.0 1.0 1 55 1 60 1 65 70 80 100 125 150 200 400 '1000 'со 119
л* УГЛЫ ф В РАДИАНАХ, ср ~^г- arcsin {/■ р- у; Таблица 2/ р 0.0000 0,0001 0,0002 0,0003 • 0,0004% 0,0005 0,0006 j 0,0007 0.0008 0,0009 0,001 0,002 0.003 0,004 0,005 0,006 0,007 0,008 0.009 0,01 0.02 0.03 0,04 0.05 0,06 0.07 0.08 0.09 1 0,10 0.11 0.12 0.J3 0,14 0,15 0,16 0,17 0,18 0,19 0.20 0,21 0.22 0,23 0.24 0,25 0,26 0,27 0.28 0,29 0.30 0.31 0,32 0.33 0.34 0.35 . 0.36* • 0.37 0.38 0.39 0.40 0 0.0000 0.0200 0,0283 ' 0.0346 * 0.0400 0.0448 0.0490 0,0529 0.0566 0.0600 0,0632 0.0S95 0,1096 0.1266 0.1415 '0.1551 0,1676 0,1791 0.1900 0.2003 0.2838 0.3482 0.4027 0.4510 0.4949 0.5355 0.5735 0.6094 0.6435 0.6761 0.7075 0.7377 0,7670 0,7954 0.5230 0,8500 #0,8763 0,9021 0.9273 0.9521 0,9764 1.0004 I.0240 1.0472 I.0701 1 1.0928 1.1152 1.1374 1.1593 1.1810 1.2025 1.2239 I.24^1 1.2661 Г (.2870 1.3078 1.3284 1.3490 1,3694 1 0,0063 0.0210 0.0290 0.0352 0,(405 ! 0.0452 ! 0.0494 0.0533 0.0569 0,0604 0.0664 0.0917 0.1114 0.1282 0,1429 0,1563 0,1687 0,1803 0,1911 0,2102 0.2909 0,3540 0.4078 0.4556 0.4991 0.5394 0,5772 0.6129 0.6468 0,6793 0.7107 0.7407 0,7699 0.79Н2 0,8258 0,8526 0.8789 0,9046 0.9298 0,9545 1 0.9788 I 1,0027 1.0262 1.0195 1.0724 1.0951 1.1174 1.1396 1.1615 1.1832 1.2U45 I,2260 1.2472 1.26*2 1.2891" 1.3093 1.3305 1.3510 1.3715 2 0.00S9 0,0220 0.0297 0.0358 0.0410 0.0456 0.0498 0.0537 0,0573.! 0.0607 0.0693 0.0939 0,1132 0.1297 0,1443 0.1576 0.1G99 • 0.1814 0.1921 0.2195 0.2978 0.3597 0.4128 0,4601 0.5033 0,5433 0.5808 0.6163 0,6501 0,6*25 0,7136 1.7437 0.7727 0.8010 0.82S5 0.8553 0.8815 0.9071 0.9323 0.9570 0.9813 j l.0051 1.0286 1.0518 I.0747 1.0973 1,1197 1.1418 1.1636 1.1853 1.2068 . 1.2281 1.2493 1.2703 1.2912 1.3119 1.3326 1.3531 1,3735 ' Последние цифры 3 0,0110 0.02SS 0.0303 0,0363 0.0415 0.0460 0.0502 0.0540 0.0576 0.0610 0,0721 0.0959 0.1149 0.1312 0.1457 0.1589 0.1711 0.1825 0 1932 0.2285 0.3045 0.3654 0.4178 0.4646 0,5074 0.5472 0.5845 0.6198 0.6534 0.6857 0.7167 0.7466 0.7756 0,8038 0,8312 0.8579 0.8841 ! 0,9097 1 0.9348 | 0,9594 0,9830 1.0075 1,0310 1.0541 1.0770 1.0996 1.1219 1,1440 1.1658 1,1875 1.2090 .1.2303 1.2514 1.2724 1.2933 1.3140 ■1.334G 1,3551 1.3/56 4 0,0126 0.0236 0.0310 0.0369 0.0420 0.0165 0.0506 0.0543 0,0580 0,0613 ! 0,0748 0,0979 0,1167 0.1328 0,1471 '0,1602 0,1723 0.1S36 0.1942 0,2372 0.3111 0,3709 0,4227 0.4690 0.5115 0,5510 0.5881 0.6232 0.6567 0.6S.XS 0,7197 0,7495 0.7785 0,8065 0,8339 0,8606 ! 0.8807 1 0,9122 0,9373 0,9619 0.9860 1.0098 1,0333 1.056» 1,0793 1.1018 1.1241 1,1462 1.1С80 1,1896 1.2111 1.2324 1.2535 1.2745 1.2953 1.3161 1.3367 1,3572 1,3776 доли и процентл 5 0.0142 0,0245 0,0317 0.0374 0.0425 0.0469 0.0510 0,0547 0.0583 ! 0.0610 0.0775 0.1000 0.1184 0,1313 0,1 «185 0,1614 0.1734 0.1847 0,1953 0,2456 0,3176 0,3764 0,4275 0.4735 0.5156 0.5543 0,5917 0,6267 0.6600 0,6920 0 7227 0.7525 0,7813 0.8093 0,5366 0,8632 0.8892 1 0,9147 0.9397 0,9643 0,9884 1.0122 1.0356 !.0587 1,0815 1,1040 1,1263 1,1483 1.1702 1.1918 1,2132 1.2345. 1,2556 1.2766 1.2974 1.3151 1 3387 1.3592 1,3796 G 0.0155 0.0253 0.0323 0.0379. 0,0429 0,0473 0.0514 0.0551 0.05S7 0.0620. 0.0800 1 0.1020 0,1200 0.135S 0.1495 { 0.1624 0,1746 0.1857 0 1963 0.2537 0.3239 0.3SI8 0,4323 0.47.8 0,5196 0.55S6 0.-5953 0.G301 0,6632 0,6951 0,7258 0,7554 0.7541 0.5121 0,8393 0,3658 | 0.8918 0,9173 0,9422 | 0,9667 0,9905 1,0146 1.0379 1.0610 1,0838 1.1063 1.1285 1 1505 1.1723 1.1939 1,2154 1 23% • 1,2577 1.27*7 1.2995 1.3202 1,ЗШ 1,3613 1.3817 • 7 0.0167 0.0261 0.0329 | 0.03S5 0,0434 0.047S 0,0518 0,0555 0,0590 0.0623 0,0824 0,1039 0.1213 0,1373 0.1511 0.1639 0.1757 0.1563 0.1973 0.2615 0.3301 0,3871 0.4371 0.4822 0,5237 0,5624 0.59S8 0.6334 0,6665 0,6982 0.7283 0.75N3 0.7800 0.3143 0.8420 0.8685 0.8944 0,9198 0.9447 0.9692 0,9932 i 1.0169 1.0103 1,0633 1.0560 1.1055 1.1307 1.1527 1.1745 1.1961 1.2175 1.2387 1,2598 1.2508 | 1,3016 1.3222 1.3428 '1,3633 1,3837 8 0,0179 • 0,0269 0.0335 0.0390 0.0438 0.0452 0,0522 0,0559 • 0.0593 0,0626 0.0S49 0.1059 0.1234 0.13S7 0.1525 0.1651 0,1769 0.1579 0.1953 0.2691 0.3363 0,3921 0.441S 0.4565 0.5276 0,5661 0.6024 0.6365 0.6697 0.7013 0.7318 0.7612 0,7598 0.5176 0.S446 0.S711 0.8970 0.9223 0.9422 0,9716 0,9956 1,0193 1,0426 1.0656 1,0533 1.1107 1.1329 ! 1,1549 1.1767 1 1.1932 ; 1.2196 1,2405 | 1.2619 I,252S 1,3036 1.3243 1.3449 1,3654 1.3357 1 9 0.0190 0,0276 0.0341 0.0394 0,0443 0.0486 0,0^25 . 0.0562 0,0597 0.0629 0.0S72 0;1075 0.1250 0.1401 0,1535 0,1664 0 1780 0.1S90 0.1993 0.2765 0.3423 0.3976 0.4464 0,4907 0.5316 0.569S 0,6059 0.6402 0,6729 0.7044 0.7348 0.7641 0,7926 0.5203 0.S473 0.8737 0,S995 0,9243 0.9496 0,9740 0.99S0 1.0216 1.0449 1.0679 1.0906. I 1 .ИЗО 1,1352 1.1571 .1.1788 I 1.2004 1.2218 1 1.2430 I 1.2610 1,2849 1.3057 1.3264 1.3409 1,3674- 1.3877 P % ■ 0,00 0,01 0.02 0.03 0.04 0.05 • 0.06 0,07 0,08 0.09 0.1 0,2 0,3 0.4 0.5 0.6 0.7 0.8 0,9 1. 2. 3. 4, 5. 6, 7, 8, 9. Ю. 11, 12. ! 13. 14. . lo. 16. 17. 18, 19. 20. 21. 22. 23, 24. 25. 26. 27. 2S, 29. 30. 31. 32. 33. 34, 35, 36. 37. 35. 39, ! 40.
Продолжение табл. У} Р 1 ° 1 ' 1 2 1 3 |- ' Л | 0.41 0.42 0,43 0,44 0.45 0.4G 0.47 0,48 0,49 0.50 0.51 0.52 0,53 0,54 0,55 0.56 0,57 3 0.58 о 0,59 0.60 0,61 0.G2 0.G3 0,64 0.65 O.oG 0.67 0,68 0.6У 0,70 1,3898' 1.4101 1,4303 1.4505 1.470G 1.4907 1.5108 1.5308 1,5508 1.5780 1,5908 1,6108 1.G308 1.6509 1.6710 1.6911 1.7113 1.7315 1.7518 1.7722 1.7926 ' 1.8132 1.8338 1,8516 1,8755 1,8965 1,9177 1.9391 1.9600 1.9823 0.71 1 0,72 0,73 0.74 | 0,75 | 0,76 0,77 1 0,78 0.79 | 0.80 0,81 0.82 ! 0.83 0.84 0.85 0.86 0.87 0.88 0,89 5 °'П? и> 0.91 0.92 0.93 0,94 0,95 •" 0.96 0.97 0,98 . 0.990 0.991 0,992 0,993 0.994 0.995 1,3918 1.4121 1,4324 1.4525 1.4726 1,4927 1.5128 1.5328 1,5528 1.5728 1.5928 1,6128 •1,6328 j 1.6530 1.6730 1.6931 1.7133 1.7335 1.7538 1.7742 1.7947 1.8152 1.8359 1.8567 1 1.8776 ! 1.8986 | 1,9198 1.9412 1.9628 1.9845 1,3939 1,4142 1.43Н 1,4515 1.4748 1.4917 1.5145 1,5348 1.5548 1.5748 | 1.5948 1.6148 1.634S 1.6549 1.6750 6.6951 1,7153 1.7355 6.7559 1.7762 1.7967 1.«172 -1.8380 1 .8588 1,8797 1,900S 1,9220 1,9434 | 1,9650 1,9867 2.0042 ! 2.0065 2.0264 | 2.0488 2.0715 2.0944 2.1177 2,1412 2,1652 2.1895 2,2143 2.2395 - 2.2653 2.2916 2.318G 2,3462 2.374G 2.4039 2.4341 2,4655 2.4981 2.5322 2.5681 2.6061 2.6467 2.6966 2.7380 2.7934 1 2.8578 2.94126 2,95157 2.96247 2.97406 2.98652 3.00С 105 2.0286 1 2.0511 2.0373 2.0967 2.1200 2.1436 2.1676 2.1920 2.2168 2,2421 1 2.2680 2.2943 | 2.3213 2,3490 2.3775 2.4068 2.4372 2.4687 2.5014 2 5357 2.5718 2.6100 2.6509 2.6952 ' 2,7440 2.7993 2,8650 2.94229 2,9г266 2.96363 2.97531 2.98787 3.001 55 1,3959 1.4102 1.4364 . 1.4566 1.4767 1.4967 1.5168 1.5368 1.556S 1.5768 1.5968 1.6168 ' 1.6368 1,6569 1.6770 1.6971 1,7173 1,7376 l.7.>7tf 1.7753 1,7988 1,8194 1.8400 i 1,8609 1,8818 1,9029 1.92U 1.9455 1,9671 1.98S9 2.00S7 2,0309 2.0533 2.0760 2,0990 2.1223 2,1-160 2.1700 2.1944 2.2193 2.2447 2.2705 2,2970 2.3240 2.351S 2.3S04 2.4098 2.4403 2.4719 2.5048 2.5392 ' 2.5755 2.61^0-. 2.6552 2.6995 j 2,7492 2.8054 1 2.8725 * 2.94332 2.95375 2.96479 2,97655 2.9892*'* з,ооз< J4 2,0109 2.0331 2.0556' 2,0783 2.1013 2,1247 2.1484 2.1724 2.19G9 2,2218 2,2472 2.2731 2.2996 2.3268 2.3546 2.3833 2.4128 2,4136 2.4751 2,5082 2.5428 2.5792 2.6179 1 2.6594 2.7045 2.7545 2.8115 2.8>01 2.914 И 2,9.1484 2.93595 2,97780 2.99058 3,00454 1.3979 1,4182 1,4384 1,4586 1,4787 1.4987 Г.5188 1.5388 1.558S 1,5788 1,5988 1,6188 1,6388 1,6589 1,6790 1.6992 1.7193 1.73VI6- 1.7599 1.7803 1,8008 1.8214 1,8421 1,8629 1.8839 1,9050 1.9262 1,9477 1,9693 1,9911 ( 2,0131 2,0353 2,0578 2,0806 2.1037 2,12/0 2.1508 2,1749 2,1994 2.2243 2.2498 2.2759 2,3023 2.3295 2,3575 2.3S62 2.4158 2,4465 2.47S4 2.5115 2.5463 2.5830 2.6220 J 2.6638 2,7093 2.7598 2.8177 2,8-79 2.94538 2 95593 2,96711 2.99904 2.99193 3,00(304 « Г 1.39S0 1 1,4202 1,4404 1.4606 1,4807 1.5007 1,5205 1,5408 U560S 1.580S i;6003 1,6208 1.6409 1.6>09 1.6810 1,7012 1.7214 1,7416 1.762C 1,7824 -1,8029 1.S2I4 1.S442 1.S650 1.M69 1.9071 | 1,9284 1,9498 1.9714 1.9933 2.0153 2.0376 2.0601 2.0829 2.1060 2,1294 2.1532 2,1773 2.2019 2,2269 2.2524 2,2784 2.3050 2.3*23 2.3603 2.3891 2.4189 2.4496 2.4816 2.5150 2,5500 2.5863 2.6256 2.6681 2.7141' 2.7652 2.8240 2.Ь960 2.91642 2.95702 2.96827 2.98029 2.99329 3.00751 —I_I 1.4020 1.4223 1,4424 1.4627 1,4827 1.5027 1.5228 1,5428 1.5628 1,5828 1,6023 1,6228 1.6428 1.6629 1,6830 1,7032 1,7234 1,7437 1,7640 1,7844 1 1,8049 i 1,8255 1,8463 1,8671 1.SSS1 1,9092 1,9305 1,9520 .1,9736 1,9954 2,0175 2,0398 2.0624 2.0S52 2,1053 2,1388 2,1556 2.1797 2.2043 ! 2,2294 2,2549 2,2810 2,3077 . 2.3351 2,2631 2.3921 2,4219 2,4528 2,4849 • 2.5164 2.5535 2.5906 2,6301 2,6726 2.7189 2.7707 2.8305 2.9044 2,91745 2,95811 2.96942 2.98155 2.99464 3,00903 * 1 1,4040 1,4243 1.4445 1,4646 1.4847 1,5048 1,5248 1,5448 1.5648 I 1 .-584S 1,6048 1.6248 1.6449 1,6649 1.6S50 1.7052 1.7254 1.7457 1,7660 1.7865 1,8070 * :1,827G 1.84S4 1.8692 1.8902 1,9113 1.9326 1.9541 1.9756 1,9976 2,0197 1 2.0421* 2.0646 2.0S75 2,1106 i .2,1341 2.15S0 2,1822 1 2,2068 2,2319 ! 2.2575 2.2037 2.3104 i 2,3373%* 2,3660 2,3950 2.4249 2,4559 2,4882 2.5218 2.5571 2.5944 2.6342 2.6770 2.7238 2.7763 2.S371 2.9131 2:91846 2.95920 2.99058 2.9S278 2.99599 3.01053 8 1,4061 1,4263 1,4465 1,4666 1,4S67 1.506S 1,5268 1.5468 1.5668 . 1,5S68 1,6068 1.626S 1.6469 1 ,b669 1,6871 1,7076 1.7274 1,7477 1,7681 1.7SS5 1,8090 1,8297 1.8504 1.5713 1,S923 1,9135 1.934S 1.9563 1,9780 1.9998 2.0220 1 2,0443 2,0669 2,0898 2.1130 2.1365 2,1604 2.1846 2.2093 2.2345 2.2(501 2.2863 2,3131 2.3406 2.3689 2.3979 ! 2.4250- 2.4591 2.4915 ! 2.5253 2.560S 2.59S3 2.G3S3 2-.6Ч15 2.728S 2.7819 2.S439 2.9221 2.94951 2.96029 2.97174 2.98403 2,99731 3.01203 9 1.40S0 1,4283 1.44S5 1.4686 " 1.4SS7 1.50S8 1,5288 i 1.548S i;56ss 1.55S8 1,6088 1.62S8 1.6489 1.6689 1.6S91 1,7092 1.7295 1.7498 1.7701 * 1.7906 1.8111 1.8315 1,8525 1.8734 1.S944 1,9156 1,9369 1.9584 1.9S01 2,0020 2,0242 I 2,0465 2.0692 2.0921 2.1153 2,1339 2.162S 2.1S71 2,2115 2,2370 2.2627 .1 2,2870 2.315S * 2.3434 2.3717 2.4009 2,4310 2.4624 2.4948 2.5237 2,5644 2.6C22 2.6125 2.6S53 2.7335 1 2,7876 1 2,8507 2.9314 2.95054 2.96136 2,97290 2,98527 2,99870 3,01352 1 P% 41, 42, 43, 44, • 45, Г 46. 47. # 48. 49. • 50. - 51. 52, 53, 54. 55, 56. 57, 58, 59, 60, 61, 62, • 63. 64, 65, 66. 67, 6S, 69. 70. 571 70 73, 74. 75.' 76', 77. 78, 79. 80, 81. 82, • 83. 84, 85, 86. 37. 5S. 89. 90. 91' 92. 93, 94. S3. 96. 97. 93, 99. 99.0 99.1 99 2 99.3 99.4
Продолжение табл. % 0,996 0.997 0.998 0.9990 0.9991 0.9992 0,9993 0.9994 0.9995 0.9996 0,9997 0.9998 0.9999 1,0000 3,01502 1 3.03200 ! 3,05212 3.07834 1 3,08467 0,09099 3,09732 3,10364 3.10997 3.11629 3,12262 3,12894 3,13526 3.14159 3,01672 3,03401 3,05474 3.07897 3 08530 3,09162 3,09795 3.10427 3.11060 3,11692 3.12325 3,12957 i 3,13589 3 01842 ' 3.03602 3,05736 3.07961 ' 3.08593 3.09226 3,09858 . 3,10491 | 3,11123 3,11756 , 3.12388 3.13020 3,13653 3,02011 3,03804 3,05999 3.08024 3.08657 3.092s9 3.09922 3.10554 11187 11819 12152 13084 13716 3.021S1 ! 3,04005 ! 3.06261 ! 3,08087 3.08720 3,09'-52 3.09985 3.10617 3,11250 3,118Ь2 3,12515 3.13147 3.13779 3,02351 3,04206 3.06523 3.06151 3,08783 3,09416 3,10048 3,10681 3.11313 3.11946 3.12078 3.13210 3,13343 3.02521 3.04407 3.06*55 3,0.ч214 3.0>816 3.09179 3.10111 3,10074 3.11376 3.12009 3.12641 3.1.273 3.13906 3.02691 3.04608 3.07047 3.08277 3.08909 3.09542 3,10174 3,10807 3,11439 3,12072 3.12704 3.13336 3.13969 3.02860 3,01810 3.07310 3,08340 3,08973 3,09605 3,10236 3.10870 3.11503 3.12135 3.12768 3.13399 3,140 2 3.03030 3,05011 3.07572 3.03404 3 09036 3,09669 3,10301 3.10934 3.11566 3,12199 3,12*31 3,13463 3,14096
Таблица . VII Критические значения Г (критерия Вилкоксона) \ПУ ^\ 4 1 5 6 7 8 9 10 \ 10 5 И 17 15 G 12 Ю 18 16 20 23 7 13 Ю 20 17 27 24 36 32 8 14 И 21 17 29 25 38 34 49- 43 9 15 11 22 18 31 2(5 40 35 51 45 63 5В 10 15 12 23 19 32 27 42 37 53 47 1 05 58 78 71 Число для р = 0,05 напечатано обычным шрифтом, а для р=0,01 — жирны м ш р ифт ом. Нуленая гипотеза принимается при 7J ^'Ли и отмергается при ТК'Лп- 125
Таблица VIII Критерий Вилкоксона-Манна-Уитни 1 Щ ? 1 3 4 1 °2 5 6 7 8 9 10 3 4 5 6 7 8 9 10 4 5 6 7 8 9 10 1 1 Уровень значимости 0,05 0 0 0 1 1 1 1 0 0 1 2 2 3 4 4 1 2 3 j 4 5 6 7 1 1 0,01 1 1 0 0 1 ; 1 2 3 з 1 п, 5 6 7 8 9 10 1 п2 5 6 7 8 1 9 10 6 7 8 9 10 7 8 9 10 8 9 10 9 10 10 j 1 Уровень значимости 0,05 4 5 6 8 9 11 7 8 10 12 14 И 13 15 17 15 18 20 21 24 27 | /Г01 ""1 2 3 I 4 5 6 3 4 | 6 | 7 8 6 7 9 11 9 11 13 14 16 19 | 126
Таблица JX Критические значения Т (критерия Внлкокеона для сопряженных пар) п ! 6 7 8 ^ ! 10 fl 12 5% 1 3 5 7 9 12 15 1% — 1 3 4 6 8 п 13 14 15 16 17 18 19 5% 18 22 26 31 36 41 47 1% 11 14 17 21 24 29 33 п 20 21 22 23 24 25 5% 53 60 67 74 82 90 1% | 39 44 50 56 62 69 Нулевая гипотеза принимается при Т^ ^.Tq5 ц отвергается при тг<т01. 127
> Л.А. ВАСИЛЬЕВА Статистические методы в биологии, медицине и сельском хозяйстве Учебное пособие к курсу лекций «Биометрия» Подписано к печати 21. 08.2007 Формат 60x90 1/16 Тираж 300 экз. Заказ 97 Усл.п.л. 7,9 Уч.издл. 5,7 Отпечатано на ротапринте Института цитологии и генетики СО РАН 630090, Новосибирск, пр. Лаврентьев, 10