Текст
                    АКАДЕМИЯ НАУК СССР
ГЛАВНЫЙ БОТАНИЧЕСКИЙ САД
3
77 Н. Зайцев
МАТЕМАТИКА
в
экспериментальной
БОТАНИКЕ
Ответственный редактор
член-корреспондент ВАСХНИЛ
В. Н. БЫЛОВ
МОСКВА «НАУКА»
1990

УДК 578.087.1 Математика в экспериментальной ботанике/Г. Н. Зайцев. М/ Наука, 1990.— 296 с. ISBN 5—02—004053—3 Книга является одним из наиболее полных справочных посо- бий, позволяющих исследователям самостоятельно решать разно- образные задачи по анализу отдельных выборок, а также их взаимосвязей, возникающие при математической обработке ре- зультатов наблюдений, экспериментов, или принимать решения в неясных ситуациях. Все методы, большинство которых отно- сится к математической статистике, изложены вполне доступно, иллюстрированы реальными примерами из исследовательской ботанической тематики и задачами, решаемыми по детально раз- работанным, наиболее рациональным алгоритмам. Приведены справочные таблицы, необходимые для оценки результатов и.Ти облегчающие расчеты. Рассчитана на практических и научных работников ботаниче- ских садов, сельского хозяйства, биологов широкого профиля, студентов и аспирантов. Табл. 127. Ил. 31. Библиогр.: 51 назв. Mathematics in experimental botany/C. N. Zaitsev. M.: Nauka, 1990. 296 p. The prezented book is one of the most complete reference books, devoted to mathematical methods in botany. It can be of great help for both practical and research workers of botanical gardens, agriculture, for wide profile bioloigists, students and post-graduates, dealing with experimental and observation data treatment. It can aid to analyse cross-section data and interrelations of indicators and to make decisions in indetermined situations as well. All methods, most of them stemming from mathematical statistics, are set forth quite intelligibly and illustrated with factual botanical research examples and with problems solved according to elabo- rated algorithms. Special attention is paid to the quality of mathe- matical maintenance and to the simplicity of the account. All refe- rence tables, necessary for estimation of results or making cal- culations easier, are enclosed herewith. Рецензенты: доктор биологических наук В. Ф. ЛЮБИМОВА доктор биологических наук Б. К. ТЕРМЕНА 3 1901000000-051 042(02)-90 459-90, I полугодие © Издательство «Наука», 1990 ISBN 5—02—004053—3
ВВЕДЕНИЕ Статистическая обработка цифрового материала, полученно- го путем опытов, учетов и наблюдений при биологических иссле- дованиях, необходима для определения степени достоверности результатов и правильного их обобщения. Особенно важна роль статистических методов как средства, помогающего принять вер- ное решение в условиях неопределенности. Каждый из методов математической статистики имеет свои возможности и ограничен- ную область применения. Использование метода, не соответст- вующего данному экспериментальному материалу, может привес- ти к неверным обобщениям и необоснованным выводам. Эта книга предназначена исследователям-биологам в качест- ве пособия для самостоятельного выбора метода математической статистики, наиболее соответствующего изучаемому вопросу, и для ознакомления с техникой расчетов при использовании из- бранного способа обработки цифровых данных. Перед обработкой результатов исследования прежде всего не- обходимо определить задачи, которые должны быть решены ма- тематическим путем. Отдельные главы книги посвящены этим задачам, и они обычно следующие. 1. Вычисление средней арифметической и ее ошибки, коэффи- циента вариации и других показателей, характеризующих один ряд однородных чисел, полученных в эксперименте или иным пу- тем (гл. 1). 2. Установление по двум и больше сопряженным рядам чисел наличия связи (корреляции) между двумя и больше признаками (гл. 2). 3. Определение по двум сопряженным рядам чисел формы за- висимости (регрессии) одного признака от другого (гл. 3). Содержание глав книги соответствует в той же последователь- ности трем названным общим задачам. Иначе говоря, если в рас- поряжении исследователя одна совокупность или группа чисел, то для ее математической обработки подойдут методы из гл. 1; при двух и более различных группах чисел можно применить ме- тоды из гл. 2 и 3. По оглавлению можно найти параграф, содержащий изложе- ние метода, которым надлежит пользоваться. В начале каждого параграфа приводятся разъяснения, дающие возможность даль- нейшего уточнения метода обработки данных. Большинство ме- 3
тодов биометрической обработки изложено в следующем поряд- ке: а) случаи применения метода; б) ограничения его примене- ния; в) формулы и объяснение символов; г) порядок расчетов по этапам; д) определение ошибки и достоверности полученных по- казателей. В книге все таблицы обозначены числами без скобок, напри- мер табл. 1.04 означает табл. 4 в гл. 1. Номера таблиц в прило- жении сопровождаются буквой П, например 5П означает табли- цу 5 в Приложении. Формулы пронумерованы числами, заклю- ченными в скобки, например формула (2.13) означает гл. 2, фор- мулу 13. Пример подбора метода статистической обработки. Требует- ся проверить предположение о том, что между величиной зерен и продолжительностью их созревания у ячменя существует кор- реляционная взаимосвязь (табл. 2.11). В Соответствии с задачей (см. выше) выбираем гл. 2. В начале гл. 2 читаем пояснения, за- тем составляем корреляционную решетку, так как численность выборки больше 30. По расположению частот корреляционной решетки (табл. 2.11) принимаем связь за криволинейную (она встречается значительно чаще прямолинейной, и во всех неясных случаях связь лучше считать криволинейной). Любой из методов, указанных в § 2.05—2.10, можно в рассматриваемом случае применить, но ввиду того, что деление наших данных на классы скорее качественное, чем количествен- ное, выбираем § 2.10, следуя указанию в его начале. Если требуется получить все основные статистические показа- тели совокупности, то лучше сразу обратиться к объединенным схемам расчетов (см. § 1.16 и 1.22). Цифровой материал, подлежащий обработке, должен быть предварительно просмотрен для выявления грубых ошибок, если таковые имеются. Числа, очень сильно отклоняющиеся от осталь- ных, надо обязательно проверить на принадлежность их к дан- ной совокупности (см. § 1.02). Все цифровые данные перед об- работкой следует округлять до одинакового числа знаков после запятой, причем оно должно быть минимальным, но достаточным для достижения требуемой точности выводов. Алгоритмы (последовательные схемы расчетов) излагаемых в книге методов статистической обработки приведены нами по воз- можности полностью, чтобы не возникало затруднений при их освоении у лиц, недостаточно хорошо знакомых с математикой, но в достаточно лаконичной, почти рецептурной форме для того, чтобы яснее была видна схема расчетов. Последовательность расчетов по каждому методу подобрана таким образом, чтобы она соответствовала обычной логике составления программ для ЭВМ. Статистическая терминология объясняется в тех парагра- фах, в которых она впервые употребляется. 4
СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ ВАРИАЦИОННОГО РЯДА Все объекты каждого исследования (растения, животные, урожаи с опытных делянок или вегетационных сосудов, образцы плодов, семян и пр.) образуют так называемую общую, или гене- ральную, совокупность. Термин «совокупность» в статистике от- носят и к полученным в опыте или путем наблюдений числам, ха- рактеризующим с какой-либо одной количественной стороны объ- екты, входящие в данную генеральную совокупность. При этом в статистическую совокупность следует включать лишь числа, от- носящиеся к качественно однородным признакам (свойствам) объекта исследования. Значение отдельного члена совокупности называется вариантой, или датой. При большом числе дат в ге- неральной совокупности можно исследовать ее некоторую часть, которая называется выборкой, или частичной совокупностью. Объем выборки, достаточный для изучения свойств генеральной совокупности, определяется по методам из § 1.24. § 1.01. СОСТАВЛЕНИЕ ВАРИАЦИОННЫХ РЯДОВ Числа совокупности, или выборки (пример таких чисел дается в табл. 1.01), если последняя не очень велика по объему, жела- тельно (но не обязательно) расположить в порядке убывания (или увеличения) их величин — в виде ранжированного невзве- шенного вариационного ряда (см., например, табл. 1.02). Если совокупность или выборка содержат много чисел (см., например, табл. 1.01), то их следует сгруппировать в классы (табл. 1.03) и составить ранжированный взвешенный вариационный ряд (табл. 1.04). Разновидностями таких вариационных рядов явля- ются многоклассовый (см. табл. 1.04) и двухклассовый (табл. 1.05) ряды, причем последний часто называют рядом с альтернативной (дихотомической) изменчивостью вариант. Каждая группа чисел (вариант), на которые разбивается со- вокупность, или выборка, называется классом. Число классов за- висит от величины классового интервала, т. е. разницы между наибольшим и наименьшим значением в пределах каждого клас- са. Классовые интервалы для одного вариационного ряда обычно делают одинаковыми. Иногда делят совокупность на классы по качественным признакам, имеющим нестрого определенное ко- личественное содержание (например, ряды х и у в табл. 2.11). 5
Таблица 1.01. Продолжительность вегетационного периода у 214 сортов ячменя, дни 66 69 63 77 73 66 72 75 75 80 78 63 75 73 74 80 75 78 68 77 82 75 68 72 84 74 65 73 71 81 80 72 79 75 80 78 84 78 67 84 70 65 79 64 72 77 77 77 82 62 77 69 75 66 69 74 81 91 77 81 78 83 78 80 79 76 77 78 77 77 67 82 80 82 80 82 82 78 79 79 86 72 77 74 76 75 79 79 78 82 80 80 84 80 81 80 76 77 75 76 82 80 78 79 77 68 81 80 75 80 78 79 79 78 80 78 78 76 78 73 65 65 67 76 78 67 71 81 76 78 76 72 75 74 70 70 74 84 76 78 73 70 76 71 74 72 75 81 82 75 73 76 69 72 68 71 80 74 72 80 66 79 78 79 64 68 74 80 64 63 65 64 82 74 64 74 64 64 65 68 60 71 77 68 75 76 67 65 70 66 82 74 80 76 72 78 80 80 69 67 88 92 92 65 73 84 73 71 76 72 78 74 80 80 Число вариант, или объем выборки: У = 214 Таблица 1.02. Высота 13 растений сои в виде ранжированного невзвешенного вариационного ряда Варианты х, см Варианты х, см Варианты х, см Варианты х, см 82 74 64 62 77 73 63 54 74 66 63 44 43 S х = 839, #=13 Таблица 1.03. Группировка данных табл. 1.01 по классам Границы класса * 57,5—62,4 62,5—67,4 67,5—72,4 72,5—77,4 77,5—82,4 82,5—87,4 87,5—92,5 Частоты Сумма £□!(□) t°ID it) 1н11°| |°| |°| 1н1 L 1н1 1н11°11°| 1°) 1°) 1=1 □ 2 30 34 62 74 8 4 о
Таблица 1.04. Данные табл. 1.01 в виде ранжированного взвешенного вариационного ряда Границы класса Середина класса Частота Частость, % 57,5—62,4 60 2 0,9 62,5—67,4 65 30 14,0 67,5—72,4 70 34 15,9 /2,5—7/,4 75 62 29,0 77,5—82,4 80 74 34,6 82,5—87,4 85 8 3,7 87,5—92,5 90 4 1,9 5 k= 7 # = 214 100 Таблица 1.05. Число мутантов среди растений ячменя Класс Число растений, или частота Частость % доли единицы 1. Нормальные растения 984 93,71 0,937 2. Мутанты 66 6,29 0,063 Всего просмотрено растений, или объем выборки N = 1050 100 1,000 Число вариант, относящихся к данному классу, называется его частотой. Так, в табл. 1.04 класс 77,5—82.4 имеет частоту 74. Частоты, выраженные в относительных числах, как доли еди- ницы или проценты от общего числа вариант (объема выборки), называют частостями (см. последние столбцы табл. 1.04 и 1.05). Группировка вариант по классам и составление таким обра- зом взвешенных вариационных рядов представляет выборку в легко обозримом виде и облегчает последующие расчеты. Однако любая группировка, при которой истинные значения групп ва- риант, объединяемых в классы, заменяются средними значения- ми классов, вносит неточность в получаемые затем показатели. Большей частью эта неточность невелика и ею можно пренебречь, однако в тех случаях, когда представляется возможность, напри- мер при обработке данных на электронно-вычислительной маши- не, рекомендуется работать с невзвешенным рядом, без разбивки его на классы. Располагая лишь арифмометром и логарифмиче- ской линейкой (минимум вычислительных приборов для биомет- рических расчетов), целесообразно составлять взвешенный ва- риационный ряд при объеме совокупности свыше 50 вариант, а при наличии настольного вычислительного автомата — свыше 150 вариант. Объемы данных, меньше указанных, еще доступны 7
для обработки без их группировки, ибо последняя требует часто много времени и внимания. Составление взвешенных вариацион- ных рядов поддается программированию и может быть выполне- но на ЭВМ. Взвешенный вариационный ряд составляют также и для опре- деления типа распределения обрабатываемых данных. Распре- деление может быть нормальным, биномиальным, пуассоновским или иным (§ 1.25—1.37). Если эмпирическое (полученное в дан- ном опыте) распределение частот вариант близко к нормальному (метод проверки этого соответствия указан в § 1.25), все приво- димые ниже методы применимы к данному материалу (в необ- ходимых случаях в тексте имеются указания об ограничениях применения метода в отношении того или иного типа распреде- ления вариант). Большинство биологических признаков имеет симметричное распределение вариант, близкое к нормальному. Согласно неравенству П. Л. Чебышева из теории вероятностей, при любом типе распределения вариант вероятность отклонения последнего от основного закона нормального распределения, так называемого правила трех сигм, составляет меньше чем 1/9 или равна этому числу. Следовательно, принимая неизвестное рас- пределение вариант за нормальное, можно ошибиться лишь в 11 случаях из 100. Порядок действий при составлении взвешенного вариацион- ного ряда обычно следующий. 1. Определяется величина классового интервала, которая за- висит от принятого числа классов и от объема выборки: c=(xN-xO/(fc-l), (1.01) где с — величина классового интервала; xN— максимальная ва- рианта выборки (в табл. 1.01—это 92); — минимальная ва- рианта (в табл. 1.01—это 60); k — число классов, которое при- нимается обычно от 7 до 15 или цо табл. 1П. Для данных табл. 1.01 по формуле (1.01) с= (92—60)/(7—1) «5, а число классов принято k—7. Классовый интервал выражается целым и дробным числом в зависимости от того, являются ли ва- рианты дискретными, т. е. неделимыми (особи, число зерен, дней и тому подобное) или непрерывными, измеряемыми величинами (длина, ширина, высота, вес и т. п.). Величину классового интервала можно рассчитать также по формуле С = [ (XN—х,) 1 g 2 ] /1 g N, 1 g 2 = 0,30102, или c= [ (xN—xt) ln2]/ln M, или по формуле C= (x„—1), In 2=0,69314, (1.02) (1.03) 8
где N— объем выборки, а прочие обозначения те же, что и в формуле (1.01). По формуле (1.02) для данных табл. 1.01 классовый интервал равен с=[(92—60)lg2]/lg214^4. Такой интервал дал бы около 9 классов, однако для сокращения вычислений и устранения нулевых классов примем классовый ин- тервал, подсчитанный выше, по формуле (1.01): с = 5 дней. Кри- терием правильности выбора величины классового интервала яв- ляется четкое выявление основной тенденции распределения при наименьшей потере информации о форме изгибов кривой и дру- гих существенных особенностях распределения вариант в данной совокупности. Иногда оказывается, что выборка состоит из раз- нокачественных элементов и нулевые (а также очень малочис- ленные) классы служат границей между ними, что можно уста- новить по виду двухвершинной кривой распределения частот и пу- тем анализа собранного материала. Такие выборки для дальней- шей обработки обычно разделяют на две. Классовые интервалы во взвешенном ряду могут быть и не- равными; это вполне оправданно в тех случаях, когда эмпири- ческое распределение при этом становится более информативным в отношении специфики изучаемого материала. Иногда следует принять малую величину интервала в области высокой концент- рации вариант ряда и, напротив большую в областях их низкой концентрации (см. § 1.21). Классовые интервалы по необходимо- сти не равны между собой, когда строится распределение лога- рифмированных чисел или же величины на оси абсцисс представ- ляют собой некоторую прогрессию. При непосредственном рас- пределении дат также обычно получают неравные интервалы, при этом точность вычисляемых показателей возрастает (§ 1.10, в). Расчет статистических показателей взвешенного ряда с неравными интервалами ведется по тем же способам, что и для рядов с равными интервалами, за исключением способов сумм (§ 1.10, а) и тех, в которых кодируют варианты в целых числах (табл. 1.21). 2. Расчет границ классов рекомендуется начать с числа, близ- кого к минимальной варианте, таким образом, чтобы полученные затем срединные значения классов (см. далее п. 3) были по воз- можности малозначными или целыми числами, что сократит объ- ем вычислительной работы. Таким произвольным началом в табл. 1.04 является число 57,5, к которому прибавляем по 5 (с=5), записывая все суммы (границы классов) вплоть до выс- шего класса. Другая граница первого класса — величина 62,4 — получена небольшим уменьшением значения верхней границы второго класса: 62,5—0,1=62,4. Это целесообразно делать для удобства разноски вариант по классам. Все остальные нижние границы классов: 67,4, 72,4 и т. д.— получаются путем последо- вательного прибавления к ним величины классового интервала. 9
Рис. 1. Способы регистрации частот при составлении взвешенных вариант ных рядов посредством комбинаций четырех точек и шести штрихов (я, десяти (в, г) и пяти штрихов (д) Произвольное начало отсчета границ классов, кроме того, жeJ тельно выбирать так, чтобы крайние варианты и xN по возмо ности оказались ближе к середине своих классовых интервале 3. Срединное значение первого класса в табл. 1.04 получе так: (57,5+62,5)/2 = 60 дней. В этом числе нет дробной части б; годаря правильно выбранным границам класса. Все остальн срединные значения классов получаются путем последовател ного прибавления к ним величины классового интервала. Се] дины классов после их получения рассматриваются как варис ты ряда и обозначаются также через х 4. Разноску вариант по классам часто производят «конверг ком», т. е. точками и линиями, последовательные сочетания i торых обозначают числа от 1 до 10 (рис. 1, а, б). Если регист{ ционные пометки при разноске вариант делать только штриха» например знаками «елочка» и «домик», то это уменьшит веро: ность ошибок при их подсчете (рис. 1, в, г). Обозначают чис вариант также пятерками штрихов (рис. 1, д). Сумма част после разноски должна равняться объему выборки (в табл. 1 и 1.04 Af = 214), сумма процентных частостей должна равняп 100%. Если совокупность вариант не вызывает сомнений в oti шении ее качественной однородности, но желательно устраш классы, в которых отсутствуют частоты, следует увеличить кл. совый интервал и повторить работу по разноске вариант сна’ ю
ла. Когда нулевые классы находятся ближе к началу или концу ряда, можно отбросить крайние классы с их частотами (если чис- ло классов достаточно большое), благодаря чему не будут вклю- чены в ряд сильноотклоняющиеся варианты выборки, нередко возникающие из-за ошибок при сборе материала (см. § 1.02). Если форма кривой распределения свидетельствует о «сме- шанном» распределении (две или несколько вершин), это жела- тельно объяснить при биологическом толковании результатов. При помощи принципа взвешенного вариационного ряда лег- ко решают различные задачи на составление многокомпонентных смесей, расчет концентраций и подобные им, а также строят шка- лы балльной оценки. § 1.02. ОЦЕНКА СИЛЬНООТКЛОНЯЮЩИХСЯ ВАРИАНТ Наибольшее значение признака в выборке называется макси- мальной, а наименьшее — минимальной вариантой. Если в ран- жированном вариационном ряду значение максимальной или ми- нимальной варианты чрезмерно велико или мало по сравнению с соседними числами ряда, то необходимо проверить принадлеж- ность к данной совокупности таких резко отклоняющихся вари- ант, которые могут относиться к иному сорту, другой популяции, а также возникнуть из-за грубой ошибки при измерении или под- счете. В подобных случаях резко отклоняющиеся варианты, чуж- дые данной совокупности, должны быть исключены из выборки. Однако это исключение должно быть обосновано посредством количественной оценки отклонения таких вариант. Для максимальной варианты (при нормальном или близком к нему распределении вариант) применяется формула '&N= (xN %n~i) / (xN х2), (1.04) где On— критерий принадлежности максимальной варианты к совокупности; xN — максимальная варианта; xN^ — варианта, следующая по величине за максимальной; х2 — варианта, стоя- щая в ранжированном ряду рядом с минимальной. Проверим, например, принадлежность варианты 82 в табл. 1.02 к данной совокупности: 0^= (82—77)/(82—44) =0,132. Так как вычисленное значение критерия меньше табличного, которое для N = 13 соответствует 0,520 (табл. 2П), то варианту нельзя исключать из выборки. Для минимальной варианты при распределении, не сильно отличающемся от нормального, применяется формула 0’1= (х2 *^i)> (1.05) где О’! — критерий принадлежности минимальной варианты к совокупности; х2 — варианта, стоящая рядом с минимальной; xN_i — вторая по значению варианта после максимальной. Для примера оценим принадлежность варианты 43 в табл. 1.02 к данной совокупности: ^=(44—43)/(77—43) =0,029. 11
Полученное значение критерия меньше табличного (табл. 2П): 0,029<0,520, поэтому отбрасывать варианту не следует. В случае, если резко отклоняются по величине не только край- ние варианты, но и соседние с ними, принадлежность их к данной совокупности оценивается по тем же формулам (1.04, 1.05). На- пример, из вариационного ряда 192, 187, 135, 127, 120, 111, 98, 87, 71, 66, 52, 47, 41, 12, 9 по формуле (1.04) надо проверить ва- рианту 187, а по формуле (1.05) варианту 12. Если эти варианты окажутся чуждыми для данной выборки, то, естественно, вари- анты 192 и 9 также должны быть исключены. Если известно среднее квадратическое отклонение нормально распределенной совокупности, то оценку степени отклонения максимальной или минимальной варианты можно сделать более тоино при помощи табл. ЗП и формул '0’N==(XjV xN_i)/a, (1.06) '0,1=(х2—xj/o, (1.07) где g — среднее квадратическое отклонение (его называют так- же сигмой), остальные обозначения те же, что и к формулам (1.04, 1.05). В § 1.09 вычислена величина сигмы для данного ряда, которая равна 11,98. Повторим процедуру оценки этих же вариант по формулам (1.06, 1.07): 0>= (82—77)/11,98 = 0,42; '0,1=(44—43)/11,98 = 0,08. По табл. ЗП критическое значение для объема совокупности М=10 (принимаем ближайшее меньшее число) при уровне значимости 0,05 (см. об уровнях значимости § 1.03) равно 1,46, что больше вычисленных значений; следова- тельно, нет оснований отбрасывать как максимальную, так и ми- нимальную варианту. Если варианта после описанных способов проверки отбрасывается, то вычисление сигмы следует повторить для новой уменьшенной выборки. § 1.03. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ НЕВЗВЕШЕННОГО РЯДА. УРОВНИ ЗНАЧИМОСТИ Средняя арифметическая — статистический показатель, вы- числяемый в первую очередь при решении различных практиче- ских и научно-теоретических задач. К сожалению, статистическая обработка в ботанике иногда ограничивается определением сред- ней, даже при наличии возможности легко найти количественное выражение варьирования данных, что необходимо для получения затем ошибки средней и других ценных показателей. Например, нередко проводят наблюдения над сортом, образцом или видом по 5—10 растениям, но признак (такой, как высота, начало цве- тения или другой) фиксируют в полевом журнале как визуальное среднее из этой группы растений. Получаемая таким образом «средняя» величина, видимо, обладает некоторой долей досто- верности, но лишена самого главного — границ научно обосно- 12
ванного интервала ее надежности. Между тем достаточно при записи результатов в приведенном примере отметить не визуаль- ную среднюю, а данные по каждому отдельному растению, что- бы после несложной обработки в свободное время получить ис- тинную среднюю арифметическую с показателями варьирования и ошибкой, что значительно повысит ценность результата изме- рения или подсчета. При биохимических и других аналогичных исследованиях, связанных с трудоемкими анализами, получение достаточного числа повторностей нередко затруднительно. В подобных случаях все же следует находить возможности для автоматизации экспе- риментов и совершенствования их методического уровня с тем, чтобы получать в любом случае достаточное число повторностей для всех измерений и анализов. Ошибку средней в биохимиче- ских анализах можно приблизительно определить на основе обоб- щения опыта предыдущих аналогичных анализов, что, естествен- но, является паллиативным решением этого вопроса. В фенологических и некоторых других результатах наблюде- ний вместо средней иногда указывают интервал крайних значе- ний признака, например пишут, что некоторое растение начинает цветение 3—12 мая. Такой способ приведения числовых данных наихудший из всех возможных, так как именно крайние значе- ния признака — самые ненадежные по сравнению со всеми дру- гими из той же выборки, что следует из закона нормального рас- пределения (§ 1.25). Если почему-либо все же нецелесообразно отражать результат в виде средней арифметической, то для не- взвешенного ряда вместо нее следует привести хотя бы медиану (§ 1.15), которая определяется очень просто и точнее отражает тенденцию ряда, чем крайние величины или их полусумма. Средняя арифметическая, являясь основной характеристикой статистической совокупности, отражает уровень, по отношению к которому колеблются значения вариант в ней. Вычисление средней арифметической, показанное в данном параграфе, про- изводится для выборки, варианты которой не сгруппированы и представляют собой невзвешенный ряд, например приведенный в табл. 1.02. При большом объеме выборки целесообразно соста- вить взвешенный вариационный ряд и применить метод из § 1.04. Если при вычислении средней арифметической имеется в виду затем оценить достоверность ее значения и получить, кроме того, другие параметры совокупности, то лучше воспользоваться схе- мой расчета из § 1.16. Ранжирование ряда при вычислении средних величин не обя- зательно. Формула вычисления средней арифметической: M = (Sx)/W, (1.08) где 5} х — сумма всех вариант ряда; N — объем выборки. Порядок работы (данные в табл. 1.02). 1. Подсчитывается число вариант: jV=13. 13
2. Суммируются все варианты данной совокупности: 2*=839. 3. Сумма вариант делится на число вариант: М=839/13 = = 64,5 см. Для оценки достоверности средней вычисляется ее ошибка: (1.09) где тм — ошибка средней арифметической; и — среднее квадра- тическое отклонение, вычисление которого для данного ряда при- ведено в § 1.09, где оно равно 11,98; N — объем выборки. Для ряда из табл. 1.02: Шм = 11,98/}/ 13 = ±3,3 см. Достоверность средней арифметической оценивают по /-кри- терию Стьюдента: t = (1.10) где М — средняя арифметическая; тм — ее ошибка. Для рассматриваемого примера величина критерия равна: t = 64,5/3,3 = 19,5. Число степеней свободы, которое необходимо знать для определения достоверности средней арифметической при помощи табл. 4П, принимается: v = N—1 = 13—1 = 12, где v — число степеней свободы; N — объем выборки. Числом степеней свободы считается число независимых откло- нений отдельных вариант от средней. Из отклонений независимы- ми являются все, кроме одного (Л/—1) последнего, величина ко- торого уже определена остальными отклонениями, и поэтому это отклонение не будет независимым. Табличное значение критерия Стьюдента (табл. 4П) для 5% уровня значимости равно 2,179 и на 0,1% уровне значимости равно 4,318. Полученное значение критерия 19,5 значительно выше табличного, поэтому средняя арифметическая вполне достоверна даже при самой строгой оценке, т. е. на 0,1% уровне значимости. Установлены следующие три уровня значимости в порядке возрастания строгости оценки достоверности биометрических по- казателей (в %): №t = 5, W2 = 1, №3 = 0,1. Им соответствуют в том же порядке возрастания строгости оценки следующие довери* тельные уровни (в %): Pt = 95, Р2 = 99, Р3 = 99,9. Выраженные в долях единицы уровни значимости равны соответственно: №/ = = 0,05; №/ = 0,01 и №/=0,001, а те же доверительные уровни в долях единицы: Р/ = 0,95; Р2,==0,99; Р/ = 0,999. Для биологиче- ских исследований во многих случаях достаточно принимать 5% уровень значимости, или 95% доверительный уровень (что одно и то же), при котором считают достаточным, если подтвердится существенность выводов в 95 случаях из 100. Если вычисленное значение критерия Стьюдента будет мень- ше табличного (из табл. 4П), это может также означать, что не- достаточен объем выборки, по которой найдена средняя арифме- тическая, или же изменчивость вариант слишком велика, или дан- ные неоднородны. 14
Средняя арифметическая в результатах обработки опытных данных должна приводиться вместе с ее ошибкой, например: М±тм = 64,5+3,3 см, но при этом обязательно следует пояснять, что приводится одинарная или двойная величина именно ошибки средней. Для проверки вычислений рекомендуется умножить среднюю арифметическую на объем выборки; полученное число должно равняться сумме вариант. В данном примере MN 64,538-13 = 838,99, что можно считать хорошим совпадением, так как фактическая сумма вариант равна 839 (табл. 1.02). Сумма от- клонений вариант от средней арифметической невзвешенного ряда должна быть равна нулю, что также можно использовать для проверки вычислений: 2(х— М) — 0- Для РяДа из табл. 1.02 эта сумма отклонений равна 0,006 (табл. 1.11). Сумма отклонений вариант от любого другого числа всегда будет больше, чем сум- ма отклонений от средней арифметической. Прибавление ко всем вариантам ряда или вычитание от них одного и того же числа, изменяет среднюю арифметическую на ту же величину. Если объем общей или генеральной совокупности известен, то ошибка средней арифметической тм = <yV(NQ-N)/[N(NQ—V>], (1.11) где о — среднее квадратическое отклонение; No — объем гене- ральной совокупности; N — объем выборки из нее. В примере из § 1.04, где о = 6,07; А/+214, предположим, что 7V0 = 900 сортов, тогда тм = 6,07/(900—214)/[214 (900—1)] = 0,36. Ошибку средней арифметической вычисляют также через от- клонения от средней арифметической: /nM= ]/М)2/[АЦА’ —1)1, (1.12) где тм — ошибка средней арифметической; /, (х— М)2—сумма квадратов отклонений вариант от средней арифметической (она вычислена в табл. 1.11); N— объем выборки. Для данных из табл. 1.02 по формуле (1.12) тм = /1721,23/(13(13—1)] = 3,3. По формуле (1.09) можно найти также объем выборки, если он неизвестен, а сигма и ошибка средней известны: N= (в/тм)2. 15
§ 1.04. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ ВЗВЕШЕННОГО РЯДА Если кроме вычисления средней арифметической для большой группы наблюдений имеется в виду получить также среднее квад- ратическое отклонение, ошибку средней и другие параметры со- вокупности, то лучше пользоваться обобщенной схемой расчета из § 1.22. а. Способ произведений Для больших выборок рекомендуется составить взвешенный вариационный ряд (см. § 1.01), затем вычислить среднюю ариф- метическую: /И = (S^)/(S/) = (1.13) где %xf—сумма произведений середин классов х на соответст- вующие им частоты f; N — объем выборки. Вычисление М по данным о вегетационном периоде ячменя из табл. 1.04 показано в табл. 1.06. Расчеты по формуле (1.13) про- водятся в следующем порядке. Таблица 1.06. К вычислению средней арифметической взвешенного ряда по способу произведений Граница класса Середина класса (варианта) х Частота f xf 57,5—62,4 60 2 120 62,5—67,4 65 30 1950 67,5-72,4 70 34 2 380 72,5—77,4 75 62 4 650 77,5—82,4 80 74 5 920 82,5—87,4 ' 85 8 680 87,5—92,5 90 4 360 с = 5 k = 7 # = 214 16 060 1. Умножаем варианты на их частоты: 60-2=120 и т. д. 2. Суммируем эти произведения: 2*/ = 120+1950+.. .-J-680+ + 360=16060. 3. Полученную сумму делим на объем выборки: М= 16060/ /214 = 75,05. 4. Достоверность полученной средней арифметической оцени- ваем так же, как это было сделано в § 1.03. Среднее квадратиче- ское отклонение для приводимых здесь данных о вегетационном периоде ячменя вычислено в § 1.10 и равно 6,07. 16
5. Получаем ошибку средней арифметической по форму- ле (1.09): /Им = 6,070/1^214 = ±0,415 дня. 6. Вычисляем критерий Стьюдента по формуле (1.10): /= = 75,05/0,415=181. 7. Число степеней свободы равно: v = N—1 = 214—1=213. 8. По табл. 4П, на 5% уровне значимости при 213 степенях свободы /=1,960. Полученное значение критерия достоверности, равное 181, больше табличного, поэтому достоверность средней арифметической не вызывает сомнений. В окончательном виде средняя арифметическая для разбираемого примера записывает- ся так: Л4±/им = 75,0±0,4 дня. Для проверки вычислений реко- мендуется умножить объем выборки на среднюю арифметиче- скую, что должно равняться сумме 2х/ = 214-75,05= 16060,70. Полученная разница 0,70 может быть опущена, так как возникла вследствие принятой в данном расчете точности промежуточных вычислений. Сумма 2 (х — должна равняться нулю (в пределах точ- ности вычислений), что также можно использовать для провер- ки правильности вычислений средней арифметической. При вы- числении М по способу произведений классовый интервал может быть неодинаковым в пределах одного взвешенного ряда распре- деления. б. Способ сумм Когда вариационный ряд состоит из большого числа классов (например, свыше 12), а частоты и середины классов выражают- ся трехзначными и более числами, вычисление М по способу про- изведений требует много времени из-за необходимости перемно- жения многозначных чисел. В подобных случаях и особенно при отсутствии достаточно производительной вычислительной техни- ки можно применить способ суммирования частот вместо их ум- ножения на варианты. По данным табл. 1.07 вычислим способом сумм среднюю дату конца цветения гладиолуса в Москве. В таблице даты конца цветения в столбцах 1, 2 даны в днях от 1 марта (см. табл. 5П). В столбце 2 принимаем за условную среднюю центральную варианту ряда Л = 182,5; при этом можно за условную среднюю взять любую варианту, но желательно, чтобы она была ближе к середине ряда. Частоты из столбца 3 последовательно суммируем до черточки сверху вниз и в нижней половине ряда—снизу вверх, получаем первый ряд сумм частот, из которого таким же образом рассчитываем второй ряд сумм частот. Проверку сумми- рования производим сложением трех центральных частот из столбцов 3 и 4: 230+667+458=1355, результат совпадает с объ- 17
Таблица 1.07. Расчет средней арифметической способом сумм Граница класса, дни от 1 марта Середина класса х Частота f Первый ряд сумм частот Второй ряд сумм частот 1 2 3 4 5 150—154,9 152,5 10 10 10 155—159,9 157,5 15 25 35 160—164,9 162,5 58 83 118 165—169,9 167,5 137 220 338 170—174,9 172,5 226 446 г 784 175—179,9 177,5 221 667 1451 180—184,9 182,5 = А 230 —— —||,и 185—189,9 187,5 145 458 1034 190—194,9 192,5 149 313 576 195—199,9 197,5 94 164 263 200—204,9 202,5 51 70 99 205—209,9 207,5 И 19 29 210—214,9 212,5 6 8 10 215—219,9 217,5 2 2 2 с = 5 £ = 14 W = 1355 емом выборки; следовательно, нет ошибки в составлении первого ряда сумм частот. Средняя арифметическая ЛГ=Л + [(б2-«1)^]с, (1.14) где А—условная средняя ряда, равная 182,5 в табл. 1.07; б2— верхнее число нижней половины второго ряда сумм частот (оно равно 1034); 6t — нижнее число верхней половины второго ряда сумм частот (оно равно 1451/; N — объем совокупности; с — классовый интервал, который должен быть одинаковым в преде- лах одного ряда. По формуле (1.14) Л4= 182,5+1 (Ю34—1451)/1355]-5= 181,0. Ошибка средней арифметической и ее достоверность опреде- ляются по формулам из параграфа 1.03. § 1.05. ОБЩАЯ СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ ПО ЧАСТНЫМ СРЕДНИМ Иногда встречается необходимость получить общую среднюю составной выборки, для каждой из отдельных частей которой средние арифметические уже вычислены. Такая общая средняя арифметическая (1.15) 18
где Ni — объемы отдельных частей выборки; — средние ариф- метические частей выборки; i — порядковые номера частей вы- борки, где п — число частей выборки. Число отдельных частей выборки может быть любое. Если части выборки одинаковы по своему объему, т. е. Nt = N2 = = N3 = .. . = Nn, то формула (1.15) упрощается: М = В качестве примера найдем общую среднюю арифметическую высоты растений гелениума осеннего за четыре года наблюде- ний. Число растений и средняя их высота (в см) по годам были: #1=16, Л11 = 87; У2=16, М2 = 135; Af3 = 20, М3= 103; #4=18, М4= = 89. Общая средняя по формуле (1.15): М=(16-87-М6-135+20.103+18 - 89)/(16+164-20+18)= 103 см. Ошибка общей средней арифметической и ее достоверность определяются по формулам (1.09), (1.10), при этом за N прини- мается весь объем полной выборки, а среднее квадратическое отклонение рассчитывается по способу, указанному в § 1.12. В рассматриваемом примере среднее квадратическое откло- нение объединенной выборки равно 14,82 (расчет не приводится), отсюда ошибка средней арифметической: тл1 = ст/Г = 14,82/1^16+16+204-18= 1,77. Решение вопроса о допустимости объединения тех или иных выборок возможно при помощи различных методов сравнения, а также на основе понятия нормы признака (§ 1.25), которое и применим в нашем примере. В формуле /=(М—Я-)/(У, (1.15а) о — среднее квадратическое отклонение; М — средняя арифмети- ческая объединенной выборки; — средние арифметические частных объединяемых выборок. Нормированное отклонение для каждой из частных выборок: t, = (103—87) /14,82 =1,08; t2 = (103— 135) /14,82 = 3,2; /3 = (103—103)/14,82 = 0; /4 = (103—89)/14,82 = 0,95. Выборки с величиной 1 можно объединять, а при 1 этого делать не следует. Следовательно, первую, третью и чет- вертую выборки можно объединить в одну, а вторую выборку (/> = 3,2) включить в общую выборку нельзя. Небольшое отклоне- ние от единицы у первой выборки в данном случае можно не при- нимать во внимание, так как в ней участвовали только однолет- ние растения, как и в третьей и четвертой выборках. Вторая вы- борка состояла из двухлетних особей гелениума. После исклю- чения некоторой выборки из объединенной расчеты указанных здесь показателей следует повторить. 19
§ 1.06. СРЕДНЯЯ ГАРМОНИЧЕСКАЯ При усреднении величин, представляющих собой изменения скорости каких-либо процессов, как то прироста длины или диа- метра побегов, а также при усреднении индексов, выражающих, в частности, число устьиц на 1 см2 или величин концентрации, например i мг на 1 л, или других подобных отношений, вместо средней арифметической пользуются средней гармонической, ко- торая для невзвешенного вариационного ряда равна: я = лг/(2у)’ (1.16) где Н — средняя гармоническая; N — объем выборки; х— вари- анты выборки. Пример. В результате подсчетов числа устьиц на определен- ной площади по пяти образцам листьев березы бородавчатой по- лучены индексы, представляющие собой число устьиц на 1 см2 (табл. 1.08), которые оказались равными: 5, 7, 10, 13, 15 устьиц на 1 см2. Средняя арифметическая этих индексов по формуле (1.08): Л4=(54-7+10+13+15)/5 = 50/5 = 10 устьиц/см2. Таблица 1.08. К вычислению средней гармонической Номер образца Число устьиц на 1 см2 х 1/Х 100/х 1 5 0,200 20/ 2 7 0,143 14,3 3 10 0,100 10,0 4 13 0,077 7,7 5 15 0,067 6,7 50 0,587 58,7 см2 Средняя гармоническая этих же чисел по формуле (1.16) равна: //=5/(1/54-1/74-1/104-1/13+1/15) =5/0,587=8,52 устьиц/см2. Прямым подсчетом можно доказать,-что в данном случае бо- лее правильно употреблять Н вместо средней арифметической. Так, общая площадь пяти листьев (по одному от каждого образ- ца) при условии, что на каждом из них будет 100 устьиц, равна: 100/5+100/7+100/10+100/13+100/15 = 58,7 см2. Общее число устьиц на этой поверхности, определенное че- рез Ну равно: 58,7-8,52 = 500,1 устьиц, в то время как число усть- иц на той же поверхности, определенное через М=10, составля- 20
ет 58,7-10 = 587 устьиц. Между тем по условию задачи взято 5 листьев по 100 устьиц на каждом, т. е. всего должно быть имен- но 5-100 = 500 устьиц. Как видим, средняя гармоническая пра- вильно отражает суть дела, а средней арифметической пользо- ваться здесь нельзя. § 1.07. СРЕДНЯЯ КВАДРАТИЧЕСКАЯ И СРЕДНЯЯ КУБИЧЕСКАЯ При выведении средних величин для значений площади и объ- ема необходимо согласовать средние по линейным размерам и средние получаемых по ним значений площади и объема. Вычис- ленная по линейным размерам средняя арифметическая обычно дает меньшие значения площади и объема, чем те, которые по- лучают по фактическому линейному размеру. В таких случаях вычисляют среднюю квадратическую для значений линейного па- раметра поверхности и среднюю кубическую для значений линей- ного параметра объема. Средняя квадратическая невзвешенного вариационного ряда (1.17) где х— отдельные варианты линейного параметра; 2*2— сумма квадратов вариант; N — объем выборки. Форма участков поверхности может быть в принципе любой, однако одинаковой или близкой в пределах усредняемой выбор- ки, значения площади в которой должны определяться по одной формуле. Например, по данным табл. 1.09 вычислим среднюю Таблица 1.09. Размеры листьев примулы Длина листовой пластинки х, см Фактическая площадь листа г/, см2 3 7 5 20 6 30 8 55 S х = 22 S у = 112 Мх = 5,500 5 = 5,788 АГ = 28,000 * о квадратическую длины листовой пластинки примулы обратноко- нической и покажем, что пользоваться средней арифметической в этом случае было бы неверно. Площадь листьев примулы мо- жет быть вычислена по уравнению степенной функции: у = = 0,6728х2-1229, где у — площадь листа; х— длина листовой плас- тинки. 21
Средние арифметические ряда х и ряда у равны: 7Их=5,500 см и Му=28,000 см2. Если же подсчитаем среднюю площадь листа у по уравнению, подставив в него среднюю арифметическую длины листовой плас- тинки х = 5,500, то получим: у = 0,6728-5,5002 1229 = 25,000 см2, т. е. средняя арифметическая длины листовой пластинки не соответст- вует истинной величине. Средняя квадратическая длины листо- вой пластинки: S = У (32+52+62+82)/4 = 5,7879. Определяя среднюю площадь листа через среднюю квадрати- ческую, получим: г/=0,6728-5,787921229 = 28,000см2,т.е. то же зна- чение, которое получается по непосредственным значениям пло- щади. Следовательно, средняя квадратическая более верно пе- редает зависимость площади от линейного параметра. Средняя квадратическая взвешенного ряда S=VN-^fx\ (1.18) где 2/х2— сумма произведений частот f на квадраты соответст- вующих вариант х; N— объем выборки. Средняя кубическая вычисляется для определения средней величины линейного параметра, на основании которого рассчи- тывается объем какого-либо тела (шаровидных плодов, пыльцы цветков и т. д.): Q=y ДГ^,*3 (1.19) где х — отдельные варианты линейного параметра; N — объем выборки. Пример. Требуется определить средний радиус трех шаров, имеющих следующие радиусы ,и объемы: 5 см и 522,0250 см3, 6 см и 902,0592 см3, 7 см и 1432,4366 см3. Средние арифметические радиуса и объема соответственно 6 см и 952,1736 см3. Однако если определять средний объем через среднюю арифметическую радиуса, равную 6, то получим средний объем 902,0592, т. е. ве- личину, не совпадающую с фактической. Средняя кубическая значений радиусов: Q = V (53 + 63 + 73)/3 = б, 1091 см. Средний объем шара, вычисленный по формуле (1.19) с ра- диусом, равным средней кубической — 6,1091, в точности совпа- дает с фактическим средним объемом — 952,1736 см3. Средняя кубическая взвешенного вариационного ряда = V N-^fXs, (1.20) где^М3—сумма произведений частот на соответствующие им кубы вариант; N— объем выборки. 22
Проверка правильности вычисления средней квадратической и средней кубической линейных параметров заключается в том, что полученные средние при подстановке в формулы определения площади или объема должны давать фактические площадь или объем. § 1.08. СРЕДНЯЯ ГЕОМЕТРИЧЕСКАЯ При математической обработке данных по темпам количест- венного изменения явлений, например при усреднении темпов роста растений, вместо средней арифметической применяют сред- нюю геометрическую: 6=уйх. (1.21) где П — знак произведения, означает, что все числа, стоящие за ним, следует перемножить, т. е. П%=Х1-х2-*з.. .xN, среди них при этом не должно быть ни одного хг —0; N — число вариант (напри- мер, число периодов времени). При вычислении средней геометрической обычно пользуются логарифмами: lgG = АГ1 2 Igx, где 2 lgx—сумма логарифмов всех вариант; N— объем выборки. Темпы роста площади листьев (табл. 1.10) определяются де- лением площади последующего измерения на площадь предыду- щего: 2,2/1,3 = 1,69; 3,1/2,2= 1,41 и т. д. Таблица 1.10. Рост листа жимолости Сроки изме- рений, дни Средняя площадь листа х, см2 Темп роста x4/xz_i Сроки изме- рений, дни Средняя площадь листа х, см8 Темп роста xi/xi—\ 10 1,3 30 3,1 1,41 20 2,2 1,69 40 3,7 1,19 50 4,6 1,24 Средняя арифметическая из значений темпов роста Л4=-(1,69+1,41 + 1,19+1,24)/4=1,38, а средняя геометрическая lg G = (0,2279+0,1492+0,0755+0,0934)/4 = 0,13652, отсюда G = l,37. Проверка ее вычисления производится по фор- муле xJ.=xiG^i, (1.22) где xN — максимальная варианта, т. е. последнее измерение на- блюдавшегося признака; xt— начальное измерение признака; G — средняя геометрическая; N — число измерений. xN = 1,3-1,374 = 4,58. 23
Полученное по формуле (1.22) значение максимальной вари- анты достаточно близко к фактическому: 4,6 см2, следовательно, средняя геометрическая вычислена верно. Подставляя в форму- лу (1.22) значение Л4=1,38 вместо G = l,37, получаем x.v = 4,71, т. е. больше фактического: 4,71 >4,6, поэтому средней арифмети- ческой здесь пользоваться было бы неправильно. Средняя геометрическая взвешенного ряда вычисляется по формуле или lgG=4-(fllg*l + Ailg*2+/:31g*3 + - • -+fk}gXk), N где х — варианты (середины классов); f — соответствующие им частоты; Af— объем выборки; N = 2Л — число классов. Между рассмотренными средними значениями одной и той же совокупности существует следующее соотношение: ^:S^ZQ, т. е. соответственно по величине средние располагаются от меньшей к большей в следующем порядке: гармоническая, геометрическая, арифметическая, квадратическая, кубическая. Степень различия между средними одной и той же совокупности зависит от величины коэффициента вариации данных этой со- вокупности: чем больше коэффициент вариации, тем больше раз- личаются по величине указанные средние. (О коэффициенте ва- риации см. § 1.13.) Все средние величины на графике кривой распределения ва- риант представляют собой точки на оси абсцисс. § 1.09. СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ НЕВЗВЕШЕННОГО РЯДА О невзвешенном ряде см. § 1.01. Мера варьирования признака в статистической совокупности имеет важное методологическое значение в биометрическом ис- следовании для углубленного познания изучаемого явления. Ве- личина колебаний значений вариант около их средней арифме- тической измеряется средним квадратическим отклонением. Вместе со средней арифметической среднее квадратическое от- клонение о является основой для вычисления многих парамет- ров выборки и других биометрических показателей. Среднее квадратическое отклонение в квадрате называется дисперсией о2. Суть понятия «среднее квадратическое отклонение» видна из табл. 1.11, где отклонения от средней перед их усреднением воз- ведены в квадрат, благодаря чему все отклонения становятся положительными, а также получают большую величину, что по- вышает их значимость и, следовательно, определяет большую 24
Таблица 1.11. Вычисление суммы квадратов отклонений по данным табл. 1.02 Варианта , \ х — М (х — М)2 Варианта х х — М (х —М)2 82 17,462 304,921444 77 12,462 155,301444 74 9,462 89,529444 74 9,462 89,529444 73 8,462 71,605444 66 1,462 2,137444 64 —0,538 0,289444 63 —1,538 2,365444 63 —1,538 2,365444 62 —2,538 6,441444 54 —10,538 111,049444 44 —20,538 421,809444 43 —21,538 463,885444 0,006 1721,230772 чуткость сигмы при измерении ею варьирования признака. Фор- мула (1.24) чаще употребляется при работе на ЭВМ, для невзве- шенных рядов при ручных расчетах применяют обычно формулу (1.25). а. Прямой способ Вычисление сигмы непосредственно через квадраты отклоне- ний от средней требует меньшего числа операций, чем по осталь- ным способам: а = + К[2 (х-М)2] /(N - 1), (1.24) где о — среднее квадратическое отклонение; х — варианты сово- купности; М — средняя арифметическая; N — объем выборки. Перед знаком корня в формуле (1.24) всегда принимается знак плюс. Вычисление сигмы для невзвешенного ряда по этой формуле проводится в следующем порядке (табл. 1.11). 1. Определить среднюю арифметическую М. Для данного ряда она вычислена в § 1.03 и равна 64,538. 2. Найти отклонения вариант путем вычитания от каждой из них средней арифметической: х— М. Вычитая: 82—64,538= = 17,462; 77 — 64,538 и т. д., получим второй столбец табл. 1.11, сумма которого должна равняться нулю. В нашем случае 2i(*—М) = 0,006, что можно считать удовлетворительным при- ближением к нулю. 3. Возвести в квадрат отклонения и получить их сумму: 2 (х — МУ = 1721,230772. 4. Вычислить сигму по формуле (1.24): о = + V 1721,230772/(13—1) = 11,98. 25
В промежуточных вычислениях статистических показателей обычно сохраняется число знаков, достаточное для получения не- обходимой их точности, сами же показатели приводятся с чис- лом знаков, имеющим реальное значение. б. Способ условной средней Для облегчения расчетов по данному способу, особенно при многозначных вариантах, используется свойство среднего квад- ратического отклонения не изменять свою величину в зависимо- сти от величины числа, от которого отсчитываются отклонения. Если прибавить ко всем вариантам ряда одно и то же число или вычесть его из них, то величина сигмы от этого не изменится. За условную среднюю арифметическую можно принять любое чис- ло А. Если взять это число целым, близким к средней арифмети- ческой, или равным нулю, то вычисления становятся менее тру- доемкими. Для вычисления сигмы невзвешенного ряда при руч- ном счете часто используют формулы (1.25) и (1.27). Вычислим сигму невзвешенного вариационного ряда через от- клонения вариант от условной средней Л = 64. Для этого понадо- бятся только столбцы 1, 3, 4 табл. 1.12. В столбце 3 таблицы при- ведены разности числа А с каждой из вариант. Сумма разностей с учетом знаков равна 4-7. В столбце 4 разности возведены в квадрат, сумма квадратов разностей равна 1725. Проверка про- межуточных вычислений делается повторением расчета с другой условной средней, при этом должно выполняться условие: Таблица 1.12. Вычисление суммы квадратов отклонений от условной средней А и от нуля Варианта х Квадрат варианты X2 х — А (х — А)2 х — 65 1 2 з. 4 5 82 6 724 18 324 ' 16 77 5 929 13 169 и 74 5 476 10 100 8 74 5 476 10 100 8 73 5 329 9 81 7 С 66 4 356 2 4 0 А = 64 4 096 0 0 —2 63 3 969 —1 1 —3 63 3 969 —1 1 —3 62 3 844 —2 4 —4 54 2 916 —10 100 —12 1936 —20 400 —22 43 1 849 —21 441 —23 839 55 869 ' | 7 1725 —19
Afpi—Д2| = 2. (x — Лг) + 2. (x — A) ’ где N— объем сово- купности; Ль А2 — первая и вторая условные средние; 2(* — А) и 2(х — Л2)—суммы отклонений вариант от этих средних. В столбце 5 табл. 1.12 приведены отклонения от второй услов- ной средней Л2 = 66, вычисленные только с целью проверки про- межуточных расчетов. Три члена последней формулы заключе- ны в прямые скобки; это обозначает, что перед ними в любом случае ставится знак плюс. По нашим данным: 13|64—661 = = 7| + |19|, 26 = 26; следовательно, соответствующие расчеты выполнены верно. Знак суммы отклонений зависит от положения условной средней: если Л>Л4, то 2(х— 4X0, а если Л<Л4, то 2 (х - Л)>0. Сигму вычисляем по формуле 0 =+ /{2^-<-^-i[2(x-+|2;/(w-d О-25) где о — среднее квадратическое отклонение;2 (х— 4)2— сумма квадратов отклонений вариант от условной средней Л=64; — сумма отклонений, возведенная в квадрат; У— число вариант. По формуле (1.25) о = + V (1725—72/13)/( 13—1) = 11,98. Средняя арифметическая М=Д + ДГ12(х — Л), М = 64+7/13=64,54. (1.26) Обозначения в формуле (1.26) те же, что и в (1.25). Когда ус- ловные отклонения отсчитываются не от числа, близкого к сред- ней арифметической, а от нуля (Л = 0), тогда формула (1.25) примет вид а = +|/ [£х2 — /V-i[2x)2]/(/V— 1). (1.27) где о — среднее квадратическое отклонение; 2*2— сумма квад- ратов вариант; (2х) —квадрат суммы вариант; N — объем вы- борки. Формулу (1.27) рекомендуется применять при однознач- ных вариантах. Если данные двузначные и выше и тем более если ряды большие, то рекомендуется формула (1.25), которая, значительно облегчая вычисления, не делает их менее точными. Для вычисления сигмы по формуле (1.27) нужны лишь столб- цы 1 и 2 табл. 1.12. 1. Суммируем варианты:2х = 839. 27
2. Возводим в квадрат все варианты и суммируем их: 2 х2 = 55 869. 3. По формуле (1.27) о = /(55 869—8392/13)/( 13— 1) - +11,98. в. Способ квадрата средней арифметической Формула (1.28) расчета сигмы может употребляться в тех случаях, когда уже известна с достаточной точностью средняя арифметическая данного ряда: »=+Ч (^-(1-28> где о — среднее квадратическое отклонение; ^х2—сумма квад- ратов вариант; N — объем выборки; М — средняя арифметиче- ская данного ряда. При больших объемах выборок множитель Af/f/V—1) можно принять за единицу. Для данных табл. 1.12 по формуле (1.28) а = 1//55869 _64 5382р_13_ = ц 98. “ \ 13 / '13— 1 Определение ошибки сигмы и метод проверки ее вычисления см. в § 1.10. § 1.Ю. СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ ВЗВЕШЕННОГО РЯДА а. СпосЪб сумм Вычисление сигмы взвешенного ряда по способу сумм наибо- лее просто, однако в случае резко асимметричного ряда требу- ется подбор подходящего способа (см. § 1.18). Данный способ сумм целесообразно применять при ручном счете и симметрич- ных рядах, если варианты и частоты ряда — большие числа, осо- бенно если ряд сравнительно длинный, например при числе клас- сов больше 12. Вычислим сигму по этому способу для вариационного ряда распределения сортов ячменя по продолжительности вегетацион- ного периода в днях, которая приведена в столбце 1 табл. 1.13 (середины классов), а в столбце 2 — соответствующее число сор- тов ячменя, или частоты. 1. Требуемый для расчетов вариационный ряд в нашем при- мере уже составлен (в табл. 1.13 приведены данные из табл. 1.04). 28
Таблица 1.13. Вычисление полусумм накопленных частот Варианта х Частота f 1-й ряд накопленных частот 2-й ряд накопленных частот <7t = 102 = 20 1 2 3 4 90 4 4 4 85 8 12 16 80 74 86 — 75 62 — 70 34 66 — 65 30 32 34 to 2 2 2 с = 5 N = 214 <7з = 100 <74 = 36 2. Против среднего класса ряда (его варианта — 75) в столб- цах 3 и 4 ставим 4 черточки точно так, как это показано в табл. 1.13. 3. Против крайних частот (4 и 2) записываем те же самые частоты в столбцах 3 и 4. 4. В столбце 3 составляем первый ряд накопленных частот сверху вниз: 4+8=12, 12+74 = 86. Поскольку дальше вниз стоит черта, накопление частот прекращаем, и таким же образом, но снизу вверх получаем накопленные частоты нижней половины первого ряда: 2+30 = 32, 32+34 = 66, дальше идет черта, накоп- ление прекращаем. 5. Составляем второй ряд накопленных частот сверху: 4+12 = = 16, ниже идут три черты. Частоты второго ряда, начиная сни- зу, накапливаем так: 2+32 = 34, выше идут те же 3 черты, на- копление частот закончено. Проверка правильности составления обоих рядов накопленных частот заключается в том, что три центральных числа вокруг первой черты должны в сумме дать объем выборки: 62+86+66 = 214 = ^, а прочие числа около четы- рех черточек равны: 86+16= 102 = q{, 66+34= 100 = 73. 6. Суммируем верхнюю и нижнюю половины каждого из двух рядов накопленных частот: qt = 44-124-86= 102, ^ = 4+16 = 20, 7з=-66+32+2= 100, 74 = 34+2 = 36. 7. Вычисляем среднее квадратическое отклонение: о = с /[<7! + <7з + 2 (<у2 + <?4) — W 1 (<?! — <7з)2]/(N — 1), (1.29) где о — среднее квадратическое отклонение; с — классовый ин- тервал; 7i — верхняя полусумма первого ряда накопленных час- 29
тот; qs — нижняя полусумма первого ряда; q2— верхняя полусум- ма второго ряда накопленных частот; д4— нижняя полусумма второго ряда; W— объем выборки. Средняя арифметическая в данном случае попутно вычисля- ется по формуле М=Д+^^(91_9з), (1.30) где А — начало отсчета полусумм; с — классовый интервал; — верхняя полусумма первого ряда накопленных частот; q3 — ниж- няя полусумма того же ряда; N — объем выборки. Подставляя в формулу (1.30) данные табл. 1.13, получаем М = 754- [ 5 (102— 100) ] /214 = 75,05. Подставляя значения полусумм из табл. 1.13 в формулу (1.29), получаем _ 5 д / 102 -4- 100 + 2 (20 4- 36) — (102 — 100)2/214 _ g q6 ° ~ ' 214—1 ~ ’ Ошибка среднего квадратического отклонения вычисляется по формуле mo=o(2N)-^ (1.31) или (при небольших выборках) та = а/1/Л2(У-1), (1.32) где о — среднее квадратическое отклонение; N — объем выборки. Для сигмы, полученной по данным табл. 1.13, по формуле (1.31) ошибка равна: т0 = = ±0,29. Таким образом, в нашем примере о = 6,06±0,29. Когда распределение часто! исследуемого ряда сильно отли- чается от нормального, лучше вычислять ошибку сигмы по более универсальной формуле та = У(Н4— Н|)/(4М0, (1.33) где та — ошибка среднего квадратического отклонения; ц4 — центральный момент четвертого порядка (см. § 1.18); р2 — цент- ральный момент второго порядка (см. § 1.18); N — объем вы- борки. Подставляя значения моментов, вычисленные в § 1.18, для той же величины сигмы получим ошибку по формуле (1.33) та = \f (3519,947—36,682)/(4 • 36,68 • 214) = 0,263. Несколько сокращает вычисления формула tnG = 0,5 V(P2V4 — Н2) N (1.34) 30
При известной ошибке средней арифметической тм можно получить тот же результат по формуле то = 0,5 V(p2/V) +4 — tn2M, (1.35) где обозначения те же, что и в формуле (1.33). Приблизительная проверка вычисления сигмы может быть сделана по соотношениям л^^Л4+Зо, х^М—Зег, (1.35а) где xN—максимальная варианта выборки; М — средняя арифме- тическая; о — среднее квадратическое отклонение; xt — мини- мальная варианта. Для рассматриваемого здесь примера xN = 75,047+3-6,06^ ^93 дня; ^ = 75,047—3-6,06^57 дней; фактически Xjv = 92 дня, а %! = 60 дней (см. табл. 1.01), что можно считать удовлетвори- тельным совпадением. Вычисление ошибок среднего квадратического отклонения и средней арифметической можно приближенно проверить при по- мощи существующего соотношения между ними: та/тм = 0,70711. (1.356) Для рассматриваемого примера 0,29/0,415 = 0,7, что можно считать удовлетворительным результатом. б. Способ условной средней Ниже приведенная схема расчета сигмы взвешенного ряда яв- ляется наиболее распространенной и применяется для сокраще- ния вычислительной работы, особенно тогда, когда варианты (се- редины классов) и соответствующие им частоты выражены мно- гозначными числами. Расчет необходимых сумм для подстанов- ки в формулу (1.36) приведен в табл. 1.14, где обработан ряд из Таблица 1.14. К расчету сигмы взвешенного ряда по способу отклонений от условной средней Варианта (середина класса) х Частота f Условное отклонение а fa fa2 а fa 90 4 + 3 +12 36 2 8 85 8 4 2 +16 32 1 8 80 74 4-1 +74 74 0 0 А = 75 62 0 0 0 —1 —62 70 34 —1 —34 34 —2 —68 65 30 —2 —60 120 —3 —90 СО 2 —3 —6 18 —4 —8 с = 5 N = 214 а — (х—А)/с +2 314 4 = 80 —212 31
табл. 1.04. (У = + с ’К|2 fc2 — К'1 (S — 1)’ (1.36) где а — среднее квадратическое отклонение; с — классовый ин- тервал; f — частоты ряда; а — условные отклонения вариант от А = 75; N — объем выборки. Порядок действий. 1. Выбираем начальную точку отсчета (условную среднюю), расположенную в середине ряда и возможно ближе к максималь- ной частоте: Л = 75. 2. Против класса с вариантой 75 (в столбце 3) записываем условное отклонение 0, затем вверх с плюсом, а вниз с минусом записываем отклонения в виде порядковых чисел: 1, 2, 3, 4, ... и т. д. по числу классов. Если варианты ряда (столбец 1) воз- растают не так, как в табл. 1.13, а наоборот, т. е. сверху вниз, то отклонения из верхней половины ряда будут отрицательными, а из нижней половины ряда — положительными. 3. Перемножаем условные отклонения на частоты f: +3-4 = = 4-12; 4-2-8 = 4-16 и т. д. (столбец 4). 4. Числа столбца 4 умножаем по строкам на соответствующие числа столбца 3: 12-3 — 36, 16-2 — 32 и т. д. (столбец 5). 5. Суммируя числа столбцов 4 и 5, получаем £Л* = +2 и 2 fa2 = 314. 6. Подставим суммы 4"2 и 314 в формулу (1.36): о = 5 /(314—22/214)/(214—1) = 6,06. Средняя арифметическая M^A + ^c^fa, (1.37) где А — начало отсчета условных отклонений, или условная сред- няя; с — классовый интервал; — сумма произведений частот на условные отклонения; N — объем выборки. Частное называется первым условным моментом В приведенном примере Л4 = 754-5- 2/214=75,05. 7. Проверку расчета М делаем повторением вычислений сум- мы отклонений от другой условной средней. В столбцах 6 и 7 исключительно для этой цели составлены отклонения от новой условной средней Л2 = 80 и произведения отклонений на те же частоты. Если Ах<сМ<^А2, то должно выполняться условие 2^ 2^ = если Л1<Д2<Л4 или Л1>42>Л4, то долж- но выполняться условие V fa — V fa =N. Заключение сумм 6mm J 2 в прямые скобки означает, что независимо от их фактического знака перед ними всегда ставится знак плюс. Так как 75<СЛ1 = 32
= 75,05<80, то выбираем первую из двух формул проверки и по- лучаем: 2+212 = 214, т. е. условие выполняется. Средняя арифме- тическая, вычисленная по второй сумме отклонений fa = = —212, равна: Л4 = 80+[5-(—212) ]/214 = 75,05, т. е. тому же значению, что и при вычислении по первой сумме отклонений. Вычисление ошибки сигмы приводится в § 1.10, а, ошибка и оцен- ка М — в § 1.03. в. Способ непосредственного распределения дат Эту схему расчета удобно применять, если все варианты вы- борки — малозначные целые числа и среди них много повторяю- щихся. Формула для вычисления сигмы по способу в: ст = + /[2 fx2 — N-1 (2 /х)2] /(N — 1) (1.38) где б — среднее квадратическое отклонение; 2/х2— сУмма ПР°" изведений частот на квадраты вариант; ^fx — сумма произведе- ний частот на варианты; N— объем выборки. Порядок действий (на примере данных из табл. 1.01). 1. Выписываем поочередно в столбец 1 табл. 1.15 все вариан- ты и отмечаем в столбце 2, сколько раз каждая из них встрети- лась в выборке. Таблица 1.15. К вычислению среднего квадратического отклонения по способу в) Варианта X Часто- та f fx fx* Варианта X Часто- та f fx fx" 1 2 3 4 1 2 3 4 92 2 184 16 928 75 14 1050 78 750 91 1 91 8281 74 13 962 71188 88 1 88 7 744 73 8 584 42 632 86 1 86 7 396 72 11 792 57 024 84 6 504 42 336 71 6 426 30 246 83 1 83 6 889 70 5 350 24 500 82 11 902 73 964 69 5 345 23 805 81 7 567 45 927 68 7 476 32 368 80 23 1840 147 200 67 6 402 26 934 79 12 948 74 892 66 5 330 21 780 78 21 1638 127 764 65 8 520 33 800 77 14 1 078 83 006 64 7 448 28 672 76 14 1064 80 864 63 3 189 11 907 62 1 62 3 844 60 1 60 3 600 214 16 069 1214 241 2 Г. Н. Зайцев 33
2. Умножаем варианты на их частоты (столбец 3). 3. Числа третьего столбца множим на числа первого столбца, результаты записываем в столбце 4. 4. Суммируем числа каждого столбца, кроме первого: 7V = 214„ 2л= 16069, 2№= 1 214241. 5. Подставляем полученные суммы в формулу (1.38): а = VU 214 241—16 0692/214)/(214—1) = 5,989. Одновременно вычислим среднюю арифметическую (1.13): М = 16069/214 = 75,09. Вычисление ошибки среднего квадратического отклонения — см. § 1.10, а, а ошибки М — см. § 1.03. Одним из достоинств способа непосредственного распределе- ния дат является также то, что в этом случае отпадает необхо- димость введения так называемой поправки Шеппарда (см. § 1.18) к величине сигмы. г. Способ произведений Этот способ вычисления сигмы отличается от предыдущего тем, что здесь составляется взвешенный вариационный ряд с равными классовыми интервалами, а по способу в интервалы могут быть неравными. Напомним, что наиболее простым по тех- нике вычислительной работы является способ б, который и ре- комендуется при симметричных распределениях в большинстве случаев. Для вычисления сигмы по способу произведений ис- пользуется формула (1.38). Порядок работы (табл. 1.16). Таблица 1.16. К вычислению сигмы по способу произведений Варианта (середина класса) х Часто- та f fx fx2 Варианта (середина класса) х Часто- та f fx fx‘ 60 2 120 7 200 80 74 5 920 473 600 65 30 1950 126 750 85 8 680 57 800 70 34 2380 166 600 90 4 360 32 400 75 62 4 650 348 750 214 16060 1 213100 1. Перемножая частоты из столбца 2 на соответствующие се- редины классов из столбца 1, получаем числа столбца 3 табли- цы: 120, 1950 и т. д. 2. Числа столбца 3 последовательно множим на варианты: 120-60- 7200, 1950-65=126 750 и т. д. 3. Суммируя числа каждого столбца, кроме первого, полу- чаем: # = 214, 2М=1б°60; 2/^=1213100. 34
4. По формуле (1.38) о = / (1 213 100—16 0602/214)/(214—1) = 6,07. Средняя арифметическая в данном случае может быть полу- чена по формуле (1.13): М = 16060/214 = 75,05. д. Прямой способ Для машинного счета удобна при вычислении сигмы форму- ла (1.24), написанная в применении к взвешенному ряду: ° = +|/ 2(х-Л4)7/(ЛГ-1). (1.38а) где о — среднее квадратическое отклонение; 2(х—M)2f— сумма произведений квадратов отклонений вариант от средней на со- ответствующие частоты; У— объем выборки. Напомним, что формула 2(х — Л4)/= 0, в пределах точности расчетов служит для проверки вычислений средней арифметиче- ской и отклонений от нее. Пример обработки ряда по этому способу дан в § 1.34. Опре- деление ошибки сигмы рассматривается в § 1.10, а расчет ошибки и оценка М приводятся в § 1.03. § 1Л1. ПРИБЛИЖЕННЫЕ СПОСОБЫ ВЫЧИСЛЕНИЯ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ При планировании эксперимента может возникнуть необхо- димость определить, хотя бы приблизительно, объем выборки, достаточный для получения достоверных результатов или выво- дов по тому или иному вопросу. Для этого вычисляют прибли- женное значение среднего квадратического отклонения по спо- собу случайных серий, размаху варьирования данных и по вели- чине коэффициента вариации, что значительно облегчает расче- ты и в то же время позволяет получить значение сигмы с точ- ностью, приемлемой для названной цели. Вычисление сигмы по способу случайных серий на примере данных табл. 1.01 прово- дится следующим образом. 1. Неранжированная выборка разбивается на случайные се- рии, по 9 вариант в каждой, так, чтобы в эти серии попали мак- симальная и минимальная варианты (если выборка берется не- полностью). Если выборка берется полностью и число ее вариант не кратно 9, то допустим случай, когда некоторые серии могут перекрывать друг друга так, что их крайние варианты будут об- щими для граничащих серий. Левая половина табл. 1.01 обра- зует 12 строк, которые примем за случайные серии по 9 вариант в каждой: сверху вниз 1-я строка — первая серия, 2-я строка — вторая серия. 35 2*
2. Подсчитаем размах вариации в сериях, для чего из макси- мальной варианты каждой серии вычитаем минимальную вари- анту этой же серии (столбец 4 табл. 1.17). Таблица 1.17. К вычислению сигмы по способу случайных серий Серия XN Xi XN Xl Серия XN Xi XN Xl 1 77 63 14 2 84 65 19 3 84 64 20 4 91 69 22 5 86 78 8 6 84 75 9 7 80 75 5 8 81 70 11 9 82 69 13 10 80 64 16 11 77 60 17 12 92 65 27 S = 181 3. Средний размах получается от деления суммы размахов (181) всех серий на их число: п = 12. __ 4. Полученное число делим на 3(3=f9). Если бы вместо девя- ток разбивали совокупность на четверки, то делили бы не на 3, а на 2 (2 = f4). Указанные действия отображены в формуле а = [2(*л/-*1)]/(Зп), (1-39) где о — среднее квадратическое отклонение; xN— максимальная варианта каждой серии; х4— минимальная варианта серии; п — число серий. Для данных табл. 1.01 и 1.17 а= 181/(3* 12) =5,03. Точное зна- чение сигмы для вегетационного периода сортов ячменя равно 5,989 (§ 1.10, в). При нормальном распределении вариант весь размах варьи- рования (xN— х4) занимает около 6о. На этом основан прибли- женный метод вычисления сигмы по размаху варьирования: a==6-1(xJv-x1)) (1.40) или: a = — х4), (1.41) где о — среднее квадратическое отклонение; xN— максимальная варианта выборки; х4 — минимальная варианта; h — коэффици- ент, выбираемый по табл. 6П. Для ряда из табл. 1.02 по табл. 6П й=3,5; по формуле (1.41) а= (82—43)/3,5= 11,14. Точное значение сигмы этого ряда — 11,976 (см. § 1.09, б). В тех случаях, когда при планировании опыта известно пред- полагаемое значение средней арифметической данной совокуп- 36
ности и примерная, хотя бы определенная глазомерно, величина коэффициента вариации (см. § 1.13), можно определить прибли- женно среднее квадратическое отклонение для установления ми- нимального в данном эксперименте объема выборки по преобра- зованной формуле (1.43): <з= 100—1 Mv, где о — среднее квадра- тическое отклонение; М — средняя арифметическая; v — прибли- зительное значение коэффициента вариации. Например, предпо- лагаемая средняя длина листьев традесканции Л4 = 40 мм и по глазомерной оценке v=10%, отсюда <j = 40-10/100 = 4 мм. Найденное приближенное значение сигмы можно использо- вать для определения требуемой численности выборки при пла- нировании эксперимента по формуле (1.102). § М2. ОБЪЕДИНЕНИЕ ВЫБОРОК ПО ИХ ДИСПЕРСИЯМ В § 1.05 было показано, как объединить выборки по их сред- ним арифметическим. Часто при этом требуется также найти и среднюю дисперсию объединенной выборки: о2 = [S {Ni - 1 )0?]/(2 м- - , (1.42) где а»2 — дисперсии частных выборок; — объемы частных выборок; k — число частных выборок. Вычислим среднюю дисперсию для четырех групп измерений диаметра цветков гелениума осеннего: ai2 = 2,00; Л^ = 7; о22 = 3,35; Af2 = 5; о32 = 2,95; 7V3 = 8; а42 = 4,37; АГ4=9. По формуле (1.42) 2 _ [(7-1)2,00+(5-1)3,35+(8-1)2,95+(9-1)4,371 о 94 (J -------------------------------------------0,^4, (7+5+8+9—4) откуда о = 1^3,24 = 1,80. § 1.13. КОЭФФИЦИЕНТ ВАРИАЦИИ Среднее квадратическое отклонение характеризует степень отклонения вариант данной совокупности от среднего арифмети- ческого в абсолютных числах. Однако для сравнения вариабель- ности двух или более совокупностей величины сигмы не могут быть использованы, за исключением редкого случая, когда сред- ние арифметические одинаковы или очень близки друг к другу. Во всех остальных случаях для сравнения совокупностей по их вариабельности необходимо вычислять коэффициент вариации. Коэффициент вариации показывает, какой процент состав- ляет сигма от средней арифметической, и позволяет сравнивать совокупности между собой по степени варьирования. Коэффици- ент вариации имеет важное значение в биологии и агрономии, 37
например для установления степени выровненности популяции или сорта по тому или иному признаку. Для оценки различных биологических признаков по степени их варьирования рекомендуется применять шестибалльную шка- лу, приведенную в конце данного параграфа. Коэффициент вариации для чисел с одинаковым знаком вы- числяют по формуле и = а-100/Л4, (1.43) где v — коэффициент вариации; М — средняя арифметическая; а — среднее квадратическое отклонение. Варьирование продолжительности вегетационного периода у сортов ячменя (по данным табл. 1.04 и § 1.10) v = 6,06-100/ /75,047 = 8,1%. Следовательно, изученные сорта ячменя сравни- тельно мало варьируют по продолжительности вегетационного периода и относятся ко второму баллу вариабельности. Для данных по высоте растений сои (табл. 1.02 и § 1.09) v — = 11,976• 100/64,538= 18,6%. Растения сои также имеют неболь- шое варьирование данных по высоте, или, точнее, нормальное, и относятся ко второму баллу вариабельности. Иногда при вычислении ошибки средней арифметической, на- пример по формуле (1.11), значение сигмы не фиксируют. Вели- чина коэффициента вариации в таких случаях v = 100М"1 mMyN, (1.44) где тм — ошибка средней арифметической; N — объем совокуп- ности; М — средняя арифметическая. Для определения коэффициента вариации, минуя вычисление сигмы, полезна формула v = 100 У — — (1.45) Например, по данным табл. 1.12 а= 11,98; Л4 = 64,54; 2х2 = = 55869; ЛГ=13; V — 100 1/7_55869__ i3V(i3_ i)= 19о/ Г ( 64,542 JI V ' что практически совпадает с результатом, вычисленным по фор- муле (1.43). Ошибка коэффициента вариации mv = v -/АГ1 (0,5+0,0001 и2), (1.46) где v — коэффициент вариации; N — объем выборки. Чаще для вычисления ошибки коэффициента вариации поль- зуются менее точной формулой: mv= v/^ZN, (1.47) где обозначения те же, что и в формуле (1.46). 38
Для рассматриваемого примера о продолжительности веге- тационного периода ячменя ошибка его коэффициента вариации по формуле (1.46) /пг = 8,1У(0,5 + 0,0001-8,12)/214= ±0,394%, апо формуле (1.47) mr = 8,iy2-214= ±0,391 %. Оба результата прак- тически совпадают, следовательно, при отсутствии особо высо- ких требований к точности определения ошибки коэффициента вариации можно пользоваться формулой (1.47). О вычислении коэффициента вариации совокупности с альтернативным разде- лением вариант — см. § 1.26. Если прибавить ко всем вариантам ряда одно и то же число п или вычесть его из них, то величина коэффициента вариации будет <?= (100 о)/(Л1±лг). (1.48) Если данные представляют собой смесь отрицательных и по- ложительных чисел, как, например, это бывает при обработке результатов измерения температуры, то коэффициент вариации следует вычислять по формуле иМЮОоШЫ+М). (1.49) где (для двух последних формул) о — среднее квадратическое отклонение; |xj—наименьшая отрицательная варианта ряда без знака; М — средняя арифметическая. В формуле (1.49) принято во внимание то, что при вычисле- нии коэффициента вариации средняя арифметическая, так же как и сигма, должна быть представлена в виде отрезка на чис- ловой оси. Алгоритм вычисления коэффициента вариации для относительных или рациональных чисел покажем на следующем примере. Для ряда из 6 чисел —3, —2, —1, 0, +1, +2 средняя арифметическая равна —0,5; а сигма 1,87, следовательно, по формуле (1.43) было бы: v= 1,87-100/(—0,5)=—374%, чего не может быть для такого небольшого варьирования данных. Если же М измерить как отрезок от точки —3 до точки —0,5, то она равна |—3| + (—0,5) =2,5; а по формуле (1.49) коэффициент ва- риации v = (100 • 1,87)/(| - 3 | + (- 0,5)) = 75 %, что гораздо ближе соответствует реальности. В § 1.37 рассмотрена аппроксимация логнормальным распре- делением результатов изучения варьирования 165 различных признаков растений и предложена шкала (в %): 1) небольшое варьирование — от 0 до 4; 2) и 3) нормальное — от 5 до 44; 4) значительное — от 45 до 64; 5) большое — от 65 до 84; 6) очень большое — от 85 до 104; 7) аномальное — от 105 и больше. В пре- делах интервала нормы, т. е. второго и третьего баллов, варьи- рование может различаться: 2) от 5 до 24 — «нижняя» норма; 3) от 25 до 44 — «верхняя» норма. В последнем числовом примере варьирование относится к пя- тому баллу и считается большим. 39
§ 1.14. ПОКАЗАТЕЛЬ ТОЧНОСТИ ОПЫТА Показатель точности опыта выражает величину ошибки средней арифметической в процентах от самой средней арифме- тической и таким образом служит показателем точности опреде- ления последней. Чем больше этот показатель, т. е. процент ошибки, тем меньше точность опыта. Показатель точности опыта Р—тм-100/М% (1.50) или P = v/tfN, (1.51) где М — средняя арифметическая; тм — ошибка средней ариф- метической; v — коэффициент вариации; А7— объем выборки. Для данных по вегетационному периоду ячменя 74=75,05 и ошиб- ка тм= ±0,415. Отсюда показатель точности опыта (1.50) Р = = 0,415-100/75,05 = 0,55%. Ошибка показателя точности опыта тР = ±Р /(l/2W) + (P/100)2, (1.52) где обозначения те же, что и в формуле (1.51). Для того же числового примера тР = ±0,55 V (1/2-214)+ (0,55/100)2 = ±0,0268. В результате Р = 0,55±0,03%. Точность опыта считается удовлетворительной, если величи- на показателя не превышает 5%. При значениях, больших 5%, рекомендуется увеличить число наблюдений, или повторностей. Иногда можно снизить величину Р, если повысить точность из- мерений объектов опыта. §.1.15. МЕДИАНА Варианта, которая разделяет ряд на две равные по числу вариант части, называется медианой. Порядковый номер медиан- ной варианты от начала ранжированного невзвешенного и взве- шенного рядов можно определить по выражению 0,5 (А7±1). Ис- пользуется медиана как средний показатель описательного типа или в качестве средней положения и для непараметрического теста медианы. Медиана взвешенного ряда Me = xe + cl(O,5A7-L)/fe], (1.53) где хе — начало класса, в котором находится медиана; с — вели- чина классового интервала; N — объем выборки; L — сумма ча- стот классов (начиная с меньшего), предшествующих классу, в котором находится медиана; fe — частота медианного класса. Рассчитаем медиану вегетационного периода совокупности сортов ячменя по данным табл. 1.04. Порядковый номер медиан- ной варианты 0,5 (214+1) = 107,5. Класс, в котором находится 40
медиана, определяется путем накопления частот. Так, в табл. 1.04 сумма частот сверху вниз равна: 2 + 30 + 34 + 62=128. Поскольку между вариантами 107 и 128 должна находиться медиана, на- копление частот прекращаем и за начало медианного класса принимаем 72,5, т. е. меньшую границу класса (72,5—77,4), сред- нее значение которого 75, а частота 62. Отсюда по формуле (1.53) Ме = 72,5 + 5 ((0,5 • 214—66) /62) = 75,8 дня. Это означает, что в данной совокупности сортов ячменя по- ловина из них (107 сортов) созревает не позже, чем на 76-й день от начала вегетационного периода, а вторая половина сортов имеет периоды созревания больше 76 дней. Ошибка медианы вычисляется сравнительно редко. Для до- статочно больших рядов те = 1,25331тм, (1.54) где те — ошибка медианы; тм — ошибка средней арифметиче- ской (1.09). Значение константы в формуле (1.54) зависит от объема N ряда: Объем 2 4 6 8 10 12 20 оо Константа 1,0 1,092 1,135 1,160 1,177 1,189 1,214 1,253 В рассмотренном примере znM = 0,415; me= 1,25331-0,415 = = 0,5 дня. Таким образом, медиана равна 75,8±0,5 и по своей величине близка к средней арифметической (Л4 = 75,05), что мо- жет служить одним из доводов в пользу заключения о близости данного распределения к симметричному. § 1.16. ВЫЧИСЛЕНИЕ ОСНОВНЫХ ПАРАМЕТРОВ НЕВЗВЕШЕННОГО РЯДА В этом параграфе приводится схема совокупного вычисления всех основных статистических параметров невзвешенного ряда наиболее экономичным способом в расчете на то, что исследова- тель располагает лишь простейшими вычислительными средства- ми: счетами, арифмометром и таблицей квадратных корней. Основными параметрами выборки считаются средняя ариф- метическая и среднее квадратическое отклонение (сигма), так как почти все прочие показатели невзвешенного ряда вычисля- ются на основании их числовых значений. Первое место по трудоемкости вычислений среди обычных статистических показателей занимает сигма. Поэтому разрабо- тано несколько способов, упрощающих ее расчет. Наиболее ра- циональным из них является способ условной средней, который обеспечивает любую требуемую точность. В приводимом приме- ре расчета обработаны даты зацветания ольхи кустарниковой в Ленинграде за 14 лет (табл. 1.18). 41
Таблица*!. 18. К вычислению параметров невзвешенного ряда способом условной средней Даты^зацвета- ния, дни от 1 марта (см. табл. 5П) а = х — А а1 2 3 4 Дата зацвета- ния, дни от 1 марта (см. табл. 5П) а — х — А а* 65 —10 100 73 —2 4 67 —8 64 73 —2 4 69 —6 36 78 4-3 9 70 —5 25 81 4-6 36 71 —4 14 85 4-10 100 72 —3 9 86 4-11 121 72 —3 9 87 4-12 144 1049 —1 677 1. Суммируя варианты ряда и деля их на число наблюдений, получаем среднюю арифметическую по формуле (1.08). \М = N-1^x = 1049/14=74,928. 2. Ближайшее к М целое число А = 75; используем его для получения условных отклонений по формуле а = х — А, приве- денных в столбце 2. Суммируем отклонения с учетом их знаков 2а=—1. Делаем проверку вычислений по формуле = 2х — —WA; —1 = 1049—14-75; —1= — 1; равенство обеих частей урав- нения соблюдается, следовательно, вычисления сделаны верно. 3. Возводим в квадрат условные отклонения (столбец 3) и суммируем эти квадраты: 2а2 = 677. 4. Определяем дисперсию по формуле (1.25) а2 = [2 а2— ЛГ^а)2]/^—1)=[677—(—1)2/14]/(14—1)=52,07, откуда среднее квадратическое отклонение о=У52,07=7,2. 5. Прочие параметры статистического ряда определим сле- дующим образом. Ошибка средней арифметической по формуле (1.09) тм= =Л+°.50=7,2уТ4=±1,9. Критерий достоверности средней арифметической по форму- ле (1.10) /м=М/шм=74,9/1,9=39,4. ___ _________ Ошибка сигмы по формуле (1.31) т0 = а/У2М = 7,2/у2-14 = = ± 1,4. Коэффициент вариации по формуле (1.43) и=(100о)/Л1 = = (100-7,2)/74,9 = 9,6%. Ошибка коэффициента вариации по формуле (1.46) т„ = = г»У (0,5+0,0001 v2)/N = 9,6У (0,5+0,0001-9,62)/14 =±1,8%. 42
Показатель точности опыта по формуле (1.50) P=(mM/Af)> •100= (1,9/74,9) 100 = 2,5%. Ошибка показателя точности опыта по формуле (1.52) trip = Р У(1/(2^)+(Р/100)2 =2,5 У(1/(2-14))+(2,6/100)2 = 0,5%. Медиана определяется следующим образом. Находим номер медианной варианты, который равен 0,5 (У+1) =0,5(14+ 1) =7,5. При четном числе вариант за медиану принимается середина промежутка между двумя центральными вариантами. При не- четном числе вариант за медиану принимается центральная ва- рианта. В нашем случае, при четном числе вариант, медиана равна полусумме 7 и 8 варианты: Ме= (72±73)/2 = 72,5. Таким образом, рассчитано 11 параметров, которые дают до- вольно полное представление о конкретном статистическом не- взвешенном ряде. Истолковать эти числа можно примерно так. В среднем за 14 лет ольха кустарниковая в Ленинграде зацве- тает через 74,9 дня от 1 марта, т. е. 13,9 мая (см. табл. 5П), округленно 14 мая, с ошибкой 1,9 дня, и с доверительным ин- тервалом на 0,95 уровне (см. § 1.23): 13,9±2-1,9; т. е. самый ранний срок зацветания 10 мая и самый поздний— 18 мая. Варь- ирование годовых дат зацветания сравнительно невелико, так как коэффициент вариации у = 9,6± 1,8%, поэтому полученные пара- метры заслуживают доверия ввиду большой достоверности сред- ней арифметической: /м = 38,9>3 и значения показателя точно- сти опыта, меньшего 5%: Р= (2,5% ±0,5%) <5%. При работе на ЭВМ сигму лучше вычислять по формуле (1.24), а остальные показатели — по приведенным здесь фор- мулам. § 1.17. МОДА Модой называется точка на оси абсцисс, соответствующая максимальной частоте теоретической кривой распределения ва- риант. Мода вычисляется лишь тогда, когда вариационный ряд разбит на классы, содержащие разное число частот. В случаях, не требующих особой точности, за моду принимают наиболее часто встречающуюся варианту ряда. Например, в ряду из табл. 1.04 за моду можно принять Af0 = 75, т. е. середину класса 72,5—77,4, который имеет наибольшую частоту — 62. Положение моды относительно средней арифметической определяет степень скошенности, или асимметрии, кривой распределения данного ряда. Мода в симметричном нормальном распределении совпа- дает со средней арифметической. Вычисляется мода по формуле Мо=х0+4 (/2—f±)/(2f2—Л—f3) ], (1.55) где xQ — начало модального класса, т. е. меньшая граница того класса, который имеет наибольшую частоту; с — величина клас- сового интервала; — частота класса, предшествующего мо- дальному; /2 — частота модального класса; f3 — частота класса, 43
следующего за модальным. Варианты ряда при этом возрастают сверху вниз. Определим моду вегетационного периода совокупности сор- тов ячменя (табл. 1.04) по формуле (1.55): Мо = 77,5 + 5 L (74—62) / (2 • 74—62—8) ] = 78,3. Это означает, что наиболее часто встречаются сорта ячменя, зерно у которых созревает на 78-й день от начала их вегетацион- ного периода. Ошибка моды обычно бывает больше ошибки средней ариф- метической той же совокупности. Ввиду сложности и малой це- лесообразности ее вычисления она здесь не приводится. Наличие нескольких мод (пиков) в вариационном ряду большей частью указывает на неоднородность совокупности. В невзвешенном ва- риационном ряду мода отсутствует. § 1Л8. МОМЕНТЫ РАСПРЕДЕЛЕНИЯ Моментами распределения называют средние степени откло- нений вариант от средней арифметической или от произвольного числа, в частности от нуля. В первом случае моменты называют- ся центральными, во втором — условными, в третьем — началь- ными. В этом параграфе приведена методика вычисления этих, а также факториальных и основных моментов. Порядок момента равен степени, в которую возводятся отклонения. Основным мо- ментом называется частное от деления центрального момента соответствующего порядка на сигму, возведенную в степень, рав- ную тому же порядку момента. Моменты, особенно центральные, играют большую роль при вычислении различных показателей вариационного ряда. Средняя арифметическая — это начальный момент первого порядка, а дисперсия — центральный момент второго порядка. Условные и факториальные моменты большей частью вычисляют в качестве вспомогательных для получения центральных моментов. Приведенные ниже вычисления момен- тов имеют главным образом методическое значение, они выпол- нены для иллюстрации самого понятия моментов. В практических расчетах рекомендуется для вычисления моментов применять способ кодированных вариант (§ 1.22), а также способы сумм, рассмотренные в конце данного параграфа. В табл. 1.19 приведена сводка таких формул вычисления мо- ментов, которые соответствуют приведенным определениям по- следних. Обозначения моментов первых четырех порядков в табл. 1.19 следующие: ц2, Цз, щ— центральные; bif b2t b3, bt — начальные; тъ т2> т3, — условные; r2, G, G — основные1; 1 В гл. 2 через г будет обозначаться также коэффициент корреляции. Если г означает моменты, то при нем стоит подстрочный индекс в виде цифры 3 или 4, а при г, означающем коэффициент корреляции, подстрочные индек- сы иные или они отсутствуют. 44
Таблица 1.19. Формулы для"вычисления моментов распределения Порядок моментов Центральные Условные Начальные Основные Первый Г1 — N —и S(x-4)f «!-- N 2 (x — 0) f *i- N — M Hi Второй 2(х-Л1)2/ Н2 = n = а £(x — A)2f S(x —0)2/ t>2- N r --^-1 '2 - a2 - 1 Третий Z(x —М)3/ Из- N S (x —’Л)3 f тз - N - . 2(X~°)3/ Ьз- N Из . Гз - qS - AS Четвертый S (x — M}4 - N Sj(x-A)*f m*~ N S(x-0)4f b* - " N H4 r“ — o* сл Таблица 1.20. Вычисление условных моментов Варианта x Частота f x — A (4 = 75) (x — A) f (x - A)* f (x - A)» f {x — A)* f 60 2 —15 —30 450 —6 750 101 250 65 30 —10 —300 3000 —30 000 300 000 70 34 —5 —170 850 —4 250 21 250 75 62 0 0 0 0 0 80 74 -j-5 370 1850 9 250 46 250 85 8 +10 80 800 8 000 80 000 90 4 +15 60 900 13 500 202 500 c = 5 214 0 + 10 7850 —10 250 751 250
2—знак суммирования; х— варианты; f — частоты вариант; N — объем выборки; М — средняя арифметическая; А — началь- ная точка отсчета или условная средняя; а — среднее квадрати- ческое отклонение (сигма); As — показатель асимметрии (см. §1.19). Центральные моменты можно вычислить прямым способом по формулам, указанным в табл. 1.19, т. е. через отклонения ва- риант от средней арифметической, но предпочитают их получать через условные моменты, для чего рекомендуются следующие формулы: р2==/п2—/nt (1.56) р3 = rn3 + — 3/n2), (1.57) = m4 + пч l3/nx (2/п2 — т*) — 4т3], (1.58) где обозначения те же, что и в табл. 1.19. Проверка вычислений центральных моментов производится по формулам: Из = тз — "h (Зц2 + "$, (1 -59) р.4 = — т1 [4нз + "ii (бр.2 + "ФК (1 -60> На примере данных из табл. 1.04 вычисление условных мо- ментов показано в табл. 1.20, подставляя суммы столбцов из ко- торой в формулы условных моментов из табл. 1.19, получаем: mi = 10/214 = 0,0467; т2 = 7850/214 = 36,682; т3=—10250/214= = —47,897; т4 = 751250/214 = 3510,5. Подставив значения условных моментов в формулы (1.56), (1.57), (1.58), определим величины центральных моментов: р2 = 36,682—0,04672=36,680; Из = —47,897+0,0467 (2-0,04672—3-36,682) = —53,036; = 3510,5+0,0467 [3 • 0,0467 (2 - 36,682—0,04672)+4 - 47,897] = = 3519,9. Проверку вычисления центральных моментов делаем по фор- мулам (1.59), (1.60): ц3 = —47,8972—0,0467 (3-36,680+0,04672) = —53,036; = 3510,5—0,0467 [-4-53,039+0,0467(6-36,680+0,04672)] = = 3519,9. Если после проверки не будет достигнуто совпадение величин центральных моментов в пределах точности вычислений, то сле- дует искать ошибку в расчете. Заметим, что чаще условные моменты вычисляют в единицах классового интервала, для чего делят разности х — Л на величи- ну с. Благодаря этому условные отклонения становятся последо- вательностью однозначных чисел, что значительно сокращает вы- числения (табл. 1.21). 46
Таблица 1.21. Вычисление факториальных моментов по способу произведений ряда распределения диаметра соцветий нивяника х X f а Mi fa2 Мз fa< 1 2 3 4 5 6 7 37 2 —3 —6 24 —120 720 51 29 —2 —58 174 —696 3480 65 119 —1 —119 238 —714 2856 79 171 0 0 0 0 0 93 121 1 121 0 0 0 107 42 2 84 84 0 0 121 16 3 48 96 96 0 с = 14 N = 500 Sl-4: 70 616 -—1434 7056 По данным столбцов 1 и 2 табл. 1.20 вычислим также началь- ные моменты по формулам из табл. 1.19: &t= 16060/214 = 75,05; b2= 1213100/214 = 5668,69; Ь3 = 92206000/214 = 430869,16; Ь4= = 7050582500/214 = 32946647,19. В биометрии из начальных моментов применяют обычно лишь момент первого порядка, который равен средней арифметиче- ской; начальный момент второго порядка иногда используют при вычислении среднего квадратического отклонения. Из основных моментов вычисляют лишь г3, который является коэффициентом асимметрии (см. § 1.19), и г4, применяемый для вычисления эксцесса (см. § 1.20). Оба этих основных момента также часто встречаются в расчетах теоретических частот неко- торых типов кривых распределения. Хотя моменты и не имеют самостоятельного интереса для био- метрического анализа, они необходимы для получения почти всех параметров взвешенного вариационного ряда, поэтому должны быть найдены достаточно точно, для чего их рекомендуется вы- числять наиболее рациональным способом кодированных вари- ант, приведенным в § 1.22. Когда варианты в совокупности распределяются симметрично или хотя бы по двускатной кривой, начальные и центральные моменты, вычисленные, например, по формулам из табл. 1.19, а также по формулам (1.56) — (1.58), могут быть уточнены по- правками Шеппарда. Посредством моментов вычисляется боль- шинство параметров статистического ряда, поэтому внесение поправок Шеппарда к моментам отразится далее почти на всех данных, получаемых в ходе статистического исследования. Эти поправки вводятся с целью компенсировать неточность опреде- ления моментов именно по взвешенному ряду, когда приходится варианты разносить по классам и тем самым как бы округлять их до среднего значения того класса, в который они попали. По- 47
этому поправки Шеппарда не нужны, когда моменты вычисля- ются непосредственно по исходным данным без группировки их во взвешенный ряд с равными интервалами. Например, не тре- буется поправка к значению среднего квадратического отклоне- ния, вычисленного в § 1.10 по способу непосредственного распре- деления дат с естественной группировкой последних. Поправки Шеппарда к начальным и центральным моментам: F2 = 62-c2/12, (1.61) *3 = &3-*V2/4, (1.62) = ft4 — (с2/2) (&2 — 7с2/120), (1.63) где $2 — Ъь — исправленные начальные моменты; — bk — исход- ные, неисправленные начальные моменты (формулы их вычис- ления— см. табл. 1.19); с — классовый интервал; Н2 = Н2 — £2/12, (1.64) — (^2/2) (н2 — 7с2/120), (1.65) где ц2, Р-4 — исправленные центральные моменты; g2, щ — не- исправленные центральные моменты, вычисленные по формулам табл. 1.19 и (1.56) —(1.58). Третий центральный момент ц3 поправок не требует. Введем поправки в следующие вычисленные моменты: Ь4 = = 75,05; 62 = 5668,69; Ь3 = 430869,16; &4 = 32946647,19; ц2=36,68; |л4=3519,95; с = 5. Исправленные значения моментов по формулам (1.61) — (1.65): &2 == 5668,69—52/12 = 5666,61; Ь3 = 430 869,16—75,05 • 52/4 = 430 400,10; = 32 946647,19 —(52/2) (5668,69—7-52/120) = 32 875806,79; ц2 = 36,68 — 52/12 = 34,60; р4 = 3519,95 — (52/2) (36,68 — 7-52/120) = 3079,68. Как видим, в некоторых случаях поправки Шеппарда могут заметно влиять на величину моментов. Однако следует иметь в виду, что применение поправок к несоответствующим распреде- лениям может внести также и заметную ошибку. Поэтому еди- ного мнения о необходимости введения поправок Шеппарда пока нет. Факториальные моменты ввиду простоты их получения в при- кладных вычислениях применяются для расчетов условных, да- лее центральных моментов, среднего квадратического отклоне- ния и средней арифметической. 48
В этом параграфе приводятся пять способов вычисления ус- ловных и центральных моментов посредством факториальных. Некоторые из этих способов дают различные величины факто- риальных и условных моментов, однако центральные моменты всегда при этом совпадают. Для сравнимости результатов и об- легчения понимания сути приводимых алгоритмов все пять спо- собов расчета выполнены на примере одного и того же взвешен- ного ряда распределения величин диаметра соцветий (в мм) у нивяника. а. Способ произведений Вычисление факториальных моментов по этому способу при- водится здесь для иллюстрации принципа их построения, а так- же ввиду того, что формулы способа произведений в общем слу- чае более удобны для программирования и счета на ЭВМ. При ручном счете факториальные моменты рекомендуется вычислять по одному из приведенных далее в этом параграфе способов сумм (б—д). Последовательность расчетов факториальных мо- ментов по способу произведений следующая. 1. По данным распределения соцветий нивяника по диаметру выписываем середины классов х и частоты f в табл. 1.21. 2. Условные отклонения в столбце 3 получены по формуле а=(х — А)/с, где условная средняя ряда Л, имеющая /=171, равна 79, а классовый интервал с=14. Практически никаких вы- числений для получения а не делают. Если ряд х возрастает сверху вниз с одинаковым интервалом (как в табл. 1.21), то про- тив выбранного А записывают 0, а затем от нуля до конца ряда вверх с минусом, а вниз с плюсом пишут натуральные ряды чи- сел: 1, 2, 3, 4, и т. д. Если ряд х убывает сверху вниз, то в верх- ней половине, начиная от центрального нуля отклонения, а будут со знаком плюс, а в нижней половине — со знаком минус. 3. Произведения частот на факториалы отклонений записаны в столбцах 4—7 табл. 1.21, где: = а2 = а(а— 1), а3 = а(а—1) • •(а — 2), а4 = а(а—1) (а — 2) (а — 3). Произведения указанного вида называются факториалами, откуда и получили название факториальные моменты. Таким образом, произведения в столб- це fat сверху вниз равны: 2-(—3) =—6, 29-(—2) =—58 и т. д.; произведения fa2 равны: 2- (—3) • (—4) =24, 29- (—2) • (—3) = 174 и т. д.; произведения fa3: 2- (—3) • (—4) • (—5) = —120, 29- (—2) • •(—3) • (—4) =—696 и т. д.; произведения /а4: 2-(—3) • (—4) • • (—5) • (—6) =720, 29 - (—2) • (—3) • (—4) • (—5) =3480 и т. д. 4. Суммируем числа в столбцах 4—7 с учетом их знаков: s£ = = 70, s2 = 616, s3 = —1434, s4 = 7056. 5. Факториальные моменты равны w^sJN, w2=s2jN, w3 = s3/N, w^sJN, (1.66) где — факториальные моменты; 54_4 — суммы произведений частот на факториалы отклонений; N — объем совокупности. 49
И следовательно, wi = 70/500 = 0,1400, w2=616/500= 1,232, w3=—1434/500 = —2,868, w, = 7056/500= 14,112. 6. На основании вычисленных значений факториальных мо- ментов ^i-4 находим условные моменты т^\ m2=w2-\-wi, mz=wz+3w2-\-wu т4=^4+6^з+7^2+^1. (1.67) Отсюда: mi = 0,14, т2 = 1,232 + 0,14= 1,372, т3 = —2,868 + + 3-1,232 + 0,14 = 0,968, т4= 14,112 + 6- (—2,868) +7-1,232 + 0,14 = = 5,668. Значения условных моментов, найденные здесь, полностью -совпадают с вычисленными другим способом в § 1.22. Следова- тельно, подставив их в формулы (1.56) — (1.58), должны полу- чить те же, что и в § 1.22 значения центральных моментов, изме- ренные в единицах классового интервала. б. Способ полного суммирования При отсутствии счетной автоматической машины условные моменты посредством факториальных при помощи простейших счетных средств вычислим способом сумм. На примере того же ряда распределения рассмотрим последовательность расчетов, в которых объединено вычисление факториальных и условных моментов (табл. 1.22). Таблица 1.22. К вычислению условных моментов посредством факториальных по способу полного суммирования X f h f* fs 37 2 500 . 2070 5 658 12 659 51 29 498 1570 3 588 7 001 65 119 469 1072 2 018 3 413 79 171 350 603 946 1395 93 121 179 253 343 449 107 42 58 74 90 106 121 16 16 16 16 16 с == 14 N = 500 sx = 2070 s2 = 5658 s3 = 12 659 s4 = 25 039 1. Суммируем частоты f снизу вверх и записываем накоплен- ные частоты в столбце 16 + 42 = 58, 58+121 = 179, 179+171 = = 350 и т. д. Нижнюю частоту 16 повторяем во всех столбцах /t_4 в той же строке. Числа столбцов /2, /з, Ъ получаем точно так же на основании чисел предыдущего столбца: 16 + 58 = 74, 74+179 = 253 ит. д. 50
2. Суммируем числа во всех четырех столбцах и проверяем вычисление накопленных частот: верхняя частота столбца Ц должна равняться М = 500; сумма каждого предыдущего столбца должна совпадать с верхней частотой последующего столбца. Вычисление и суммирование частот последнего столбца /4 необ- ходимо повторить два раза. 3. Вычисляем условные моменты по формулам mi=N~lsi, m2=2s2N~l—ти т3 = 213 — 0,5m2) — mi j, (1.68) m4 = 6 (4s47V-1 — rrii — m3) — 11 m2. Отсюда: m, = 2070/500 = 4,14, m2 = 2 . 5658/500—4,14=18,492, m3 = 2 [ 3 (12659/500—0,5 • 18,492) — 4,14 ]= 88,152, m4 = 6 (4 • 25039/500—4,14—88,152) — 1 Ы 8,492 = 444,708. Несмотря на то что величины условных моментов отличаются от таковых, полученных по предыдущему способу, подставив их в формулы (1.56) — (1.58), получим практически те же, что и в § 1.22, значения центральных моментов в единицах классового интервала: р2 = т2— m[= 18,492—4,142= 1,3524, Из = т3 + т1 (2m* — Зт2) = 88,152+4,14 (2 • 4,142—3.18,492) = = 0,3972; ц4 = m4 + tn1 [Зтх (2m2 — m2) — 4m3] = 444,708 + + 4,14 [3 • 4,14 (2 • 18,492—4,142) — 4 • 88,152] = 5,2859. Для проверки вычисления второго центрального момента в единицах классового интервала служит формула ц2=N-1 (2s2-51 (1 +^4s0 ], (1.69) где s2 — суммы столбцов f{ и f2 из табл. 1.22; 2V— объем сово- купности. Если требуется вычислить среднее квадратическое отклоне- ние, как обычно, в именованных числах, то в формулу (1.69) вво- дится дополнительный множитель: о2 = [c2/(N— 1)] [2s2 — sx (1 + A^sJ], a = (1.69a) По данным нашего примера (табл. 1.22) ц2 = 1/500.(2-5658—2070(1+2070/500))= 1,3524; о2 = 142/(500—1). [2-5658—2070 (1+2070/500)] = 265,61, о= /ЖбТ =16,3 В § 1.22 по тем же данным о2 = 265,07 за счет того, что там не вычиталась единица из N в знаменателе, что допустимо при до- 51 4*
статочно большом объеме выборки. Когда Af<100, то при вычис- лении сигмы извлечением корня из второго центрального момен- та можно вводить так называемую поправку Бесселя N/(N—1). Если в знаменателе любой формулы вычисления сигмы или дис- персии стоит (W—1), это означает, что поправка Бесселя в нее введена и оценка дисперсии при этом стала несмещенной. Средняя арифметическая Л4 = х1 + с(т1— 1), (1.70) где +— начальная варианта ряда; с — классовый интервал; — первый факториальный или первый условный момент (они равны между собой). По данным нашего примера Л1 = 37+ 14(4,14—1) =80,96 = 81,0. Заметим, что для вычисления среднего квадратического от- клонения и средней арифметической по способу б в табл. 1.22, кроме исходных данных, достаточно получить частоты и суммы Si И S2 ЛИШЬ двух столбцов — fl и f2. На основе центральных моментов, дисперсии и средней мож- но рассчитать далее другие статистические показатели данного ряда (см. § 1.22). в. Способ неполного суммирования 1. По тем же данным (см. табл. 1.21) составляем табл. 1.23, в которой варианты х возрастают сверху вниз. 2. Суммирование накопленных частот в столбцах /\_4 ведется онизу вверх, в каждом столбце оно заканчивается на одну строку раньше по сравнению с предыдущим столбцом, как показано в таблице. Столбец 16 + 42 = 58, 58+121 = 179 и т. д. Столбец f2: 16 + 58 = 74, 74+179 = 253, 253 + 350 = 603, 603+469=1072, 1072 + 498=1570; здесь суммирование должно было бы закон- читься, но для проверки вычислений получим еще одну накоп- ленную частоту 1570 + 500 = 2070' и в знак того, что она не будет Таблица 1.23. К вычислению факториальных моментов способом неполного суммирования X f fi fa f3 f< 37 2 500 (2070) » 51 29 498 1570 (3588) —• 65 119 469 1072 2018 (3413) 79 171 350 603 946 1395 93 121 179 253 343 449 107 42 58 74 90 106 121 16 16 16 16 16 Af = 500 2070 3588 3413 1966 52
участвовать в дальнейших расчетах, возьмем ее в скобки. Также сделаем и с конечными частотами f3 и f4. Проверка заключается в том, что верхнее число последующего столбца должно рав- няться сумме частот предыдущего столбца у всех столбцов. Сум- мирование частот f4 необходимо повторить для проверки. 3. Факториальные моменты равны: w^sJN, w2 = 2s2N-i, w3 = 6s3N~l, ^4 = 24s4/V"1, (1.71) где — суммы частот в столбцах табл. 1.23; N— объем со- вокупности. = 2070/500 = 4,14, w2 = 2-3588/500 = 14,352, w3 = 6-3413/500 = 40,956, ш4 = 24-1966/500 = 94,368. 4. Вычислим условные моменты по формуле (1.67). m1 = w1 = 4,14, m2= 14,352 + 4,14= 18,492, т3 = 40,956 + 3-14,352 + 4,14 = 88,152, m4 = 94,368 + 6 • 40,956 + 7 • 14,352 + 4,14 = 444,708. 5. Центральные моменты определим по формулам (1.56) — (1.58): р2= 18,492—4,142 = 1,3524, р3 = 88,152+4,14 (2-4,142—3-18,492) = 0,3972, р4 = 444,708+4,14 [3 - 4,14 (2 • 18,492—4,142)—4 - 88,152] =5,2859. 6. Среднее квадратическое отклонение равно корню из второ- го момента, помноженному на классовый интервал: о = сУц2 = = 14-1+3524=16,3. Средняя арифметическая по формуле (1.70) Л1 = 37 + + 14(4,14— 1) =81,0. Центральные моменты ц2 и ц3 возможно вычислить также не- посредственно, используя суммы Si-з, полученные в табл. 1.23: = +[2s2 + S1(1-S1/^], += + У с3 N (1-72) где N — объем совокупности. По данным нашего примера: Цо С2 с3 500 6(3413+3588)+2070 1 = 0,3972. Нз _ 1 • 53
Вычисление четвертого центрального момента непосредст- венно через суммы нецелесообразно ввиду того, что соответ- ствующая формула становится слишком громоздкой. Расчет это- го момента, а при необходимости и остальных можно выполнить или проверить по формулам: Ц2 = W2 + (1 — tOj), ц8 = “’з + 2{1,5ш2+ш1[0,5 —1,5о>2 —^(1,5 —Wj)]}, (1.73) ц4 = wi + 4 {1,5 w3 4- 1,75 ау2 — (да3 + 3u>2 — 0,25 — — аух [ 1,5 w2 — 1 +0,75(2 — аух)])}, где Wt-4 — факториальные моменты, вычисленные по способу в; подставляя их значения в формулы (1.73), получим: р2/с2= 14,352+4,14(1—4,14)= 1,3524, Рз/с3 = 40,956+2 {1,5-14,352+4,14 [0,5—1,5-14,352—4,14 (1,5— -4,14)]} = 0,3974, ц4/с* = 94,368+4 {1,5-40,956+1,75-14,352—4,14(40,956+ +3-14,352—0,25—4,14 [ 1,5 • 14,352—1 +0,75 -4,14 (2— —4,14)])} = 5,2852. Четвертый центральный момент можно вычислить также иначе: + (1 — [4р3 + (6ц2 + и»1)]), (1-74) — [4-0,3972 + 4,14(6-1,3524 + 4,142)]) = 5,285. Проверку по формулам (1.73) и (1.74) следует проводить, однако с несколько большим числом значащих цифр в промежу- точных вычислениях. г. Способ суммирования от центра ряда 1. Используя те же данные (см. табл. 1.23), составляем табл. 1.24, в которой против центральной варианты с максималь- ной частотой (Л = 171) проводим черту, от нее вверх и вниз ста- вим еще по три черты так, как указано в таблице, т. е. каждый раз отступая на одну клетку от центра ряда. 2. Суммирование накопленных частот делается от центра ряда вверх и вниз. Сумма центральных вариант (171 + 150 + + 179 = 500) должна равняться объему совокупности. Правильность суммирования накопленных частот в осталь- ных столбцах проверяется по равенству сумм крайних (в цент- ральном пробеле) вариант соответствующей сумме а или &, на- 54
Таблица 1.24. К вычислению условных моментов посредством факториальных по способу суммирования от центра ряда X f . fs f4 37 2 2 2 2 IM 51 29 31 33 — 65 119 150 —• —- —• 79 4=171 —• —* — — 93 121 179 — — 1 107 42 58 74 —— 121 16 16 16 16 1 111 k=l tf=500 6:183 35 2 0 a: 253 90 16 0 d:10 55 14 0 s-АЗв 125 18 0 пример: 179 + 74 = 6^ = 253, 74 +16 = £Z2 = 90, 16 + 0=а3 = 16, 150 + 33=Ь1= 183, 33 + 2=62 = 35, 2 + 0 = &3 = 2. 3. Верхнюю и нижнюю половины рядов чисел в столбцах /\_4 •складываем отдельно, соответственно получаем суммы &!-4 и ^-4. Затем ниже записываем разности d = a—b и суммы s = a + b этих сумм. 4. Подставляя эти разности и суммы в формулы, в которых условные моменты выражены через факториальные: m^dJN, m2= (54+252)/^ m3 = [dl+6{d2+d3) ]/N, mk= = {«4 + 24 L 0,5 (1,1667s2 + 3s3) + s4 ]} /N, (1.75) получим: m1=70/500=0,14, m2= (436+2-125)/500= 1,372, m3 = (70 + 6 (55 + 14)) /500 = 0,968, m4= (436+24[0,5(1,11667-125+3-18)+0])/500=5,668. Значения условных моментов совпадают с найденными ранее, следовательно, по ним можно получить те же, что и раньше ве- личины центральных моментов по формулам (1.56) — (1.58). д. Способ полуцентрального суммирования 1. Составим табл. 1.25, в первых двух столбцах которой при- ведены данные (х, /), уже использованные для иллюстрации рас- четов по алгоритмам а—г. 2. В верхней половине таблицы образование накопленных ча- стот ведем сверху вниз до черты против центральной варианты 55
Таблица 1.25. К вычислению моментов по способу полуцентрального суммирования X f К ft fs h 37 2 2 2 2 2 51 29 31 33 35 37 65 119 150 183 218 255 79 171 — —— 93 121 179 — — —- 107 42 58 74 — — 121 16 16 16 16 #=500 Z>:183 218 255 294 а: 253 90 16 0 d:10 —128 —239 —294 s:436 308 271 294 (Л=171): 2 + 29 = 31, 31 + 119=150, 2 + 31 = 33, 33+150=183, 2 + 33=35 и т. д.; в нижней половине таблицы накопленные ча- стоты получаем суммированием снизу вверх: 16 + 42 = 58, 58 + + 121 = 179, 16 + 58 = 74 и т. д. до черточек, проставленных в таб- лице. Сумма центральных вариант должна равняться объему совокупности 150+171 + 179=А/ = 500; нижняя частота в верхней половине таблицы должна равняться сумме b предыдущего столбца, например 183 = Z\= 183; сумма любых двух верхних ча- стот в нижней половине таблицы должна быть равна числу а, например: 179 + 74 = ^ = 253, 74+ 16 = а2 = 90. 3. Получаем суммы чисел верхней половины b и нижней по- ловины а таблицы, затем записываем их разности d=a — b и суммы s = a + b. 4. Факториальные моменты вычисляем по формулам: w^dJN, w2 = 2s2N~ii w3 = 6d3N-\ w4 = 24s4A+\ (1.76) где — факториальные моменты; d и s — разности и суммы из табл. 1.25; N — объем совокупности. По формулам (1.76): = 70/500 = 0,14; w2 = 2 - 308/500 = 1,232; w3 = 6-(—239)/. 500 = —2,868; w4 = 24-294/500 = 14,112, откуда условные моменты по формуле (1.67) равны: m1 = w1== 0,14, т2 = 1,232+0,14 = 1,372, т3 = —2,868+3.1,232+0,14 = 0,968, т^ = 14,112+6-(—2,868)+7-1,232+0,14 = 5,668, 56
что полностью совпадает со значениями, полученными другими способами. Следовательно, подставив их в формулы (1.56) — (1.58), мы вправе ожидать верных результатов при вычислении центральных моментов. Симметричные ряды распределений с целью получения ука- занных моментов можно обработать любым из пяти приведен- ных способов; для асимметричных рядов удобнее применять спо- соб б или в; пример расчета по способу б дан в § 1.34 (показа- тельное распределение). § 1.19. АСИММЕТРИЯ Асимметрией, или скошенностью, называется мера отклоне- ния распределения частот от симметричного их распределения относительно максимальной ординаты. Степень асимметрично- сти распределения можно измерить тремя способами: через раз- ность между средней арифметической и модой, или медианой, по формулам (1.77), (1.78) и через отношение момента третьего по- рядка к кубу среднего квадратического отклонения по формуле <1.79). 1 способ. КА=(М-М0)1о, (1.77) где К л — коэффициент асимметрии; М — средняя арифметиче- ская; Л40 — мода; о — среднее квадратическое отклонение. Подставив в формулу (1.77) соответствующие параметры ряда из табл. 1.04, получим КА= (75,09—78,27)/5,99 = —0,53. Знак минус перед коэффициентом соответствует отрицательной, а плюс — положительной асимметрии (рис. 2, А). В формулу (1.77), если не требуется особая точность, можно подставлять величину моды, полученную по формуле (1.55), но обычно под- разумевают величину моды, определяемую при вычислениях па- раметров кривых Пирсона, т. е. по формуле Мо - аг3 (г4+3)/[2 (5г4 - 6г| — 9)1, (1.77а) или по формуле: М0 = М — оАа, (1.776) в которой Кд= Гз(г4+3)/[2(5г4-6г|-9)], (1.77в) где Л40 — мода; М — средняя арифметическая; о — среднее квад- ратическое отклонение; г3, г4 — третий и четвертый основные мо- менты (формулы их вычисления см. в табл. 1.19); КА — коэффи- циент асимметрии. Модификация формулы (1.77а) приведена в § 1.22 под номером (1.93). Обозначив Pi = f32> Р2 = г4, формулу (1.77а) можно представить так: мо = М - [a f S (Р2+3)]/[2 (5р2—6рх—9)]. (1.77г) 57
Рис. 2. Асимметрия (А: а — отрицательная, б — положительная) и эксцесс (Б: а — положительный, б — отрицательный) 1 — теоретическая и 2 — эмпирическая кривые распределения Рассмотрим пример вычисления по формулам (1.77а, б, в)г используя данные из § 1.22. Мода ряда, приведенного в табл. 1.28, вычисленная по обычно применяемой формуле (1.55): Л4О = 72+ 14L (171—119)/(2-171—119—121) ] =79,14. Для сравнения найдем более точную величину моды этого же ряда по формуле (1.776). В § 1.22 третий основной момент г3 = =Xs = 0,253; четвертый основной момент по формуле из табл. 1.19 равен: г4=ц4/ц22 = 5,2861/1,35242 = 2,8902; Л4 = 81,0; о= 16,28. По формуле (1.77в) [0,253(2,8902+3) ]/[2(5-2,8902—6-0,2532— —9)] =0,14706; по формуле (1.776) М0=81,0-16,28-0,14706= = 78,606, 79,14>78,606. Как видим, более точное последнее зна- чение моды меньше примерно на 0,5. Коэффициент асимметрии, полученный по формуле (1.77в), также меньше показателя асим- метрии, вычисленного по формуле (1.79) : 0,147<0,253. При публикации статистически обработанных научных дан- ных необходимо приводить формулу, по которой получен тот или иной показатель (например, мода), или указывать источник, в котором можно ее найти. 2 способ. Иногда в формуле (1.77) моду заменяют медианой Ме, что также может характеризовать асимметрию: КАч=(М-Ме)/а. (1.78) 58
3 способ. Л = Цз/(Д ИЛИ As = r3, (1.79) где As— показатель асимметрии; ц3— центральный момент третьего порядка; о — среднее квадратическое отклонение; г3 — основной момент третьего порядка (см. табл. 1.19). Подставляя ц3, вычисленный поданным табл. 1.20 и а = 6,056 в формулу (1.79), получим Д5 =—53,036/6,0563 =—0,24. Под- тверждается, что распределение вариант вегетационного перио- да сортов ячменя имеет отрицательную асимметрию. Ошибка показателя асимметрии тА= УбЛГ1, (1.80) где N — объем выборки. Для рассматриваемого примера о вегетационном периоде сортов ячменя тА=уб/214=0,17, следовательно: Аа= =—0,24+0,17. Более точно ошибка асимметрии может быть вы- числена по формуле V 6/^+3), (1.81) которую следует применять для сравнительно небольших рядов. Оценка достоверности показателя асимметрии производится по формуле (1.10) и табл. 4П. Число степеней свободы при этом принимается равным бесконечности (у = оо). t = A3/mA, где t — критерий Стьюдента (см. табл. 4П); As — показатель асимметрии; тА — ошибка показателя асимметрии. Для только что рассмотренного примера / = 0,24/0,17=1,41. По табл. 4П при у = оо требуется величина критерия не меньше 1,96, для того чтобы можно было говорить о существенности асимметрии. Следовательно, рассматриваемое распределение сортов ячменя по вегетационному периоду достаточно близко к симметричному. * * * В случаях, требующих повышенной точности, показатель асимметрии и его ошибку вычисляют с учетом несмещенности их величин по формулам А3 = (Лг—2)’1г3 VN (Л/— 1), (1.82) тА = Y[6# (N—L)]/[(N—2) (7V+1) (#+3)], (1.83) где обозначения те же, что и в формулах (1.79), (1.80). Для рассматриваемого примера As = [—0,24 /214(214—1)]/(214—2) = —0,2412, тА= / [6-214(214—1)]/[(214—2)(214+1)|(2144-3)] = 0,166. 59
Минимальное число вариант NA, которое обеспечивает досто- верность величины показателя асимметрии 4S: ЛГЛ=54М|. (1.83а> В нашем примере AfA = 54/(—0,24)2 = 937. Таким образом, для надежного выявления особенностей асимметрии распределения величин вегетационного периода у ячменя необходимо взять 937 сортов или различных образцов этой культуры. § 1.20. ЭКСЦЕСС Эмпирические распределения по сравнению с нормальным могут быть туповершинными или островершинными (см. рис. 2, Б), Степень отклонения эмпирической кривой распределения от нормальной теоретической кривой на своей вершине количествен- но выражается показателем эксцесса: Е= —3, или Е=1\—3, (1.84) где ц4 — центральный момент четвертого порядка (о вычислении его см. § 1.18); о4 — среднее квадратическое отклонение в четвер- той степени (о4 = ц22); г4— основной момент четвертого порядка (см. § 1.18). Эксцесс эмпирической кривой распределения сортов ячменя по продолжительности вегетационного периода определим, под- ставив в формулу (1.84) найденные в § 1.18 значения ц4 и р,2: £= (3519,9473/36,68012) —3 = —0,38. Ошибка показателя эксцесса равна удвоенной ошибке пока- зателя асимметрии: тЕ = 2 /Ж (1.85) где тЕ — ошибка показателя эксцесса; N — объем выборки; ^/6/N— ошибка показателя асимметрии. тЕ = 2 /6/214 = ±0,34. Для сравнительно небольших рядов несколько более точная величина ошибки эксцесса тЕ= /24/(Л/’±5), (1.86) где обозначения те же, что и к формуле (1.85). В ответственных случаях наиболее точные, несмещенные оценки показателя эксцесса и его ошибки вычисляются более сложно: £ = (Л/2 __ !) [(f4 _ 3) + + 1)/[(jV _ 2) (JV _ 3)] (1<87) тЕ = /[24Л7 (N - 1)2]/[(W — 3)(N — 2) (W+3) (N+ 5)], (1.88) где обозначения те же, что и в формулах (1.84), (1.85). 60
Для рассматриваемого примера £ = (2142—1) (2,62—3) + /[(214-2)(214 3)] = —0,389; тЕ = V [24-214.(214—1)2]/[(214—3)(214—2)(214+3)(214+5)[ = = 0,331. Оценка достоверности показателя эксцесса производится по критерию Стьюдента (1.10): t = ElmE, где t — критерий Стьюден- та (см. табл. 4П); в данном случае принимается число степеней свободы v=oo; Е — показатель эксцесса; тЕ— ошибка показа- теля эксцесса. В рассмотренном здесь примере/=0,38/0,34= 1,12. По табл. 4П v = оо требуется величина критерия, большая 1,96, для того что- бы можно было считать распределение сортов ячменя по вегета- ционному периоду существенно отклоняющимся от нормального по своему эксцессу. Показатель отрицательного эксцесса не может быть меньше,, чем —2, и это его значение указывает на то, что данная выборка состоит из вариант, относящихся к различным совокупностям. «Провал» на вершине кривой при этом достигает оси абсцисс, и на графике получаются две различные кривые распределения. Положительный эксцесс по своей величине теоретически не огра- ничен. Эксцесс считается незначительным, если |£| <0,4; чем меньше |Е|, тем ближе распределение к нормальному. Когда кривая распределения имеет два выступа, которые одинаковы по размерам, форме и расположены симметрично от- носительно центра кривой, т. е. при наличии «провала» в сере- дине кривой, тогда величина эксцесса также будет равной нулю, хотя, судя по форме кривой, эксцесс должен быть ясно выра- женным по величине и обладать отрицательным знаком. Следо- вательно, распределение ряда будет подчиняться нормальному закону только тогда, когда близость величины Е к нулю одно- временно сопровождается соответствующей формой кривой. Минимальное число вариант NE, необходимое для достовер- ности показателя эксцесса Е\ А^ = 216/£2. (1.88а) В нашем примере AfE=216/(—0,38)2=1496. Следовательно, для получения достоверного представления об особенностях эксцесса распределения величин вегетационного периода ячменя необходимо составить совокупность из 1496 сортов или различ- ных образцов этой культуры. § 1.21. ЭНТРОПИЯ Многим биологическим явлениям, процессам, состояниям ор- ганизмов и популяций в той или иной степени присуща неопре- деленность или различная информативность. Поэтому количест- венный показатель меры неопределенности, или энтропии (из 61
теории информации), должен найти широкое применение в био- логических исследованиях. Энтропию возможно вычислить для любой системы, которая может принимать различные состояния с определенными вероятностями. В частности, посредством эн* тропийного анализа распределений фенодат в некоторой степени становится доступным объективное решение вопроса о том, ка- кая из фенофаз содержит максимум полезной информации и, следовательно, должна наблюдаться более тщательно и глубоко, чем остальные. Если рассматривать комплекс фенодат по каж- дой фенофазе с точки зрения теории вероятностей как поле, образованное композицией независимых испытаний, что и пред- ставляет собой совокупность наблюдаемых видов растений, то к нему применимо понятие энтропии. Совокупности фенодат, со- стоящие из независимых испытаний, в то же время, следователь- но, не могут считаться временными или динамическими рядами. Энтропия определяется вероятностями всех элементарных собы- тий данного поля, она служит мерой его неопределенности и вы- числяется по общей формуле k н (Pl, Р2. • • • > Pft) = — 2 Pi Io& Pi' U -89) 1=1 где pb p2, ..., pk—все вероятности данного поля в целом, кото- рые можно заменить частостями распределений; log2p— двоич- ный логарифм вероятности; k — число значений, которое может принимать данная система, в частности это число классов рас- пределения вариационного ряда. Для всякого поля, связанного с неопределенностью резуль- тата, энтропия всегда положительна, поэтому перед знаком суммы в формуле (1.89) стоит минус. Энтропия обычно измеря- ется в битах, что связано с применением двоичных логарифмов для ее вычисления, но она может быть выражена и в нитах — единицах, связанных с применением натуральных логарифмов, или в десятичных единицах (дитах), когда энтропия вычисляется с помощью десятичных логарифмов. Практически энтропию удобнее вычислять с помощью натуральных логарифмов, а затем для перевода в биты делить полученную величину на In 2 = = 0,69314718. Если энтропия найдена с помощью десятичных ло- гарифмов в дитах, то для перевода в биты ее надо делить на 1g 2 = 0,3010300. Напомним, что перевод логарифма числа х с основанием b в логарифм с основанием а производят по извест- ной формуле logax= (log6x)/(log6a). (1.90) Алгоритм вычисления энтропии покажем на примере взве- шенного ряда, который представляет собой распределение по времени начала цветения 431 вида древесных растений из арбо- ретума Ботанического института АН СССР в Ленинграде. Время начала цветения указано в первом столбце табл. 1.26 в днях от 62
Таблица 1.26. Распределение видов по датам зацветания Г раницы класса, дни от 1 марта Середина класса х, дни от 1 марта Частота (число видов) f Частости f/N—P In р —Р In р 32,5—51,4 42 5 0,0116 —4,46541 0,0518 51,5—70,4 61 38 0,0882 —2,42815 0,2142 70,5—89,4 80 120 0,2784 —1,27870 0,3560 89,5—108,4 99 160 0,3712 —0,99101 0,3679 108,5—127,4 118 68 0,1578 —1,84643 0,2914 127,5—146,4 137 20 0,0464 —3,07046 0,1425 146,5—165,4 156 12 0,0278 —3,58272 0,0996 165,5—184,4 175 6 0,0139 —4,27587 0,0594 184,5—203,4 194 1 0,0023 —6,07485 0,0140 203,5—222,5 213 1 0,0023 —6,07485 0,0140 с=19 Л=10 431 0,9999 1,6108 1 марта при помощи переводной табл. 5П. Для вычисления энтропии нужны только частоты ряда, которые путем деления на объем ряда (431) преобразуем в частости (столбец 4). Нату- ральные логарифмы частостей (столбец 5) умножаем на часто- сти (столбец 6) и суммируем, получаем энтропию в нитах Ян = = 1,6108, делим ее на In 2, что дает энтропию в битах: /7б = = 1,6108/0,69315 = 2,324. Подобным образом были вычислены величины энтропии для рядов распределения и других фенофаз этого же массива древес- ных растений. По своей убывающей информативности фенофазы располагаются в следующем порядке (в скобках величина эн- тропии в нитах): начало цветения (1,611), конец цветения (1,729), начало распускания листьев (1,845), начало осенней раскраски листьев (1,895), созревание плодов (1,917) и начало осеннего листопада (1,917). Более других содержит информации распределение видов по началу цветения, мера неопределенности поля вероятностей которого наименьшая (1,611). У травянистых многолетников путем множественного корреляционного анали- за, т. е. принципиально иными методами, установлено, что цент- ром корреляционной плеяды их фенофаз в Москве является так- же начало цветения, а на втором месте по силе корреляционных взаимосвязей стоит конец цветения, что также полностью соот- ветствует порядку возрастания величин энтропии этих фенофаз у деревьев и кустарников в Ленинграде. Следовательно, у тра- вянистых и древесных многолетников основной из фенофаз, опре- деляющей ход других, является фенофаза начала цветения, ко- торая и должна наблюдаться в первую очередь. В результате изучения 300 взвешенных рядов, составленных по данным, представляющим собой разнообразные биологиче- 63
Таблица 1.27. Два варианта построения взвешенного ряда распределения частот величин энтропии биологических признаков Ряд с равными интервалами Ряд с неравными интервалами Границы класса Частота Границы класса Середина класса Частота 0—2,499 137 0—0,499 0,25 5 2,5—4,999 159 0,5—0,999 0,75 6 5—7,499 1 1—1,499 1,25 12 7,5—9,999 0 1,5—1,999 1,75 35 10—12,499 0 2—2,499 2,25 88 12,5—14,999 0 2,5—2,999 2,75 102 15—17,499 0 3—3,499 3,25 36 17,5—19,999 0 3,5—3,999 3,75 5 20—22,499 0 4—4,499 4,25 6 22,5—24,999 1 4,5—4,999 4,75 1 25—27,499 1 5—5,499 5,25 1 27,5—29,999 0 5,5—5,999 5,75 0 30—32,499 0 6—6,499 6,25 0 32,5—35,000 1 6,5—6,999 6,75 0 с=2,5 7—7,499 7,25 0 *=14 — 7,5—34,676 21,088 3 2=300 с=0,5 и 27,5 £=16 300 ские признаки, получено распределение величин их энтропии, ко- торое в двух вариантах приведено в табл. 1.27. В левой половине таблицы находится распределение величин энтропии с равным интервалом (с = 2,5), что привело к большой концентрации ча- стот (137 и 159) в первых двух классах. Вполне возможно, что в начале этого распределения поэтому утеряны некоторые важ- ные его детали. Заново составленное распределение (в правой половине табл. 1.27) с неравными интервалами (с = 0,5 и с = = 27,5) стало более правильным, центр концентрации частот в нем переместился из начала ряда в его середину, и стало ясно, что кривая распределения величин энтропии в действительности не односкатная, а двускатная. Средняя арифметическая и дис- персия левого ряда равны: Л4 = 2,88, а2 = 8,128, а правого: М = = 2,65, о2 = 3,956, т. е. варьирование одних и тех же данных в ре- зультате применения более методически правильного способа их организации снизилось в 2 раза. Рассмотренный пример ясно показывает, насколько важен неформальный подход в биомет- рических исследованиях. Для оценки информативности рядов и, следовательно, тех или иных биологических и других признаков в соответствии с их энтропией (в нитах) составим шкалу инфор- мативности. Для этого воспользуемся данными правого ряда в табл. 1.27. К средней арифметической последовательно приба- 64
вим, а затем вычтем величину о = Уо2 = уЗ,956= 1,989. Получим следующие баллы шкалы информативности: Балл Величина энтропии, ниты Балл Величина энтропии, ниты 1 10,608 и выше 5 2,650—4,638 2 8,617—10,607 6 0,661—2,649 3 6,628—8,616 7 0—0,660 4 4,639—6,627 Напомним, что меньшей энтропии соответствует большая ин- формативность. Норма величины энтропии и, следовательно, ин- формативности статистических рядов, по данным биологических признаков, находится в пределах М±о = 2,650± 1,989, т. е. от 4,639 до 0,661. Низкой информативностью обладают ряды с 1 — 3 баллами и высокой — с 6 и 7 баллами. Ряд из табл. 1.26, энтро- пия которого 1,6108 нит, относится к 6-му баллу и является высо- коинформативным, вполне пригодным для научной обработки, в результате которой могут быть получены надежные выводы. § 122. ВЫЧИСЛЕНИЕ ПАРАМЕТРОВ ВЗВЕШЕННОГО РЯДА Приведенные здесь схемы расчета следует применять при необходимости сделать сравнительно полный анализ изучаемой совокупности. При разработке алгоритмов имелось в виду свести к минимуму вычислительную работу и вместе с тем обеспечить требуемую точность и правильность расчетов путем введения проверочных операций. Методика подготовки выборки для обра- ботки в виде взвешенного вариационного ряда приводится в § 1.01. Способ 1. Вычислим параметры ряда распределения соцве- тий нивяника по диаметру (табл. 1.28). 1. В столбце 2 выбираем А— начало отсчета отклонений, т. е. варианту, имеющую наибольшую частоту, такой здесь ока- залась центральная варианта 79 с частотой 171. 2. По формуле а=(х— А)/а=(х— 79)/14 (где с — классо- вый интервал) кодируем варианты (столбец 4). 3. Частоты f перемножаем с 1—4 степенями условных откло- нений а (столбцы 5—8). 4. Суммируем числа в столбцах 3, 5—8. 5. Прежде чем переходить к вычислению условных моментов, проверим сделанные расчеты. Для этого переносим на один класс вверх начало отсчета условных отклонений, т. е. прини- маем Д = 65; затем кодируем ряд х по формуле 1+а=(х—65)/ /14 и записываем новые отклонения в столбце 9, возводим их в четвертую степень (столбец 10) и перемножаем на частоты. Сумма чисел столбца 11 должна быть: 2/(а+1)4=2М + 42/«3 + б2М2 + 4 2/а + ^- (1-91) 3 Г. Н. Зайцев 65
Таблица 1.28. К вычислению моментов ряда распределения величин диаметра соцветия у нивяника, мм Границы класса Сере- дина класса X Час- тота f а fa fa2 fa2 fa4 □4-1 (a+D4 to+W 1 2 3 4 5 6 7 8 9 10 11 30—43 37 2 —3 —6 18 —54 162 —2 16 32 44—57 51 29 —2 —58 116 —232 464 —1 1 29 58—71 65 119 —1 —119 119 —119 119 0 0 0 72—85 79 171 0 0 0 0 0 1 1 171 86—99 93 121 1 121 121 121 121 2 16 1936 100—113 107 42 2 84 168 336 672 3 81 3402 114—128 121 16 3 48 144 432 1296 4 256 4096 с=14 А=79 2=50С ) 6=7 70 686 484 2834 9666 т. е. 9666=2834 + 4 • 484 4 6 • 686 + 4 • 70 + 500, 9666=9666. Следовательно, вычисления данных пяти сумм сделаны вер- но. Если начало отсчета отклонений перенести вниз от вначале принятого нуля, например против варианты 93 с частотой 121, то проверку надо делать по формуле 2/(а- 1)4= -45/а3 + 62 /«2- 4 2(1-92) 6. Находим условные моменток m1=N 1^fa — 70/500=0,1400, т2 = ЛГ1 2 М2 = 686/500 = 1,3720, т3 = N'12 fa3 = 484/500 = = 0,9680, mt = N~l 2 =2834/500=5,6680. (1.92 а) Моменты рекомендуется вычислять не менее чем с четырьмя знаками после запятой. 7. Вычисляем центральные моменты по формулам (1.56) — (1.58): с“2р2 = тг — ml = 1,3720 — 0,14002 = 1,3524, с-3Рз —т3 4- тг (2ml — 3m2) = 0,9680 4- 0,1400 (2 -0.14002— -3-1,3720) = 0,3973, с~4р4 = mi 4- /Hi [3/П!(2/п2—/П1)—4т3]=5,66804-0,1400[3-0,1400х х (2 • 1,3720 — 0.14002) — 4 -0,9680] = 5,2861. 66
8. Проверяем по формулам (1.59), (1.60) вычисление цент- ральных моментов (деленных на степени классового интервала): с~Зр3 — т3 — тг (Зс~2ц2 + /и2) = = 0,9680 — 0,1400 (3 -1,3524 + 0,14002) = 0,3973; с“4ц4 = т4 — т1 [4р3с~3 + (6р2£ 2 + mi)l — = 5,6680 — 0,1400 [4 • 0,3973+0,1400(6 • 1,3524 + 0,14002) ] = = 5,2861. Значения с"3|1з и с~4ц4 практически совпадают с вычислен- ными выше, следовательно, расчеты произведены верно. 9. Находим центральные моменты из уравнений: ц2/с2 = = 1,3524, р,3/с3 = 0,3973, ц4/с4 = 5,2861, где с2=142= 196, с3 = = 143=2744, с4= 144 = 384 1 6, (с — классовый интервал). ц2= = 196-1,3524= 265,0704, ц3=0,3973 • 2744 = 1090,1912, ц4= = 38416- 5,2861 = 203070,8176. 10. Средняя арифметическая определяется по формуле (1.37): М=Л + т1с=79 + 0,1400-14=80,96=81,0. ___ __________ 11. Среднее квадратическое отклонение а=Уц2=у265,0704 = = 16,28. 12. Коэффициент асимметрии вычисляем по формуле (1.79): As = (Г3р3)/(с-2р2 )Лг%) - 0,3973/(1,3524 /К3524) = 0,253. 13. Эксцесс — по формуле (1.84): Е = (с-%/(с~2р2)2 — 3 = 5,2861 /1,35242 — 3 = — 0,11. 14. Коэффициент вариации рассчитываем по формуле (1.43): v=M~la- 100= 16,28-100/81,0=20,1 %. Пользуясь полученными здесь данными, можно вычислить другие параметры, а также кривые распределения взвешенного ряда в зависимости от цели обработки. Кроме указанной в § 1.17, существует формула определения моды Мо через показатели асимметрии As, эксцесса Е, величины сигмы о и средней арифметической М: М0==М — [ До (0,16667.Е+1)] / [2 (0,83333Е — A2 + 1)], (1.93) после чего возможно приближенное вычисление медианы Ме=(Мо+2М)/3. (1.94) По данным рассматриваемого примера Мо = 81 — [0,253 -16,28 (—0,11-0,16667+1) ] / [2 (0,83333 X X (—0,11) —0,2532+ 1)1 - 78,605. Ме = (78,605 + 2 • 81 )/3 = 80,205. Формулы (1.93), (1.94) удобны при вычислениях на ЭВМ, когда желательно избежать промежуточного обращения к исход- 67 3*
Таблица 1.29. К вычислению моментов ряда распределения величин коэффициента вариации биологических признаков X f а fa /а2 fa3 fa4 а—1 (a-1)4 (а—I)4/ 10 89 — 1 —89 89 —89 89 —2 16 1424 30 45 0 0 0 0 0 — 1 1 45 50 19 1 19 19 19 19 0 0 0 70 9 2 18 36 72 144 1 1 9 90 3 3 9 27 81 243 2 16 48 110 1 4 4 16 64 256 3 81 81 130 3 5 15 75 375 1875 4 256 768 150 3 6 18 108 648 3888 5 625 1875 170 2 7 14 98 686 4802 6 1296 2592 190 1 8 8 64 512 4096 7 2401 2401 с=20 S=175 Л=10 16 532 2368 15 412 9243 ным данным, чтобы найти границы модального и медианного классов (§ 1.15, 1.17). Способ 2. Рассмотренный пример относился к ряду, распре- деление частот которого довольно симметрично. Вычисление статистик взвешенного ряда с резко асимметричным распреде- лением частот покажем на примере распределения величин ко- эффициента вариации 175 биологических признаков, для каж- дого из которых коэффициент вариации был получен, в свою очередь, в результате обработки взвешенного вариационного ряда достаточного объема. В табл. 1.29 приведены: х— величи- ны коэффициента вариации от 10 до 190; f — частоты; а — ус- ловные отклонения от варианты Д = 30, полученные по формуле (х— 30)/20; fa, fa2, fa3, fof — произведения степеней отклонений на частоты; а—1, (а—I)4, (а—I)4/ — проверочные вычисле- ния с нулем против варианты А = 50; число классов ряда &=10; интервал ряда с=20; объем ряда 7V = 175. Так как в этом при- мере для проверки вычислений число А перенесено не вверх, а вниз на один класс, то применяем формулу (1.92): 15412—4.2368 + 6 • 532—4 -16+175=9243, что совпадает с итогом последнего столбца табл. 1.29, следова- тельно, расчеты в ней выполнены верно. Условные моменты по формулам (1.92а): т1 = 16/175 = 0,0914286, т2 =; 532/175 = 3,04, т3 = 2368/175 = 13,53143, т4 = 15412/175 = 88,068576. Средняя арифметическая, вычисленная по формуле (1.37): Л1=Л + т1с = 30+20-0,0914286=31,828572. 68
Среднее квадратическое отклонение ввиду сравнительно не- большого объема ряда лучше определить по формуле (1.95) где обозначения те же, что и раньше. о = 20 /(532—0,0914286-16)/( 175—Г) = 34,922, что является несмещенной оценкой сигмы в отличие от формулы о = Ур2, применяемой для больших совокупностей и при исполь- зовании которой можно пренебречь несущественным смещением оценки сигмы. Дальнейшие расчеты других параметров ряда можно провести, пользуясь теми же формулами, по которым об- работан симметричный ряд в этом же параграфе. Способ 3. Рассмотрим еще один алгоритм вычисления (табл. 1.30) показателей взвешенного ряда, который представ- ляет собой модификацию способа г вычисления факториальных Таблица 1.30. Вычисление условных отклонений по способу сумм X f at=7\ а2—46 а3=20 а4=6 213 1 1 1 1 1 194 1 2 3 4 5 175 6 8 11 15 — 156 12 20 31 — —. 137 20 40 — — — 118 68 — —- 99 160 323 — — —• 80 120 163 211 —’ 61 38 43 48 53 5 5 5 5 5 6=10 ЛЛ=431 ^=534 &2=264 63=58 Ь4=5 р—а- -b —463 —218 —38 q—a-\-b 605 310 78 11 моментов, приведенного в § 1.18 (см. табл. 1.24). Найдем цент- ральные моменты ряда из табл. 1.26. Обратим внимание на то, что варианты в столбце 1 табл. 1.30 возрастают по величине сни- зу вверх. Расположим 16 черточек в таблице симметрично отно- сительно центральной варианты 118 и частоты 68. Получим как обычно (см. табл. 1.24) накопленные частоты в столбцах 3—6 и суммируем отдельно их верхние (fli-4) и нижние (&i-4) части. В ходе суммирования проверяем правильность получения на- копленных частот. Так, tz1 = 71, что равно сумме нижних чисел в верхних частях данного и последующего столбцов, т. е. 40+31; 69
u2 = 46, что равно 31 + 15; as = 20, что равно 15+5. Аналогично проверяем суммы &!-4. Разности р и суммы q чисел а и b под- ставляем в формулы Si = Pi, s2 = 7i + 2^2, s3 = Pi + 6 (p2 + p3), si = q1-[-2t7q2 + 6^q3+2qi)], (1.95a) s,=—463, s2=605+2-310= 1225, ’s3=—463+6 (—218 —38)= —1999, s4=605+2[7-310 + 6(3-78+2-11) ] =8017. Далее находим вспомогательную величину: m=st/N, т =—463/431 = —1,07425 и суммы степеней от- клонений: 2x2 = s2— spn, 2*3 = s3 — 2m(l,5s2— Sj/n), 2 x4 = s4 — m [4s3 — 3m (2s2 — msj)], (1.956) 2*2 = 1225-463-1,07425 = 727,62225, S*3 = -1999+1,07425-2 (1,5 -1225—463-1,07425) = 880,25265, 2 x4 = 8017+1,07425 (—4 -1999+3 • 1,07425 (2-1225—1,07425 x X 463)) = 6187,8756. Центральные моменты отсюда равны: щ = (2 x2)/N, Рз=(2г’‘)/^. (1.95в) = 727,62225/431 = 1,6882, ц3 = 880,25265/431 = 2,0424, g4 = 6187,8756/431 = 14,3571. - Среднюю арифметическую и сигму вычисляем по формулам Л4 = Л-|-ст, о = с]/гр2, где А — начало отсчета отклонений; с — классовый интервал; т — вспомогательная величина; |i2— второй центральный мо- мент, Л1= 118—19-1,07425=97,589; а= I9fh6882= 19-1,2992= = 24,685. Пользуясь этими величинами, можно найти и другие показатели взвешенного ряда по ранее приведенным формулам. Способ 4. При описании способа 3 рассмотрен алгоритм вы- числения моментов взвешенного ряда путем суммирования, когда варианты ряда возрастают снизу вверх. В излагаемом здесь ал- горитме показано вычисление моментов для ряда, варианты ко- торого возрастаютсверху вниз. По данным из табл. 1.28 найдем моменты ряда распределения величин диаметра соцветия у ни- вяника (табл. 1.31). 70
Таблица 1.31. К вычислению моментов по способу 4 X 1 а1==183 a2—35 a3—2 a4=0 37 2 2 2 2 51 29 31 33 — 65 119 150 — — 79 171 — — — 1 93 121 179 — — — 107 42 58 74 —- — 121 16 16 16 16 — k=7 7V=5OO &i=253 &2=90 f>3=16 Z?4=0 р=а- —b —70 —55 —14 0 q—a-[-b 436 125 18 0 По формулам (1.95а): s,=—70, s2=436 + 2-125=686, $,=—70+6(—55—14) = =—484, s4=436+2[7- 125+6- (3-18+2-0) ] =2834. Вспомогательная величина m=sJN=—70/500=—0,14. По формулам (1.956): 2*2 = 686-70-0,14 = 676,2; 2*3 = -484+2-0,14(1,5 х X 686—70 • 0,14) = — 198,624, 2 ** = 2834+0,14 (—4 х X 484+3-0,14 (2-686—70-0,14)) = 2643,05736. Центральные моменты для ряда, в котором варианты воз- растают по величине сверху вниз, вычисляются по тем же форму- лам (1.95в), за исключением одного, третьего, центрального мо- мента, перед которым меняется знак: ц2=676,2/500= 1,3524; и,=— (2 х3)/# =—198,624/500=—0,3972; ц4=2643,05736/500= = 5,2861. Сравнивая суммы s^4 с суммами степеней отклонений fa, fa2, fa3, fa*1 из табл. 1.28, видим, что они совпадают по абсолютной величине, что можно использовать для проверки вычислений, рас- положив варианты и частоты сначала по возрастанию вариант, а затем по их убыванию и, сравнив затем результаты вычислений, которые должны быть одинаковыми, лишь третий момент будет различаться по знаку, но не по величине. Прочие показатели взвешенного ряда можно найти по формулам, приведенным в описании способа 3. 71
§ 1.23. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ СТАТИСТИЧЕСКИХ ПАРАМЕТРОВ Ценность статистически обработанных данных заключается также и в том, что вычисленные средние, коэффициенты вариа- ции и корреляции, критерии различия и другие показатели полу- чают количественные границы доверия, которые обозначают воз- можные колебания показателя в меньшую и большую стороны в пределах доверительного интервала. В зависимости от типа рас- пределения данных доверительный интервал рассчитывается дву- мя способами. 1. В симметричных распределениях, близких к нормальному, размах отклонений данных от средней арифметической обычно равен приблизительно За в ту и другую сторону, поэтому счи- тают, что все возможные отклонения параметра от его истинной величины будут лежать в пределах ±3а. Отклонения от средней арифметической для их сравнимости выражают в долях сигмы: /= (х— М)/о, где t — нормированное отклонение от средней арифметической; х— любая варианта совокупности; М — средняя арифметиче- ская; а — среднее квадратическое отклонение. При расчете доверительного интервала для трех стандартных доверительных уровней: Р1 = 95%, Р2 = 99%, Р3 = 99,9%, t выби- рается по табл. 4П, по числу степеней свободы, соответствующе- му данному параметру. Если объемы выборок достаточно вели- ки, то принимаются /, равные 1,960; 2,576; 3,291, или округленно 2,0; 2,6; 3,3, по тем же доверительным уровням, т. е. берется по- следняя строка таблицы. Доверительный интервал средней арифметической строится по формуле М — /тм<истинное значениеЧ-(1.96) Пример. Доверительный интервал средней арифметической из §1.16 построим на 95% доверительном уровне при числе степе- ней свободы v=14—1 = 13, откуда по табл. 4П / = 2,160. Сред- няя Л1 = 74,9, ее ошибка тм= 1,9, следовательно: 74,9—2,160- 1,9<истинное значение<74,9 + 2,160-1,9, откуда истинное значение средней арифметической находится в пределах 70,8<7И<79,0, т. е. не меньше 70,796 и не больше 79,004. Подставив в формулу (1.96) вместо М и тм величину любого параметра и его ошибки, например среднего квадратического от- клонения, коэффициентов вариации или корреляции и других можно построить для них доверительный интервал таким же об- разом. 72
2. Когда доверительный интервал необходимо построить при неизвестном типе распределения вариант, применяется неравен- ство П. Л. Чебышева. В этом случае подразумевается, что раз- мах отклонений от средней арифметической в совокупности с не- известным распределением может быть больше, чем в нормаль- ном распределении, т. е. больше чем За. Согласно неравенству П. Л. Чебышева, истинная средняя арифметическая находится в интервале: Л4 — 1 — Р' <; истинное значение М + тм/V 1 —Р\ (1.97) где М — средняя арифметическая, рассчитанная по выборке; тм— ее ошибка; Р' — доверительный уровень, или 1 — Р'= = W' — уровень значимости в долях единицы. Построим доверительный интервал для средней из предыду- щего примера по неравенству П. Л. Чебышева: Л4 = 74,9; тм— = 1,9; примем доверительный уровень Pi = 95%, т. е. уровень значимости 1F'=1—Р4=1 — 0,95 = 0,05. По формуле (1.97) 74,9— 1,9//бД> ^истинная средняя <^74,9 + 1,9/(Л0,05, следовательно, согласно неравенству (1.97), средняя арифмети- ческая с вероятностью 0.95 находится в пределах от 66,4 до 83,4, т. е. в более широком интервале, чем при нормальном распреде- лении. При доверительном уровне P4 = 95% истинная величина статистического параметра (например, средней арифметической) находится в пределах от М =—4,47 тм до М= +4,47 тм, (где 4,47= 1/У0,05), каково бы ни было распределение данных в рас- сматриваемой выборке. Если требуется определить доверительный интервал стати- стического параметра лишь с одной стороны (большей или мень- шей), то значение t по сравнению с рассчитанным по формуле (1.96) принимается несколько меньшим, по табл. 7П. Для трех стандартных уровней: Р4 = 95%, Р2=99% и Р3=99,9%, t при од- ностороннем доверительном интервале для больших (АС>30) вы- борок соответственно равно: 1,645; 2,326 и 3,090. Используя при- мер из § 1.04, где средняя арифметическая равна 714 = 75,05, а ее ошибка тл/ = ±0,41, вычислим доверительный интервал в боль- шую сторону на 95% доверительном уровне: истинное значение.4 + tmM, (1.98) М+tmM = 75,05+1,645 • 0,41 = 75,72. Следовательно, правая, или большая, граница односторонне- го доверительного интервала рассматриваемой средней арифме- тической составляет 75,72. Односторонний интервал с левой, или меньшей, стороны М—значение, (1.99) 73
где t принимается для больших выборок, согласно приведенным значениям для одностороннего интервала, или по табл. 7П, если выборки небольшие, при числе степеней свободы N— 1. § 1.24. ОПРЕДЕЛЕНИЕ РЕПРЕЗЕНТАТИВНОСТИ И МЕТОДЫ ОТБОРА ВАРИАНТ ВЫБОРОК Генеральной совокупностью называется вся совокупность особей или предметов изучаемого объекта. Если изучается сред- няя высота растений какого-либо сорта, то генеральной совокуп- ностью являются все особи данного сорта, выращенные в сход- ных условиях. Большинство биометрических исследований про- водится на некоторой части генеральной совокупности, которая называется выборкой, или выборочной совокупностью. Стати- стические показатели, полученные по выборке, распространяются затем на всю генеральную совокупность данного объекта. Чис- ленность генеральной совокупности может быть известной, а чаще ее определить трудно. Объем выборки, достаточный для достоверности получаемой по ней средней арифметической, мож- но определить различными способами. Объем репрезентативной, т. е. достаточной по численности, выборки для того случая, ког- да известен объем генеральной совокупности, вычисляется по формуле #=1/[(Д//о)2+1Ж], (1.100) где N— искомый объем выборки; критерий достоверности Стью- дента в зависимости от доверительного уровня исследования /=1,96 при Р/=0,95; / = 2,58 при Р/=0,99 и /=3,30 при Р3'= = 0,999; No — численность генеральной совокупности; Д — допу- стимая погрешность определения средней арифметической в именованных числах; о — среднее квадратическое отклонение. Если сигму нельзя вычислить по предыдущим опытам с дан- ным объектом, ее можно определить по приближенным способам, рассмотренным в § 1.11. Определим репрезентативность выборки для изучения про- должительности вегетационного периода совокупности сортов ячменя. Предположим, что существует всего около 2000 сортов этой культуры. Из предыдущих расчетов известно, что в этой со- вокупности для выборки Д7 = 214 среднее квадратическое откло- нение о=6,07 дня. Примем допустимую погрешность определения средней ариф- метической Д=1 день, тогда по формуле (1.100) при /=1,96: 7V= 1/[ (1/1/96-6,07)2+1/2000] = 132 сорта. Таким образом, для изучения продолжительности вегетаци- онного периода совокупности сортов ячменя достаточно было взять выборку в 132 сорта при условии их случайного отбора. 74
Репрезентативность выборки для достоверности ее средней арифметической можно определить, минуя расчет средней ариф- метической, сигмы и ошибки средней арифметической: --------------^9, (1.101) (2 х) yV2x2—1 где х — варианты ряда; N — число вариант. Если значение левой части неравенства (1.101) будет боль- ше 9, то данный объем выборки достаточен для достоверности средней арифметической совокупности. Оценку значимости по формуле (1.101) можно делать также и более точно по критерию Фишера при v (1) = 1 и v(2)=iV— 1 (см. табл. 8П). При отборе нужного числа вариант из генеральной совокуп- ности необходимо прибегать к методу рендомизации, который обеспечивает случайность выбора вариант. Например, для про- изводства каких-либо наблюдений или измерений следует отби- рать не «типичные» и не «средние» экземпляры, а те, которые попадают в выборку по схеме отбора, независимо от размещения и состояния растений или их органов. Применяют в основном метод механического отбора и жеребьевку. При механическом отборе отсчитывают каждое пятое или десятое, или двадцатое и т. д. растение или рядок. При жеребьевке всем растениям де- лянки присваивают номера, затем записывают их на билеты и по жребию выбирают нужное число особей или же отбирают их по таблице случайных чисел (см.: [Янко, 1961, табл. 36]). Второй принцип отбора выборки — равномерность распределения отби- раемых вариант по делянке, опытному полю, по буртам, ящикам и т. д. Например, нельзя брать все 20 растений какой-либо вы- борки из одного места делянки или 20 плодов из одного ящика, если ящиков много, и т. д. Можно отобрать 20 требуемых рас- тений, например, по диагонали делянки через равные промежут- ки так, чтобы отбираемые особи распределялись равномерно по всей длине диагонали. При подсчете репрезентативности выборки, например, из со- вокупности сортов растений по какому-либо хозяйственно важ- ному признаку получаемое число может послужить при опреде- ленных условиях указанием на качественный состав данной со* вокупности сортов. Если, например, при объеме генеральной совокупности, равном 2000 сортов, при подсчете по формуле (1.100) получается, что для достоверного изучения длительности вегетационного периода сортов ячменя достаточно располагать выборкой в 132 сорта, это, помимо чисто статистического смысла данной величины, означает также и хозяйственную ненужность остальных 1868 сортов, так как они повторяют по данному при- знаку уже имеющиеся сорта. Поэтому использование таких сор- тов может быть оправдано лишь в том случае, если они обладают другими ценными признаками, не встречающимися у остальных сортов. Следовательно, сортооценка любой совокупности сортов 75
должна производиться по достаточно репрезентативному комп- лексу хозяйственно и биологически важных признаков. В биологических исследованиях часто встречаются случаи, когда подлежащая изучению совокупность имеет неизвестную численность. Достаточный объем выборки из таких совокупно- стей W=(/o/A)2, (1.102) где t — критерий достоверности, порядок его применения указан в пояснении к формуле (1.100); о — среднее квадратическое от- клонение; когда его величина для данного объекта неизвестна, ее можно приближенно определить по методам, рассмотренным в § 1.11; А — допустимая погрешность определения средней ариф- метической. Определим достаточный объем выборки для примера, приве- денного в начале параграфа, в предположении, что объем сово- купности неизвестен, f=l,96, а = 6,07 дня, Д=1 день, тогда по формуле (1.102) =.(1,96-6,07/1)2= 142. Формулы (1.100) и (1.102) дают только приближенные зна- чения численности выборок; результаты, получаемые по ним, сильно зависят от принимаемой величины допустимой погрешно- сти средней арифметической. Проверить правильность назначе- ния достаточной численности выборки можно, вычисляя затем по ней показатель точности опыта (см. § 1.14), который должен быть не больше 5%. Когда известна величина варьирования вариант совокупно- сти (в %), достаточный объем выборки ^=(^/g)2? (1.103) где v — коэффициент вариации, % ; е — допустимая погрешность, %; t — критерий достоверности. Рекомендуется принимать е = 3% и не больше 5%. Если из- вестны точно или приблизительно средняя арифметическая и сигма (см. § 1.11), то коэффициент вариации можно подсчитать (см. § 1.13), а затем подставить его значение в формулу (1.103). Достаточная численность выборки при /=1,96, и=10% и е=3% по формуле (1.103) N= (1,96-10/3)2 = 43. Если принять /=1,96, е = 3%, то формула (1.103) получает вид N = 0,43 v2. Тогда минимальный при /=1,96 и е = 5% и мак- симальный при /=3,30 и е= 1 % объемы достаточных выборок соответственно равны: A^min = 0,1537-t/2 и Nmax= 10,89-и2. При v =10% минимальная и максимальная выборки соответ- ственно равны 15 и 1089 особей. Размеры минимальных выборок в зависимости от коэффициента вариации исходных данных при- ведены в табл. 9П. При альтернативном варьировании и известной численности генеральной совокупности изучаемого объекта объем выборки, достаточный для достоверности определяемой доли, можно при- ближенно определить по формуле (1.100), которая для часто 76
применяемого уровня достоверности в 95% при /=1,96 и о=0,5 (когда последняя неизвестна) примет вид Л/= (1,042Д2 + ^1Г1, (1.104) где Л/о— объем генеральной совокупности; А—допустимая по- грешность при определении доли (средней арифметической); о — среднее квадратическое отклонение изучаемой совокупности; если оно неизвестно, следует принять максимальное его значение при альтернативном разделении дат а=0,5; / — показатель до- стоверности суждения, в зависимости от требуемой точности опы- та он равен 1,96; 2,58; 3,30. Определим достаточный размер выборки, который требуется для достоверности определения доли корнеплодов моркови, по- ражаемых фомозом при механическом их повреждении (по дан- ным^ 1.27). Сигма этой совокупности известна а=уо,63-О,37= = 0,48, имеющаяся в наличии численность генеральной совокуп- ности: Л^о^бОО корнеплодов. Примем Д = 0,1 и /=1,96. По фор- муле (1.100) Л/= 1/[ (0,1/(0,48-1,96) )2 +1/600] =77. Таким образом, для достоверного определения доли распро- странения заболевания в данной партии моркови как минимум необходимо 77 корнеплодов. По формуле (1.104) достаточная величина выборки по этим же данным, но для совокупности с неизвестной сигмой, которая принимается о=0,5 и при А = 0,1; No = 6OO: 2V= 1 /(1,042 • 0,12 + 4-1/600) =83. Увеличение выборки на 6 корнеплодов по сравнению с пре- дыдущим результатом произошло из-за увеличения сигмы с 0,48 до 0,50. При планировании опыта или обследования необходимый объем выборки, обеспечивающий достоверность доли при альтер- нативном варьировании признака, в зависимости от требуемой точности при неизвестном объеме генеральной совокупности мо- жет быть приближенно определен и по формуле (1.102). Если сигма неизвестна, то и в этом случае следует принять ее максимально возможное значение при альтернативном раз- делении вариант а=0,5, а А — допустимую погрешность опреде- ления доли выразить в частях единицы. Для данных табл. 1.05 о доле мутантов среди особей ячменя по формуле (1.102) требуемый минимум объема выборки для достоверности определения доли мутантов при /=1,96; o=ypq = = У0,06 • 0,94 = 0,24 и А=0,02: Armin =( 1,96-0,24/0,02)2 = 553 осо- би. Величина выборки, в которой гарантировано наличие хотя бы одной особи, обладающей изучаемым признаком, определяется по формуле ^=[lg(l-Pt-3)]/[lg(l-p)], (1.105) 77
где Р/—0,95; Р2'=0,99; Р3'=0,999; р — доля особей в генераль- ной совокупности, обладающих изучаемым признаком. При де- лении логарифмов их необходимо преобразовать из искусствен- ной в естественную форму. Для тех же данных при р = 0,06 по формуле (1.105) объемы выборки, гарантирующих наличие как минимум одного зараженного корнеплода на трех указанных уровнях достоверности суждения от Р/ до Р3 будут: 48, 74 и 112 корнеплодов. § 125. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Достаточно большую статистическую совокупность можно представить в виде эмпирической кривой распределения частот. Почти каждое эмпирическое распределение можно, в свою оче- редь, интерпретировать каким-либо теоретическим типом рас- пределения, что, как правило, раскрывает новые особенности изучаемого явления и позволяет прогнозировать некоторые его свойства. Принципы построения статистических распределений и другие подробности о них можно найти в курсах теории веро- ятностей. Распределения разделяются на два основных типа: дискретные и непрерывные — в зависимости от характера изме- нения составляющих их случайных величин. Начиная с § 1.26, рассмотрены распределения дискретного типа: альтернативное, биномиальное, гипергеометрическое, Пуассона, негативное бино- миальное, мультиномиальное, а затем, начиная с § 1.32,— рас- пределения непрерывного типа: Максвелла, Рэлея, показатель- ное, Парето и др. Предшествует тем и другим типам нормальное распределение непрерывного типа, которое является основным, так как, согласно теории вероятностей, к нему в пределе стре- мятся все известные типы распределений. Нормальное распреде- ление широко распространено, имеет наибольшее значение для теории и практики биометрических исследований, поэтому в пер- вую очередь сравнивают полученное эмпирическое распределе- ние с нормальным, теоретические частоты которого необходимо для этого вычислить. Нормальному распределению присущи сле- дующие признаки: 1) симметричная колоколообразная двускат- ная кривая распределения частот; 2) соотношение средней ариф- метической и сигмы, равное Л1 = 3о, или ц = 33%. Чем ближе эмпирическое распределение к этим показателям, тем больше шансов на удовлетворительную аппроксимацию его кривой нор- мального распределения. Итак, требуется установить, какие зна- чения частот имел бы данный вариационный ряд, если бы рас- пределение частот было нормальным. Теоретические частоты кривой нормального типа можно вычислить по формуле f = (АГс/а/2^) е-0’5'2, (1.106) или, что одно и то же: f'= (Nc/o) • (0,39894/е0>5/2), (1.107) 78
или f'=Afexp {Inc+ln0,39894 — Ina—0,5/2}» (1.108) где N — объем выборки; с — классовый интервал; a — среднее квадратическое отклонение; е — основание натуральных лога- рифмов = 2,7182818 (см. табл. 10П); t=(x—М)/с — нормиро- ванное отклонение (о нем говорится также в § 1.23); М — сред- няя арифметическая; х — варианты (середины классов) ряда. Формула (1.108) наиболее удобна при вычислении на не- больших ЭВМ, так как дает возможность избежать переполне- ния памяти при больших показателях числа е. Вычисление тео- ретических частот и совпадение их с эмпирическими у распре- деления 214 сортов ячменя по продолжительности вегетацион- ного периода по данным из табл. 1.04 по формуле (1.106) пока- зано в табл. 1.32 и 1.33. В табл. 1.33 произведены следующие действия. 1. Найдены разности вариант и средней арифметической: х — М (столбец 2). 2. Разности х—М в столбце 3 нормируются, т. е. делятся на среднее квадратическое отклонение (о=5,989). 3. По вычисленным значениям /, пользуясь табл. 11П, нахо- дим значения выражения ф (/) = (1/|Л2л) е-0*5*2 для формулы (1.106), или ф(/) = 0,39894/(е0>5*2) для формулы (1.107) (стол- бец 4). 4. Вычисляем значение выражения Nel о = 214 • 5/5,989 = 178,66. 5. Множим числа столбца 4 на 178,66 (столбец 5). 6. Округляя числа столбца 5 до целых чисел, получаем тео- ретические частоты; их сумма должна быть близкой к объему вы- борки, а величина крайних вариант, выраженных в нормирован- ных отклонениях, должна быть не меньше 3. Если эти отклонения меньше 3, то следует соответственно слева, справа или симмет- рично добавить несколько классов по краям распределения. Урав- нение кривой нормального распределения в конкретной форме: f'= 178,66 ф (/), где t= (х—75,09)/5,989. На рис. 3 изображены эмпирическая и теоретическая кривые нормального распределения рассмотренной совокупности. Срав- нение теоретических частот с эмпирическими с целью установить, отличается ли данное распределение от нормального, рекомен- дуется производить критерием Колмогорова. При помощи критерия Колмогорова сравнивают лишь взве- шенные ряды, как теоретические с эмпирическими, так и эмпи- рические между собой. Число наблюдений при этом должно быть достаточно большим; объединять их в очень крупные разряды (классы) нельзя, а сама изучаемая случайная величина должна иметь распределение непрерывного типа. В результате вычисле- ний получают величину К(Х), которую сравнивают в зависимо- 79
Таблица 1.32. Расчет критерия [Колмогорова при сравнении эмпирических и теоретических частот Ч астоты n/N n'/N d эмпири- ческие теорети- ческие накоплен- ные эмпири- ческие п накоплен- ные теорети- ческие п' 1 2 3 4 5 6 7 2 2,98 2 2,98 0,00935 0,013925 0,0045 30 17,4 32 20,38 0,14953 0,095234 0,0543 34 49,7 66 70,08 0,30841 0,32748 0,01907 62 71,3 128 141,38 0,59813 0,66065 0,0625 74 50,9 202 192,28 0,94393 0,89850 0,0454 8 18,1 210 210,38 0,98131 0,98308 0,0018 4 3,2 214 213,58 1,000 0,99804 0,002 ЛН=214 213,58 Таблица 1.33. Вычисление теоретических частот нормального распределения Вариан- ты X х—М Х—М Д’ - 1 о М>(0 (табл. 11 П) Теоретические частоты Эмпири- ческие частоты f вычислен- ные округ- ленные 60 —15,09 —2,5196 01 667 2,98 3 2 65 —10,09 —1,6848 09 728 17,4 17 30 70 —5,09 —0,8499 27 798 49,7 50 34 75 —0,09 —0,0150 39 889 71,3 72 62 80 4,91 0,8198 28 504 50,9 51 74 85 9,91 1,6547 10 139 18,1 18 8 90 14,91 2,4896 01 797 3,2 3 4 с=5 М=75,09 о—5,989 — 213,58 214 214 сти от принятого доверительного уровня с одним из трех следую- щих чисел: 1,36 (/>/=0,95); 1,63 (//=0,99); 1,95 (// = 0,999). Если вычисленная величина критерия будет меньше критиче- ского уровня для избранной доверительной вероятности (указа- на в скобках), то различие считается несущественным, если больше, то устанавливается факт неслучайного различия между двумя данными рядами. Критерий Колмогорова более удобен, чем обычно применяемый для этой же цели критерий хи-квад- рат, в частности тем, что позволяет обходиться без таблиц, учета 80
Рис. 3. Распределение сортов яч- меня по продолжительности веге- тационною периода 1 — эмпирические частоты; 2 — кривая нормального распределения; f — частоты; х — варианты числа степеней свободы и объеди- нения классов распределения с малыми частотами. 1. Вычислим величину крите- рия Колмогорова для данных, приведенных в табл. 1.32, где сравниваются частоты эмпириче- ского ряда распределения про- должительности вегетационного периода у сортов ячменя (столбец 1) с частотами соответствующей нормальной кривой (столбец 2). Частоты располагаются в табли- це сверху вниз в порядке возра- стания вариант ряда, что принято в качестве условия при вычисле- нии этого критерия. В столбцах 3 и 4 приведены эти же частоты, но нарастающим итогом, т. е. в столбце 3: 2 + 30 = 32; 32+34 = 66; 66 + 62=128 и т. д., также и в столбце 4; суммирование частот ведется только сверху вниз. По- следнее число в столбце 3 должно быть равно объему эмпириче- ского ряда 7V = 214, а последнее число в столбце 4 должно быть равно сумме частот теоретического ряда tV' = 213,58. В столбцах 5 и 6 те и другие частоты поделены на М = 214, т. е. на объем эмпирического ряда. В столбце 7 вычислена разница без знака построчно между приведенными в столбцах 5, 6 аналогичными частостями эмпирического и теоретического рядов. Для дальней- ших расчетов необходима лишь одна разность из этого столбца — максимальная, которая в данном случае равна 0,0625. По фор- муле (1.178) К(Х) =dmax}W, в которой К(Х) —величина критерия Колмогорова; dmax — максимальная разница по модулю числа (без знака) из столбца 7; N — объем эмпирического ряда; К(Х) = = 0,0625у214 = 0,915. Это число меньше чем 1,36 при Р/ = 0,95; поэтому делаем вывод, что совпадение частот эмпирического ряда с частотами нормальной кривой удовлетворительное. Теоретические частости нормальной кривой (в %) можно приблизительно вычислить и для невзвешенного ряда, если при- нять в формуле (1.106) Af=100%, с=10% (что определяет число классов й=10), начальную варианту Xt = 0. Необходи- мость в таком расчете может возникнуть, например, при оценке степени нормальности распределения данных. 8)
* * * Одним из важных применений свойств нормального распре- деления служит возможность определения доли совокупности, на- ходящейся в пределах заданного интервала изменения величи- ны х, что покажем на следующем примере. Требуется выяснить, у какой части всех сортов ячменя урожай созревает на 70—80-й день после появления всходов, или, говоря иначе, какова веро- ятность встретить в культуре сорта ячменя с вегетационным пе- риодом от 70 до 80 дней. 1. Для этого вычисляем нормированные отклонения меньшей и большей границ заданного интервала: х1==70, х2 = 80. Выше были вычислены средняя Л4 = 75,09 дней и сигма <у=5,989 дней. Отсюда нормированные отклонения равны: /1=(х1 — М)/в= = (70—75,09)/5,989 = -0,8499; t2= (х2 — М)/в= (80—75,09)/ /5,989 = 0,8198. 2. По табл. 12П значений функции Ф(/), приведенной в при- ложении, определяем по вычисленным и t2 доли совокупности, находящиеся левее этих точек, но перед этим следует каждый раз преобразовывать отрицательные величины t и функции, если та- ковые имеются, в положительные. В нашем примере Л = —0,8499, поэтому функция для него Ф (—0,8499) = 1 — [ Ф (0,8499) ] = = 1—0,8023 = 0,1977; т. е. в случае отрицательного t найденное по таблице значение функции Ф вычитаем из единицы; остаток и будет искомым значением функции Ф для отрицательного t. Нормированное отклонение t2 для второй, большей границы ин- тервала— число положительное, поэтому находим сразу по таб- лице Ф (0,8198) =0,7939. 3. По формуле р = Ф(/2)—Ф(/1) находим искомую долю: р=0,7939—0,1977=0,5962, или 59,62%. Таким образом, примерно у 60% всех известных сортов яч- меня на созревание урожая требуется от 70 до 80 дней. Подоб- ные сведения представляют интерес как при определении на- правления селекции новых сортов этой культуры, так и при гео- графическом их размещении. На основе свойств нормального распределения возможно ре- шать также и обратные задачи: по заданной вероятности или объему совокупности, в процентах или долях единицы найти ко- личественную границу интервала, в котором эта доля будет на- ходиться. При этом одна из границ интервала должна быть из- вестна. Например, требуется определить, по какому количест- венному критерию следует отбирать 5% сортов ячменя, вегета- ционный период которых больше медии (средней арифметиче- ской) . Одна из границ искомого интервала известна — это значение медии: 714 = 75,1 день. Другую границу, численное значение кото- рой больше медии, предстоит найти. Сначала решим эту задачу обычным способом при помощи таблицы функции нормального 82
распределения. Сигма была вычислена раньше, она равна 5,989. Нормированное отклонение для средней арифметической, как из- вестно, равно нулю: ^=(75,1—75,1)/5,989=0,0. В табл. 13П находим, что этому значению соответствует веро- ятность 0,50, или 50% всего объема совокупности. Далее в этом же столбце табл. 13П находим вероятность 0,55(0,50 + 0,05, или 5%), которой соответствует Z2 = 0,13. Так как /2=(х— М)/с= — (х— 75,1)/5,989, то искомое значение второй границы интер- вала х=о/2 + Л4 = 5,989-0,13 + 75,1 = 75,9 дней. Таким образом, для того чтобы отобрать 5% сортов с указанным признаком, надо выбрать из совокупности все те сорта, вегетационный период у которых равен 76 дням. Решим эту же задачу вторым способом — непосредственно по эмпирическому ряду, без помощи каких-либо таблиц нормаль- ного распределения, рассуждая следующим образом. 5% от 214 сортов составят 214-0,05=10,7=11 сортов. По табл. 1.34 Таблица 1.34. К вычислению доли совокупности по эмпирическим частотам Вегетационный период ячменя, дни Частота f Накопленная частота граница класса середина класса X 57,5—62,4 60 2 2 62,5—67,4 65 30 32 67,5—72,4 70 34 66 72,5—77,4 75 62 128 77,5—82,4 80 74 202 82,5—87,4 85 8 210 87,5—92,5 90 4 214 k~7 с=5 2V=214 накопленных частот определяем, что значение медии — одной из границ искомого интервала находится в классе с границами от 72,5 до 77,4. Число сортов, приходящихся на одну единицу этого классового интервала: 128—66 = 62 сорта — на 5 дней. Опреде- лим прямолинейной интерполяцией, т. е. обычной пропорцией, сколько единиц классового интервала приходится на 11 сортов: 62 5 дней = 1Ь5 = 88 11 — Х2 2 62 Таким образом, левая граница интервала равна 75,1 дня, а правая: 75,1+0,887=75,987^76 дням, что и было получено по первому способу решения этой задачи. Отобрав все сорта в пре- делах этого интервала, т. е. с вегетационным периодом 76 дней, получим 11 сортов, или 5% от их общего числа. В табл. 1.01 на- 83
считывается 12 сортов с вегетационным периодом 76 дней, что можно считать хорошим совпадением результатов подсчета с фактическими данными. Только что изложенную задачу, решен- ную по эмпирическим частотам, можно выполнить и по следую- щим формулам в зависимости от того, совпадают ли границы интервала искомой доли с границами или серединами класса. 1. Если границы интервала искомой доли совпадают с сере- динами классов распределения, например от ^ = 70 до х2 = = 80 дней, то р = [ f 22 - f 21 - 0,5 (/2 - А) ] Ж (1.109) где f2(, fz2 — накопленные частоты, соответствующие заданным Xi и х2; fiy f2 — эмпирические частоты, соответствующие задан- ным и х2; N — объем совокупности. Подставляя в формулу (1.109) известные данные из табл. 1.34, получим р= [202—66—0,5(74—34) ]/214 = 0,542, что хотя и не- много меньше доли, полученной через посредство таблиц функ- ции Ф(/), однако, вероятно, более соответствует фактам, так как аппроксимация нормальной кривой, как это видно на рис. 3, мог- ла бы быть лучшей. 2. Если границы интервала искомой доли совпадают с грани- цами классов распределения, то р=(а2-аож (ено) где обозначения те же, что и в формуле (1.109). Например, для интервала от ^ = 72,5 до х2 = 82,4 дней доля совокупности, или вероятность: р=(202—128)/214= 0,346, или 34,6% сортов. 3. Если границы интервала искомой доли не совпадают ни с границами классовых интервалов, ни с серединами классов, то вычисления доли р ведем следующим образом. Находим частоты f/ и соответствующие, например, заданным границам интер- вала доли Xi = 64, х2 = 73, для чего делим частоту, соответствую- щую меньшей границе интервала доли на классовый интер- вал, получаем число частот, приходящееся на единицу классо- вого интервала: 30/5 = 6, умножаем его на разницу xt с меньшей границей класса (64—62,5), т. е. 6-1,5=9, и вычитаем получен- ное число из частоты // класса, в котором находится х{: 30—9 = = 21, что можно представить в виде формулы А = А 11 — (*т - GJ/c] = 30 [ 1 — (64-62,5)/5] = 21, (1.111) где // — частота, точно соответствующая х{ — меньшей границе интервала искомой доли; А — частота класса, в котором нахо- дится хс, Gi — меньшая граница класса, в котором находится с — классовый интервал. Частота для х2— большей границы интервала доли: А = fz (х2 - GJ/c, (1.112) 84
Рис. 4. Нормальная кривая На оси абсцисс — баллы (1—6) шкалы по среднему квадратическому отклонению; ЛТ — средняя арифметическая, f — частоты; х — варианты где G2— меньшая граница класса, в котором находится значе- ние х2; /г — частота этого класса, т. е. f2=62(73—72,5)/5 = 6,2. Из таблицы накопленных частот данного ряда находим /21=32; /22=128, после чего вычисляем искомую долю: р = (/х2- Ы+ А - h + АЖ (1.113) р = (128—32+21—62+6,2)/214 = 0,286, т. е. среди сортов ячменя насчитывается 28,6% созревающих в период от 64 до 73 дней после посева. При количественном определении понятий «типичное» и «нор- ма» важную роль играет среднее квадратическое отклонение. На расстоянии (Л4+о) и (Л4—о) от медии на графике нормальной кривой расположены абсциссы ее двух точек перегиба (рис. 4). Точки перегиба кривых, как правило, указывают на тот момент процесса или явления, когда в нем происходят качественные из- менения, что в данном случае важно для построения теоретически обоснованных шкал. В нормальном распределении в точках пе- региба может произойти лишь переход от типичных величии вариант совокупности к нетипичным, хотя и принадлежащим еще к одной совокупности. В этом, собственно, и заключается смысл среднего квадратического отклонения, которое измеряет сред- нюю величину отклонений вариант от медии, наиболее вероятной, или типичной, величины. Приведем величины площади под нор- мальной кривой, которые соответствуют определенным значениям сигмы, одновременно по обе стороны от медии. В интервале нор- мы, между абсциссами, от (Л! — о) до (Л1 + о) находится 68,27% всей площади нормального распределения, т. е. вариант, или дат совокупности; между М — 2о и М + 2о заключается 95,45% дат от всего объема и в интервале от М — Зо до ЛТ + Зо лежит 99,73% от всего объема нормально распределенной совокупности. Если тип распределения данных неизвестен или известно, что он не относится к нормальному, то минимальная доля вариант, 85
приходящаяся на интервал M-t-t: pmin>l-l//2, (1.113а) где ±t— нормированное отклонение, взятое со знаком + и —, т. е. находящееся на одинаковом расстоянии от средней ариф- метической слева и справа по оси абсцисс. При определении доли вариант в сигмальном интервале (То), когда ±/=1, pm]n> >1 —1/1>0. Таким образом, не исключено, что в интервале нормы при некотором типе распределения может оказаться лю- бое число вариант, о котором известно лишь одно — что оно больше нуля. При /<1 в правой части неравенства (1.113а) по- лучается отрицательное число, следовательно, в интервале, мень- шем ±о, по обе стороны от средней при некоторых типах рас- пределений не гарантируется наличие даже одной варианты. Доля вариант при нормальном и любом другом распределе- нии данных для некоторых значений t указана в табл. 1.35. Таблица 1.35. Доли вариант, соответствующие различным сигмальным интервалам t Границы интервалов Доля вариант от ДО при нормальном распределении минимум при любом распреде- лении 1 M—G М4-а 0,683 0 1,5 М—1,5 а ЛЖ,5а 0,866 0,555 2 М—2 а М+2 а 0,955 0,750 2,5 М—2,5 а М+2,5 а 0,988 0,840 3 М—За Л4+3 а 0,997 0,889 3,5 М—3,5 а М4-3,5а 0,999 0,918 § 1.26. АЛЬТЕРНАТИВНОЕ РАСПРЕДЕЛЕНИЕ Альтернативное (или дихотомическое) распределение при- меняется в тех случаях, когда варианты могут быть разделены по некоторому признаку только на два класса. Например, сово- купность корнеплодов моркови может быть разделена на пора- женные фомозом и здоровые, совокупность цветков на однодом- ном растении может быть разделена на мужские и женские, и т. д. Таким образом, при альтернативном варьировании дат совокупность делится на две части: в одной из них наблюдаемый признак, например поражение болезнью, присутствует, а в дру- гой части наблюдаемый признак отсутствует. Выборки, состоящие из двух групп альтернативных вариант, нередко встречаются в практике биологических, в частности ге- нетических, исследований. Например, в табл. 1.05 в одной выбор- ке, состоящей из 1050 обследованных растений ячменя, 66 осо- 86
бей оказались мутантами, что составляет 6,3% от всего числа растений, или 0,063 в долях единицы. Доли особей, или вариант, обладающих изучаемым признаком или не обладающих им: p=nP!N, (1.114) q—nJN, (1.115) где р— доля особей с изучаемым признаком, выраженная как часть от единицы, она же и средняя арифметическая; q — доля особей без этого признака; пр— число особей, имеющих изучае- мый признак; nq— число особей, не имеющих изучаемого при- знака; N — объем всей выборки (N=np+nq). Когда обе указанные доли выражаются в частях от единицы, всегда соблюдается равенство р + <7=1, (1.116) которое служит для проверки вычислений. Доли особей с изучаемым признаком или без него могут быть определены также в процентах: p=np.100%/JV, (1.117) q=nq.100%/N, (1.118) p + q=l00, (1.119) где обозначения аналогичны тем, которые даны в формулах (1.114) — (1.116). Для данных табл. 1.05 доли мутантов и нему- тантов в частях единицы определяются по формулам (1.114) — (1.116): р = 66/1050=0,063; (/=984/1050=0,937; /> + (/ = 0,063 + + 0,937=1, или в процентах по формулам (1.117) — (1.119): р=66-100/1050=6,3%; (/=984-100/1050=93,7%; р + (/=6,3 + + 93,7=100%. Для определения достоверности доли при альтернативном разделении вариант необходимо определить ее ошибку. mM=VpqlN, (1.120) где тм — ошибка доли; р — доля вариант, имеющих наблюдае- мый признак, или средняя арифметическая этого признака; q — доля вариант, не имеющих наблюдаемого признака; N — объем выборки. Для данных табл. 1.05. тм = ^Лб,3-93,7/1050 = ±0,75%. Ошибка получается в долях единицы или в процентах в за- висимости от размерности р и q. Границы достоверности при альтернативном разделении вариант можно определить, прибав- ляя к той или другой доле выражение ±tmMi где t — критерий Стьюдента (по табл. 4П) с числом степеней свободы v=N—1. Для рассматриваемого случая, при Р/=0,95, Af=1050, v= = 1050—1 = 1049, /=1,96 (из табл. 4П), р=6,3% ±1,96-0,75= = 6,3± 1,5%, т. е. процент мутантов в совокупности особей ячме- 87
ня при воздействии на них некоторых мутагенных факторов, или средняя арифметическая мутантов, может колебаться от 4,8 до 7,8%. Ошибка альтернативной доли равна той же величине, т. е. mg=mp = mAf, в данном случае <7 = 93,7%± 1,5%. При р = 0 ошибку доли вычисляют при помощи искусственного приема по формулам р = [(Пр+l).100]/(JV + 2), тм = / pq/(N + 3), (1.121) где обозначения те же, что и в формулах (1.114), (1.120). Допустим, что в другой выборке из 997 растений ячменя не оказалось ни одного мутанта, т. е. пр=0, тогда по формулам (1.121) р = [(0+1). 1001/(997+2) = 0,1 %, тм = /0,1.99,9/(997+3)= = 0,1%, т. е. в генеральной совокупности возможно все же встретить не- большой процент мутантов, несмотря на их отсутствие в данной выборке. Формулы (1.121), конечно, применимы также и к аль- тернативной доле — q. Среднее квадратическое отклонение, или сигма двухклассо- вого разделения вариант, определяется для количественного вы- ражения меры альтернативной изменчивости в долях единицы или процентах: a = (1.122) где р — доля вариант, обладающих наблюдаемым признаком в долях единицы или процентах; q — доля вариант, не обладаю- щих наблюдаемым признаком. Для данных из табл. 1.05 сигма в долях единицы по формуле (1.122) а=]/0,063-0,937=0,243, или в процентах а=Уб,3-93,7= = 24,296%. Ошибку сигмы можно определить по формуле (1.32). Величина сигмы при альтернативном варьировании не может превышать 50%, или 0,5 в долях единицы. Коэффициент вариации v для альтернативного варьирования дат v = 2o%, (1.123) где о — среднее квадратическое отклонение, %. При среднем квадратическом отклонении, равном 24,296, коэффициент вариа- ции v = 2-24,296 = 48,6%. Ошибку коэффициента вариации мож- но определить по формуле (1.47). С достаточным приближением показатель точности опыта при альтернативном разделении дат определяется по формулам (1.50) и (1.51). Для рассмотренного примера показатель точно- сти опыта вычисляется по формуле (1.51): Р = 48,6/КТб50 = 1,5%. 88
Такое значение является высоким показателем точности опре- деления доли, или средней арифметической, в данном опыте. Точность опыта в общем случае считается неудовлетворительной, если показатель Р больше 5%. § 1.27. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Теоретические частоты распределения вычисляют главным образом для того, чтобы путем сравнения с эмпирическими часто- тами выяснить меру их совпадения. При совпадении опытных и теоретических частот на эмпирическую выборку распространяют закономерности, присущие данному теоретическому типу рас- пределения. Для применения биномиального распределения исходные дан- ные должны быть дискретного типа и отвечать следующим ус- ловиям. 1. Объем исходной совокупности, из которой делается выбор- ка, должен быть настолько велик, чтобы не могла измениться вероятность определения данного признака. Если объем исход- ной (генеральной) совокупности недостаточно велик, то отобран- ные единицы учета должны быть возвращены в нее для сохра- нения той же вероятности получения выборки с данным призна- ком. Если совокупность невелика и отобранные единицы не могут быть в нее возвращены, то в этом случае следует применить ги- пергеометрическое распределение (см. § 1.28). 2. Величина дисперсии выборки должна быть меньше ее сред- ней арифметической. Выборка при биномиальном распределении обычно образуется, когда берут проб одинакового объема, равного п. В каждой из проб подсчитывают число вариант, обла- дающих изучаемым признаком. Например, было взято Nn — = 112 проб корнеплодов из совокупности сортов моркови с целью изучения их устойчивости к заболеванию фомозом. Корнеплоды заражали искусственно — механическим повреждением. В каж- дой из 112 проб было одинаковое число корнеплодов: п = 9. В каждой девятке подсчитывалось число пораженных фомозом корнеплодов (табл. 1.36). Соответствие эмпирического распре- деления биномиальному можно определить четырьмя способами. Если п велико, например больше 10, теоретические частоты би* номиального распределения можно получить с достаточной точ- ностью по первому способу при помощи формулы частот нормаль- ного распределения. Если и<С10, лучше воспользоваться вторым способом, т. е. формулой разложения бинома, отдельные члены которого представляют собой теоретические частоты биномиаль- ного распределения. В конце параграфа приведены также рекур- рентный и табличный способы. Три первых способа рассмотрим на данных из столбцов 1 и 2 табл. 1.36. Теоретические частоты биномиального распределения по пер- вому способу, по схеме нормального распределения, вычисляю т- 89
Таблица 1.36. Вычисление гчастот биномиального распределения по формуле (1.107) Число больных корнеплодов в пробе х Число проб f xf x2f <• О -Ф (/) Nn Г = —Ф(0 1 2 3 4 5 6 7 9 4 36 324 1,802 0,07895 5 8 20 160 1280 1,255 0,18037 И 7 18 126 882 0,708 0,31006 19 6 14 84 504 0,161 0,393870 24 5 27 135 675 0,386 0,371150 23 4 18 72 288 0,932 0,258880 16 3 4 12 36 1,479 0,133440 8 2 7 14 28 2,026 0,05082 3 1 0 0 0 2,572 0,014603 1 0 0 0 0 3,119 0,0030698 0 112 639 4017 НО ся по формуле (1.107): f' = [NncxV (/)]/а, где сигма может быть найдена, например, по формуле (1.38): [S fx* - (2 fxf I Nn\/(Nn - 1), Обозначения в этих формулах следующие:— теоретические частоты биномиального распределения; Nn — число проб; Т (/) — функция от /, отыскивается по табл. 11П; t—нормированное отклонение: t=(x — Л4)/о; х — варианты распределения; М — средняя арифметическая; f — эмпирические частоты распределе- ния; с — классовый интервал. Теоретические частоты по первому способу вычисляем в сле- дующем порядке (табл. 1.36). 1. Перемножаем варианты из столбца 1 на соответствующие им частоты из столбца 2, результаты пишем в столбце 3. 2. Числа столбца 3 множим на числа столбца 1, результаты записываем в столбце 4. 3. Суммируем числа столбцов 2—4, получаем итоги: Nn>= 112, 2^ = 639, 2/*2 = 4017- 4. Вычисляем среднюю арифметическую по формуле (1.13): М = 639/112=5,705 корнеплода. 5. Среднее квадратическое отклонение находим по формуле (1.38) о = У (4017—6392/112)/(112—1) = 1,829. 90
Дисперсия о2=3,34 меньше, чем средняя, поэтому в данном случае можно применить бино- миальное распределение. 6. Разности средней ариф- метической с вариантами х де- лим на о=1,829, получаем зна- чения нормированных отклоне- ний в столбце 5. 7. По табл. 11П находим значения функции Т (0 и выпи- сываем их в столбец 6. 8. Находим значение выра- жения Nnc/o= 112-1/1,829= Рис. 5. Эмпирические (/) и теоретиче- ские (2) частоты биномиального рас- пределения поражаемости фомозом корнеплодов моркови f — частоты; х — варианты = 61,236. 9. Перемножаем числа из столбца 6 на 61,236 и, округляя до целых чисел, получаем в столбце 7 теоретические часто- ты кривой биномиального рас- пределения (рис. 5), уравнение которой /,=61,236ЧГ(/), где /= (х—5,7)/1,8. Для вычисления теоретических частот биномиального распре- деления по второму способу используем формулу разложения бинома: (1.124) где р — доля вариант, обладающих данным признаком; q — доля вариант, не обладающих данным признаком; п — число вариант в пробе; Nn — число проб. В рассматриваемом примере (см. табл. 1.36) число больных корнеплодов пр = 639 (итог столбца 3), а общее число корнепло- дов N=Nnn= 112-9= 1008. Следовательно: nq—1008—639=369. В долях единицы от общего числа корнеплодов р = 0,63; р=0,37. Размер пробы п = 9. Общее число проб A7?i= 112. Вычисление теоретических частот по формуле (1.124): f'— (0,63 + 0,37)9- •112 — ведется в следующем порядке (табл. 1.37). 1. Из табл. 14П выписываем в столбце 1 коэффициенты раз- ложения бинома при п = 9 (размер пробы). 2. Возводим в степени от 0 до 9 долю р = 0,63 (столбец 2). 3. Возводим в степени от 0 до 9 долю <у = 0,37 (столбец 3). 4. Перемножаем по строкам числа столбцов 2 и 3, произведе- ния записываем в столбец 4. 5. В столбце 5 получаем произведения чисел столбцов 1 на 4. 6. В столбце 6 записываем произведения числа проб Nn— 112 на числа из столбца 5, произведения округляем до целых чисел, 91
Таблица 1.37. Вычисление частот биномиального распределения по формуле (1.124) Числа из табл. 14 П при п~9 Степени р=0,63 Степени <7=0,37 PQ Произведение чисел столбцов 1X4 Произведение /Vn=112 на числа столбца 5 Г Частости, % 1 2 3 4 5 6 7 1 р9=0,0156 <?°=1,00 0,0156 0,0156 2 1,8 9 0,0248 0,37 0,0092 0,0826 9 8,0 36 0,0394 0,1369 0,0054 0,1942 22 19,6 84 0,0625 0,0507 0,0032 0,2662 30 26,8 126 0,0992 0,0187 0,0019 0,2337 26 23,2 126 0,1575 0,0069 0,0011 0,1369 16 14,3 84 0,2501 0,0026 0,0007 0,0546 6 5,4 36 0,3969 0,001 0,0004 0,0143 2 0,9 9 0,63 0,0004 0,0003 0,0023 0 1 р»=1 ^=.0,0001 0,0001 0,0001 0 112 100,0 которые и будут теоретическими частотами биномиального рас- пределения. Если р = д = 0,5, то кривая биномиального распределения бу- дет симметричной. Вычисление частостей биномиального распределения наибо- лее легко производится по третьему способу, т. е. по рекуррент- ной формуле: Лчх — п — i р г' т"""; ti i + 1 q (1.125) где ff+i — последующая частость; а — объем пробы; р, q — доли присутствия и отсутствия изучаемого признака в совокупности; fi' — предыдущая частость"; i — номер члена ряда частостей. За- метим, что рекуррентные формулы требуют достаточной точно- сти вычислений, так как все последующие результаты расчетов основаны на предыдущих и даже небольшая неточность, допу- щенная вначале, быстро увеличивается в конце ряда. В нашем примере п = 9; р = 0,63; ^ = 0,37. Начальный член /7 ряда частостей (1.126) через любые (десятичные или натуральные) логарифмы: Infoz= = nlnp, или f0/ = exp(nlnp), т. е. для нашего примера f'= exp (9 In 0,37) = ехр[9(—0,99425)] = exp (—8,94825)=0,00012996. Последующие члены Вэтчисляем по формуле (1.125), например: г = _9_. _2163_. о,ООО 12996=0,0019915 и т. д. (см. табл. 1.38). '! 1 0,37 92
Таблица 1.38. Вычисление частостей биномиального распределения по рекуррентной формуле (1.125) п—i 1+1 (п—0/(1+1) (3)р/<7 /н-1=(4) fi % X f'=(5) Л’п 1 2 3 4 5 6 7 8 9 1 9 15,3243 0,0019915 0,199 0 0,015 8 2 4 6,8108 0,013564 1,36 1 0,223 7 3 2,333 3,9724 0,053882 5,39 2 1,52 4 1,5 2,5541 0,13762 13,8 3 6,04 5 5 1 1,7027 0,23433 23,4 4 15,4 4 6 0,6667 1,1352 0,26601 26,6 5 26,2 3 7 0,4286 0,7298 0,19423 19,4 6 29,8 2 8 0,25 0,4257 0,082684 8,27 7 21,7 1 9 0,1111 0,1892 0,015644 1,56 8 9,26 1 9 1,75 р/?=0,63/0,37= =1,7027, /;=о,з7»= =0,00012996, 99,98 ;Vn=112 111,91 В табл. 1.38 величинам изучаемого признака — от 1 до 9 боль- ных корнеплодов (п — i в столбце 1) соответствуют частости би- номинального распределения от 1,56 до 0,199 (столбец 6), которые могут быть нанесены на график. Оценка посредством критерия Колмогорова (см. § 1.25) меры совпадения частот вычисленных и эмпирических показала, что лучшее совпадение в рассматри- ваемом случае дает применение уравнения нормальной кривой (К(Х) =0,76); расчеты по рекуррентной формуле (Д'(X) = 1,22) и по формуле разложения бинома (/<(Х) = 1,13) дают при- мерно одинаковые результаты. Найденные теоретические частоты биномиального распреде- ления показывают, какова вероятность появления проб с данным числом в ней больных корнеплодов. Принимая во внимание в табл. 1.36 столбец 1, в табл. 1.37 столбец 7, можем видеть, сколь- ко проб в процентах от общего их количества заключает в себе то или иное число больных корнеплодов. Так, с девятью больны- ми корнеплодами может встретиться 1,8% всех проб; появление проб с 1 или 0 больных корнеплодов также маловероятно. Меру совпадения теоретической кривой распределения с фак- тическими данными часто оценивают критерием согласия хи-квадрат (х2). Этот критерий может применяться лишь при наличии не менее пяти частот в каждом классе. Если в каком- либо классе вариационного ряда содержится частот меньше чем 5, то этот класс вместе с частотами следует объединить с сосед- ним классом. Общая формула вычисления критерия х2- X2=(f-f')7f', (1.126а) 93
Таблица 1.39. К сравнению эмпирических и теоретических частот биномиального распределения критерием хи-квадрат Число пораженных корнеплодов в пробе х Число проб фактическое f Число проб теоретическое /' (f-f'Wf' 1 2 3 4 О 1 3 - 8 , 17 24 24 19 О 1 2 3 4 5 6 7 8 9 О О 7 ’ 4 , 18 27 14 18 20 0,083 0,059 0,375 4,167 0,053 4,000 112 112 Х* 1 2 3 4=8,737 где f — фактические частоты, или численности; f'— ожидаемые или теоретические частоты, или численности. Найдем меру соответствия фактическим частотам — теорети- ческой кривой биномиального распределения. В табл. 1.39 по столбцам приводятся следующие данные. 1. Классы распределения проб корнеплодов по поражаемости фомозом. 2. Всего проб одинакового размера было взято 112 — по 9 корнеплодов в каждой. 3. Ввиду того что по условиям применения критерия хи-квад- рат требуется, чтобы частота в каждой клетке была не менее 5, объединяем в столбцах 2 и 3 классы 1, 2 и 3 в один с частотами 11 и 12, а также классы 8 и 9 — в другой класс с частотами 24 и 16. Дальше, следовательно, ведем расчеты уже с шестью клас- сами распределения. 4. Квадраты разностей эмпирических и теоретических частот, деленные на теоретические частоты, что представляет собой кри- терий хи-квадрат по строкам; в итоге столбца 4 получаем иско- мую величину х2 = 8,737. Для ее оценки необходимо знать число степеней свободы, которое зависит от числа классов в ряду и числа параметров в том теоретическом распределении, которое сравнивается с данным эмпирическим рядом. Так, при нормаль- ном распределении число степеней свободы v=k — 3, при бино- миальном и пуассоновском v — k—2, где k — число классов взве- шенного ряда; v — число степеней свободы. В табл. 1.39 с эмпирическим сравнивается биномиальное рас- пределение, в котором после укрупнения крайних вариант стало 94
шесть классов, следовательно: v = 6—2 = 4 степени свободы. По табл. 15П для уровня значимости №/ = 0,05 и v==4 находим табличное значение хи-квадрат, равное 9,488. Поскольку вычис- ленное значение, равное 8,737, меньше табличного, делаем вы- вод, что теоретическое распределение частот несущественно от- личается от эмпирического. Поэтому рассматриваемые эмпири- ческие данные в первом приближении могут быть моделированы биномиальным законом распределения, не исключая возможно- сти более близкого соответствия частот другого типа распреде- ления, так как по 0,01% уровню значимости табличное значение хи-квадрат равно 13,277. Достоверность хи-квадрат при отсутствии таблиц и с числами свободы v оценивают также по правилу Романовского: (х2 — v)//2v=g3. (1.1266) Различие считается достоверным, если левая часть неравен- ства будет равна или больше 3. Для рассматриваемого примера: (8,737—4)/у2-4= 1,67<3, следовательно, биномиальное распре- деление подходит к эмпирическим данным. Среднее квадратическое отклонение биномиального распре- деления в именованных числах (например, в числе особей) о = (1.127) где п — объем пробы (см. в начале этого параграфа); р—доля наблюдаемого признака в совокупности; q — доля особей без наблюдаемого признака. Средняя арифметическая биномиаль- ного распределения, выраженная в именованных числах: М — пр, (1.128) где М — средняя арифметическая для пробы; п — объем пробы; р — доля наблюдаемого признака. При изучении повреждаемости фомозом корнеплодов морко- ви бралось jVn=112 проб по 9 корнеплодов (п=9) в каждой; доля поврежденных корнеплодов оказалась р = 0,63, что состав- ляет в среднем по формуле (1.128) Л4 = 9-0,63 = 5,67 корнеплода в пробе. Среднее квадратическое отклонение для этого примера по формуле (1.127) 0=^9-0,63-0,37= 1,45 корнеплода в среднем для одной пробы. Указанные параметры могут быть выражены также и в относительных числах по примеру того, как это сдела- но в § 1.26. Ошибка средней арифметической биномиального распределения приближенно определяется по формуле (1.120). Показатели асимметрии А и эксцесса Е в рассматриваемом рас- пределении: As = {q-p)lVWq, (1.129) £=JV-*[(p<7)-‘-6], (1.130) где остальные обозначения те же, что и к формуле (1.124). 95
В нашем примере As= (0,37—0,63)/У 1008-0,63-0,37=—0,017, Е = [ (0,63 - 0,37) -1—6] /1008 = —0,0017. Чем ближе к нулю величины As и Е, а р — к 0,5, тем симме- тричнее кривая данного распределения частот. При р<0,5 вели- чина показателя асимметрии положительна, а при р>0,5 — от- рицательна. Центральные моменты биномиального распределе- ния: Р1 = 0, [iz = Npq, [i3=Npq(q—p)9 yk=Npq[3pq (N—2) +1]. (1.131) Коэффициент вариации (1.132) Кроме перечисленных трех способов, частоты биномиального распределения находят также и при помощи таблиц, что рассмот- рим на примере распределения частот неразвитых семян яблони домашней, которых насчитали 148 из N = 307 (по данным, подго- товленным по моей просьбе С. Ф. Демидовой). Следовательно: р= 148/307 = 0,48208, ^=159/307 = 0,51792, где последнее число обозначает долю нормальных, выполненных семян. Выберем чис- ло классов, например k = 10. По табл. 5.1 (см.: [Большев, Смир- нов, 1968]) для этого числа классов и при р = 0,5 (ближайшее число в таблице) находим теоретические частости (в %, с округ- лением): 0,1; 1,0; 4,4; 11,7; 20,5; 24,6; 20,5; 11,7; 4,4; 1,0; 0,1 соот- ветственно для i от 1 до 10. Если будем брать из этой совокупно- сти пробы по 10 семян в каждой, то со всеми выполненными семе- нами найдем 0,1% от числа всех проб, с одним неразвитым семе- нем— 1,0%, с двумя неразвитыми семенами — 4,4% и т. д. Как видим, по этому способу можно получить ряд теоретического рас- пределения, зная только долю признака. Среднее квадратическое отклонение в данном примере о=у307-0,5-0,5 = 8,76 семян. Приведем еще один пример работы с этими же таблицами. При анализе партии семян лещины из 79 семян оказалось 8 не- всхожих, что составляет р = 79~1-100-8= 10,13%. При числе клас- сов k = b частости этого распределения (в процентах, с округле- нием) для вариант от 0 до 5 соответственно равны: 59; 33; 7; 1; 0 05; 0,001%. § 1.28. ГИПЕРГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Некоторые эмпирические дискретные распределения биологи- ческих признаков в зависимости от принципа организации вы- борки можно моделировать гипергеометрическим распределени- ем вместо биномиального. Дело в том, что последний тип распре- деления требует соблюдения принципа случайного отбора проб из генеральной совокупности, для чего следует располагать очень большим объемом исходного материала или же каждый раз воз- вращать пробу обратно в исходную совокупность и тщательно 96
перемешивать объекты учета для того, чтобы вероятность доли содержания учитываемого признака в совокупности от пробы к пробе оставалась одной и той же. Гипергеометрическое распреде- ление предоставляет возможности учитывать объем совокупно- сти, а также не возвращать пробы обратно в совокупность и не перемешивать ее, что на практике более удобно. Приведем два способа расчета частостей этого распределения. Отдельно взятая частость гипергеометрического распределения для любого значения х: Схп С™ f' = - -р q , (1.133) где f' — частость гипергеометрического распределения в долях единицы; ГХ _ пр (пр — 1) (пр — 2)... (п — X + 1) . Пр~ 1-2-3---Х х — варианта ряда; пр— число вариант, обладающих учитывае- мым признаком; п — объем пробы; nq— число вариант в совокупности, не обла- дающих учитываемым признаком; N — объем совокупности: Ar(iV— 1) — n+1) Ь/V = ---------. В распределении числа зараженных корнеплодов моркови, приведенном в табл. 1.36: np = 639, n = 9, nq=369, N= 1008 корне- плодов. Рассчитаем для х = 3 значение его частости, т. е. опреде- лим вероятность найти три зараженных в пробе из девяти корне- плодов. По формуле (1.133) 639•638•637 369•368-367-366-365•364 1-2-3 1-2-3-4-5-6 1008-1007-1006-1005-1004-1003-1002-1001•1000 =0,051, ИЛИ 5,1 %. 1-2-3-4-5-6-7-8-9 Вычисления проводим через посредство логарифмов, предва- рительно сократив дробь. Сумма десятичных логарифмов числи- теля в данном примере равна 26,5018, а знаменателя — 27,7937, их разница, т. е. результат деления числителя на знаменатель, рав^а логарифму —1,2919, или в искусственной форме логариф- ма 2,7081, что соответствует числу 0,051. Вычислять по формуле (1.133) рекомендуется не менее чем с пятью знаками мантиссы логарифмов, особенно в тех случаях, когда объем выборки боль- ше 1000. 4 Г. Н. Зайцев 97
Таблица 1.40. Эмпирические частоты и частости /, f % (по данным табл. 1.36) и частости гипергеометрического распределения % X f А % Р Г, % 0 0 0 0,00011091 0,0111 1 0 0 0,0017669 0,177 2 7 6,2 0,012456 1,25 3 4 3,6 0,051002 5,10 4 18 16,1 0,13367 13,4 5 27 24,1 0,23255 23,2 6 14 12,5 0,26855 26,9 7 18 16,1 0,19179 19,2 8 20 17,8 0,082345 8,23 9 4 3,6 0,015645 1,56 112 100 0,989886 99,0281 Второй способ расчета рассматриваемого типа распределения следует применять тогда, когда желательно получить все теоре- тические частости для аппроксимации эмпирического ряда. Проведем этот расчет для тех же данных. В табл. 1.40 приве- дены взятые из табл. 1.36 варианты (столбец 1), их эмпирические частоты (столбец 2), частости (столбец 3), а также теоретиче- ские частости гипергеометрического распределения (столбцы 4 и 5). 1. Определим исходное значение частости для х=0. Это зна- чение следует вычислять с 6—7 знаками после запятой, так как оно послужит начальной величиной в цепочке дальнейших рас- четов. nq (ztq—l) (nq —2)•••('»„ — «+1) СП ~ tf(W-l)(Af-2)...0V-n+ 1) ’ (1.134> где f0' — частость начального, нулевого члена распределения, остальные обозначения те же, что и к-формуле (1.133). Подставляя известные величины в формулу (1.134), получим через натуральные логарифмы частость нулевого члена: 1 f _ 1 369.368.367-366.365.364-363.362-361 = Ш / о — 1п1008.1оо7.1ооб.1005-1004-1003-1002-1001-1000 = 11,65231932 — 20,75916426 = —9,10684494, что соответствует f0' = 0,00011091, или 0,0111%. Через десятичные логарифмы, что рекомендуется делать для проверки: lgfoz = = 23,0605—27,0149= —3,9544, или в искусственной форме lgfo,== =4,0456, что соответствует /oz=0,0001111, или 0,0111%. 98
Вычисление следующих членов ряда частостей ведется по ре- куррентной формуле ' (п - X- ,) (пп - X; .) L , fi =-------5, (1.135) + 1) (N — пр — п + х^ + 1) где f/ — частость для хг; хг-! — предыдущая варианта; пр— чис- ло вариант с учитываемым признаком; N— объем выборки; п — объем пробы (число классов распределения); f'i—i— частость предыдущей варианты. Последовательно вычисляя по формуле (1.135), получим все остальные частости. (9 — 0) (639 — 0) (0+ 1) (1008 —639—94-0+1) -0,00011091 =0,0017669. Заметим, что N—пр—п+1 = 1008—639—9+1 = 361 (в данном примере величина постоянная). fl = J2--*Н639—Л .0,0017669 = 0,012456; (1 + 1) (361 + 1) fl = 2^1; 0,012456 = 0,051002; fl = 12^.0,23255 = 0,26855; 3363 1 6-366 4 = ±636 .0,051002 = 0,13367; fl = ^^-0,26855 = 0,19179; 4-364 ' 7-367 5 - -0,13367 = 0,23255; fl = -0,19179 = 0,082345; 5-365 1 8-368 1-631 9-369 • 0,082345 = 0,015645. Все компоненты дробной части этой формулы изменяются за- кономерно: в числителе убывают, а в знаменателе возрастают на единицу с каждым шагом, чем можно воспользоваться для про- верки расчета или для его упрощения. Средняя арифметическая гипергеометрического распределе- ния М = пр, где п — объем пробы; р — доля вариант с учитывае- мым признаком в выборке; по данным § 1.27, она равна 0,635, a q = 1—р= 1—0,63 = 0,37; М = 9-0,635=5,7. Дисперсия c2 = Mq(N—n)/(N— 1), (1.136) где N— объем совокупности, остальные обозначения см. в тек- сте, перед формулой (1.136). а2 = 5,7-0,37- (1008—9)/(1008—1) =2,09. Коэффициент вариации v гипергеометрического распределе- ния при тех же обозначениях, что и в последнем расчете: V = У [q (N — п)]/[М (N — i)], (1.137) у == /[0,37(1008—9)]/(5,7(1008—1)1 = 0,254, или 25,4%. 99 4*
При вычислении медии и сигмы обычным способом, принятым для нормального распределения по данным § 1.27, коэффициент вариации: v = 1,829/5,7=0,321, или 32,1%, т. е. на 7% боль- ше полученного по формуле (1.43), что следует учитывать при расчетах степени вариабельности подобных данных. § 1.29. РАСПРЕДЕЛЕНИЕ ПУАССОНА Распределение Пуассона, или распределение редких событий,, близко к биномиальному и образуется тогда, когда р (доля на- блюдаемого признака) очень мало, a q близко к 1. Таким образом, распределение Пуассона характерно для ред- ких событий, вероятность (доля) появления которых очень мала. Так же как и при биномиальном распределении, эмпирические частоты распределения Пуассона являются числом одинаковых проб, имеющих ту или иную долю наблюдаемого признака. В рас- пределении Пуассона средняя арифметическая примерно равна дисперсии Af^a2, что является основным его признаком. Теоретические частоты этого распределения вычисляют по формуле (1138> х! где f' — теоретические частоты, т. е. число проб, обладающих той или иной долей наблюдаемого признака; х — варианты, т. е. от- дельные значения наблюдаемого признака; х! (икс-факториал) — произведение ряда натуральных чисел, например: 3! = 1-2« • 3 = 6; М — средняя арифметическая; Nn — общее число проб; е = = 2,71828182 — основание натуральных логарифмов (см. табл. 10П). Первый способ. Вычислим теоретические частоты распределе- ния Пуассона для данных табл. 1/41, где приведены данные рас- пределения проб корнеплодов моркови, заболевших естественно (в отличие от данных из § 1.27), не поврежденных механически и Таблица 1.41. Вычисление частот распределения Пуассона Число пора- женных корнеплодов в пробе х Частоты (число проб) f мх= —0,672х X I Mxjx ! (Мх/ x\)NneTM Г 0 70 1,000 0 !=1 1,00 62,43 62 1 32 0,6720 1 0,6720 41,95 2 14 0,4516 2 0,2258 14,10 14 3 2 0,3035 6 0,0506 3,16 3 4 4 0,2039 24 0,0085 0,53 1 122 — —— — 122,17 122 100
без искусственного заражения их фомозом. Объем каждой пробы был и = 9, однако больше четырех больных корнеплодов в пробах не встречалось, поэтому расчет выполнен при п = 4, Л7П= 122. 1. Определим среднюю арифметическую данного взвешенного ряда по формуле (1.13): М = (2 xf)/Nn = (0 • 70+1 • 32+2 • 14+3 • 2+4 • 4)/122 = 0,672. 2. Возведем М в степень с показателем х: 0,672°= 1; 0,672* = = 0,672; 0,6722 = 0,4516 и т. д. (столбец 3). 3. В столбце 4 запишем факториалы от х: 0! = 1, 4! = 1 -2-3-4 = = 24 (столбец 4). 4. Числа столбца 3 поделим на числа столбца 4 и частные за- пишем в столбце 5. 5. Вычислим выражение Nne~M= 122-2,718~°’672 = 62,43. 6. Числа столбца 5 перемножим на число 62,43; произведения запишем в столбце 6. 7. После округления чисел столбца 6 до целых получаем иско- мые теоретические частоты Оценка совпадения эмпирических частот с теоретическими по критерию хи-квадрат (изложение ме- тода его расчета см. § 1.27) показывает, что различие между ними несущественное (%2 = 4,413; при объединении классов 3 и 4 v = 4—2 = 2; пр табл. 15П %2 = 5,99 на уровне значимости W/ = = 0,05). Таким образом, можно сделать вывод, что естественное зара- жение фомозом корнеплодов моркови, не повреждаемых механи- чески искусственным путем,— явление редкое, но встречающееся с определенной частотой, которое можно моделировать распре- делением Пуассона. По первому способу можно вычислять от- дельно теоретическую частоту для любой варианты рассматри- ваемого распределения по формуле (1.138). Второй способ более удобен для расчетов, когда требуется вы- числять все частоты данного распределения, так как в этом слу- чае для вычисления последующей теоретической частоты необхо- димо знать величину предыдущей. Рассмотрим рекуррентный = 6,7175; о2 алгоритм вычисления частот по второму способу на примере рас- пределения числа семян в плодах яблони домашней (табл. 1.42). 1. Вычисляем среднюю арифметическую и сигму: М =2996/446= (23 214 —29962/446)/ /(446—1) = 6,9402; о = 2,6344. Так как средняя близка к вели- чине дисперсии, то данный ряд соответствует распределению Пу- ассона. Это подтверждает также их сравнение по критерию Фи- шера: F = 6,9402/6,7175= 1,03, что меньше критической величины, равной 1,56. 2. Находим нулевой член распределения с помощью логариф- мов или таблиц е“х: foz = Ne~M = 446-2,7183“6,7175 = 0,53953. 3. По рекуррентной формуле (1.139) 101
Таблица 1.42. Распределение числа семян в плодах яблони домашней Число семян X Число плодов f xf x2f Г Число семян х Число плодов f xf x2f Г 1 2 3 4 5 1 2 3 4 5 0100 0,53953 1 666 3,6243 2 15 30 60 12,173 3 38 114 342 27,257 4 44 176 704 45,775 5 40 200 1000 61,499 6 59 354 2124 68,854 7 60 420 2940 66,076 8 67 536 4288 55,483 9 49 441 3969 41,411 10 38 380 3800 27,818 И 14 154 1694 16,988 12 И 132 1584 9,5097 13 3 39 507 4,914 14 1 14 196 2,3578 15 0 0 0 1,0559 £=16 446 2996 23214 445,34 вычисляем все остальные члены ряда теоретических частот: А = 617175 ,О153953 = 3 6243; д _6^7175 .3^43 = 12,173; 1 2 А =62121.12,173 = 27,257 и т. д. 3 Все теоретические частоты приведены в столбце 5 табл. 1.42, их удовлетворительное соответствие эмпирическим частотам до- статочно ясно видно из рис. 6. Третий способ вычисления частот распределения Пуассона основан на использовании таблиц, где для разных величин М приведены соответствующие частости. Например, на с. 197 таб- лиц [Янко, 1961] для Л4 = 6,7 и числа классов от 0 до 20 даны частости, умножая которые на наш объем совокупности N = 446, получим следующие частоты: 0,548, 3,68; 12,3; 27,5; 46,2; 61,6; 68,9; 66,0; 55,3; 41,2; 27,5; 16,8; 9,5; 4,82; 2,31; 1,03; 0,43; 0,169; 0,063; 0,022; 0,007, сумма которых 445,88. Соответствие этих час- тот, вычисленным по первому и второму способам, вполне удо- влетворительное, что позволяет рекомендовать третий способ для применения в первую очередь, учитывая также то, что для дан- ного расчета понадобится лишь логарифмическая линейка. Центральные моменты, показатели асимметрии и эксцесса распределения Пуассона вычисляют по формулам ц2 = Л1, ц3 = М, ц4 = М(ЗМ+1), (1.140) Д5 = М-0’5, £ = (1.141) Коэффициент вариации v в распределении Пуассона: v =Ю0/о%, или v = 100/|ЛИ%, (1.142) 102
Рис. 6. Эмпирические (/) и теоретические (2) частоты f распределения Пуас- сона х — число семян в плодах яблони где а — среднее квадратическое отклонение; М — средняя ариф- метическая. Эти формулы можно использовать также для оценки близости некоторого эмпирического ряда к распределению Пуассона. Так, в примере, рассмотренном во втором и третьем способах, коэф- фициент вариации эмпирического ряда по формуле (1.43) равен и = 100о/М = 100 -2,6344/6,7175 = 39,2%, а по формуле (1.142) v = = 100/<т= 100/2,6344=38%; обе величины достаточно близки друг к другу, и, следовательно, данный эмпирический ряд соот- ветствует распределению Пуассона. В литературе встречаются указания на возможность примене- ния одного из свойств распределения Пуассона в качестве уни- версального критерия или правила для определения максималь- ных величин различных, в том числе биологических, признаков. Речь идет о свойстве вариант этого распределения |хг|<2Л1, где Xi — любая варианта совокупности; М — средняя арифметическая той же совокупности. На практике это, например, означает, что если для сортов некоторой культуры средняя урожайность равна Л4, то не может существовать сорта с урожайностью х{>2М. Фак- тически это правило представляет собой известное свойство бо- лее общего нормального распределения, в котором 2Af = 6o>Xt. § 1.30. НЕГАТИВНОЕ БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Распределение случайных, дискретных, величин, вероятность появления которых в данной совокупности непостоянна, может быть моделирована негативным биномиальным распределением. На практике пользуются следующей формулой расчета членов 103
этого распределения: ра(1—(1.143) а=М/(М-1о2— 1), (1.144) р=1/(1+Л1а-1), (1.145) ?+р=1, (1.146) где р — вероятность появления наблюдаемого признака; q — ве- роятность его отсутствия; а — экспонента бинома, характеризую- щая вариабельность данных; 7И, о2 — средняя арифметическая и дисперсия эмпирического ряда. В рассматриваемом типе распределения дисперсия по абсо- лютной величине должна быть больше средней арифметической той же совокупности; это служит одним из признаков того, что некоторый эмпирический ряд может быть моделирован негатив- ным биномиальным распределением, вычисление частот которого ведется следующим образом. Определяются обычным путем вели- чины М, а2 и по формуле (1.144) —экспонента бинома. Дальней- шие вычисления обусловлены величиной полученной экспоненты а и ее соотношением с М, которое оценивается по формуле 1= [ (а+М) (а+2) ]/М> 15. (1.147) Если />15, то расчеты ведем по первому способу. При 1< 15 дополнительно вычисляем величину т = (М + 0,17) (^Л—0,32) >0,20, (1.148) где fi — первая эмпирическая частота ряда; N — объем совокуп- ности. Когда т>0,20 и 1< 15, расчеты ведем по второму способу. При К15, ги<0,20 переходим к третьему способу. Нередко ока- зывается, что, несмотря на несоответствие величин I и т крите- риям, указанным для первого способа, по нему получается непло- хое совпадение на графике кривых эмпирических и теоретических частот, поэтому в случаях, не требующих большой точности, мож- но ограничиться применением первого способа. Для эмпириче- ских рядов, у которых т>0,20 и /< 15, характерны резкая пра- восторонняя асимметрия кривых распределения и большая вели- чина первой частоты по сравнению с остальными частотами дан- ного ряда. Такие ряды обычно подходят для расчетов экспонен- ты бинома по второму способу. Третий способ — универсальный, он дает точную величину экспоненты для любых форм негативного биномиального распре- деления независимо от полученных величин /, т, но этот способ наиболее трудоемкий и рекомендуется для исполнения с помощью ЭВМ. Варианты х эмпирических рядов для вычислений по всем трем способам должны быть представлены числами 0, 1, 2, 3 и т. д. по- средством преобразования (nf—п^)1с (см. примеры для второ- 104
Таблица 1.43. Частоты негативного биномиального распределения (первый способ) Порядковый номер i Число побегов на двулетней особи гелени- ума осеннего х Частота f % ‘J ч Порядковый номер i Число иобегов на двулетней особи гелениума осеннего х Частота f г, % ч 1 2 3 4 5 1 2 3 4 5 1 0 0 0,1869 0,495 13 12 26 6,228 16,5 2 1 5 0,8272 2,192 14 13 17 5,144 13,63 3 2 12 2,048 5,427 15 14 13 4,139 10,97 4 3 9 3,739 9,908 16 15 9 3,253 8,621 5 4 14 5,611 14,87 17 16 6 2,504 6,637 6 5 14 7,327 19,42 18 17 5 1,892 5,014 7 6 23 8,616 22,83 19 18 6 1,405 3,724 8 7 13 9,332 24,73 20 19 2 1,028 2,723 9 8 33 9,458 25,06 21 20 4 0,741 1,964 10 9 22 9,073 24,05 22 21 1 0,5274 1,398 И 10 17 8,311 22,02 23 22 0 0,3709 0,983 12 И 14 7,318 19,39 с—1 6=23 265 99,08 262,6 го и третьего способов). Три рассматриваемых способа отлича- ются друг от друга только техникой вычисления экспоненты а, в остальном их алгоритмы совпадают. Первый способ. Расчеты параметров и частот рассмотрим на примере распределения числа побегов у двулетних растений ге- лениума осеннего (табл. 1.43). Средняя арифметическая, диспер- сия, экспонента бинома и I — критерий для этого ряда равны: Л4 = 9,3397, о2= 19,71, а=9,3397/(19,71/9,3397— 1) =8,4112, I = [ (8,4112 + 9,3397) (8,4112 + 2) ] /9,3397 = 19,787. Так как 19,787> 15, то применяем к данному ряду первый спо- соб, или способ моментов, как он иначе называется, т. е. величи- ну а далее не уточняем и приступаем к общему для всех трех спо- собов этапу работы — вычислению параметров р, q и теоретиче- ских частот. По формулам (1.145), (1.146) р= 1/(1+ 9,3397/ /8,4112) =0,47385, q= 1—0,47385=0,5261. Первый член распределения // для х = 0 вычисляется особо: h'=Pa (в долях единицы), или//=100ра (в %). (1.149) Для нашего примера с использованием логарифмов при лю- бом их основании //= 100-0,473858»4112 = ехр (In 100 + 8,4112« •In 0,47385) =0,1869%. Остальные члены разложения бинома в 105
виде частостей (в %) находим по рекуррентной формуле, т. е. такой, в которой каждый последующий член вычисляется по ве- личине предыдущего: ft = (а + ± , (1.150) xi т.е. /2 =0,1869 (8,4112 4- == 0,8272, /з = 0,8272 (8,4112+ 1) = 2,048, Д = 2,048 (8,4112 + 2) 5^- = 3,739 и т. д. 3 При каждом новом шаге вычислений увеличиваются на еди- ницу правый член выражения в скобках и знаменатель дроби. Теоретические частости (в %) для всех 23 вариант ряда записаны в столбце 4 табл. 1.43. Если перенести в них запятую влево на 2 знака, т. е. разделить эти числа на 100, а затем умножить на объ- ем выборки М = 265, то получим теоретические частоты, которые записаны в последнем столбце таблицы. Буквой i в формуле (1.150) и табл. 1.43 обозначены порядковые номера вариант и со- ответствующих им частот, начиная с 1. Варианты эмпирического взвешенного ряда перед вычислением частот негативного бино- миального распределения желательно привести к натуральному ряду чисел, который начинается с нуля. Кривые эмпирических и теоретических частот в рассмотренном примере достаточно хоро- шо совпадают (рис. 7), что подтверждает и величина критерия согласия Колмогорова К(Х) =0,884, которая меньше первого кри- тического уровня, равного 1,36. Таким образом, распределение числа побегов на одной дву- летней особи у гелениума осеннего может быть моделировано не- гативным биномиальным распределением. Второй способ, или способ пропорции первого члена. Рас- смотрим технику вычислений по этому способу на примере рас- пределения числа побегов на однолетних растениях гелениума осеннего (табл. 1.44). Вначале преобразуем исходные варианты ряда, приведенные в столбце 1 таблицы в натуральный ряд, на- чинающийся с нуля (столбец 2), для чего из всех вариант вычтем первую варианту и разделим их на классовый интервал с= 1, т. е. произведем действия по формуле, указанной в заголовке столбца 2 таблицы. В столбце 3 даны эмпирические частоты ряда, сумма которых равна объему совокупности N = 339. Вычислим для этих преобразованных к следующие показатели: среднюю М = 0,19469; дисперсию о2 = 0,60695; экспоненту по формуле (1.144) а = 0,19469/ (0,60695/0,19469— 1 )= 0,091942; критерий по формуле (1.147) / = [ (0,091942+0,19469) (0,091942+2) ]/0,19469=3,0799. 106
Рис. 7. Негативное биномиальное распределение числа побегов х на двухлет- них растениях гелениума осеннего f — частоты: 1 — эмпирические, 2 — теоретические Так как вычисленная величина критерия меньше 15 (Z= = 3,0799<15) и поэтому данный вариационный ряд не желатель- но обрабатывать по первому способу, то определяем величину следующего критерия (1.148): т = (0,19469+0,17) (310/339— —0,32) =0,22011. Величина критерия т оказалась больше критической 0,20, по- этому экспоненту бинома для рассматриваемого эмпирического ряда следует вычислять по второму способу: а1=[1п(Ш)]/[1п (l + M/aJ], (1.151) где <%1 — экспонента бинома, полученная по второму способу; N— объем совокупности; — первая частота ряда, соответствующая первой варианте: х = 0. При вычислении по формуле (1.151) следует найти такое зна- чение при котором левая часть формулы будет равна правой. Алгоритм заключается в том, что вначале в правую часть форму- лы подставляют найденное по этой же формуле (1.151), полу- ченный результат снова подставляют в правую часть, в знамена- тель дроби, находящейся в скобках, и повторяют такой расчет до тех пор, пока подставленная и полученная величины не бу- дут равны между собой с точностью до трех-четырех знаков. Ра- венство (1.151) в нашем примере соблюдается при 0^ = 0,064119, а именно 0,064119= [In (339/310)]/[1п (1 + 0,19469/0,064119)]. Логарифмы в данном случае можно применять любые — нату- ральные или десятичные. Далее по найденной таким образом ве- 107
Таблица 1.44. Частоты негативного биномиального распределения (способ 2) Число побегов на однолетних особях гелениума осеннего ni nt- — X — с f 1 » /0 Г 1 2 3 4 5 1 0 310 91,44 310 2 1 13 4,41 14,95 3 2 / 1,765 5,985 4 3 2 0,9138 3,098 5 4 3 0,5266 1,785 6 5 3 0,322 1,092 7 6 1 0,2045 0,6931 7 0 0,1333 0,4517 8 0 0,08852 0,3001 9 0 0,05967 0,2023 10 0 0,04069 0,1379 с — 1 k = 11 339 99,9 338,7 личине а! вычисляем по формулам (1.145), (1.146) р = 1 / (1 + о, 19469/0,064119) = 0,24774, q = 1 —0,24774 = 0,7523. Начальный член по формуле (1.149) f/= 100-0,24774<’’0в4“9 = = 91,44%. Прочие члены находим по формуле (1.150): =91,44(0,064119 + 0)^2 = 4,41%, /з = 4,41 (0,064119 + 1) 0^7523^ = 1j765o/Oj /< = 1,765(0,064119 + 2) 212^ = 0,9135 % и т.д. 3 В столбце 4 табл. 1.44 приведены теоретические частости не- гативного биномиального распределения (в %), умножив их на объем выборки М=339 и разделив на 100, получим теоретические частоты (столбец 5), которые достаточно хорошо совпадают с эмпирическими, что подтверждает также и величина критерия согласия Колмогорова: /С(Х) =0,111. Заметим, что подобные рас- пределения иногда можно аппроксимировать кривой Парето (§ 1.35). Третий способ (максимального правдоподобия). Рассмотрим технику вычислений по этому способу на примере распределения числа детки у 347 сортов гладиолуса. В столбце 1 табл. 1.45 даны границы классов, по которым распределены данные о числе дет- 108
Таблица 1.45. Частоты негативного биномиального распределения (третий способ) Число детки на 1 луковицу у гладиолуса Середина класса — П! 1 с f А Г, % Г границы класса число деток П[ 1 2 3 4 5 6 7 0—9 5 0 111 236 33,58 116,53 10—19 15 1 103 133 25,67 89,06 20—29 25 2 58 75 16,64 57,74 30—39 35 3 23 52 10,14 35,2 40—49 45 4 22 30 5,988 20,78 50—59 55 5 11 19 3,465 12,03 60—69 65 6 8 И 1,979 6,866 70—79 75 7 4 7 1,119 3,882 80—89 85 8 3 4 0,628 2,179 90—99 95 9 4 0,3505 1,216 10 0,1947 0,6755 И 0,1077 0,3739 с — 10 k = 10 347 99,86 346,53 ки на одну луковицу, в столбце 2 — середины классов niy в столб- це 3 — величины середин классов х, -преобразованные по форму- ле, данной в заголовке этого столбца, в столбце 4 — эмпириче- ские частоты f. По величинам х и f вычисляем, как обычно, сред- нюю арифметическую Л4= 1,634, дисперсию о2 = 3,5391 и затем по формулам (1.144), (1.147) а= 1,634/(3,5391/1,634— 1) = 1,4015, 1= [ (1,4015+ 1,634) (1,4015 + 2) ]/1,634 = 6,319. Так как вычисленная величина числа I меньше 15, находим следующий критерий по формуле (1.148): т= (1,634+0,17) (111/ /347—0,32) =0,00284, величина которого значительно меньше Ю,20, поэтому к данному эмпирическому ряду следует применить третий способ для уточнения величины экспоненты бинома, осно- ванный на решении уравнения 2(^')=л'1п(1+7)' (И52) тде А — накопленные частоты; х— варианты ряда из столбца 3 талб. 1.45; а2 — уточненное значение экспоненты бинома; N — объехМ совокупности; М — средняя арифметическая. Уравнение (1.152) можно решать путем итераций, или после- довательных приближений, на ЭВМ или с помощью ручных средств счета с применением интерполяции для ускорения приб- лижения к равенству обеих частей уравнения. 109
Рис. 8. Негативное биномиальное распределение числа детки п у луковиц гла- диолуса 1 — эмпирическая, 2 — теоретическая кривые; f — частоты В столбце 5 таблицы приведены накопленные частоты, кото- рые вычисляются путем последовательного вычитания всех эмпи- рических частот из объема совокупности, в данном случае из N— = 347. Например: А, = 347—111=236, А2=236—103= 133, А3 = = 133—58 = 75, А4=75—23=52 и т. д. до k— 1. Для данных рассматриваемого примера уравнение (1.152) справедливо при а2= 1,4359, т. е. 236/(0+1,4359) + + 133/(1 + 1,4359) + 75/(2 + 1,4359) + 52/(3 + 1,4359) + 30/ (4+1,4359) +19/ (5+1,4359) +11 / (6+1,4359) +7/ (7+1,4359) + +4/(8+1,4359) =3471п(1 + 1,634/1,4359). За исходное значение экспоненты перед началом процесса итерации принимаем то, ко- торое было получено по формуле (1.144), в данном случае а —1,4015. Изменяя его в ту или другую сторону, добиваемся, чтобы выполнялось равенство (1.152). После вычисления а2 по формулам (1.145), (1.146) определяем величины: р = 1/ (1 +1,634/1,4359) = 0,46773, q = 1 —0,46773 = 0,5323. Начальная теоретическая частость по формуле (1.149) //= = 100-0,46773‘-43S9 = exp (In 100+1,4359 In 0,46773) =33,58%. Ос- тальные частости (столбец 6 табл. 1.45) вычисляем по рекуррент- ной формуле (1.150) = 33,58 (1,4359+0) Цр? = 25,67 %, Д = = 25,67(1,4359+1)^М^= 16,64% и т. д. (до 12 класса). ПО
Перенося в этих числах запятую на два знака влево и умножая на объем совокупности Af=347, получим теоретические частоты (столбец 7), которые хорошо соответствуют эмпирическим часто- там, как видно из рис. 8, и величины критерия согласия Колмого- рова К(Х) =0,4655. Число классов теоретических частостей и час- тот в данном случае увеличено на два по сравнению с числом эмпирических ввиду того, что суммы столбцов 6 и 7 иначе были бы заметно меньше соответственно 100% и N = 347. § 1.31. МУЛЬТИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Все до сих пор рассмотренные здесь дискретные распределе- ния образованы изменением одной случайной величины и дру- гой, альтернативно связанной с ней. При расширении числа ком- бинаций признаков, с определенной вероятностью, независимо друг от друга появляющихся в генеральной совокупности, полу- чается мультиномиальное распределение. Вероятность появления определенной комбинации признаков или ^-мерной случайной величины вычисляется по следующей формуле мультиномиального распределения: дл пП1пП2 nnk р __ --Pk nv\ п2\ ... nk\ где Р — вероятность появления комбинации из k признаков; пь л2, ..., пк — эмпирические численности особей с данными призна- ками; Лг = п1 + п2 + .. .+nft — объем пробы, взятой из генеральной совокупности; —ph — теоретические вероятности появления при- знаков. В биологии мультиномиальное распределение, в частности, может быть применено для оценки степени случайности появле- ния некоторых комбинаций признаков в генетических, фитосоцио- логических и других исследованиях. Например, в одной коллек- ции сортов картофеля насчитывалось 209 сортов с белой окрас- кой венчиков цветков, 88 — с красно-фиолетовой, 56 — с красной, 24 — с темно-сине-фиолетовой и 20 сортов с голубой окраской вен- чиков, всего 397 сортов. Доли этих окрасок, или признаков, соот- ветственно составляют: pj = 0,526; р2 = 0,222; р3 = 0,141; р4 = 0,06; ,р5 = 0,05 от общего числа сортов. В пробе, взятой случайным об- разом из популяции гибридных сеянцев, полученных в результате свободного опыления, насчитали П1 = 8 сеянцев с белой окраской венчиков, п2 = 6 с красно-фиолетовой, п3 = 4 с красной, п4 = 6 с тем- _но-сине-фиолетовой, п5 = 5 с голубой, всего N = 29 сеянцев. По формуле (1.153) р=^ 29! 0,5268>0,222^0,141*.0,06е.0,05* 8! 6! 4! 6! 5! 111
применяя десятичные логарифмы и таблицы логарифмов факто- риалов (см., например, [Большев, Смирнов, 1968. С. 454]), най- дем искомую вероятность: lg Р = 30,94654 — (4,60552 + 2,85733 + 1,38021 + 2,85733 + + 2,07918) — 8 • 0,279 — 6 • 0,6536- 4.0,8508—6 • 1,2218-5-1,301 = = —6,22563; 1g Р = 7,77437, откуда Р = 0,000000889. Таким образом, вероятность случайного появления данной комбинации численностей очень мала: из 10 млн проб по 29 осо- бей в каждой, может встретиться примерно лишь 9 проб, в кото- рых будет наблюдаться указанное числовое соотношение призна- ков окраски цветков, появление которого было, следовательно» вызвано в данном случае некоторыми существенно действующи- ми факторами. Формулу (1.153) можно также применить для анализа расщепления гибридного потомства, подобно тому, как это делают посредством хи-квадрата. § 1.32. РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА Кривая распределения эмпирических частот вариационного ряда существенно положительных чисел, обладающего умеренной асимметрией, может быть аппроксимирована распределением Максвелла. Кривая частот рассматриваемого типа распределения удобна тем, что строится посредством уравнения, определяемого всего одним параметром, причем она достаточно гибка и может быть применена для выравнивания асимметричных распределе- ний различных биологических признаков, величины которых из- меняются по непрерывному типу. Рассмотрим технику вычисле- ния частот распределения Максвелла на примере эмпирического распределения периодов продолжительности цветения (в днях) 381 вида деревьев и кустарников в Ленинграде. Этот ряд, приве- денный в столбцах 1 и 2 табл. 1.46, удовлетворяет требованиям, перечисленным в начале параграфа: период цветения — сущест- венно положительная величина и не может принимать отрица- тельных значений; ряд — умеренно асимметричен (рис. 9, /). Последовательность расчетов следующая. 1. Вычисляем среднюю арифметическую М= 16,363 и среднее квадратическое отклонение ряда о= 12,362 для оценки теорети- ческого соответствия условиям аппроксимации посредством ко- эффициента вариации v распределения Максвелла, который является величиной постоянной: v = V(Зл)/8—1 =0,42203, или 42%. (1.154) Отклонения от данного соотношения, однако, могут быть до- вольно большими, в частности для рассматриваемого примера по формуле (1.43) г; = о/Л1 = 12,362/16,363 = 0,75, или 75%, тем не ме- нее качество аппроксимации данного ряда распределением Макс- велла, как увидим дальше, нельзя назвать плохим. 112
Рис. 9. Распределение Максвелла периодов цветения х древесных растений в Ленинграде f — частоты: 1 — эмпирические, 2 — теоретические 2. Параметр распределения получаем по одной из четырех равноценных формул: а = 0,626657 А4, а = М/(2/2/л), а = Л4//8/л, а=М/1,595769 (1.155) где М— средняя арифметическая; а — параметр распределения, т. е. в нашем примере а = 16,363/(2]/2/л)= 10,254. 3. Среднее квадратическое отклонение распределения Макс- велла а = а / 3—8/л, (1.156) а = 10,254 • 0,67345 = 6,9053, а2=47,683. 4. Мода Мо = а /2, (1.157) Мо= 10,254-1,41421 = 14,501. 5. Медиана Ме= 1,538а, (1.158) Ме= 1,538-10,254= 15,771. В случае асимметричных распределений мода и особенно ме- диана нередко лучше характеризуют ряд по его центральной тен- денции, чем средняя арифметическая. 6. В столбце 3 табл. 1.46 подсчитаны квадраты нормирован- ных отклонений, для чего середины интервалов х поделены на а = 10,254 и возведены в квадрат. 7. Числа столбца 3 умножены на —0,5, и от них получены экспоненты, которые легко найти по таблицам ех (см., например 113
[Сегал, Семендяев, 1962]) или путем логарифмирования; ре* зультаты записаны в столбце 4. 8. Числа столбца 4 умножены на числа столбца 3, и результа- ты записаны в столбце 5. 9. Константа (с/а)У2/^= (10-0,797885)/10,254 = 0,77812, где с — классовый интервал, умножена на числа столбца 5, и полу- ченные частости в долях единицы записаны в столбце 6. Если пе- ренести запятую в этих числах на 2 знака вправо, получим час- тости в процентах. 10. Умножая числа столбца 6 на объем выборки М = 381, по- лучим теоретические частоты распределения Максвелла (стол- бец 7), которые на рис. 9, 2 достаточно хорошо совпадают с эмпи- рическими (критерий Колмогорова K(i) = l,31). Изложенный здесь и рекомендуемый для применения ход вычислений соответ- ствует формуле /' = (М?/а) /2/л ZV0’5*’, (1.159) где f'— теоретическая частота распределения Максвелла; N— объем выборки; а — параметр распределения; t = x/a — нормиро- ванное отклонение; х — середины интервалов эмпирического ря- да; е — основание натуральных логарифмов. Формула (1.159) может быть представлена также и в следую- щих двух вариантах: 2 ~2О2' ел____ 2Nc t2 “Т Т ~ а* У л ’ Т ~ /2Г а где обозначения те же. При вычислении параметров и частот рас- пределения Максвелла полезно располагать значениями следую- щих констант: л = 3,14159; е = 2,718282; 2у2/л = 1,595769; 1/ / (2-|Т2М) =0,626657; ]/2М=0,797885; ]/2= 1,414214; 1/у2п= = 0,398942; 3—8/л = 0,453531; УЗ—8/л = 0,67345. Если интервалы ряда после его составления окажутся слиш- ком крупными, как это получилось в ряду из табл. 1.46, то про- межуточные частоты можно получить, уменьшая классовый ин- тервал и одновременно в столько же раз увеличивая объем вы- борки и число классов ряда. Уменьшив классовый интервал в 2 раза (с = 5) и увеличив объем выборки в 2 раза (УУ = 762) и чис- ло классов тоже в 2 раза (£ = 24), получим по формуле (1.159) для соответствующих вариант следующие частоты в начале кри- вой: 0—0; 5—62,6; 10—175,3; 15—217,6; 20—168,3; 25—90,2; 30— 35,1; 35—10,2; 40—2,2, которые помогают более точно построить кривую теоретического распределения на том участке, где она была недостаточно определена. Распределение Максвелла связа- но с трехмерным нормальным распределением, поэтому его ча- стоты можно вычислить также при помощи двух таблиц по фор- муле fx = N[F(t) — 2/ф(01, (1-160) 114
Таблица 1.46. Вычисление частот распределения Максвелла сл Период цветения видов деревьев и кустарников х, дни Число видов f /2 = rJL\2 V а ) е~о >^г ^2е—о1 bt* 4 Г 1 2 3 4 5 6 1 5 37 0,23777 0,88798 0,21114 0,16429 62,595 15 238 2,1401 0,34298 0,73401 0,57115 217,61 25 78 5,9443 0,051196 0,30432 0,2368 90,221 35 9 11,651 2,9514-10~3 3,4387-10-а 0,026757 10,194 45 8 19,259 6,5764-10-8 1,2666-10-» 9,8557-10”4 0,3755 55 3 28,77 5,6593-10“7 1,6282-Ю-з 1,2669-Ю-з 4,8269-10-» 65 3 40,183 1,8803-Ю-9 7,5556-10-» 5,8792-10-» 2,24-10-’ 75 1 53,498 0 0 0 0 85 2 68,716 0 0 0 0 95 0 85,835 0 0 0 0 105 1 104,86 0 0 0 0 115 1 125,78 0 0 0 0 с = 10; k = 12 381 1,00000 381,00
где fx'—накопленные частоты распределения Максвелла; N — 2 р _ объем совокупности; F (/) = I е — интегральная 1/ 2л v о функция нормального распределения; ф(/) = -7=ге *8/2—плот- V 2л ность нормального распределения; t = xla — нормированное от- клонение; х — варианта эмпирического распределения (середина класса); а — параметр распределения Максвелла. Вычисления по второму способу ведутся следующим образом. 1. По величинам t: 0,48761; 1,4628 и т. д. из таблицы F(t) вы- бираются соответствующие числа (они даны, например, в табл. 33, 34 [Митропольский, 1952]). Для первых двух вариант они равны: 0,37445; 0,856533. 2. Из табл. 11П по тем же величинам t находим (с интерполя- цией) значения функции ф(/): 0,24187; 0,01614, умножаем их на 2/: 0,9752; 2,9256, вычитаем из найденных F(t), получаем: 0,13258; 0,84039, умножаем на N = 381 и получаем накопленные частоты 50,5; 320 и таким же образом еще три: 372, 380, 381. 3. Дальнейшее вычисление накопленных частот прекращаем, так как все последующие будут равны объему выборки — 381. Вычитая предыдущую частоту из последующей, получаем 12 час- тот: 50,5; 269,5; 52; 28; 1; 0 (все остальные — нули). Как видим, найденные по второму способу частоты, хотя и до- статочно близки к эмпирическим, но отличаются от найденных по первому способу. Объясняется это тем, что частоты данного эмпирического ряда сильно сконцентрированы в начале кривой, которая к тому же имеет диапазон вариации от нуля до 11/, на что существующие таблицы F(t) и i|)(f) не рассчитаны. Из этого следует, что в случае сильной концентрации частот в основной части ряда и большого варьирования дат лучше применять пер- вый способ вычислений и, напротив, при более мелких интерва- лах ряда и сравнительно небольшого диапазона вариации (до 4/ в обе стороны) можно применять второй способ. Первый способ, кроме того, как показал опыт, удобнее для программирования на ЭВМ. Из приведенного анализа можно сделать следующие выводы. Варьирование периода цветения у видов деревьев и кустарников очень велико. Величина нормы для периода цветения этих видов должна находиться в пределах Л4±о= 16,363± 12,362, т. е. от 4 до 29 дней. В этот период укладывается цветение 362 видов из 381, т. е. подавляющее большинство. Остальные 19 видов или от- носятся к ремонтантным, или при наблюдениях ошибочно фикси- ровались (главным образом в конце лета и осенью) вторично цветущие виды. Таким образом, критерий нормальной продолжительности цветения 4—29 дней дает способ выделить отклоняющиеся виды для последующего биологического анализа их фенологии. В част- ности, этот критерий позволяет количественно отделить ремой- 116
тантные виды от видов с нормальной продолжительностью цвете- ния. Большинство видов (238) цветет в течение 15 дней, на что указывает величина моды. Половина видов цветет в течение ме- нее 16 дней, другая половина—дольше этого периода, что видно из величины медианы. § 1.33. РАСПРЕДЕЛЕНИЕ РЭЛЕЯ К числу типов распределений, определяемых одним парамет- ром, относился также распределение Рэлея, которое пригодно для аппроксимации умеренно асимметричных вариационных ря- дов, составленных из дат непрерывного вида, принимающих толь- ко положительные значения. Количественным критерием того, что некоторый эмпирический взвешенный ряд может быть аппрокси- мирован распределением Рэлея, служит соотношение а = М/(4/л)-1 =0,5227М, (1.161) т. е. среднее квадратическое отклонение должно быть примерно в 2 раза меньше средней арифметической. Например, распреде- ление 205 сортов пиона по среднему из 10 особей числу побегов (фертильных и вегетативных вместе) на особи может состоять только из положительных величин, которые после усреднения изменяются по непрерывному типу. Показатели этого эмпириче- ского ряда, приведенного в табл. 1.47 (столбцы 1—3), следую- щие: М = 22,075; о= 11,7806; Л = 0,60436; Е = —0,0842. Таблица 1.47. Частоты распределения Рэлея Общее число побегов на особи пиона Час- тота f X а2 X2 х 2а2 а2 е /в Г границы интервала середина интервала X 1 2 3 4 5 6 7 1,5—8,4 5 21 0,016117 0,015479 0,10835 22,212 8,5—15,4 12 48 0,03868 0,030667 0,21467 44,007 15.5—22,4 19 50 0,061243 0,034229 0,2396 49,118 22,5—29,4 26 29 0,083806 0,02819 0,19733 40,453 29,5—36,4 33 34 0,10637 0,01839 0,12873 26,39 36,5—43,4 40 13 0,12893 0,0097821 0,068475 14,037 43,5—50,4 47 7 0,1515 0.0043078 0,030155 6,1818 50,5—57,4 54 2 0,17406 0,0015839 0,011087 2,2728 57,5—64,4 61 1 0,19662 0,0004889 0,0034223 0,70157 с=7 Л = 12 205 1,0018 205,37 117
Рис. 10. Распределение Рэлея числа побегов х на растениях пиона f — частоты: 1 — эмпирические, 2 — теоретические Вычисление показателей и частот распределения Рэлея ве- дется в следующем порядке. 1. Основной параметр а: а2= (2М2)/л, (1.162) где М — средняя арифметическая эмпирического ряда; л = 3,1416; а2 = (2 • 22,075) /3,1416=310,24. 2. Мода (1.162а) Мо = а = 17310,24 = 17,614. 3. Дисперсия о2=а2(2—л/2), (1.163) о2=310,24(2—3,1416/2) = 133,16 и среднее квадратическое откло- нение о = У ст2 — у 133,16 = 11,54. 4. Медиана Ме = у2а2 In 2, Mt = У2-310,24.0,69315 = 20,738. 5. Частоты вычисляем по формуле f =£е ^Nc, 1 а2 (1.164) (1.165) где — частоты распределения Рэлея; х — середины классов эмпирического распределения; а — основной параметр; е = 2,7183; N — объем выборки; с — классовый интервал. ---*—е 620,48 .205’7. 310,24 118
В табл. 1.47 (столбец 4) приведены частные от деления сере- дин классов на а2: 5/310,24 = 0,016117 и т. д. В столбце 5 эти вели- чины умножаются на е 2fl2: (5/310,24) (е~52/620’48) = 0,015479 и т. д. Числа столбца 5, умноженные на с = 7, дают теоретические часто- сти (столбец 6), перенося в которых запятую на 2 знака вправо, получим частости (в %). Умножив числа столбца 6 на N = 205, получим теоретические частоты распределения Рэлея (столбец 7). Критерий согласия Колмогорова оказался равным К (к) =0,54, что позволяет говорить о достаточно хорошем совпадении эмпи- рических и теоретических частот (рис. 10). § 1.34. ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ По этому типу распределения выравнивают эмпирический ряд, частоты которого распределены с резко выраженной правосто- ронней (или положительной) асимметрией, а средняя арифмети- ческая примерно равна сигме: При этом величины изучае- мого признака должны изменяться непрерывно и принимать толь- ко неотрицательные значения, т. е. они могут быть положитель- ными числами или равными нулю. Единственный параметр по- казательного распределения так же всегда число положительное, обратное средней арифметической: Х=1/М, (1.166) где X— параметр показательного распределения; М — средняя арифметическая данного эмпирического ряда. Дисперсия, сигма и медиана показательного распределения равны: о2=1Д2, о=1Д, (1.167) Ме = In 2Д = 0,69315/Х=0,69315 М, (1.168) где о2 — дисперсия; о — сигма; % — параметр распределения; Ме— медиана; М — средняя арифметическая. Коэффициент вариации, учитывая равенство средней и сигмы в этом распределении равен: v = a/M=l, или 100%, что может служить одним из признаков соответствия эмпирического ряда показательному распределению. Мода показательного распреде- ления всегда равна нулю, или началу отсчета величин вариант. Теоретические частоты f' вычисляют по формуле f = N (е-1®'-1 — (1.169) где X — параметр распределения; g^^ gi— верхние границы пре- дыдущего и последующего классов распределения вариант изу- чаемой величины; N — объем совокупности. 119
Таблица 1.48. Вычисление частот показательного распределения Границы класса Сере- дина клас- са X Час- тота f Верх- няя грани- ца класса ё е->-8 _e'Kgi ЛМ7) =г Л % 1 2 3 4 5 6 7 8 9 0 0 1 — — — 0—29 15 1249 30 0,66921 0,5121 0,4879 1277,8 48,8 30—59 45 639 60 1,3384 0,26227 0,2498 654,31 25 60—89 75 419 90 2,0076 0,1343 0,128 335,15 12,8 90—119 105 185 120 2,6768 0,06879 0,06551 171,57 6,56 120—149 135 89 150 3,3461 0,035222 0,03357 87,915 3,36 150—179 165 20 180 4,0153 0,018039 0,01718 45,002 1,72 180—209 195 10 210 4,6845 0,009239 0,0088 23,047 0,88 210—239 225 8 240 5,3537 0,0047305 0,004508 11,808 0,45 240—269 255 0 270 _ _ 0,002308 6,0444 0,23 Л = 9 с = 30 2619 0,998 2612,6 99,8 Распределение 2619 побегов в зависимости от числа соцветий на них у однолетних растений гелениума осеннего, приведенное в столбцах 1, 2, 3 табл. 1.48, обладает значительной положительной асимметрией: As= 1,4563; эксцесс также велик: £ = 2,34; коэффи- циент вариации у = 83,4%, т. е. близок к 100%; величина средней арифметической М = 44,828 близка к величине сигмы а = 37,383; число соцветий — величина существенно положительная, в дан- ном случае непрерывно изменяющаяся, так как исходные данные являются результатом усреднения^—все эти признаки позволяют применить к указанному ряду показательное распределение для выравнивания эмпирических частот. Несмотря на большое варьи- рование данных, показатель точности опыта сравнительно мал: Р=1,63% и находится в допустимых пределах (Р^5%). В табл. 1.48 приведены данные, которые по номерам столбцов разъясняются ниже. 1—3. Границы, середины и частоты классов. 4. В сответствии с формулой (1.169) для расчетов использо- ваны не середины классов, а их верхние (меньшие) границы, ко* торые записаны в столбце 4 на одну строку выше, так как здесь вычисляется объем интервала по разности его границ. 5. Величина параметра распределения по формуле (1.166): Л = 1/44,828 = 0,022307; эту величину умножим на все значения верхних границ из столбца 4. 6. Экспоненты отрицательных чисел из столбца 5. 7. Разность предыдущего и последующего чисел из столбца 6^ например 1—0,5121=0,4879; 0,5121—0,26227 = 0,2498 и т. д. Эти 120
числа представляют собой вероятности появления побегов с дан- ным количеством соцветий на них, сумма этих вероятностей должна бьйъ равна 1. 8. Умножив полученные вероятности на объем совокупности 7V = 2619 побегов, получим теоретические частоты показательного распределения, которые в столбце 9 представлены также в про- центах от общей их суммы: 2612,6. Частоты теперь соответству- ют серединам классов из столбца 2. Как видим, сумма теоретиче- ских частот несколько меньше фактической, что происходит в по- добных случаях в основном из-за неполноты теоретического ряда, вычисление частот которого можно было бы продолжить и полу- чить недостающие 6,4 побегов, или 0,2% от объема исходной со- вокупности. Однако эти дальнейшие частоты становятся слишком малыми, маловероятными событиями, поэтому здесь не приво- дятся. Сравнение фактических частот (столбец 3) с теоретическими (столбец 8) по критерию Колмогорова показало, что их совпаде- ние вполне удовлетворительное: К(Х) = 1,059 (рис. 11). Диспер- сия и сигма показательного распределения на практике исполь- зуются редко. Вместо них применяют дисперсию и сигму, под- считанные способом, обычным для нормального распределения. В частности, для рассматриваемой совокупности второй цент- ральный момент равен 1397,5. Медиана, рассчитанная по формуле (1.168): Л4е = 0,69315- -44,828 = 31,072 соцветия. Отдельно взятые частоты показатель- ного распределения, соответствующие серединам классов, вычис- ляются по формуле f=me"Xx, (1.170) где х— середины классов; с — интервал распределения; осталь- ные обозначения те же, что и к формуле (1.169). Например, при х = 15 соцветий: /, = 2619-30-0,022307е“0’022307л5 = = 1254,2 побега. Заметим, что вытекающее из условия показа- тельного распределения равенство М = а не рекомендуется улуч- шать за счет усреднения (Л4 + а)/2 исходных показателей, так как это, по нашему опыту, не приводит к улучшению аппроксима- ции кривой распределения, т. е. в формулу (1.166) и при после- дующих расчетах следует подставлять только среднюю М исход- ного эмпирического ряда. Если возвести в квадрат среднюю и сигму: М2= (44,828)2 = = 2009,55; а2= (37,383)2= 1397,79, то можно получить объектив- ную оценку различия между ними. Сравнение по критерию Фишера при величине большей дис- персии о12 = 2009,55 и меньшей дисперсии а22= 1397,79 показывает несущественное различие между ними: ^ = 2009,55/1397,79= 1,44, что близко к единице при v(l) = оо и v(2) =оо на доверительном уровне Р3 = 99,9% (табл. 8П), который рекомендуется для оценок в подобных случаях. Если объем совокупности больше 120, как это часто бывает, то оценку различия квадратов средней и сигмы 121
Рис. 11. Показательное распределение числа побегов f у однолетних расте- ний гелениума осеннего в зависимости от числа соцветий на них х f — частоты: / — эмпирические, 2 — теоретические можно делать без таблиц, для этого достаточно сравнить полу- ченное значение F с числом 1,56. При 1,56 различие двух по- казателей существенно и данное распределение не подходит для аппроксимации его показательным, а если F<1,56, то при подхо- дящей форме кривой на графике некоторое эмпирическое распре- деление может быть интерпретировано как показательное. Рассмотрим также применение показательного распределения к важному для биологических исследований распределению ве- личин коэффициента вариации 175 различных признаков расте- ний. Каждая величина коэффициента вариации, в свою очередь,, была получена путем обработки взвешенного ряда достаточного объема, и общее число первичных наблюдений, использованное для получения рассматриваемого ряда, составляет более 70300. В табл. 1.49 по столбцам 1—6 приведены: х — середина класса (или варианта), т. е. величины коэффициента вариации с интер- валом с=20; f — частота; р — частости эмпирического распреде* ления; xf—произведения вариант на частоты; (х—M)f и (х— —М) 2f — произведения отклонений вариант от средней, а также их квадратов с частотами. На основании данных табл. 1.49, которая служит также примером для способа д из § 1.10, вычисляем сред- нюю арифметическую: М= 2 Xf/N = 5570/175 = 31,828573. Проверка: ^\xf = MN\ 5570 = 31,828573.175 = 5570,000275; раз- ница, равная 0,000275, в данном случае может считаться несуще- 122
Таблица 1.49. Определение средней и сигмы распределения величин коэффициента вариации X f р, % xf (x-M)f (х-М)Ч 10 89 50,85714 890 —1942,7454 42 407,4122 30 45 25,71429 1350 —82,2870 150,4700 50 19 10,85714 950 345,2566 6 273,7958 70 9 5,14286 630 343,5426 13113,5020 90 3 1,71428 270 174,5142 10 151,7353 110 1 0,57143 110 78,1714 6109,7678 130 3 1,71428 390 294,5142 28 912,8713 150 3 1,71429 450 354,5142 41 893,4393 170 2 1,14286 340 276,3428 38 182,6716 190 1 0,57143 190 158,1714 25 018,1918 175 100,00000 5570 —0,0050 212 222,7571 Таблица 1.50. К вычислению факториальных моментов распределения величин коэффициента вариации f h f* fs ft f fi ft fa 89 175 366 831 1962 1 10 29 63 118 45 86 191 465 1131 3 9 19 34 55 19 41 105 274 666 3 6 10 15 21 9 22 64 169 392 2 3 4 5 6 3 13 42 105 223 1 1 1 1 1 Af = 175 Si = 366 s2 = 831 s3 = 1962 s4 = 4575 ственной. Правильность вычисления отклонений проверяем по равенству 2(х — М)/ = 0, в нашем примере эта сумма равна: —0,0050, что можно считать несущественной ошибкой. Дисперсия о2 - J (х — M)2f/(N — 1) = 212 222,7571 /(175— 1) = 1219,671. Среднее квадратическое отклонение: о=Уо2=У 1219,671 = = 34,92379. Проверяем вычисление сигмы посредством фактори- альных моментов по способу полного суммирования, который бо- лее чем другие способы из § 1.18, подходит для подобных асим- метричных рядов. В табл. 1.50 подсчитаны суммы, необходимые для получения четырех факториальных моментов. Дисперсия 2 о2 =----- Лг — 1 = 1219,625212; 20* 2 175—1 2 • 831 2s2 — Si 123
Таблица 1.51. Частоты показательного распределения величин коэффициента вариации Верхняя граница класса g Середина класса X e-Xg р' f =Np р, % 0 0 1 1 — — 20 10 0,628 0,5337 0,4663 81,60 46,6 40 30 1,257 0,2845 0,2492 43,61 24,9 60 50 1,885 0,1518 0,1327 23,22 13,3 80 70 2,513 0,08103 0,07077 12,38 7,08 100 90 3,142 0,04320 0,03783 6,62 3,78 120 110 3,770 0,02305 0,02015 3,53 2,02 140 130 4,398 0,01229 0,01076 1,88 1,08 160 150 5,027 0,006558 0,005732 1,0 0,573 180 170 5,655 0,0035 0,003058 0,535 0,306 200 190 6,284 0,001866 0,001634 0,286 0,163 220 210 6,912 0,000996 0,00087 0,152 0,087 с = 20 & = 11 174,813 99,889 Первый условный момент m1 = s1/W=366/175 = 2,0914287. Средняя арифметическая М = x1 + c(zn1—1) = 10 + 20- •(2,0914287—1) =31,82857; здесь — первая варианта из столб- ца 1 табл. 1.49. Проверяем равенство средней и сигмы как условие показа- тельного распределения: 7? = а2/Л12 = 1219,671/(31,828572)2 = 1,2< <1,56. Из сравнения величины критерия Фишера с числом 1,56 заключаем, что ряд распределения величин коэффициента ва- риации биологических признаков можно представить показатель- ным распределением. Основной параметр по формуле (1.166): Х= 1/31,8286 = = 0,031418. Дальнейшие действия представлены в табл. 1.51, где обозначения те же, что и в табл. 1.48. Совпадение теоретических (столбец 6 табл. 1.51) и эмпирических (столбец 1 табл. 1.50) ча- стот удовлетворительное, что видно из величины критерия Кол- могорова К (X) =0,66529. которая меньше первого критического уровня 1,36. § 1.35. РАСПРЕДЕЛЕНИЕ ПАРЕТО Ряды с односторонней кривой распределения и в первую оче- редь с резким падением частоты вариант в начале кривой реко- мендуется аппроксимировать распределением Парето, которое относится к непрерывному типу, определяется всего одним пара- метром и сравнительно просто по технике вычислений. 124
Таблица 1.52. Частоты распределения Парето Число побегов на однолетней особи геле- ниума Число особей 7 In X а 1пх х-а -а —х^=В 102,92-5= =Г % сере- дина интер- вала грани- цы ин- терва- ла X 1 2 3 4 5 6 7 8 9 0,5 1 —0,69316 1,1921 3,294 — - 1 ™ 1 1,5 310 0,40546 —0,69731 0,49795 2,796 287,76 84,9 2 2,5 13 0,9163 —1,5759 0,20682 0,29113 29,963 8,9 3 3,5 7 1,2528 —2,1546 0,11595 0,09087 9,3523 2,7 4 4,5 2 1,5041 —2,5868 0,075262 0,04069 4,1878 1,2 5 5,5 3 1,7048 —2,9319 0,053293 0,021969 2,2611 0,67 6 6,5 3 1,8718 —3,2191 0,04 0,013296 1,3684 0,4 7 7,5 1 2,015 —3,4654 0,031258 0,008739 0,89942 0,27 8 8,5 0,006045 0,62215 0,18 ^>8 оо 2,59 0,76 k = 7 С = 1 339 339,0 99,98 Например, число побегов на одной особи гелениума (при ве- гетативном размножении путем деления растения) чаще всего небольшое — один побег имели большинство, т. е. 310 особей (табл. 1.52), а два побега — только 13 особей. В этом месте про- исходит резкое снижение частоты с 310 до 13 и кривая образует почти прямой угол, закругленный на вершине (рис. 12), что ти- пично для кривой распределения Парето, напоминающей сильно- вогнутую гиперболу. Средняя арифметическая распределения по- бегов гелениума М = 1,1947; начальная или минимальная вари- анта ряда Xi=l побег и среднее квадратическое отклонение о = = 0,77906. Последовательность расчета показателей и частот этого типа распределения следующая. 1. Для вычислений требуются: средняя арифметическая, на- чальное значение ряда, частоты, середины и границы классов. Единственный параметр распределения а=М/(Л1—х,), (1.171) где а — параметр распределения Парето; М — средняя арифме- тическая взвешенного эмпирического ряда; — начальное зна- чение ряда. В данном случае вычисления будут вестись не по средним значениям классов, а по их границам. Левая наимень- шая граница первого класса — 0,5, это число и принимаем за хР По формуле (1.171) а= 1,1947/(1,1947—0,5) = 1,7198. 125
Рис. 12. Распределение однолетних особей гелениума осеннего по числу побе- гов на них х f — частоты* 1 — эмпирические; 2 — кривой Парето 2. Медиана Ме = 2ах1=х1ехр — , \ а / Ме = 0,5-ехр ( °’69?.15-) = 0,7482. \ 1,7198 ) 3. Частоты находим по формуле = ^(х?Л-х7а), (1.172) (1.173) где f' — частоты распределения Парето; xt — начальное значение ряда, в нашем примере равное 0,5; а — параметр распределения; Xi-t — предыдущая граница класса; х{ — последующая граница класса. Множитель перед скобками в этой формуле посредством лога- рифмирования вычислим сразу: Лгх1а = 339-0,51’7198= 102,92. 4. Дальнейшие вычисления приведены в табл. 1.52. В столбце 4 — натуральные логарифмы границ классов, в столбце 5 они умножены на —а, в столбце 6 — экспоненты, или антилогарифмы, чисел столбца 5. В столбце 7 записаны разности предыдущего и последующего чисел из столбца 6, которые умножены на 102,92, и в столбце 8 — частоты распределения Парето, для наглядности представленные также в процентах (столбец 9). Более точная аппроксимация данного распределения дана в § 1.30 по второму способу негативного биномиального распределения, однако для этого там потребовались более сложные расчеты. 126
Вычисление частот далее седьмого класса в данном случае бесполезно, так как частота не может быть менее 1, т. е. одной особи. Кривая Парето асимптотически приближается к оси х, и число вариант может быть неограниченно большим. Класс >8 побегов в таблице означает, что теоретически в совокупности мо- жет встретиться около 0,76% особей, на которых может быть от 9 до 16 побегов. Последнее число было найдено продолжением вы- числений до 16 класса, после которого сумма столбца 8 доста- точно точно приблизилась к N = 339. Дисперсия, среднее квадратическое отклонение о и коэффици- ент вариации v распределения Парето имеют смысл при условии, что а>2 или 2Xi>Af, и вычисляются по формулам: а2 = ах2/[(а—2) (а—I)2], о = |/"о2, (1-174) и=100/]Ла(а—2), или и — [100 (Л4—х1)]/|ЛЛ4(2х1—Л4), (1.175) где остальные обозначения те же, что и к формуле (1.171). В на- шем примере а меньше двух и 2xt меньше чем величина средней арифметической, поэтому показатели по формулам (1.174), (1.175) не вычисляем. § 1.36. РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ Распределение дискретных, или непрерывных, величин с рав- ной для всех из них вероятностью называется равномерным. Кри- вая распределения частот этого типа представляет собой прямую, параллельную оси абсцисс, ограниченную слева и справа значе- ниями минимальной и максимальной вариант. Наиболее частым случаем применения этого типа распределения можно считать проверку на равную вероятность появления любой варианты из данной совокупности. Рассмотрим два практических примера. В тиражах выигры- шей спортивной лотереи «Спортлото 5 из 36» в 1977—1979 гг. числа от 1 до 36 появлялись с различной частотой (столбцы 1, 2 табл. 1.53). Определим, существенна ли разница между частота- ми появления этих чисел. Вычисления проводим в следующем порядке: 1. Находим среднюю частоту появления чисел Г = 2/А= 1570/36 - 43,611112, (1.176) где f'— теоретическая частота равномерного распределения; 2/ — сумма эмпирических частот; k — число классов распреде- ления. 2. При помощи критерия хи-квадрат оценим степень соот- ветствия эмпирических частот равномерному распределению. Для этого эмпирические частоты возведем в квадрат (столбец 3) и 127
Таблица 1.53. Проверка соответствия частот чисел лотереи равномерному распределению X f Г п п' n/N n'/N d-io3 1 2 3 4 5 6 7 8 1 41 1681 41 43,611 0,026 0,028 2 2 43 1849 84 87,2 0,053 0,055 2 3 34 1156 118 130,8 0,075 0,083 8 4 35 1225 153 174,4 0,097 0,111 14 5 46 2116 199 218,1 0,127 0,139 12 54 2916 253 261,7 0,161 0,167 6 7 58 3364 311 305,3 0,198 0,194 4 8 45 2025 356 348,9 0,227 0,222 5 9 42 1764 398 392,5 0,253 0,250 3 10 48 2304 446 436,1 0,284 0,278 6 И 53 2809 499 479,7 0,318 0,306 6 12 39 1521 538 523,3 0,342 0,333 9 13 43 1849 581 566,9 0,370 0,361 9 14 1936 625 610,5 0,398 0,388 10 15 56 3136 681 654,2 0,434 0,416 18 16 46 2116 727 697,8 0,463 0,444 19 17 42 1764 769 741,4 0,490 0,472 18 18 45 2025 814 785,0 0,518 0,500 18 19 51 2601 865 828,6 0,551 0,528 23 20 31 961 896 872,2 0,571 0,555 16 21 39 1521 935 915,8 0,595 0,583 12 22 37 1369 972 959,4 0,619 0,611 8 23 45 2025 1017 1003,1 0,648 0,639 9 24 51 2601 1068 1046,7 0,608 0,667 13 25 47 2209 1115 1090,3 0,710 0,694 16 26 39 1521 1154 • 1133,9 0,735 0,722 13 27 45 2025 1199 1177,5 0,764 0,750 14 28 43 1849 1242 1221,1 0,791 0,778 13 29 45 2025 1287 1264,7 0,820 0,806 14 30 36 1296 1323 1308,3 0,843 0,833 10 31 37 1369 1360 1351,9 0,866 0,861 5 32 49 2401 1409 1395,6 0,897 0,889 8 33 31 961 1440 1439,2 0,917 0,917 0 34 35 1225 1475 1482,8 . 0,939 0,944 5 35 50 2500 1525 1526,4 0,971 0,972 1 36 45 2025 1570 1570,0 1,000 1,000 0 1570 70 040 128
получим сумму 2/2 = 70 040. Величина критерия хи-квадрат: %2 = 2 /2/Л — W = 70 040/43,6111 — 1570 = 36, (1.177) где —сумма квадратов эмпирических частот; f'— теоретиче- ская частота равномерного распределения; N =2/—объем со- вокупности, или сумма эмпирических частот. Найденную величину хи-квадрат оценим с помощью табл. 15П. Число степеней свободы равно: v=k—1 =36—1=35, по нему при трех стандартных уровнях значимости: 0,05; 0,01; 0,001 —табличные значения критерия равны: 49,8; 57,3; 66,6, что больше найденной величины, равной 36. Следовательно, разли- чия между частотами появления чисел в тиражах выигрышей случайны и они появляются практически с равной вероятностью, иными словами, их распределение подчиняется закону равномер- ного распределения. 3. Для контроля проверку соответствия эмпирических частот равномерному распределению сделаем также по критерию Кол- могорова. В столбце 4 таблицы записаны накопленные эмпири- ческие частоты, которые получены так: 41+43 = 84, 84+34=118, 118 + 35=153 и т. д. В столбце 5 записаны накопленные теорети- ческие частоты, которые начинаются со средней частоты =43,611, к ней последовательно прибавляется ее же величина: 43,611+43,611=87,2; 87,2 + 43,611 = 130,8 и т. д. В столбцах 6, 7 помещены частные от деления этих частот на объем совокупно- сти Л/=1570. В столбце 8 приведены разности чисел из предыду- щих двух столбцов, умноженные на 1000 для краткости написа- ния, так что ^пих=23 соответствует 0,023. Эту максимальную раз- ность подставляем в формулу Х = dmax/jV = 0,023/1570 = 0,911. (1.178) В соответствии с полученной величиной лямбда, равной 0,91 по табл. 16П, находим значение 1—К(Х) =0,379. Если табличная величина будет больше критической вероятности 0,05, то данное распределение не отклоняется от теоретического, а если 1—К(Х)<0,05, то исследуемое эмпирическое распределение су- щественно отклоняется от теоретического распределения частот. В нашем случае 1—К(^) =0,379>0,05, следовательно, распре- деление частот чисел лотереи практически не отличается от рав- номерного, что подтверждает результат уже сделанной проверки при помощи критерия хи-квадрат. И поэтому все попытки неко- торых любителей этой игры найти «счастливые» комбинации чи- сел являются заведомо и полностью бесплодными. Рассмотрим второй пример применения равномерного распре- деления, относящийся к биологическим исследованиям. При по- мощи равномерного распределения можно получать ответы на вопросы следующего типа: правомерно ли считать сортовым при- знаком, например, высоту растений у совокупности сортов како- 5 г. Н. Зайцев 129
Таблица 1.54. Распределение 270 двулетних растений 22 сортов гелениума осеннего по высоте Высо- та х, см Число особей / /2 п п' n/N n’/N d 86 3 9 3 30 0,011 0,111 0,100 98 10 100 13 60 0,048 0,222 0,174 110 21 441 34 90 0,126 0,333 0,207 122 19 361 53 120 0,196 0,444 0,248 134 41 1681 94 150 0,348 0,555 0,207 146 92 8464 186 180 0,689 0,667 0,022 158 57 3249 243 210 0,900 0,778 0,122 170 23 529 266 240 0,985 0,889 0,096 182 4 16 270 270 1,000 1,000 0 е= 12 270 14 850 Л = 9 го-либо культивируемого вида. В табл. 1.54 приведено распре- деление по 9 классам высоты 270 двулетних особей 22 сортов ге- лениума осеннего. Требуется выяснить, различаются ли досто- верно растения по высоте в данной совокупности и, следователь- но, может ли служить высота растений сортовым признаком. Средняя частота распределения по формуле (1.176): /'=270/9= =30. Сравнение по критерию хи-квадрат — формула (1.177): ^2=14850/30—270=225 (по табл. 15П при v=9—1 = 8 и уровне значимости 0,001 — критическое значение 26,1) и по критерию Колмогорова: Х=0,248У270=4,075 (что соответствует нулевой ве- роятности 0<0,05) показало, что данное распределение частот существенно отличается от равномерного, следовательно, высота растений у данной совокупности сортов может служить сорто- вым признаком. § 1.37. ЛОГНОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Иначе этот тип распределения называют логарифмически нормальным, или типом SL из семейства распределений Джонсо- на. Весьма пластичное логнормальное распределение часто при- меняется для аппроксимации распределений многих биологиче- ских признаков, особенно тех из них, которые обладают умерен- ной положительной асимметрией. Величины признаков должны при этом отвечать условию: 0^%< + оо, т. е. быть положитель- ными числами, так как они в дальнейших расчетах подвергаются логарифмированию. Если применяются для этого десятичные ло- гарифмы, то желательно также, чтобы величины х были больше единицы или равны ей, что позволит избежать трудоемкого пере- 130
вода логарифмов из естественной в искусственную форму и об- ратно. Применение натуральных логарифмов поэтому предпочти- тельнее, когда среди величин х встречаются большие и меньшие единицы или только меньшие единицы. Из различных способов вычисления частот этого распределения рассмотрим наиболее ра- циональный— способ процентилей на примере распределения величин коэффициента вариации 165 биологических признаков. Ь § 1.34 этот резко асимметричный ряд был с удовлетворитель- ной точностью аппроксимирован показательным распределением. Однако слишком большой шаг интервала в этом ряду с=20 за- ставлял предполагать, что в начале ряда, где особенно велика плотность вариант, могут быть скрыты существенные детали кривой данного распределения. По тем же данным был заново получек взвешенный вариационный ряд с шагом интервала с=5, асимметрия которого оказалась значительно меньшей и эмпири- ческая кривая стала двускатной, что больше соответствует реаль- ным фактам. При этом пришлось отбросить те варианты, кото- рые были больше 100%, и объем ряда поэтому стал ЛА= 165 при числе классов £=20 (табл. 1.55). Расчеты частот логнормального распределения выполнены в следующем порядке. 1. Составление ряда накопленных частот: 124-26=38, 384- -(-27=65, 654-24=89 и т. д. до последней частоты, которая долж- на быть равна объему ряда (столбец 3). 2. Вычисление номеров процентильных вариант: 4=Р^4-1), (1.179) где i — номер процентильной варианты; Р — величина проценти- ля; N — объем ряда. За величины процентилей приняты: медиана Р=0,5 и симмет- ричные ей Р=0,05, Р=0,95. По формуле (1.179) iQ 05=0,05(1654- + 1)=8,3; 45=0,5(165+ 1)=83; 495=0,95( 1654-1) = 157,7. 3. Значения процентильных вариант Хр = (ip — /н) у + g, (1.180) где iP — номер процентильной варианты; fa — накопленная часто- та класса, предшествующего процентильному; с — классовый ин- тервал; f — частота процентильного класса (ненакопленная); g— левая, или меньшая, граница процентильного класса: Хо,оз (8,3 — 0) - + 0 = 3,46; х0>5 = (83 —65)-+ 15= 18,75; 12 24 ХО(95 = (157,7 — 153) - + 60 = 64,7. 5 Таким образом, процентильные варианты находятся в 1, 4 и 13 классах ряда (сверху вниз по строкам столбца 1 табл. 1.55). 131 5*
Таблица 1.55. К расчету частот логнормального распределения Нижняя граница класса g Частота f Накопленная частота Is g-e In (g—е) П (5) 2 =V+(6) P Г == N (9) f • 0/ 1 » /0 1 2 3 4 5 6 7 8 9 10 11 0 12 12 4,15 1,423 2,127 —2,56 0,005234 0,0801 13,22 8,0 5 26 38 9,15 2,214 3,310 —1,37 0,08534 0,1504 24,82 15,0 10 27 65 14,15 2,649 3,960 —0,72 0,23576 0,1578 26,04 15,8 15 24 89 19,15 2,952 4,413 —0,27 0,39358 0,1383 22,82 13,8 20 14 103 24,15 3,184 4,760 0,08 0,53188 0,1087 17,94 10,9 25 14 117 29,15 3,373 5,043 0,36 0,64058 0,0852 14,06 8,5 30 10 127 34,15 3,531 5,279 0,60 0,72575 0,0624 10,30 6,2 35 7 136 39,15 3,667 5,482 0,80 0,78814 0,0483 7,97 4,8 ~ 40 4 138 44,15 3,788 5,663 0,98 0,83646 0,0364 6,01 3,6 g 45 10 148 49,15 • 3,895 5,823 1,14 0,87286 0,0286 4,72 2,9 50 3 151 54,15 3,992 5,968 1,29 0,90147 0,0207 3,42 2,1 55 2 153 59,15 4,080 6,100 1,42 0,92220 0,0160 2,64 1,6 60 5 158 64,15 4,161 6,221 1,54 0,93822 0,0123 2,03 1,2 65 1 159 69,15 4,236 6,333 1,65 0,95053 0,0103 1,70 1,0 70 1 160 74,15 4,306 6,437 1,76 0,96080 0,0070 1,16 0,7 75 2 162 79,15 4,371 6,535 1,85 0,96784 0,0066 1,09 0,7 80 1 163 84,15 4,433 6,627 1,95 0,97441 0,0044 0,73 0,4 85 1 164 89,15 4,490 6,713 2,03 0,97882 0,0038 0,63 0,4 90 1 165 94,15 4,545 6,795 2,11 0,98257 0,0032 0,53 0,3 95 0 165 99,15 4,597 6,872 2,19 0,98574 0,0024 0,40 0,2 100 — — 104,15 4,646 6,946 2,26 0,98809 — c — 5 165 k 20 162,23 98,1
4. Параметры логнормального распределения: т] = 1,645 In 0,95 0,5 \ 0,5 0,05 / I _ р-1.645/П \ •у = Г] In I ------------------ , \ 0,5 0,05 / е = х015 — ег^, , С.СГ, /64,7—18,75^-1 т) = 1,645 In' 1 (1.181) (1.182) (1.183) 18,75 — 3,46 = 1,495 /1 р~1,645/1,495 х у = 1,495 In -— ------------------ = — 4,6820 \ 18,75 — 3,46 / е = 18,75 — е4’в82/1>495 = — 4,15. 5. Нормированные отклонения г, левых (нижних, или мень- ших) границ классов g, вычисленные по формуле 2=у + т] 1п(£—8), (1.184) записаны в столбце 7. 6. Из табл. 12П в соответствии с величинами z в столбец 8 табл. 1.55 выписываем значения функции Ф, т. е. площади под интегральной кривой нормального распределения. Вычитая за- тем предыдущее значение из последующего, в столбце 9 полу- чим частности логнормального распределения, выраженные в до- лях единицы. 7. Произведения чисел столбца 9 на объем ряда М=165 (стол- бец 10) представляют собой частоты логнормального распреде- ления, которые также выражены в процентах (столбец И). Сов- падение эмпирических и теоретических частот достаточно близ- кое (рис. 13), что показывает и величина критерия /С(Х)=О,40336. На этом задача аппроксимации данного распределения мо- жет быть закончена, но ввиду важности рассматриваемого ряда для оценки вариабельности признаков растений в целом вычис- лим его другие параметры. 1. Средняя арифметическая по серединам классов рассчиты- вается по формуле (1.13): Л4=4057,5/165=24,5909. 2. Среднее квадратическое отклонение определяем по форму- ле (1.24а): ст = у60 453,637/(165—1) = У368,6197 = 19,8958, 3. Проверка вычисления средней и сигмы по формулам (1.70), Л4=2,5 + 5 (5,4182— 1) =24,591, о2 = 25/164 [2-4078—894(14-894/165)] = 368,6196; о= 19,896. 133
Рис. 13. JIoi нормальное распределение величин коэффициента вариации х био логических признаков f — частоты: 1 — эмпирические, 2 — теоретические 4. Моменты условные по формулам (1.68): т1 = 894/165 = 5,4182, т2-2-4078/165—5,4182 = 44,0121, т3 = 2 [3 (16 852/165—0,5 -44,0121) — 5,4182] = 469,9268, = 6(4-63841/165—5,4182—469,9268) — 11-44,0121 = = 5949,7593; центральные моменты по формулам (1.56) — (1.58). ц2 = 44,0121—5,41822 = 14,6552; Из == 469,9268+5,4182 (2 • 29,3569—3 - 44,0121) = 72,6508; = 5949,7593+5,4182 [3-5,4182 (2-44,0121—29,3569) — -4-469,9268] = 931,9984. 5. Коэффициент вариации эмпирического ряда по формуле ^=19,9-100/24,6=81 %. Величина Л42/о2==604,7/368,6=1,76> 1,56 (см. § 1.34), поэтому данное эмпирическое распределение нельзя аппроксимировать показательным. 6. Уравнение, по которому можно вычислить частоту для лю- бой величины х в пределах области аппроксимации логнормаль- ным распределением: f' - ех₽ {- 0’5,,! [i+111 М!} (1.185) 134
где N— объем ряда; с — классовый интервал; х — случайная ве- личина, любая варианта ряда, в том числе g — граница класса; т), у, 8 — параметры распределения. В рассматриваемом примере вычислим частоту для х=33%, т. е. теоретическую частоту появления рядов распределений био- логических признаков с коэффициентом вариации 33%: f ------165-5-1,495_ 0 5' । 4952 4 б82/1 495 + ' (33 + 4,15) И2л + In (33+ 4,15)]2} = 165’0,08027 = 13,24, где 1/]/2л=0,39894. Таким образом, в данной совокупности мо- жет встретиться около 8% рядов, вариабельность которых близ- ка к 33%. Используя полученное значение среднего квадратического от- клонения, построим интервал нормы вариабельности признаков растений: М4=0=24,594119,9, т. е. от 4,69 до 44,49, далее: 44,49— 64,39—84,29—104,19. Округленно шестибаллькая шкала вариабельности выглядит так: 1) 0—4,69; 2) 4,7—24,59; 3) 24,6—44,49; 4) 44,5—64,39; 5) 64,4—84,29; 6) 84,3—104,2 (величины коэффициента вариации в процентах. Иногда для точного определения типа кривой из семейства распределений Джонсона пользуются следующими критериями: Р1 = (1.186) подставив в эти формулы найденные значения центральных мо- ментов, получим: Р,=72,65082/14,65523= 1,6769, р2= 931,99 84/14,65 522 = 4,33 94. Однако как показывает наш опыт, аппроксимация логнор- мальным распределением бывает обычно достаточно точной, не- смотря на то что по критериям (1.186) ряд может откоситься к другому типу кривой, как это имеет место в данном случае, в ко- тором, согласно критериям (1.186), следовало бы применить тип кривой 5В. По данным аппроксимации через процентили можно получить также приближенную оценку коэффициента вариации логнормального распределения: v = 100 /ехр(+2)—1, (1.187) где т] вычисляется по формуле (1.181). Для нашего примера: v = 100 /ехр(1,495"2)—1 = 75,1 %.
2 КОРРЕЛЯЦИЯ Между величинами может существовать более точная, или функциональная, связь, когда одному значению аргумента х со- ответствует одно определенное значение функции у, и менее точ- ная— корреляционная связь, когда одному конкретному значе- нию аргумента соответствует приближенное значение или неко- торое множество значений функции, в той или иной степени близ- ких друг к другу. Близость в этом множестве значений функции друг к другу соответствует понятию силы, или тесноты, корре- ляционной связи. Чем больше сила корреляционной связи, тем ближе эта связь к функциональной. Объекты ботанических исследований (популяции, особи, ор- ганы, клетки) всегда в той или иной степени неоднородны по своим наследственным особенностям, и, кроме того, в любом, даже тщательно поставленном эксперименте его объекты испы- тывают неучитываемые воздействия многих факторов внешней среды. Поэтому между признаками объектов ботанических ис- следований бывают исключительно корреляционные связи. На- пример, большей длине корня у высших растений, как правило, соответствует, в общем, большая высота стебля, в этом случае имеет место положительная, или прямая, корреляция. Чем расте- ния крупнее, больше по размерам или по весу, тем меньшее их число может произрастать на одной и той же единице площади участка земли; в этом случае существует отрицательная, или об- ратная, корреляция. В одной и той же парной связи может быть и прямая и обратная корреляция. Например, высота растений и число соцветий на них у гелениума осеннего находятся в прямой связи, но до некоторого предела, после которого при дальнейшем увеличении высоты растений происходит не увеличение а, наобо- рот, уменьшение числа соцветий на них. Поэтому при изучении корреляций следует брать достаточно широкие пределы измене- ний обоих признаков, чтобы была возможность выявить и такие двузначные связи. Сложность изучения корреляционных связей заключается также и в том, что все признаки (например, у растения) в раз- личной степени взаимосвязаны и при исследовании методом пар- ной корреляции можно считать доказанной лишь ту связь между двумя признаками, механизм которой биологически понятен; в противном случае можно установить корреляцию там, где ее 136
нет, ибо изменения двух признаков могут более сильно зависеть от изменения другого, третьего признака или от совокупности не- которых других признаков. Поэтому более правильным было бы совместное, одновременное исследование связей всего комплекса признаков данного растения или явления с применением методов множественной корреляции, парциальных коэффициентов корре- ляции и корреляционных плеяд. В этой главе методы вычисления показателей корреляции располагаются в следующем порядке: ранговые показатели кор- реляции, наиболее простые по технике вычисления (§ 2.02, 2.03), обычный коэффициент корреляции (§ 2.04, 2.05), схемы расчетов показателей криволинейной связи (§ 2.06—2.10), некоторые ча- стные случаи корреляционных связей (§ 2.11—2.13). Для проверки гипотезы о взаимосвязи между двумя призна- ками, которые могут быть выражены количественно, вычисляют различные показатели силы и достоверности этой связи. Для не- взвешенных рядов (см. 1.01) составление корреляционной решет- ки (пример ее см. табл. 2.01) не требуется, так как проще вы- числить коэффициент корреляции без ее составления. Если объ- емы выборок значительны и требуют группировки вариант во взвешенные ряды, то для вычисления различных показателей связи: коэффициента корреляции, корреляционного отношения, полихорического показателя связи — желательно, особенно при отсутствии вычислительной техники, составить корреляционную решетку. Вычисление эмпирической линии регрессии сильно об- легчает возможность выявления формы связи, чтобы далее решить, какой из показателей следует применить в данном кон- кретном случае. Если связь прямолинейная, то вычисляют коэф- фициент корреляции, показатель корреляции Спирмена, коэф- фициент корреляции Кендалла, а при криволинейной связи вычисляют корреляционное отношение и полихорический показа- тель связи независимо от объема выборки. Точки эмпирической линии регрессии, вычисленные по способу, приведенному в § 2.01, используются также при вычислении корреляционного от- ношения. При вычислении прямого корреляционного отношения требуется получить средние значения нескольких у для одного определенного значения х, а при вычислении обратного корре- ляционного отношения вычисляют усредненные значения не- скольких х для определенного у. Таким образом, существуют два вида эмпирической линии регрессии: ух и ху, т. е. у по х и х по у. Вычисление точек эмпирической линии регрессии производится также и в том случае, когда корреляционное отношение вычис- ляют для невзвешенного ряда. При исследовании корреляционных связей между признаками любых, в том числе и биологических, объектов желательно вна- чале выявить тип распределения данных (см. гл. 1). При этом, чем ближе эмпирическое распределение к нормальному или хотя бы к симметричному, тем больше оснований для применения методов корреляционного анализа, и наоборот Однако во многих 137
Таблица 2.01. Вегетационный период х (в днях) и вес 1000 семян у (в г) у 214 сортов ячменя У 57,5— 62,4 62,5- 67,4 67,5— 72,4 72,5— 77,4 77,5— 82,4 82,5— 87,4 87,5— 92,5 ХУ 60 65 70 75 80 85 90 55—61 58 1 2 3 7 1 14 76,8 49—54,9 52 5 8 10 11 2 2 38 75,4 43—48,9 46 7 10 17 33 3 1 71 76,3 37—42,9 40 1 8 9 20 18 1 1 58 74,6 31—36,9 34 1 4 5 10 5 1 26 73,3 25—30,9 28 3 3 6 70,0 19—24,9 22 1 1 65,0 fx 2 29 34 63 74 8 4 Л Г =214 Ух 37,0 41,4 44,8 42,9 45,8 46,8 47,5 случаях эту проверку нельзя выполнить из-за недостаточного объема исходных данных, что определяет в дальнейшем соот- ветствующую надежность результатов. Затем следует установить степень криволинейности изучаемой связи, что можно сделать визуально при помощи несложного графика данной эмпириче- ской зависимости или аналитически (§ 2.07). Далее вычисляют избранные показатели связи и обязательно их ошибки для оцен- ки достоверности найденных величин показателей. Недостовер- ные величины показателей корреляции из дальнейшего анализа в общем случае исключают. Методы статистических исследований, изложенные в гл. 1, мо- гут быть отнесены к общему универсальному этапу математиче- ской обработки данных. Задача этого этапа — первичная обра- ботка фактов, в результате которой большей частью ожидается получить основные характеристики массива данных: среднюю арифметическую, дисперсию, среднее квадратическое отклоне- ние, ошибку средней, коэффициент вариации и показатель точ- ности опыта. Перечисленные показатели позволяют судить об уровне и степени варьирования данных, оценить их полноту (ре- презентативность), надежность и пригодность для дальнейших исследований и выводов. /Методы корреляционного анализа, ре- грессии и другие, изложенные в гл. 2, 3, относятся к специально- му этапу статистических исследований, на котором в отличие от общего требуется выдвижение четко сформулированной рабочей гипотезы, которую надлежит доказать или опровергнуть при по- мощи биометрических методов. В частности, посредством вычис- ления показателей корреляции и оценки их достоверности опре- деляют наличие или отсутствие связи между различными призна- ками объектов. 138
§ 2.01. КОРРЕЛЯЦИОННАЯ РЕШЕТКА И ЭМПИРИЧЕСКАЯ ЛИНИЯ РЕГРЕССИИ При составлении корреляционной решетки оба ряда данных надо сгруппировать в сопряженные между собой взвешенные ряды. Составление корреляционной решетки и вычисление точек эмпирической линии регрессии производится в следующем по- рядке. 1. Перед составлением сопряженных вариационных взвешен- ных рядов следует назначить аргумент х и функцию у, т. е. опре- делить, что является соответственно причиной и следствием в изу- чаемой взаимосвязи. Это поможет лучше ориентироваться в рас- четах показателей связи, хотя само по себе является приемом до- вольно условным, так как в биологии часто исследуются связи, зависящие не друг от друга, а от чего-то третьего. Многие из парных взаимосвязей позволяют легко установить, какой член связи у них является аргументом. Но в некоторых случаях пра- вильность назначения аргумента определяется лишь после вы- числений и заключается в том, что у рассматриваемых двух ря- дов величина прямого корреляционного отношения будет боль- ше, чем у обратного корреляционного отношения. Если обратное корреляционное отношение окажется больше прямого, за аргу- мент принимают другой из двух рядов. Повторять вычисления при этом нет необходимости, так как величины обоих корреля- ционных отношений не изменятся. При исследовании взаимо- связи продолжительность вегетационного периода — вес 1000 се- мян у сортов ячменя (см. табл. 2.01) за аргумент х предположи- тельно принимается продолжительность вегетационного периода, которая может оказывать влияние на вес семян у. 2. Вариационный ряд, который будет принят за функцию, лучше располагать в вертикальном ряду корреляционной решет- ки, числа ряда при этом возрастают снизу вверх. Значения аргу- мента располагаются в горизонтальном ряду, они возрастают слева направо. Такое же расположение рядов принимается при их графическом представлении. В табл. 2.01 приводятся границы классов и их срединные значения, т. е. варианты х, у, и затем частоты. Исходные данные разносятся по классам корреляцион- ной решетки так же, как и при составлении отдельного вариаци- онного ряда (§ 1.01), с той разницей, что здесь каждая точка в клетке (частота) соответствует определенным значениям обоих рядов одновременно. Сумма частот столбцов должна равняться сумме частот строк и объему выборки, в данном случае N=214. 3. Расчет эмпирической линии регрессии yxt которая использу- ется при вычислении прямого корреляционного отношения, ве- дется путем определения взвешенных средних арифметических для отдельных участков ряда у или групп вариант, имеющих ча- стоты. Точка 37,0 (табл. 2.01) получена так: (40-1 +34-1)/2= =37,0. 139
Рис. 14. Эмпирические линии регрес- сии признаков ячменя / — вес 1000 семян у в зависимости от ве- гетационного периода — ух ; 2 — продолжительность вегетационного пе- риода х в зависимости от веса се- мян — Ху 4. Эмпирическая линия рег- рессии xv (рис. 14) вычисляется в том случае, если требуется определить обратное корреля- ционное отношение, т. е. когда правильность первоначального назначения аргумента вызыва- ет сомнение. Точки ху получе- ны путем определения группо- вых средних в горизонтальных рядах корреляционной решет- ки. Например: (65-1+70-2+ +75-3+80-7+ 85-1)/14 = 76,8; (65-5 + 70-8 + 75-10 + + 80-11 + 85-2 + 90-2)/38= = 75,4 и т. д. 5. Вычисление точки эмпи- рической линии ререссии ух на- носим на график (см. рис. 14) и соединяем линией. Полученная эмпирическая линия позволяет заключить, что связь между изучаемыми признаками поло- жительная (так как при возрастании аргумента функция возрас- тает) и близка к прямолинейной. Следовательно, в данном слу- чае для определения степени силы связи можно применить коэф- фициент корреляции (см. § 2.05). При обработке невзвешенных малочисленных рядов, как ука- зывалось в начале главы, корреляционная решетка не составля- ется, однако график зависимости у от х по непосредственным данным вычерчивается для того, чтобы можно было судить о форме данной взаимосвязи, рукородствуясь рис. 15. Вычерчи- вание такого графика перед вычислением показателя корреля- ции часто позволяет легко найти правильный метод обработки материала. Многие корреляционные связи, не слишком откло- няющиеся от прямолинейных, могут быть удовлетворительно охарактеризованы коэффициентом корреляции, который вычис- ляется проще, чем корреляционное отношение. Допустимая сте- пень отклонения корреляционной связи от прямолинейной в та- ких случаях определяется при помощи критериев криволиней- ности (см. § 2.07). § 2.02. ПОКАЗАТЕЛЬ КОРРЕЛЯЦИИ РАНГОВ ПО СПИРМЕНУ Сила корреляционной связи между двумя признаками при помощи рассматриваемого показателя измеряется в основном для небольших невзвешенных рядов, которые представляют со- бой качественные оценки признаков. Численность рядов в прин- 140
ципе может быть любой, однако ранжирование выборки боль- шого объема при ручном счете становится затруднительным. Достаточную точность вычисления обеспечивает формула р = 1 - [б (2 62 + Вх + B,)]/[tf (№—1)1 (2.01) где р — показатель корреляции рангов; У — число пар вариант корреляционных рядов; Вх — поправка на объединение рангов в ряду х по формуле (2.03); Ву—поправка на объединение ран- гов в ряду у по формуле (2.03); S62 — сумма квадратов попар- ных разностей рангов. Если в рядах х и у отсутствуют объединенные ранги, показа- тель корреляции рангов равен р = 1-6.2 62/[ЛГ(№-1)], (2.02) где обозначения те же, что и в формуле (2.01). В биометриче- ских исследованиях в подавляющем большинстве случаев при- меняют формулу (2.02). На следующем примере показан один из возможных случаев использования показателя корреляции рангов. Требуется объ- ективно подобрать из числа опытных специалистов группу экс- пертов для оценки сортов декоративных растений. Для этого всем этим специалистам предлагается оценить 13 сортов одной цветочной культуры (вообще желательно для этого брать боль- шую выборку: 20—30 сортов или других образцов). Оценка ве- дется по декоративно-хозяйственным признакам растений и вы- ражается в сумме баллов. Затем между оценками всех специа- листов находят попарно показатель корреляции рангов и отби- рают в качестве экспертов тех лиц, оценки которых в наиболь- шей степени совпадают. При этом требуется вычислить показа- тели корреляции, число которых равно 0,5Af(N—1), где N — число кандидатов на должность эксперта. Для примера вычис- лим показатель корреляции рангов между оценками только двух экспертов: х и у (столбцы 1 и 2 табл. 2.02). 1. Ранжируем данные рядов х и у от большего к меньшему, присваивая вариантам порядковые номера. Варианта 72 ряда х получит ранг 1, варианта 67 — ранг 2, варианты 64 и 64 должны были бы получить ранги 3 и 4, но так как они имеют равное зна- чение, то берется средний ранг для обеих вариант: (3 + 4)/2=3,5. Остальные ранги обоих рядов приведены в столбцах 3, 4 табл. 2.02. 2. Получаем разности рангов без учета их знаков (столбец 5). 3. Возводим разности в квадрат и суммируем: 2®2 = 479 (столбец 6). 4. Вычисляем поправки: Вх (или Ву) = 2 l(rt® — п)/12] (2.03) 141
Таблица 2.02. К вычислению показателя корреляции рангов между оценками двух экспертов X У Ранг х Ранг у Разность рангов 6 б2 1 2 3 4 5 6 52 64 10 8 2 4 53 66 8,5 6 2,5 6,25 63 57 5 13 8 64 72 62 1 10 9 81 56 61 6 И 5 25 34 63 12 9 3 9 33 71 13 2 И 121 44 70 И 3,5 7,5 56,25 53 65 8,5 7 1,5 2,25 64 70 3,5 3,5 0 0 64 72 3,5 1 2,5 6,25 54 68 7 5 2 4 67 60 2 12 10 100 2 = 479,00 где Вх или Ву— поправки на объединение рангов в ряду х или у; п — число рангов в каждой группе объединенных рангов; 3 — знак суммирования всех значений (ns—я)/12, вычисленных для отдельных групп. Число групп объединенных рангов в ряду х — две группы. В каждой из групп по 2 ранга: 8,5 и 8,5; 3,5 и 3,5, от- сюда по формуле (2.03) Взс=[(23 *-2) + (23-2)]/12=1. ' В ряду у одна группа объединенных рангов с двумя рангами в ней: 3,5 и 3,5, следовательно, по формуле (2.03) В^=(23—2)/12= =0,5. 5. Подставляем полученные значения в формулу (2.01): р=1 — [6(479+1+0,5) ]/[13(132—1)]=—0,32. По тем же данным, но без поправок на объединенные ранги получим по формуле (2.02) р= 1 — 6 • 479/ [ 13 (132—1) ] =—0,32. Таким образом, для оценки силы связи в данном случае мож- но было бы пользоваться и формулой (2.02). Критерий достоверности показателя корреляции рангов t = IРI V(N - 2)/(1 -1 р |). (2.04) 142
Число степеней свободы для его оценки определяется по вы- ражению v=Af—2; |р|—абсолютная величина показателя кор- реляции рангов; N — объем ряда х. Достоверность показателя корреляции рангов в рассмотрен- ном примере по формуле (2.04) /=0,32У(13—2)/(1—0,32) = = 1,286. По табл. 4П при Р/=0,95 и v=13—2=11 /=2,201, следо- вательно, полученный показатель корреляции рангов недостове- рен и кандидаты на должность эксперта х и у оба не подходят или не подходит один из них, а кто именно, должны указать остальные показатели корреляции рангов между оценками дру- гих экспертов, рассмотренные совокупно. Достоверность показателя корреляции рангов можно опреде- лить также по табл. 17П. При N=13 вычисленное значение должно быть равно или больше табличного, которое равно 0,48, следовательно, подтверждается сделанный вывод о недостовер- ности показателя корреляции. Его критические значения при объеме совокупности N можно также рассчитать для 5% уровня значимости: р= (1,96//лГ-Г)(1— 0,16/(Лг—1)) (2.05) и для 1% уровня значимости: р = (2,58/тЛлТ—Т) (1—0,69/(ЛГ—1)). (2.06) Последние формулы дают более строгую оценку. Если вычис- ленное значение р будет меньше, чем полученное по формуле 1,2.05) на 5% уровне значимости, то он недостоверен. Достовер- ным показатель корреляции рангов считается лишь тогда, когда он больше критического значения, полученного по формуле (2.06) на 1% уровне значимости. § 2.03. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ РАНГОВ ПО КЕНДАЛЛУ Сила корреляционной связи между двумя невзвешенными ря* дами может быть определена посредством вычисления коэффи- циента корреляции рангов. Рекомендуется его вычислять для ря- дов не менее чем из 10 вариант. Численность ряда в большую сторону теоретически может быть любой, однако ранжирование рядов с большим числом вариант при ручном счете становится затруднительным, поэтому обычно применяют коэффициент Кен- далла к небольшим выборкам. Вычисление производится по об- шей формуле: т = Б/(N-V) - Вх] [0,5У (N—1) — (2.07) гдет — коэффициент корреляции рангов по Кендаллу; Б — сумма рангов, пример ее вычисления приводится в табл. 2.03; N — объ- ем выборки; Вх, Ву — поправки на объединение рангов, которые находим по формуле (2.08). 143
Таблица 2.03. Ранги и их оценка для вычисления коэффициента < корреляции Кендалла < Ранги 1 х 1 2 3,5 3,5 5 6 7 8,5 8,5 10 11 12 13 у 10 12 1 ЗЛ 13 Й 5 6 7 8 3~5 9 2 Оценка рангов Больше +3 +1 +9 +7 0 0 +4 +2 +2 +1 +1 0 +30 Меньше —9 —10 0 —1 —8 —7 —2 —2 —2 —2 —1 —1 —45 Сумма оценок: Б — + 30+ (—45) = —15 Если среди вариант в обоих рядах нет совпадающих величин, следует обратиться к более простой формуле (2.12) вычисления коэффициента корреляции Кендалла. Коэффициент корреляции рангов является более строгой оценкой связи, чем показатель корреляции рангов, так как по абсолютному значению | р | > | т j для одних и тех же данных. На примере, приведенном в § 2.02, вычислим коэффициент корреля- ции рангов по формуле (2.07). 1. Рекомендуется расположить все значения ряда х от мень- шего к большему; сопряженные значения у ранжируем вместе с х, т. е. передвигаем одновременно, они также займут соответст- вующее им положение. 2. Всем значениям обоих рядов от большего к меньшему при- сваиваем порядковые номера (ранги) так, как это описано в § 2.02, п. 1. В примере предыдущего параграфа ряды уже ранжи- рованы (столбцы 3, 4 табл. 2.02) остается лишь расположить ряды по порядку возрастания рангов ряда х (см. табл. 2.03). 3. Оценку рангов производим слева направо парами сопря- женных рангов: в каждой паре один ранг из ряда х и другой, со- ответствующий ему, из ряда у. Каждая пара рангов сравнивает- ся со всеми стоящими справа от нее. При сравнении могут воз- никнуть три случая: а) ранг у левой из сравниваемых двух пар меньше соответствующего ранга у из правой пары, в этом слу- чае записываем +1; б) ранг у из левой пары больше соответст- вующего ему ранга из правой пары, в этом случае записываем — 1; в) ранги сравниваемых пар совпадают в одноименном ряду, в этом случае записываем 0. Начинаем с пары рангов 1 —10, сравнивая ее со всеми 12 парами, стоящими справа. В паре 2—12 ранг //=10 из левой пары меньше ранга //=12, записываем +1; в следующей паре: 3,5—1 левый ранг //=10 больше правого ран- га //= 1, записываем —1 и т. д. Если ранги совпадают, например при сравнении восьмой пары с девятой: 8,5—6 и 8,5—7 или чет- вертой пары с одиннадцатой: 3,5—3,5 и 11—3,5, записываем 0. Затем подсчитываются суммы положительных единиц и отрица- тельных единиц, что даст значение Б. Указанный алгоритм по- ясняет принцип построения коэффициента и пригоден для про- граммирования и вычисления на ЭВМ. 144
При ручном счете рекомендуется поступать следующим обра- зом. Для оценки любой пары рангов, начиная с первой, подсчи- тываем, сколько рангов у из находящихся справа от нее имеют значения большие чем значение ранга у, находящееся в оцени- ваемой паре, и записываем это число с плюсом. Затем подсчиты- ваем справа же число пар, значение ранга у в которых меньше значения у из оцениваемой пары, и записываем это число ран- гов со знаком минус. Перед началом оценок каждой пары сле- дует выявить совпадающие ранги (в одноименном ряду) и не принимать в расчет те пары рангов, в которых они встречаются. Первая пара 1 —10 имеет ранг у=10, больше которого справа в ряду у имеются три ранга: 12, 13, 11. Записываем +3. Меньше 10 справа насчитывается девять рангов. Записываем под оценивае- мой парой —9. Совпадающих рангов нет. Оцененную пару 1—10 исключаем из дальнейших подсчетов. Во второй паре 2—12 ранг z/=12, больше которого справа имеется один ранг и меньше его десять рангов, записываем под ним соответственно: +1 и —10. Совпадающих рангов нет. Оцененную пару и далее каждый раз исключаем из расчетов. В третьей паре 3,5—1 в ряду х имеется ранг 3,5, совпадающий по значению с рангом х=3,5 в четвертой паре, поэтому четвертую пару исключаем из цикла оценки третьей пары. Получаем число рангов, больших 1 (справа), равно +9 и меньших 1 равно 0. Так- же при сравнении четвертой пары 3,5—3,5 с другими исключаем одиннадцатую пару 11—3,5, так как в ней ранг у=3,5 совпадает с таковым из четвертой пары, и т. д. 4. Суммируем положительные и отрицательные суммы оце- нок: Б=+ 30+(—45)=—15. 5. Находим поправки на объединение рангов в обоих рядах по формуле Вх (или Ву) = 0,5 2 п (п + 1)> (2.08} где Вх — поправка на объединение рангов в ряду х\ Ву— поправ- ка на объединение рангов в ряду у; п — число объединенных рангов в каждой группе. В ряду х объединено по два ранга в двух группах: 3,5; 3,5; и 8,5; 8,5; отсюда по формуле (2.08) Вх=0,5[2(2—1) 4-2(2—1) ]=2. В ряду у объединено два ранга в одной группе: 3,5; 3,5, от- сюда Ву=0,5-2(2—1) = 1. 6. Подставляем в формулу (2.07) найденные значения Б, Вх и Ву. т = —15/f [0,5.13(13—1) —2110,5.13(13—1) — 1] = —0,196. 145
7. Оцениваем значимость коэффициента корреляции Кендал- : ла: ; t = г//2 (2#+5)/[9А (АГ—1)] = T/mt > 3, (2.09) 1 где t — критерий достоверности Стьюдента; т — коэффициент корреляции Кендалла; N— объем выборки; тх — ошибка коэф- фициента корреляции, которую можно также получить из табл. 18П. Коэффициент корреляции рангов является значимым, если t равно или превышает 3 или табличное значение (см. табл. 4П), при числе степеней свободы v=Ar—2. В нашем примере по фор- муле (2.09) t = 0,196//2 (2 -13+5)/[9 • 13 (13— 1)] = 0,93, ту же величину получаем при тх=0,2099 (см. табл. 18П). Вычисленное значение 0,93 значительно меньше таблично- го— 2,20 (см. табл. 4П) при числе степеней свободы 13—2=11 и доверительном уровне 95%, следовательно, коэффициент корре- ляции рангов, равный —0,196, является недостоверным. Это под- тверждает вывод, сделанный в § 2.02, о несовместимости или не- пригодности специалистов х и у в качестве экспертов. Формула (2.09) упрощается после возведения ее в квадрат и очевидных преобразований: N(N— 1)т2/12(2ЛЧ5)]^1. (2.10) Если левая часть этого неравенства будет больше единицы, то коэффициент Кендалла значим, а если левая часть неравен- ства будет меньше единицы, то коэффициент Кендалла будет не- достоверным. Для рассмотренного примера при У=13 т=0,196 по формуле (2.10) 13 (13— 1) 0,1962/ [2(2-13+5)] =0,09666 < 1, следовательно, данная величина коэффициента корреляции Кен- далла недостоверна. При v (1)^=1 и v(2)=W—2 значимость коэф- фициента можно также оценить несколько точнее по критерию Фишера. Принимая Pt=95% и v(l) = l, v(2) = 13—2=11, по табл. 8П, /7/=4,84>0,09666, т. е. подтверждается тот же вывод. По формуле r2(2V—1)/(0,4+1/Л0^10 (2.11) величина коэффициента корреляции Кендалла оценивается наи- более просто. Подставив в нее известные величины, получим 0,1962(13—1)/(0,4+1/13) =2,0521, что меньше 10, следовательно, подтверждается уже сделанный вывод о недостоверности данной величины коэффициента корре- ляции. Если при вычислении коэффициента Кендалла в рядах х и у объединения рангов не производится (в том случае, когда не име- 146
стся совпадающих вариант в любом из этих рядов), то формула (2.07) обращается в более простую, которая большей частью и применяется: т=2Б/[ЛЦЛГ-1) ], (2.12) где обозначения те же, что и в (2.07). Процесс образования сум- мы рангов Б — см. в этом же параграфе. Без учета поправок на объединение рангов коэффициент Кендалла по формуле (2.12)* равен: т=—2-15/113(13—1) ]=—0,192, что несколько отличается от величины, полученной по формуле (2.07). Значения N(N—1) и 2/[tV (7V—1)] вычислены в табл. 18П для N от 2 до 31. Оценка достоверности коэффициента, получен- ного по формуле (2.12), производится также по одной из фор- мул— (2.09), (2.10), (2.11). § 2.04 . КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ДЛЯ МАЛЫХ ВЫБОРОК Коэффициент корреляции вычисляется в тех случаях, когда требуется выразить количественно силу связи между двумя со- пряженными признаками, если известно, что зависимость одного из признаков от другого близка к прямолинейной. Если форма связи неизвестна, ее следует предварительно установить по гра- фику (§ 2.01). При взвешенных рядах х (аргумент) и у (функ- ция) применяют метод из § 2.05, а при невзвешенных рядах ко- эффициент корреляции г = [2«/-(2*X/Н/ x)2/.v][&- (2, (2.13> где х — варианты ряда аргумента; у — варианты ряда функции; N — объем выборки (число пар вариант, или объем одного из рядов X или у). В конце § 2.05 приведен способ вычисления коэффициента корреляции через отклонения от средней, который также удобен’ при небольших выборках или машинном счете. Вычислим по формуле (2.13) силу связи между высотой рас- тений и урожайностью у сои (табл. 2.04): 1. Возводим в квадрат значения х и у (столбцы 3 и 4). 2. Перемножаем по строкам значения х на у (столбец 5). 3. Суммируем величины столбцов 1—5 и получаем: 2* = 839, 2У“262, 2^ = 55869, 2^ = 5544, 2^ = 16 696. 147
Таблица 2.04. Вычисление коэффициента корреляции для малых выборок Высота растений X, см Урожай у, ц/га X2 и2 ху 62 19 3844 361 1178 63 20 3969 400 1260 73 12 5329 144 876 82 17 6724 289 1394 66 16 4356 256 1056 44 18 1936 324 792 43 26 1849 676 1118 54 25 2916 625 1350 63 19 3969 361 1197 74 25 5476 625 1850 74 27 5476 729 1998 64 23 4096 529 1472 77 15 5929 225 1155 839 262 55 869 5544 16 696 4. Возводим в квадрат суммы столбцов 1 и 2: (2 х)2 = 8392 = 703 921, (2 у)* = 2622 = 68 644. 5. Перемножаем итог столбца х на итог столбца у: 2x2^=839-262 = 219818. 6. Подставляем полученные значения в формулу (2.13): г=[16 696-219 818/13 ] /1<(55 869-703 921/13)(5544-68 644/13)= = —0,316. В зависимости от особенностей исходных данных могут при- меняться различные способы вычисления коэффициента корреля- ции для малых выборок. Если известны средние арифметические обоих рядов Мх, Му, то формулу (2.13) можно преобразовать: r= ^уХ-м^}/У (2*2—Mx2x)(S#2 (2.13а) где обозначения те же. Несколько сокращается объем вычисле- ний при пользовании формулой (2.18), где также участвуют ве- личины средних арифметических. При известных коэффициенте регрессии и средних квадратических отклонениях обоих рядов 148
коэффициент корреляции можно получить из формул (3.10) и (3.11), преобразуя их соответственно: rXy= (Оха^/Оу, rxy= (aiSxcx)l(sycv) (см. § 3.01). Приблизительные, графические способы определения силы связи редко дают удовлетворительные результаты, поэтому здесь не рассматриваются. Некоторое сокращение вычислительной работы достигается иногда путем преобразования исходных данных, в которых мож- но перенести запятую на любое одинаковое в каждом ряду чис- ло знаков вправо или влево или вычесть одно и то же число; от этого величина коэффициента корреляции не изменится. Для примера определим силу связи между высотой растений х (в см) и весом 1000 семян у (в г) у сои по данным из первых двух столбцов табл. 2.15. Найдем средние арифметические этих рядов: Л1Х=839/13=64,5385, Му=2868/13=220,6154, округлим эти вели- чины: Лх=64, Лу=221, вычтем последние соответственно из всех вариант рядов х и у и произведем следующие действия: = x — kr Af A? У Ад ax au —2 —к 4 16 8 —1 —9 1 81 9 9 —3 81 9 —27 18 21 324 441 378 2 —22 4 484 —44 —20 —21 400 441 420 —21 14 441 196 —294 —10 14 100 196 —140 —1 4 1 16 —4 10 13 100 169 130 10 2 100 4 20 0 —3 0 9 0 13 —11 169 121 —143 7 —5 1725 2183 313 После вычислений первых двух столбцов сделаем проверку: 2^ = 2* — Ж = 839—13-64 = 7, ^ау^^у — NAy — = 2868—13-221 =—5. Найденные суммы подставляем в формулу fху== (2 ахаУ 2 / V (2®* д<)(2q» tn« 2q»)» (2.136) где tnx = 2 ax/N = 7/13 = 0,53846; tny = 2 av/N = —5/13 = = —0,38462; rxy = (3134-0,38462-7)/ / У (1725—0,53846 • 7) (2183—0,38462 • 5) = 315,69//3 754 140. 149
Под знаком радикала, как это часто бывает, получилось большое число, которое в подобных случаях можно уменьшить» представив его в виде произведения с 10 в четной степени: 3754140=3,754-106; |'106=106/2=103, следовательно (после сокра- щения на 103=1000): гху=0,31569/уЗ,754= + 0,163. Напомним» что извлечение квадратного корня равносильно делению на два показателя степени подкоренного выражения. В некоторых случаях, чтобы не отвлекать внимания на знаки чисел, бывает целесообразно вычесть из всех чисел каждого ряда его минимальную варианту, например в рассматриваемом при- мере 43 в ряду хи 199 в ряду у. Далее надо вычислить новые средние арифметические для редуцированных данных, получить необходимые суммы, затем воспользоваться формулой (2.13а)’. Оценка достоверности коэффициента корреляции производит- ся путем преобразования его при помощи табл. 19П, из которой берем 2=0,33 для г=0,32. Ошибка преобразованного коэффици- ента корреляции тг = 1/]ЛлГ=3, (2.14> где N — объем выборки. _____ Для рассматриваемого примера т2=1/У13—3 = 0,316, откуда критерий достоверности Стьюдента Z=z//n2=0,33/0,32= 1,03. Вы- численное значение критерия достоверности меньше табличного (см. табл. 4П), которое на доверительном уровне 0,95 равно 2,2. Число степеней свободы при оценке преобразованного коэффи- циента корреляции принимается v=W—2. В данном случае ко- эффициент корреляции оказался недостоверным, что могло про- изойти по двум причинам: из-за малого объема выборки или вви- ду отсутствия исследуемой связи в генеральной совокупности данного объекта. Заметим также, что некоторое снижение вели- чины г может произойти из-за чрезмерно большого округления значений х и у, В табл. 20П приведены минимальные значения коэффициента корреляции, существенные при данном числе ва- риант. По этой таблице для суждения о достоверности г=0,316~ -0,32 требуется не менее 38 парных вариант, поэтому следует повторить вычисление г на большей выборке, после чего при не- достоверном значении коэффициента корреляции можно делать вывод об отсутствии достоверной прямолинейной связи между изучаемыми признаками. Дополнение коэффициента корреляции до единицы, т. е. зна- чение выражения 1 — |г|, называется коэффициентом алиенации и позволяет судить о степени независимости изучаемых факто- ров. В рассмотренном примере коэффициент алиенации равен: 1—10,32 =0,68. 150
§ 2.05. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ДЛЯ БОЛЬШИХ ВЫБОРОК Определение силы связи между признаками при взвешенных (см. § 1.01) рядах данных производится путем вычисления коэф- фициента корреляции с построением корреляционной решетки. Перед вычислением любого показателя связи рекомендуется предварительно построить график данной взаимосвязи для того, чтобы можно было обоснованно выбрать подходящий показатель силы связи в зависимости от степени криволинейности эмпириче- ской линии регрессии. Если эмпирическая линия регрессии зна- чительно отклоняется от прямой линии, следует применить соот- ветствующий показатель криволинейной связи (см. § 2.08—2.12). Коэффициент корреляции для больших групп вычисляется различными способами, здесь рекомендуется для применения формула fхуахау “ (5 axfx 2 ayfy\'N , r\ г --------------------------— , (2.15) A у где N— объем выборки; fxy— совместные частоты рядов х и у; ях, — отклонения вариант рядов х и у от условных средних Ах и Ау\ fx, fy — частоты рядов х, у; ох, оу— сигмы рядов х, у. Отклонения вариант равны: ах=(х—Ах)/сх, ау=(у—Ау)/су, где х, у — варианты обоих рядов; Ах, Ау — центральные вариан- ты (условные средние); сх, су — классовые интервалы в рядах х и у. Вычислим сигмы обоих рядов: <Ух= У [_2aV* — [^axfx}Z/N /N, (2.16) —К” [2°*/»—(2a»/») /у где обозначения те же, что и в формуле (2.15). Определим коэффициент корреляции для проверки предполо- жения о существовании зависимости веса 1000 зерен от продол- жительности вегетационного периода у сортов ячменя (табл. 2.05). Действия производятся в следующем порядке. 1. Массивы данных по обоим признакам разбиваются на клас- сы (см. § 1.01) и производится разноска вариант совместно обо- их рядов по клеткам корреляционной таблицы (см. § 2.01). Чис- ло классов в рядах х и у может быть различным. Аргумент х располагается в горизонтальном ряду таблицы слева направо. Значения функции у возрастают снизу вверх (они могут и, на- против, возрастать сверху вниз; от этого результат не изменится, но будет труднее представить форму зависимости по расположе- нию частот в таблице). 2. Находят точки эмпирической линии регрессии (см. § 2.01) для выяснения формы и степени криволинейности данной связи. 151
0 Рис. 15. Формы корреляционных связей а — обратная (отрицательная) линейная; б — прямая (положительная) линейная; в, г* д — отсутствие связи; е — кольцевая связь Если эмпирическая линия регрессии близка к прямой линии и не является двускатной (см. рис. 15), то вычисляют коэффициент корреляции, в противном случае — показатель корреляции для криволинейных связей (§ 2.06—2.12). 3. В корреляционной таблице произвольно выбирается услов- ный центр, обычно это клетка, содержащая наибольшую частоту (в данном случае клетка с частотой 20). В ряду х против нее бу- дет находиться условная средняя Лх=75, а в ряду у — средняя Ау=40. 4. Вычислим условные отклонения ах: (60—75)/5=—3, (65—75)/5=—2, (70—75)/5=—1, (75—75)/5=0, (80—75)/5= = 4-1 и т. д., записывая их значения в горизонтальной строке. 5. Таким же образом от условной средней 4v=40 вычисля- ются отклонения ау, которые записываются в вертикальной гра- фе табл. 2.05. 6. Условные отклонения перемножаем на соответствующие им частоты: axfx=—3-2=—6, —2*29=—58, —1-34=—34 и т. д. aJv= + 3-14=42, + 2-38=76 и т. д. 7. Квадраты условных отклонений перемножаем на соответст- вующие им частоты: ax2fx=(—3)2-2=18, (—2)2-29= 116, (—1)2Х X 34=34 и т. д. Также для ряда у: ay2fy==32-14=126, 22-38= 152, 12.71=71, О2-58=0, (—1)2-26=26, (—2)2-6=24, (—3)2-1=9. 8. Находим произведения условных отклонений между собой и на имеющуюся совместную для них частоту. Начнем перемно- жать эти числа по столбцам слева направо; первый столбец: 152
Таблица 2.05. К вычислению коэффициента корреляции между вегетационным периодом х (в днях) и весом 1000 зерен ячменя у (в г) СП со л 57,5— 62,4 62,5—67,4 67,5—72,4 72,5-77,4 77,5—82,4 82,5-87,4 87,5-92,5 аУ “Ж a*fg 60 65 70 75 Ах 80 85 90 55—61 58 1 6 2 6 3 ° 7 21 1 6 +3 14 42 126 49—54,9 52 г —20 о ~16 0 ,, 22 8 12 +2 38 76 152 5 8 10 И 2 2 43—48,9 46 —14 —10 0 33 6 3 4-1 71 71 71 7 10 17 33 3 1 37-42,9 40-4, , ° 8 ° 9 ° 2|) ° „ ° , ° , ° « 58 » » 31-36,0 34 1 3 4 8 S 5 К> ° S —5 1 —1 30 —26 26 25—30,9 28 12 0 —2 6 —12 24 о о 19—24,9 22 6 —3 1 —3 9 1 ах —3 —2 —1 0 . 4-1 4-2 4-3 2 =148 = 408 fx 2 29 34 63 74 8 4 N = 214 а с —6 —58 —34 0 74 16 12 J = 4 a2f 18 116 34 0 74 32 36 2= 310 ; 3 -14 -27 0 71 18 15 £ = 66 Л» gj а? у
axayfxy=(—3) *0*1=0, (—3) • 1 • (—1)=3, второй столбец: (—2) X X3*l =—6, (—2)-2-5=—20, (—2)-1’7==—14 и т. д., записывая полученные произведения в правом верхнем углу соответствую- щих клеток таблицы. 9. Суммируем совместные частоты по столбцам и записываем в горизонтальной строке снизу таблицы: 3, —14, —27, 0, 71, 18, 15. 10. Получаем суммы по строкам (ряд х) и по столбцам (ряд у): 2fJC = tf = 214, 2^=4, S^ = ^ = 214, 2^ = 310, 2fxyCtxtiy = 66, 2^=148, 2аХ = 408. Для проверки вычисление этих сумм следует повторить. И. Находим сигмы обоих рядов по формуле (2.16): ах = тЛ(310—42/214)/214 = 1,203, = V(408— 1482/214)/214= = 1,195. 12. Подставляя найденные суммы и величины сигм в форму- лу (2.15), получаем г=(66—4-148/214)/(214• 1,203* 1,195)=0,2055. Ошибку коэффициента корреляции вычисляют по двум фор- мулам в зависимости от численности совокупности. Для неболь- ших групп данных (7V< 100) применяют преобразование через z и формулу (2.14), а для больших групп (Af> 100) ошибка тг = (1-г2)//М, (2.17) « где тг — ошибка коэффициента корреляции; г — коэффициент корреляции; N — объем выборки (Л’> 100). Для рассмотренного примера по формуле (2.17) mr= = (1—0,20 552)/}214=0,065. Достоверность найденного коэффи- циента корреляции определяется по критерию Стьюдента: /=г/тг=0,2055/0,065=3,16. Число степеней свободы при опреде- лении значимости коэффициента корреляции равно v=N—2= =214—2=212. По табл. 4П при Р/=0,95 /=2,0. Вычисленное значение, равное 3,16, больше табличного, следовательно, между продолжительностью вегетационного периода и весом 1000 се- мян, судя по выборке из 214 сортов ячменя, имеется положитель- ная, небольшая, но достоверная зависимость: чем продолжитель- нее вегетационный период, тем больше вес 1000 зерен. Оценку достоверности коэффициента корреляции можно сделать также по табл. 20П (см. § 2.04). При расчете коэффициента корреляции на ЭВМ как для ма- лых, так и для больших рядов (без группирования в классы) удобна формула г = [2 (х-Мх) (у -М,)]/ У 2 (X-Мху 2 (У- Му}\ (2.18) 154
где г — коэффициент корреляции; (х—Мх)—отклонения значе- ний ряда аргумента от его средней Мх; {у—Му) — отклонения значений ряда функции от ее средней Му. Пример расчета по этой формуле приведен в § 3.01. § 2.06. ОПРЕДЕЛЕНИЕ ЛИНЕЙНОЙ И НЕЛИНЕЙНОЙ СВЯЗЕЙ МЕЖДУ ВЗВЕШЕННЫМИ РЯДАМИ Данный метод может быть применен главным образом тогда, когда при наличии большой выборки данных требуется количест- венно определить не только силу связи между двумя изучаемыми признаками, но и степень ее криволинейности. Такие случаи мо- гут встретиться, если по эмпирической линии регрессии нельзя определенно судить, насколько изучаемая связь отклоняется от прямолинейной (см., например, рис. 14), или если требуется, помимо количественного выражения силы связи, получить также и представление о тенденции (знаке) данной зависимости. Квад- рат коэффициента корреляции, который вычисляется и оценива- ется здесь, иногда называют коэффициентом детерминации. Рас- сматриваемый метод включает также и вычисление точек эмпи- рической линии регрессии ух, которыми можно воспользоваться для построения графика изучаемой взаимосвязи. Вычисление коэффициента корреляции и прямого корреляци- онного отношения по совмещенному алгоритму ведется по фор- мулам: где г — коэффициент корреляции; av — условные отклонения ва- риант ряда х от начала ряда; f — частоты корреляционной ре- шетки; ау— условные отклонения вариант ряда у от начала ряда; пх — суммы частот по столбцам корреляционной решетки; — суммы частот по строкам корреляционной решетки; N — объ- ем выборки; т]у — прямое корреляционное отношение. Последовательность вычислений следующая. 1. Составляем корреляционную решетку таким образом, что- бы варианты ряда аргумента х располагались в верхней строке решетки слева направо, а варианты ряда функции у располага- лись в вертикальном столбце снизу вверх (табл. 2.06). 2. Суммируем частоты по столбцам пх и по строкам пу. 3. Записываем условные отклонения ах и ау от начала рядов х и у в виде натурального ряда чисел, начиная с 0, соответствен- но направлению возрастания вариант в обоих рядах. 155
Таблица 2.06. Полный анализ корреляционной зависимости веса семян у от продолжительности вегетационного периода х у ячменя У X пу ау 60 65 70 75 80 85 90 58 1 2 3 7 1 14 6 52 5 8 10 И 2 2 38 5 46 7 10 17 33 3 1 71 4 40 1 8 9 20 18 1 1 58 3 34 1 4 5 10 5 1 26 2 28 3 3 6 1 22 1 1 О' п, 2 29 34 64 74 8 4 ^=214 790 Л 2 fay 5 94 129 219 293 33 17 790 3222 12’50 304>69 489,44 761,29 1160,12 136,13 72,25 2936,42 — ах 0 1 2 3 4 5 6 646 2260 (2/+/«х 2’50 3’24 3’79 3’48 3’96 4 5 6’13 4>25 - - и 37,00 41,44 44,74 42,88 45,76 46,78 47,50 — — 7/777 7 7 4. Получаем по столбцам суммы произведений частот на со- ответствующие им условные отклонения ау: первая сумма 5=1Х ХЗ+1-2; последняя сумма 17=2-5+1 -4+1 -3. В итоге этой строки 2^ = 790. 5. Значения ^\fay возводим в квадрат и делим каждое из них на соответствующие им суммы частот: получаем: 12,50; 304,69; 489,44 и т. д., в итоге этой строки /v-1 \2 2 -- - = 2936,42. пх 6. Для получения точек эмпирической линии регрессии от- дельные значения ^fay\ 5,94; 129 и т. д.— надо разделить на соответствующие им пх: 2, 29, 34 и т. д., получим [^f^y)/nxz 2,50; 3,24; 3,79 и т. д. Затем каждое из полученных значений умножается на величину классового интервала с=6 и к каждому произведению прибавляется минимальная варианта ряда у (она в табл. 2.06 равна 22): 2,50-6+22=37,00; 3,24-6+22=41,44; 3,79-6+22=44,74 и т. д. Полученные значения ух представляют собой точки эмпирической линии регрессии. 156
7. Перемножаем все значения п на соответствующие услов- ные отклонения ах и складываем произведения: 2-0 + 29-1 + + 34-2+63-3 + .. . + 4-6=646= 2пхах. 8. Получаем сумму ^Пхах=2260, перемножая значения пх на квадраты условных отклонений: 2-02 + 29-12+34-22+63-32... и т. д. 9. Подобно действиям в п. 7 и 8, получаем суммы: 2= 790 = 1-0+6.1+26-2... и т. д. 2^ = 3222 = 1-02+6.12+26-22+58-32 и т. д. 10. Получаем сумму 2 (^2/*+) = 2448=0-5 + 1-94+2 • 129+ +3.219+4-293+5.33+6-17. 11. Находим показатели связи по формулам (2.19) и (2.20): г = (2448—646 • 790/214)/ / (2260—6462/214) (3222—7902/214) = = +0,205, г2 = 0,0422, П2 = (2936,42 — 7902/214)/(3222—7902/214) = 0,0656, ^=0,256. 12. Достоверность коэффициента детерминации (г2 — квадра- та коэффициента корреляции) в зависимости от объема выборки N определяется по критерию Фишера F: F=r2(N—2)/(1 — г2), (2.21) т. е. +=0,0422 (214—2) / (1 —0,0422) =9,34. Числа степеней свободы при оценке коэффициента детерми- нации принимаются v(l) = l, a v(2)=A7—2=214—2=212; отсюда значение критерия Фишера по табл. 8П при равно 3,89. Вычисленное по формуле (2.21) значение критерия больше таб- личного, поэтому делаем вывод о существовании достоверной прямолинейной зависимости веса 1000 зерен от продолжительно- сти вегетационного периода у ячменя. Достоверность квадрата корреляционного отношения т)у2 в зависимости от N—объема выборки и kx — числа классов в ряду х определяется также по критерию Фишера: F = [^N- Ш1(1 - Пр(^х- 1)], (2.22) т. е. для рассматриваемого примера по формуле (2.22): F = [0,0656 (214—7)]/[( 1 —0,0656) (7—1)] = 2,42. Числа степеней свободы при определении достоверности т)у2 по табл. 8П принимаются равными числу классов ряда х без 157
единицы: v(l)=£x—1=7—1 = 6 и объему выборки минус число классов ряда х: v(2)=A’—fex=214—7=207. Отсюда при /\=95% находим F' табличное, равное 2,14. Вычисленное по формуле (2.22) значение критерия составляет 2,42, т. е. больше таблич- ного, поэтому делаем вывод о достоверности также и криволи- нейной зависимости веса 1000 зерен от продолжительности веге- тационного периода у ячменя. § 2.07. КРИТЕРИИ КРИВОЛИНЕЙНОСТИ В биологических исследованиях нередко возникает вопрос, к какому типу отнести изучаемую связь: к прямолинейной или криволинейной. Оценка степени криволинейности корреляцион- ной зависимости производится при помощи критериев криволи- нейности, из которых здесь рассмотрено пять в порядке возраста- ния трудоемкости их вычисления. В формулах (2.23) — (2.27) приняты следующие обозначения: г — коэффициент корреляции; — корреляционное отношение; N— объем выборки. а) - г2 >0,1. (2.23) Связь считается криволинейной, если разность квадратов т]у и г больше 0,1. Для рассмотренного в предыдущем параграфе примера: 0,0656—0,0422=0,02<0,1, поэтому связь между про- должительностью вегетационного периода и весом 1000 зерен практически можно считать прямолинейной. Кроме того, видно, что прямолинейная связь сравнительно слаба, поскольку вычис- ление корреляционного отношения лишь немного повысило ее оценку. ' б)^(ц*-г2)>11,37, (2.24) где 11,37 — критерий криволинейности Блэкмана. Исходя из данных предыдущего примера (а) по формуле Блэкмана: 214(0,0656—0,0422) — 5,03. Полученная разница (5.03) меньше 11,37, поэтому считаем, что рассматриваемая связь мо- жет считаться близкой к прямолинейной. В) F = Цтй - Г2) (N - fe)]/[( 1 - n2) (kx - 2)], (2.25) где F— критерий Фишера; kx — число классов в ряду х. Для рассматриваемого здесь примера по формуле (2.25): F=[ (0,0656—0,0422) (214—7) ]/[ (1—0,0656) (7—2) ] = 1,04. Числа степеней свободы при определении значимости F рав- ны числу классов ряда х без двух: v(l)=&x—2=7—2=5, и объ- ему выборки минус число классов ряда х: v(2)=/V—^=214—7= =207. По табл. 8П при Л=95% на пересечении строк v(l)=5 и v(2)=207 находим /;/=2,26. Вычисленная величина критерия 158
меньше табличной: 1,04<2,26, поэтому делаем вывод о несуще- ственном отличии рассматриваемой связи от прямолинейной. г) Оценим степень криволинейности связи при помощи кри- терия Стьюдента t t = 0,5 /W/[l/(r)2 - г2) - 2 + т]Н- г2] S 3, или i2 = 0,25JV/[(i]2 — г2)-1 — 2 + г)2 + г2] Se9. У У (2.26) (2.26а) Для примера, рассматриваемого в данном параграфе, по формуле (2.26) t = 0,5 /214/(1/(0,0656 — 0,0422) — 2+0,0656+0,0422] = 1,15. Вычисленное значение меньше 3 и меньше табличного (см. табл. 4П) при Р1=95%, которое равно 1,960; поэтому делаем вы- вод, что рассматриваемая связь несущественно отклоняется от прямолинейной. д) Оценка степени криволинейности по критерию В. И. Рома- новского в зависимости от k — числа групп, на которое разбива- ется ряд при вычислении корреляционного отношения: /V —6 —2 Чу — г2 , --------------— 1 и 2 (N — 4)/[(& — 2) — k — 4)] Для рассматриваемого примера по критерию Романовского также подтверждается уже сделанный вывод: 214 — 7 — 2 0,2562 —0,2052 7 — 2 * 1 — 0,2562 “ * § -—..................... = 0, Uo + о. /2(214 —4)/( (7 —2). (214—7 —4)] Из пяти рассмотренных критериев криволинейности первые два просты по вычислению, но менее точны, чем три последних. Заметим, что для решения вопроса о степени криволинейности связи во многих случаях можно удовлетвориться визуальным анализом графика связи по эмпирическим данным. § 2.08. КОРРЕЛЯЦИОННЫЕ ОТНОШЕНИЯ ДЛЯ НЕВЗВЕШЕННЫХ РЯДОВ Корреляционные отношения дисперсий, прямое и обратное, служат для оценки силы связи между двумя признаками, когда последние могут находиться не только в прямолинейной, но и в криволинейной зависимости между собой. При более детальном исследовании вместо корреляционных отношений лучше приме- нять методы дисперсионного анализа, с которыми они тесно свя- заны. 159
а. Под прямым корреляционным отношением понимается та- кой показатель, который измеряет силу криволинейной или пря- молинейной зависимости признака у (функция) от признака х (аргумент), его расчет производится по формуле =У «2 (№ - Му)У2 (у - му? • (2.28) где ух — значения (точки) эмпирической линии регрессии; Му — средняя арифметическая ряда у\ у — варианты ряда; п — число вариант в частной группе. Вычисление прямого корреляционного отношения покажем на примере анализа взаимосвязи между числом вегетативных и фертильных побегов у костра безостого (табл. 2.07). Цель ана- - лиза — выяснить направление взаимосвязи между побегами, т. е. какая группа побегов больше влияет на численность другой. Таблица 2.07. К вычислению прямого корреляционного отношения Форма костра безос- того Число побегов Суммы у (по 3 растения) Ух У х~~^у (Ух-Му)' вегетативных X фертильных У 1 132 164 164 184 533 177,7 14,85 220,5225 184 185 2 76 180 136 183 568 189,3 26,45 699,6025 96 205 3 257 123 78 92 330 110,0 —52,85 2793,1225 143 115 4 270 114 146 250 564 188,0 25,15 632,5225 121 200 5 206 150 197 142 475 158,3 —4,55 20,7025 227 183 6 53 80 92 124 364 121,3 —41,55 1726,4025 161 160 7 147 175 102 209 604 201,3 38,45 1478,4025 106 220 8 170 152 107 179 509 169,7 6,85 46,9225 155 178 9 20 126 27 146 450 150,0 —12,85 165,1225 36 178 A^===27 3609 4397 4397 —0,05 7783,3225 160
Предположим, что число вегетативных побегов обусловливает число фертильных, поэтому примем число первых за аргумент %, а число вторых — за функцию у и соответственно вычислим пря- мое корреляционное отношение. 1. Точки эмпирической линии регрессии ух по невзвешенному ряду получаем путем усреднения по группам. В данном случае эти группы образовались естественно: по три растения каждого сорта (и=3); в других случаях группы составляют искусствен- но— не менее двух вариант в каждой. Суммы: 164+1844-185= =533, 1804-1834-205=568 и т. д. (столбец 4)—делим на число вариант в группе (здесь оно везде равно 3) и получаем точки эмпирической линии регрессии ух\ 177,7; 189,3; 110,0 и т. д. (стол- бец 5). 2. Средняя арифметическая ряда у вычисляется по формуле (1.08): = (2 4/ЛГ = 4397/27 = 162,85. 3. Вычисляем квадраты отклонений точек эмпирической линии регрессии от средней арифметической (столбцы 6 и 7): ^(Ух — — Му^ = 7783,3225. 4. Сумму квадратов отклонений вариант получаем возведени- ем в квадрат разницы каждой варианты у со средней арифмети- ческой и одновременным суммированием квадратов:^ У— = 41 087. 5. По формуле (2.28) т]*/ = V3-7783,3225/41 087 = 0,75. 6. Ошибка квадрата корреляционного отношения, в том числе и обратного: ^=(1-+)%’^, (2.29) где ц — корреляционное отношение; vY=k—1; v2=N—k — числа степеней свободы; k — число групп (классов), на которое разде- лен ряд; N — объем выборки. V1=9—1=8, v2=27—9=18 (1—0,752) 8/18=0,19. Оценим достоверность квадрата корреляционного отношения: (2.30) где F— вычисленное значение критерия Фишера; F' — его таб- личное значение; ц — корреляционное отношение; — ошибка квадрата корреляционного отношения; F=0,7570,19=2,89. По табл. 8П при Р/=0,95 и v(l)=Vi = 8, v(2)=v2=18, F'=2,51, следовательно, на данном доверительном уровне число вегетативных побегов у костра безостого достоверно влияет на число фертильных побегов. 7. Оценку достоверности корреляционных отношений, прямого и обратного удобно, особенно при отсутствии табл. 8П и при сче- 6 Г. Н. Зайцев 161
те на ЭВМ, делать по критериям: (v2 — 2) if/t (1 — n* 1 2 3) Vi] — 1 (2.31) или /^£. _ J у ( 4)/f 2 ( + 2)] s 9( (2.32) где Vi=k—1; v2 = N—k — число групп, на которое был разделен ряд при вычислении корреляционного отношения; N — объем вы- борки; г] — корреляционное отношение. Как видим из формулы, число степеней свободы у2 должно быть не меньше 5. При величине критерия, большей или равной 3 или 9 корреляционное отношение будет достоверным. Уровень достоверности при таком значении критерия примерно Р2' = 0,99. Для менее ответственных выводов можно принимать за его кри- тическое значение соответственно 2,5, или 7,5. Вычислим крите- рий достоверности по формуле (2.31) для прямого корреляцион- ного отношения (vt = 9—1=8, v2=27—9=18): ' (18 —2)0,752 (1 —0,752)8 /1/2 (8+ 18 —2) = / ' 8(18—4) ~ Критерий здесь меньше 3, следовательно, на уровне досто- верности, большем 0,95%, данное корреляционное отношение не- достоверно. б. В тех случаях, когда после вычисления прямого корреля- ционного отношения остается неуверенность в том, что аргумент в парной взаимосвязи был выбран верно, необходимо вычислить обратное корреляционное отношение, при помощи которого мож- но оценить обратную связь между признаками, т. е. силу влияния у на х, и тем самым получить более полное представление о дан- ной связи. Схема расчета остается точно такой же, однако все вычисления проводятся с вариантами из ряда х: Пх = ]/ п2 (ху - М,)2/[ 2 (X - Мх)2], (2.33) где —обратное корреляционное отношение; ху — значения (точки) эмпирической линии регрессии; Мх — средняя арифмети- ческая; п — число вариант в частной группе. 1. Суммируем по каждой форме костра варианты х, которые приведены в табл. 2.07, столбец 2, и записываем их в столбец 1 табл. 2.08: 480, 308, 478 и т. д. 2. Каждую групповую сумму делим на число ее составляю- щих, т. е. на п = 3, и получаем групповые средние, или точки эм- пирической линии регрессии ху: 160,0; 102,7; 159,3; и т. д. 3. Средняя арифметическая ряда аргумента по формуле (1.08) Мх= (2 x)/N = 3609/27 = 133,67. 162
Таблица 2.08. К вычислению обратного корреляционного отношения для невзвешенных рядов Групповые суммы X ху (х^/ Мх)2 480 160,0 26,33 693,2689 308 102,7 —30,97 959,1409 478 159,3 25,63 656,8969 537 179,0 45,33 2 054,8089 630 210,0 76,33 5 826,2689 306 102,0 —31,67 1 002,9889 355 118,3 —15,37 236,2369 432 144,0 10,33 106,7089 83 27,7 —105,97 11 229,6409 3609 —0,03 22 765,9601 4. Сумма квадратов отклонений значений эмпирической ли- нии регрессии ху от средней арифметической (столбцы 3, 4 табл. 2.08) 2(ху — Мх)2 = 22 765,9601. 5. Сумма квадратов отклонений вариант от средней арифме- тической (получена на счетной машине) 2(х— Мг)2= 110 720. 6. Обратное корреляционное отношение по формуле (2.33) Пх= /3.22 765,9601/110720 = 0,79. 7. Оценка достоверности по критерию (2.31) ~ (18 —2) 0,792 _ Я /т / 2(8+18 — 2) (1 — 0,792) 8 ]/ У 8(18 — 4) = 3,55>3 и по критерию Фишера (2.29), (2.30): Vi = 9—1=8, v2 = 27—9 — = 18, mn2= (1—0,792)8/18 = 0,17, F = 0,7970,17 = 3,67, F = 2,51 (при P/ = 0,95) (табл. 8П). Следовательно, обратное корреляционное отношение более достоверно и по величине оказалось больше чем прямое. Поэтому делаем вывод о том, что за ряд аргумента следует принять не число вегетативных побегов, а число фертильных, т. е. число фер- тильных побегов более влияет на число вегетативных, чем наобо- рот. При пользовании методами из § 2.08 и 2.09 следует иметь в виду для сравнимости результатов, что на величину корреляци- онного отношения влияет способ разбивки рядов на группы (чис- ло групп и число вариант, составляющих группы). 163 6*
§ 2.09. КОРРЕЛЯЦИОННЫЕ ОТНОШЕНИЯ ДЛЯ ВЗВЕШЕННЫХ РЯДОВ а. Прямое корреляционное отношение по данному методу вы- числяется в тех случаях, когда исходные данные сгруппированы во взвешенные ряды. Перед началом работы по вычислению от- ношения требуется установить, что является аргументом х и функцией у в изучаемой зависимости. Прямое корреляционное отношение для взвешенных рядов вычисляется по формуле п,=[2 ~ ~ <2-34> где Mv — средняя арифметическая ряда у. Остальные обозначения по их смыслу и расположению соот- ветствуют таковым в табл. 2.01, по данным которой оценим зави- симость веса 1000 семян от периода созревания у ячменя. Вычис- ления производятся в следующем порядке. 1. Составляем корреляционную решетку и рассчитываем эм- пирическую линию регрессии ух, точки которой уже вычислены в табл. 2.01. 2. Выполнив действия, приведенные в столбце 3 табл. 2.09, по- лучаем среднюю арифметическую ряда у. Му=9448/214 = 44,15 г. 3. Сумма квадратов отклонений, умноженных на частоты для ряда у: %(у— My)2fy = И 003 (столбец 6). 4. Сумма квадратов отклонений, умноженных на частоты, для эмпирической линии регрессии: ^(ух—My)2fx = 736,90. Обе по- следние суммы и слагаемые для них получены на ЭВМ, округле- ние на которой ведется непрерывно в процессе счета до 5 знача- щих цифр. 5. По формуле (2.34) % = /736,90/11 003 = 0,26. 6. Ошибка квадрата корреляционного отношения определяет- ся по формуле (2.29): (1—0,262)6/207 = 0,027, V1 = 7—1 = 6, v2 = 214—7 = 207. Оценка достоверности по критерию Фишера по формуле (2.30) ^=0,2670,027=2,50, F=2,14 (табл. 8П). 7. Критерий достоверности, вычисленный по формуле (2.31) равен Г(207 — 2)0,262 _ j 1 /-, /2 (6 + 207 ~ 2) = 2 51 . (1 — 0,262) 6 ]/ У 6(207 — 4) Оба критерия позволяют заключить, что продолжительность вегетационного периода у ячменя лишь на 95% доверительном уровне достоверно влияет на вес 1000 семян, при более строгой оценке эта связь недостоверна. б. Обратное корреляционное отношение для больших класси- фицированных выборок вычисляется в тех же случаях, в которых 164
Таблица 2.09. К вычислению прямого корреляционного отношения для взвешенных рядов У !У У Л/ Ух f X Myi2fx 1 2 3 4 5 6 7 58 14 812 37,0 2 2685,5 102,25 52 38 1976 41,4 29 2341,7 219,31 46 71 3266 44,8 34 243,00 14,365 40 58 2320 42,9 63 998,91 98,438 34 26 884 45,8 74 2678,6 201,47 28 6 168 46,8 8 1564.9 56,180 22 1 22 47,5 4 490,62 44,890 214 9448 — 214 11 003 736.90 Таблица 2.10. К вычислению обратного корреляционного отношения для взвешенных рядов X ^Х xf X ху fy (X Мд.)2/ х (х^ Л/ v)2f у 1 О 3 4 О 6 7 60 2 120 76,8 14 455,66 40,746 65 29 1885 75,4 38 2954,8 3,5582 70 34 2380 76,3 71 882,26 103,27 75 63 4725 74,6 58 0,55667 14,154 80 74 5920 73,3 26 1781,1 83,679 85 8 680 70,0 6 785,03 155,69 90 4 360 65,0 1 888,76 101,89 214 16 070 — 214 7748,2 502,99 оно применяется для невзвешенных рядов (см. § 2.08). Исполь- зуя тот же пример, рассчитаем обратное корреляционное отноше- ние т]х, оценивающее зависимость продолжительности вегетаци- онного периода от веса 1000 семян у ячменя (см. табл. 2.01): пх = у [2 Н/12(х ~ МхЩ ’ (2-35) где ху — точки эмпирической линии регрессии; Мх — средняя арифметическая ряда х; fx, fy — частоты рядов. Порядок вычислений тот же, что и в пункте а, но с другим ря- дом х. 1. Получаем значения эмпирической линии регрессии ху (столбец 4 табл. 2.10). 165
2. Средняя арифметическая ряда х: Мх = 16070/214 = 75,094 (столбцы 1, 2, 3 табл. 2.10). 3. Суммы квадратов отклонений вариант ряда х (столбец 6) и значений эмпирической линии регрессии (столбец 7), помно- женных на соответствующие частоты, равны:2\х /Их)2/х=7748,2, 2 (ху- MxYfy = 502,99. 4. По формуле (2.35) т]х =/502,99/7748,2 = 0,25. 5. Ошибку отношения и критерий Фишера находим по форму- лам (2.29), (2.30): (1—0,252) 6/207 = 0,027, V1 = 6, v2 = 207, F=0,2570,027 = 2,30>F' = 2,14 (см. табл. 8П). 6. Критерий достоверности по формуле (2.31): (207 —2) 0,252 1 / -, / 2 (6 + 207-2) = 9 17 о _ (1 — 0,252) 6 ]/ У 6 (207 — 4) ’ Оба критерия позволяют заключить, что обратная зависи- мость — продолжительность вегетационного периода от веса 1000 семян у ячменя является еще более слабой, чем прямая, по- этому считаем, что аргумент при расчете прямого корреляцион- ного отношения (п. а) был назначен верно и что вес семян у яч- меня больше зависит от продолжительности их созревания, чем наоборот. § 2.10. ПОЛИХОРИЧЕСКИЙ КОЭФФИЦИЕНТ СОПРЯЖЕННОСТИ ЧУПРОВА При измерении силы корреляционной связи между двумя признаками, каждый из которых варьирует по качественным по- казателям, вычисляется полихорический коэффициент сопря- женности, предложенный А. А. Чупровым. Число классов варьи- рования обоих или одного из коррелирующих признаков при этом должно быть больше двух. Если число классов варьирова- ния по два в каждом ряду, рекомендуется вычислять тетрахори- ческий (четырехпольный) вариант этого же коэффициента (см. § 2.11). Коэффициент сопряженности можно вычислить и тогда, когда оба ряда имеют многоклассовое распределение со взве- шенными вариантами (по примеру корреляционной решетки в табл. 2.01), причем варианты в рядах могут быть и неранжиро- ванными. Полихорический коэффициент сопряженности Т = (J - l)/f(^-l)(^-l), (2.36) где J — сумма частных, вычисленная в табл. 2.11; kx — число классов в ряду х\ ky — число классов в ряду у. Вычисления ведем в следующем порядке. 1. Значения всех вариант разносим по клеткам корреляцион- ной решетки (табл. 2.11). 166
Таблица 2.11. Вычисление суммы частных J для полихорического коэффициента сопряженности Вес 1000 зерен у, г Вегетационный период х, дни пу скороспелые, до 73 дней среднеспелые, 74—81 дня позднеспелые, более 85 дней Крупнозерные 2(4) 12 (144) 14 (196) 28 (более 50,6) 0,14 5,14 7,0 Среднезерные 27 (729) 74 (5476) 47 (2209) 148 (от 38,0 до 50,6) 4,93 37,0 14,93 Мелкозерные 9(81) 25 (625) 4 (16) 38 (менее 37,9) 2,13 16,45 0,42 пх 38 111 65 214=7V ^f2/^ 7,20 58,59 22,35 k =3 л пх 0,19 0,53 0,34 ./=1,06 2. Суммируем частоты по строкам таблицы, получая и по столбцам, получая пх. Сумма пх должна равняться сумме пу и является объемом выборки: N = 214. 3. Частоты всех клеток таблицы возводим в квадрат и произ- ведения записываем рядом в скобках. 4. Квадраты частот делим на сумму пу данной строки, в кото- рой расположены частоты, например квадраты всех частот пер- вой строки делим на 28, получаем: 4/28 = 0,14; 144/28 = 5,14; 196/28 = 7,0. Квадраты всех частот второй строки делим на 148: 729/148 = 4,93 и т. д. Результаты деления записываем в тех же клетках. 5. Суммируем результаты деления по всем столбцам табли- цы, получаем 2 (/2/nz/) — 0» 14+4,93+2,13 = 7,20 и т. д. 6. Суммы частных от деления по столбцам делим на суммы частот по этим же столбцам: (j2/ny) /пх = 7,20/38 = 0,19; 58,59/111 = 0,53 и т. д. 7. Суммируем результаты последнего деления по строке, по- лучаем / = 0,19+0,53+0,34 = 1,06. ____________ 8. Применяем формулу (2.36): Т— (1,06—1)/]/(3—1)(3—1) = = 0,03. 9. Оценку достоверности коэффициента сопряженности произ- водим по критерию хи квадрат: X2 = W-1), (2.37) где N — объем выборки; J — сумма, полученная в итоге табл. 2.11. 167
Число степеней свободы v=(kx—\){ky—1) = (3—1)(3—1)=4. В рассматриваемом примере по формуле (2.37) %2 = 214(1,06— —1,00) = 12,84, что выше значений хи-квадрат первых двух уров- ней достоверности, которые по табл. 15П при v = 4 равны соот- ветственно 9,488 и 13,277. Следовательно, на вес 1000 зерен у яч- меня в небольшой степени, но достоверно влияет продолжитель- ность их созревания. § 2.11. ТЕТРАХОРИЧЕСКИЙ КОЭФФИЦИЕНТ СОПРЯЖЕННОСТИ Силу связи двух признаков, варьирующих альтернативно, можно определить также при помощи коэффициента сопряжен- ности Чупрова (см. § 2.10), формула которого для четырехполь- ной таблицы данных следующая: 7\ = [ | ad — bc\ — 0,5ЛП/]Л(а + b) (с + d) (а + с) (b + d), (2.38 где Г4 — тетрахорический коэффициент сопряженности; « — ячей- ка табл. 2.12, в которую заносятся особи или предметы, обладаю- щие обоими признаками; b — ячейка, в которую заносятся особи, обладающие признаками х и без признака у\ с —ячейка для осо- бей без признака х, но с признаком у\ d — ячейка для особей без обоих признаков; N — объем выборки. Под х, как и во всех подобных случаях, (здесь подразумева- ется аргумент или причина изучаемого явления, а у — функция, или следствие, условно или фактически. Ряд х располагается го- ризонтально, а ряд у - вертикально. Выражение \ad—bc\ озна- чает, что разница в прямых скобках в любом случае получает знак плюс. Буквы «, b, ct d обозначают также численности частот в этих же ячейках. Рассмотрим последовательность вычислений на примере из- мерения силы связи между наличием остей и иммунитетом к бу- рой ржавчине у сортов пшеницы*(см. табл. 2.12). 1. Располагая классы варьирования, как показано в табл. 2.12, производим разноску вариант по ячейкам «, &, с, d согласно их назначению, указанному в объяснении к форму- ле (2.38). 2. Подставляем значения полученных частот в формулу (2.38): т = | 166-1078 — 1297-34 | — 0,5-2575_= . 0 j5 4 ~ К (166 + 1297) (34+1078) (1664-34) (1297+1078) ~ + ’ 3. Оценим значимость полученного коэффициента: X2 = NT*, (2.39) где х2 — критерий хи-квадрат, используемый здесь для оценки силы сопряженности наблюдаемых факторов; У —объем выбор- ки; 7\ — тетрахорический коэффициент сопряженности. 168
Таблица 2.12. Четырехпольная корреляционная решетка данных к вычислению тетрахорического коэффициента сопряженности У X Ости имеются Ости отсутствуют Сумма Сорта, устойчивые к бу- а=166 с—34 а + Ь=200 рой ржавчине Сорта, неустойчивые к 6=1297 d=1078 b 4-^=2375 бурой ржавчине Сумма а+6=1463 c+d=U12 А=2575 В данном примере /2 = 2575-0,152 = 57,9. При оценке значимо- сти коэффициента сопряженности число степеней свободы всегда равно v=l. По табл. 15П при доверительном уровне Р/ = 0,95 Х2 = 3,841; при Л/= 0,99 /2 = 6,635 и Р/ = 0,999 /2= 10,827. В дан- ном случае вычисленное значение хи-квадрат, равное 59,5, зна- чительно больше всех трех критических значений, следовательно, можно утверждать, что имеется положительная зависимость иммунитета сортов пшеницы от наличия у них остей. Сила этой связи измеряется тетрахорическнм коэффициентом сопряженно- сти: Т4 = +0,15. Направление связи можно определить, вычислив ожидаемую частоту ячейки a: ar = N~i (а+с) (а+Ь) =200-1463/ /2575= 113,6. Так как фактическая частота (166) больше ожи- даемой (113,6), то связь положительная. Когда фактическая ча- стота а меньше ожидаемой а', то связь между признаками отри- цательная. При многозначных вариантах, как это имеет место в рассмот- ренном примере, формулой (2.38) иногда удобнее пользоваться в логарифмированном виде: 7\ = exp0,5{21n(|ad—bc\—0,5УУ)— — [In+ln(c+d) +ln(a+c) 4-ln(&4-d) ]}, где обозначения те же, что и к формуле (2.38). § 2.12. БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Применяется тогда, когда один ряд варьирует по числу клас- сов, большему двух, а второй ряд имеет альтернативное (двух- классовое), бисериальное размещение вариант. В биологии не- редки подобные случаи, когда один признак варьирует количест- венно, а другой, связанный с ним, изменяется только качествен- но: по принципу «да» или «нет». Коэффициент корреляции по формуле (2.40) можно вычислять при любой численности выбор- ки, в том числе при Af < 100: 3 faxay “ (S fax 3 fay}/N ( . m rb = —r - ;-= , (2.40) V (s к -(2 )(s Ms M7 169
Таблица 2.13. К вычислению бисериального коэффициента корреляции Освещен- ность, у Даты зацветания х, дни от 1 марта ау ^УаУ г 2 f уау 57 85 113 141 169 197 225 Открытый 77 172 131 57 13 7 2 459 0 0 0 участок Теневой 71 167 140 63 И 6 1 459 1 459 459 участок fx 148 339 271 120 24 13 3 918 459 459 ах —3 —2 —1 0 +1 -1-2 -f-З 0 fxax —444 —678 —271 0 24 26 9 —1393 +59 —1334 fxa2x 1332 1356 271 0 24 52 27 3062 где гъ — бисериальный коэффициент корреляции; / — частоты; ах, ау — условные отклонения; N — объем выборки. Порядок вычислений следующий (табл. 2.13). 1. Составляется корреляционная решетка, в которой ряд х представляет собой даты зацветания в днях от 1 марта, а у — ряд с альтернативным распределением вариант на два участка — теневой и освещенный. 2. Суммируем частоты по столбцам и строкам, итоги которых должны совпадать и вместе равны объему выборки: Af = 918. 3. Условные отклонения ау всегда будут 0 и 1. Отклонения ах образуются путем поочередного вычитания из всех вариант ряда х числа Л—141, т. е. центральной варианты и деления разностей на классовый интервал, который в данном случае с = 28. 4. Перемножив условные отклонения ах на соответствующие им суммы частот fx, получим: —3-148 = —444; —2-339=—678; —1-271= —271 и т. д. 5. Перемножим квадраты условных отклонений ах2 на те же частоты: —З2-148= 1332, —22-339= 1356 и т. д. Те же самые действия произведем с частотами и условными отклонения- ми /у, ау. 6. Суммируем: 2/*ях = —1334, 2 = 3062, ^fyay — 459, 2 fyal = 459. 7. Получаем сумму faxay— 71 (—3) • 1 + 167(—2) -1 + + 140(—1) • 1+63• 0-1 + 11 • 1 • 1+6-2• 1 +1-3• 1 = —661 путем пере- множения каждой частоты из строки «теневой участок» на соот- ветствующие условные отклонения ах. Частоты из строки «откры- тый участок» не множим на отклонения, так как все произведения будут равны нулю, поскольку в ней av=0. 170
8. По формуле (2.40) — 1334-459 — 661----------- 918 rb = —г — у- — =—0,012. т/7 — 13342 \/ 4592\ 1/ 3062 —------ 459 —---- " \ 918 Л 918 ) 9. Ошибка бисериального коэффициента корреляции, ввиду того что iVl>100, определяется по формуле (2.17): mr= (1—г2)/ ГУЫ=(1—0,0122)/У918 = 0,033. Оценка достоверности гъ произво- дится по критерию Стьюдента: t = 0,012/0,033 = 0,36. Величины ошибки и критерия Стьюдента совпадают с вычис- ленными по формуле (2.14) с преобразованием через г. По табл. 4П при v=~-N—2 = 918—2 = 916 и Z\ = 95% /=1,96. Посколь- ку вычисленное значение t = 0,36 меньше табличного, делаем вы- вод об отсутствии корреляционной связи между числами видов, зацветающих одновременно на теневом и открытом участках. Следовательно, динамика зацветания видов на этих участках различна, на нее больше влияют местные микроусловия, чем об- щий ход изменения метеофакторов. Бисериальный коэффициент корреляции можно найти также с помощью таблицы Келли—Вуда (табл. 21П). Этот способ при- меняется в тех же случаях, что и предыдущий, но по технике вычислений он проще благодаря наличию специальных таблиц. При 7V<C 100 вместо способа Келли—Вуда для вычисления бисе- риального коэффициента лучше пользоваться способом по фор- муле (2.40) ввиду довольно сложной поправки, которая вводится при способе Келли—Вуда, Бисериальный коэффициент корреля- ции, находимый с помощью табл. 21П: гь= [ |М--Л4+|р^]/Ы), (2.41) где М- — взвешенная средняя арифметическая ряда отрицатель- ных частот; М+— средняя арифметическая ряда положительных частот; р —доля ряда положительных частот; q — доля ряда от- рицательных частот; oz —среднее квадратическое отклонение суммарного ряда частот (ряда в табл. 2.14); $ —ордината в месте границы классов положительных и отрицательных частот; х — абсцисса этой же точки в долях сигмы. Величины з, х в соответствии с р находйм по табл. 21П. Пря- мые скобки в формуле (2.41) обозначают, что знак разности средних арифметических не принимается во внимание, т. е. бисе- риальный коэффициент —всегда положительная величина. Вы- числение бисериального коэффициента корреляции ведем в сле- дующем порядке. 1. Заполняем корреляционную решетку по образцу табл. 2.14. В столбец f+ заносим особи, обладающие первым изучаемым признаком (растут в тени), а в столбец f_ заносим особи с аль- тернативным признаком (растут на открытом месте). Требуется 171
Таблица 2.14. К вычислению бисериального коэффициента корреляции с использованием табл. 21П Баллы повреждаемо- сти растений X Условия освещенности растений у 2/ м в тени f+ на открытом месте 3 1 1 3 9 4 4 4 16 (4 5 —- 7 г* / 35 175 6 2 21 23 138 828 7 5 16 21 147 1029 8 2 3 5 40 320 9 - . 1 1 9 81 — 9 53 62 388 2506 — Л1+=7,00 М"=6,13 — — — выяснить, связана ли повреждаемость растений болезнями с их освещенностью. 2. Суммируем частоты по столбцам, получая 2/'+ = 9, = = 53 и по строкам: 2/ = N = 62. 3. Находим величины р и q. Так как следует выполнить усло- вие p>q, то для определения q из сумм рядов /+ и выбираем меньшую, т. е. 2/+ = 9, отсюда одна доля равна q = f+]/N = = 9/62 = 0,1452 и другая р = 1—q= 1—0,1452 = 0,8548. 4. Определяем средние арифметические рядов и по формуле (1.13): М+ = (6-2+7-5+8-2)/9 = 7,00 баллов, А4~= (3-1 + +4-4+5-7+6-21+7• 16+8-3+9-1)/53 = 6,13 балла. Таким обра- зом, повреждаемость растений в тени больше, чем на открытом месте. 5. Вычисляем сигму суммарного ряда частот по формуле (1.38). о2 = V(2506—3882/62)/(62— 1) = 1,13 балла. 6. По табл. 21П для р = 0,85 находим величины в = 0,2332 и х= 1,0364. 7. По формуле (2.41) бисериальный коэффициент корреляции гь = [ 16,13—7,001 • 0,8548 • 0,1452 ] / (1,13 • 0,2332) = 0,41. 8. Так как в рассматриваемом случае число наблюдений рав- но 62 (меньше 100), то к полученному значению коэффициента вычисляется поправка (которая не определяется при А/>100) 172
по формуле ' Il р Н 0,25г? ,(2.42) S / -М « где гЬс — исправленная с учетом числа наблюдений величина би- сериального коэффициента корреляции; гъ — величина коэффици- ента корреляции до введения поправки; N — объем выборки; остальные обозначения те же, что и в формуле (2.41). Для рассматриваемого примера: гЬс = 0,41 1 _j_ ±Го 25 + °’885-°>145 62 L ’ "Г 2-0,23322 Л 0,855-1,0364 \ \ 0,2332 / = 0,4502. 0,145-1,0364 \ 0,2332 J + 0,5-0,412 9. Ошибка бисериального коэффициента корреляции mr= [(Vw/a) — rl]iVN, (2.43) где обозначения те же, что и в формуле (2.42). В данном примере тг = [ (/0,8548 • 0,1452) /0,2332 — 0.45022] /1<62 = 0,1661. 10. Ошибку бисериального коэффициента корреляции тг мож- но определить также с помощью табл. 22П, составленной Сопе- ром, по формуле mr = V (Х| - М + г?)/Л/, (2.44) где Х22, Х3 —величины, находимые по табл. 22П в зависимости от величины 9; гъ — величина бисериального коэффициента корреля- ции; N — объем выборки. _______________ Отсюда ошибка по формуле (2.44) пгг = У (2,3453—3,0923- •0,45022+0,45024)/62 = 0,1685, т. е. по величине ошибка достаточ- но близка к вычисленной по формуле (2.43). 11. Если доля q окажется меньше 0,05, то ошибку гь вычис- ляют иначе: _1/ 1 [ РЯ Г 3 i /1 Рх\ (1 1 г2 1 г41 (9 (‘~тН1+уЛг,+ т ( ’ где обозначения те же, что и в формуле (2.42). 12. Оценим достоверность коэффициента корреляции по кри- терию Стьюдента: t = rbc/mr = 0,4502/0,166 = 2,71. При числе степе- ней свободы v=Af—2 = 62—2 = 60 и при 95% уровне достоверно- сти по табл. 4П /=2,000. Вычисленное значение больше таблич- ного, следовательно, между степенью затенения растений и степенью их повреждаемости болезнями имеется небольшая, но достоверная связь: гь=0,4502±0,166, т. е. (чем больше затенение, тем больше повреждаемость растений. 173
§ 2.13. ЧАСТНЫЕ И МНОЖЕСТВЕННЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ Основные задачи, которые решают обычно при анализе мно- жественных взаимосвязей,— это выявление полной структуры связей в данном комплексе признаков, а также отбор централь- ных или доминантных, наиболее тесно связанных между собой признаков, служащих ядром данной структуры или плеяды. Если зависимости между признаками комплекса линейные, что можно предварительно проверить построением простейших графиков, то для исследования структуры взаимосвязей применяют част- ные (парциальные) и множественные коэффициенты корреляции. Если эти зависимости нелинейные, то их следует привести путем различных преобразований данных к линейной форме. Множест- венные и частные коэффициенты корреляции возможно вычис- лить лишь при числе коррелирующих признаков, большем двух. Сила совокупной взаимосвязи трех признаков, когда измеряется совместное взаимодействие двух признаков с третьим, определя- ется при помощи множественных коэффициентов корреляции: Ry.xz = (г2ху + г*у2 - Д)/(1 - г*г), (2.46) Rxyz = (r2xy + r2xz -Л)/( 1 - r2z)t (2.47) Rlxy = (r2zx + r2zy - Д)/( 1 - r2xy). (2.48) Частные, или парциальные, коэффициенты корреляции для трех связанных признаков равны: (2.49) (2.50) (2.51) В формулах (2.46) —(2.51) приняты обозначения: Ry.xz — мно- жественный коэффициент корреляции; точка, например, после у означает, что изучается совместное, или объединенное, влияние аргументов х, z на функцию у\ A = 2rxyrxzryz-f ryz, ryXi rxz — полные (обычные) коэффициенты корреляции попарно между признака- ми х, у, z\ ryz.x, ryx.z, rxz.y — частные (парциальные) коэффициенты корреляции попарно при исключении влияния третьего признака, индекс последнего ставится справа от точки. Полные коэффициенты корреляции вычисляются по формуле (2.15), если ряды взвешенные, или по формулам (2.13), (2.18), если ряды невзвешенные. Вычисление множественного и частных коэффициентов корре- ляции производится в следующем порядке. 1. Вычисляем полные коэффициенты корреляции между при- знаками сои, для чего выполним действия указанные в табл. 2.15. 174
Подставим суммы столбцов этой таблицы в формулу (2.13) Г ух — - — - — ___________185412 —(2868-839)/13______= 0 163 И (55869 — 8392/13) (634906 — 2868а/13) ’ 16609—(839-260)/13_________ К (55869—8392/13) (5458—2602/13) = — 0,257, __________57737 —(2868-260)/13________ Q -„2 К (5458 —2602/13) (634906 — 28682/13) ~ ’ Ошибки по формуле (2.14) и значения критерия достовернос- ти этих коэффициентов следующие: гух = 0,163, тг= 1//13=3=0,316, 4=0,164/0,316=0,52 г^ = 0,502, т2 = 0,316, 4 = 0,552/0,316 = 1,75. rxz = —0,257, m2 = 0,316, 4 = 0,263/0,316 = 0,83. 2. Все три полных коэффициента корреляции оказались недо- стоверными, так как величины 4 меньше табличных, однако это не означает, что связь между рассматриваемыми признаками от- сутствует. Например, связь между у и г, т. е. весом 1000 семян и урожайностью, хотя и недостоверна, но сильнее, чем прочие свя- зи. Может возникнуть вопрос, не мешает ли полнее выявить связь между у и z влияние х, т. е. высоты растений. Чтобы прове- рить эту гипотезу, необходимо исключить из связи между у и z влияние х. Для этого вычисляем парциальные коэффициенты корреляции по формулам (2.49), (2.50), (2.51): ryx.z = [0,163—0,502 (—0,257)]// (1—0,5022) [ 1 — (—0,257)2] = = 0,350, ryz.x = [0,502-0,163 (—0,257)]/ /(1—0,163)2 [ 1 — (—0,257)2] = = 0,571, гхг.у = [—0,257—0,163 • 0,502]//(1—0,1632)(1 —0,5022)=—0,404. Исключаемый фактор в индексах при г обозначен буквой справа отточки. Критерий достоверности t частного коэффициен- та корреляции при любом объеме совокупности / = rxy.z /(/V —п —2)/(1 — г2,,..,); (2.52) 175
подставляя сюда известные величины, получим: txy.z = 0,35 / (13—1—2)/(1—0,352) = 1,182, tyz.x = 0,571 V (13—1—2)/(1—0,5712) = 2,200, txz.y = —0,404 /(13— 1 —2)/( 1 —0,5712) = —1,400. При оценке достоверности частного коэффициента корреля- ции по табл. 4П число степеней свободы принимается v = =ЛГ—2—и, где N — объем выборки; п — число факторов, действие которых устраняется, в данном случае п=1, следовательно: v = = 13—2—1 = 10; те же обозначения N, п приняты в формуле (2.52). Таким образом, связь между у и z действительно стала досто- верной, когда мы устранили влияние высоты растений х на связь между весом 1000 семян у и урожайностью z, Следовательно, парциальные коэффициенты корреляции имеют важное самостоя- тельное значение как метод исследования множественных взаи- мосвязей. Таблица 2.15. Вычисление полных (обычных) коэффициентов корреляции между тремя признаками Высота расте- ний X, см Вес 1000 зерен У, г Уро- жай- ность г, ц/га X2 У2 Z2 ху XZ У* 62 217 19 3 844 47 089 361 13 454 1 178 4123 63 212 20 3 969 44 944 400 13 356 1260 4 240 73 218 12 5 329 47 524 144 15 914 876 2 616 82 242 17 6 724 58 564 289 19 844 1394 4114 66 199 16 4 356 39 601 256 13 134 1 056 3184 44 200 17 1 936 40 000 289 8 800 748 3 400 43 235 25 1 849 55225 625 10105 1075 5 875 54 235 25 2 916 55 225 625 12 690 1350 5 875 63 225 19 3 969 50 625 361 14175 1197 4275 74 234 25 5 476 54 756 625 17 316 1 850 5 850 74 223 27 5 476 49 729 729 16 502 1998 6 021 64 218 23 4 096 47 524 529 13 952 1 472 5014 77 210 15 5 929 44100 225 16 170 1155 3150 839 2868 260 55 869 634 906 5458 185 412 16 609 57 737 3. Множественные коэффициенты корреляции, отражающие силу взаимосвязи одного с двумя остальными факторами сово- купно, определим по формулам (2.46), (2.47), (2.48): = (0,1632 +0,5022 — Л)/( 1 - (—0,257)2) = 0,34330, Ryxz =0,58593, R2x.yz = [0,1632+(—0,257)2 — Л ]/(1 —0,5022) = 0,18005, 176
Rx*yz — 0,42432, Rlxy = [—0,2572+0,5022 — Л]/( 1—0,1632) = 0,36994, Rz-xy — 0,60822, Л = 2-0,163-0,502- (—0,257) =—0,042058. Без применения таблиц достоверность квадрата коэффициен- та множественной корреляции R2 в зависимости от объема вы- борки N оценивается по критерию Романовского: ' - 11/W - 3)/(^ - 7) (2.53) Из формулы (2.53) видно, что коэффициент множественной корреляции может быть достоверным лишь в том случае, если объем совокупности не менее 8. Если левая часть выражения, полученного по формуле (2.53), будет больше или равна 3, то коэффициент считается значимым. Величина Ry.xz в нашем примере недостоверна, так как (13-5) 0,586s _ Я /г нз_з)/(1з_7) = о 84 < 3. L 2(1 —0,586s) ]/ V v Величина критерия Романовского для Rx.yz равна —0,094, для Rz-w она составляет наибольшую величину—1,04. Следователь- но, в уравнении множественной регрессии этих трех признаков z следует принять за функцию, т. е. искать зависимость z, = a0+ +а^х+а2у. При оценке достоверности величины множественного коэффициента корреляции можно пользоваться также критерием Фишера: (2.54) где F — вычисляемая величина критерия, которая сравнивается с табличной (см. табл. 8П) при Vi = n—1, v2=N—п степенях свобо- ды; Я — множественный коэффициент корреляции; Af —объем со- вокупности; п — число признаков в изучаемом комплексе. Для Rx-yz 0,42432 Fx 424322* 3 1 ’Ю» Для Ryxz—* = 0,58593 Fy=2,61; для 7?^ = 0,60822 Fz = 2,94. По табл. 8П при Vi = 3—1=2 и v2=13—3=10 на 95% доверительном уровне Fz=4,10, что больше каждой из трех вычисленных величин кри- терия, следовательно, все три найденных множественных коэф- фициента корреляции недостоверны при оценке как критерием Романовского, так и критерием Фишера. Причина недостоверно- сти связи в данном случае, по-видимому, заключается в недоста- точном объеме совокупности. Таким образом, все нужные вели- чины для построения структуры взаимосвязей в изучаемом ком- плексе вычислены — это частные и множественные коэффициен- ты корреляции, которые отражают как попарные связи призна- ков, так и связи совместно двух из них с третьим.
3 РЕГРЕССИЯ После того как при помощи методов, приведенных в гл. 2, установлено наличие корреляционной связи между двумя изучае- мыми явлениями или признаками, можно попытаться установить закономерность количественного изменения одного из признаков (функция) при изменении другого (аргумент). Эту закономер- ность можно далее использовать для прогноза изучаемого явле- ния или выяснения его критических точек. Для этого изучаемую связь выражают аналитически в виде соответствующего уравне- ния регрессии и графически с вычислением точек вычерчиваемой теоретической кривой по найденному уравнению. В этой главе даются методы такого аналитического и графического выраже- ния некоторых типов корреляционных зависимостей. Определенно ответить на вопрос о достаточном числе точек для построения той или иной кривой регрессии нельзя, так как это связано с числом коэффициентов уравнения и точек перегиба кривой, с одной стороны, и дисперсией исходных данных — с дру- гой. Чем больше у кривой точек перегиба и чем больше диспер- сия выборки, тем больше требуется данных для вычисления уравнения и больше точек для построения кривых. Поэтому, хотя формально прямую линию можно построить и по двум точкам, а параболу второго порядка — по ’трем, на практике, особенно в биологических исследованиях, почти никогда не бывает доста- точно этого минимума точек, чтобы более или менее ясно пред- ставить себе тенденцию изучаемой связи. В общем случае, рас- сматриваемый вопрос следует решать в начале исследования, когда определяется репрезентативность выборок. Если объемы обеих выборок достаточны для достоверности определения их основных статистических показателей — средней и сигмы, то объ- емы этих выборок обычно достаточны и для выявления тенден- ции взаимосвязи между ними. Независимо от способа расчета коэффициентов уравнений ре- грессии существенно снижает трудоемкость расчетов преобразо- вание исходных данных так, чтобы их величина приближалась по возможности к первому порядку. Для этого исходные данные де- лят на одно и то же число или вычитают из них среднее или начальное значение, а также принимают другие единицы изме- рения. Такое преобразование чисел на обеих осях координат, 178
чтобы они приняли величины от 1 до 10, полезно также для под- бора по рисункам в § 3.16 уравнения кривой, соответствующей графику эмпирических данных. §3.01. УРАВНЕНИЕ ПРЯМОЙ ЛИНИИ Эмпирические линии регрессии, получаемые по способу из § 2.01, отражают изучаемую корреляционную связь с присущими ей случайными отклонениями и не дают возможности аналитиче- ского прогноза данного явления. Чтобы получить уравнение, по которому можно такой прогноз сделать, требуется аппроксими- ровать данную эмпирическую линию регрессии подходящей тео- ретической линией регрессии, которая даст возможность анали- тической интерпретации связи. Простейшей теоретической лини- ей регрессии, подходящей для приблизительного прогноза явле- ния в некоторых случаях, является прямая линия или парабола первого порядка. Уравнение прямой линии несложно для расче- та, поэтому путем различных преобразований данных часто стремятся свести криволинейные зависимости к прямолинейным. Однако нередко корреляционные связи в биологии имеют такую форму криволинейности, что уравнение прямой к ним применить не удается. В таких случаях, изучив форму эмпирической линии регрессии (см. § 2.01), следует попытаться подобрать к ней под- ходящую теоретическую кривую (см. § 3.03—3.16). Вопрос о при- годности той или иной эмпирической линии регрессии для ап- проксимации ее прямой линией обычно решается визуальным анализом графика, на котором нанесены эмпирические данные в виде точек. Последние по своей общей тенденции расположения должны достаточно близко соответствовать прямой линии. На примере зависимости веса 1000 семян от продолжитель- ности вегетационного периода у ячменя ниже излагаются пять способов вычисления коэффициентов уравнения прямой линии, которое в общей форме имеет вид у' = щ+а^х, (3.01) где у' — теоретические значения функции или зависимой пере- менной; х — аргумент или независимая переменная; а0, — ко- эффициенты уравнения, имеющие различное значение в зависи- мости от специфики изучаемого явления; у — эмпирические зна- чения зависимой переменной. Для того чтобы можно было пользоваться уравнением (3.01) в применении к некоторой конкретной связи, необходимо опреде- лить присущие ей величины коэффициентов а0, Способ 1. Определение коэффициентов уравнений теоретиче- ских линий регрессии производится различными способами, са- мый точный из них—метод наименьших квадратов, посредством которого вычислим коэффициенты уравнения прямой линии. 179
Таблица 3.01. К вычислению уравнения прямой линии Продолжитель- ность вегета- ционного пе- риода х, дни Вес 1000 семян ячменя у, г X2 Z/X у' у'— У (у'—у)* 1 2 3 4 5 6 7 90 47,50 8100 4275,00 48,3399 0,84 0,7056 85 46,75 7 225 3973,75 46,8004 0,05 0,0025 80 45,75 6 400 3660,00 45,2609 —0,49 0,2401 75 42,85 5 625 3213,75 43,7214 0,87 0,7569 70 44,76 4 900 3133,20 42,1819 —2,58 6,6564 65 41,44 4 225 2693,60 40,6424 —0,80 0,6400 60 37,00 3 600 2220,00 39,1029 2,10 4,4100 525 306,05 40 075 23169,30 306,0498 —0,01 13,4115 1. В качестве исходных данных для нахождения коэффициен- тов уравнения служат точки эмпирической линии регрессии (спо- соб ее вычисления см. в § 2.01), если функция и аргумент пред- ставлены взвешенными рядами. Если же выборки у и х пред- ставлены невзвешенными рядами, то для расчета коэффициентов уравнения регрессии берутся непосредственно варианты этих рядов без вычисления эмпирической линии регрессии. Требующиеся здесь значения эмпирической линии регрессии ух уже подсчитаны в табл. 2.01. 2. В столбцах 1 и 2 табл. 3.01 приведены значения ряда хну, последние равны ух из табл. 2.01. В столбцах 3 и 4 производятся действия, суть которых ясна из заголовков. 3. Суммы, полученные в итоге столбцов 1—4, подставляем в систему двух нормальных уравнений: 1) «Л + 2 * = 2 У’ (3.02) 2) а^х + а^х2 = ^ху, получаем: 1) 7а0+525а1 = 306,05, 2) 52500+4007504 = 23169,3. 4. Находим значения а0 и at из уравнений следующим обра- зом. Делим число при а0 во втором уравнении на число при а0 в первом уравнении: 525/7 = 75, умножаем все члены первого урав- нения на 75, вычитаем из второго уравнения первое: _ 525а0 + 40 075ах = 23 169,3 525а0 +- 39 375ох = 22953,75 700ах = 215,55, 180
откуда а{ = 0,3079. Подставляя найденное значение в первое уравнение, находим aQ = (306,05—525-0,3079)/7 = 20,6289. Урав- нение (3.01) получает следующие коэффициенты: #' = 20,6289+0,3079*, или округленно у' = 20,63+0,31*. 5. В столбце 5 вычислены теоретические значения веса 1000 семян у' при различной продолжительности вегетационного периода *. 6. В столбце 6 приводится разница между теоретическими и фактическими значениями веса 1000 семян. Ошибка уравнения прямолинейной или криволинейной ре- грессии вычисляется по формуле ту = V(N -п), (3.03) или по вытекающей из нее формуле тУ = [S (У - - »). (3.04) где у — эмпирические значения функции; у' — теоретические зна- чения функции; N — число точек эмпирической линии регрессии, по которым вычислялось уравнение регрессии; —сигма ряда функции; гху — коэффициент корреляции между * и у\ при криво- линейной регрессии вместо него подставляется п — число ко- эффициентов уравнения, включая свободный член. ______________ В рассматриваемом примере (см. табл. 3.01) ту = У13,4115/ /(7—2) = 1,6 г. Таким образом, вес 1000 семян у' (в г) у ячменя можно приблизительно определить, зная продолжительность их созревания * (в днях) по уравнению у' = 20,63+0,31* с ошибкой ± 1,6 г (рис. 16). Точки пересечения с осями ординат и абсцисс равны соответ- ственно: у=а^ *= —(^oMi), (3.05) где обозначения те же, что и в формуле (3.01), т. е. # = 20,63, * = — (20,63/0,31)=—66,5. Коэффициент fli —основной параметр уравнения прямой ли- нии и, кроме того, степень его достоверности отражает также и наличие или отсутствие корреляционной связи между признака- ми. Поэтому рекомендуется оценивать достоверность отличия найденного коэффициента от нуля по критерию t = (а^х УN — 1 )/ту, (3.06) где / — величина критерия Стьюдента, сравниваемая с критиче- ской по табл. 4П при числе степеней свободы v = N—2; если вы- численная величина больше табличной, то связь между *, у и значение достоверны, а если вычисленная величина будет меньше табличной, то связь данных признаков и значение — недостоверны; а{— коэффициент при аргументе в уравнении 181
Рис. 16. Зависимость веса 1000 семян у от продолжительности вегетационного периода х у сортов ячменя 1 — эмпирическая линия регрессии ух, 2 — прямолинейная регрессия связи прямой линии; ох— среднее квадратическое отклонение ряда аргумента; ту — ошибЛ ка уравнения по формуле! (3.04;) N — объем выборки.1 Для нашего примера ве-1 личина их= 10,802 (см. спо- соб 3 в этом параграфе)? Остальные величины извест- ны. Подставив их в формулу (3.06), получим t= (0,308* * • 10,802уЛ-Г)/1,637=5. По' табл. 4П значение критерия’ при числе степеней свободы v = 7—2 = 5 и 99 %-ном дове- рительном уровне меньше вычисленного: 4,032<5, следовательно, корреляция между х и у действительно существует и величина коэффициента пропорцио- ; нальности данной линии регрессии достоверно отличается от 1 нуля. 1 Достоверность отличия от нуля коэффициента а0 оценивается j по критерию ’ , // , Г1 1 /мх\2\ j + , (3.07). \ X / / । где / — величина критерия Стьюдента, сравниваемая с табличной (см. табл. 4П) при числе степеней свободы v = N—2; ту — ошиб- ’ ка уравнения; aQ — величина свободного члена в уравнении пря- 1 мой линии; N — объем выборки; Мх, ож —средняя арифметическая и сигма ряда х, ; ------------------ 1 - + —( 75 У] = 4,4. 7 7 —1 \ 10,802 / J Полученная величина критерия больше табличной: 4,4>4,032 при пяти степенях свободы и 99% доверительном уровне, поэто- му считаем достоверной найденную величину коэффициента а0. Способ 2. Для вычисления коэффициентов уравнения прямой линии aQ и применяют также следующие формулы: а0 = Му — aYMx, (3.08) «1 = [£(*- Мх) (у -Лу]/[S (х - Ж)2], (3.09) где Му и Мх — средние арифметические рядов у и х. По данным табл. 3.02: Мх = fexj/N = 525/7 =75 дней, Му=306,05/7 = = 43,723 г, S (* — Мх)2 = 700, 2 (х — Мх) (у —Му) = 215,55, от- сюда а, = 215,55/700 = +0,30793, а0=43,723—0,30793-75 = 20,628. Ошибка уравнения и точки пересечения прямой с осями коорди- нат вычисляются по формулам (3.04), (3.05). 182
Таблица 3.02. К вычислению коэффициентов уравнения прямой линии по способу 2 X У х—Мх (х—МЛ2 (X—Мх){у—Му) Oz-Mz,)8 90 47,50 15 225 3,777 +56,655 14,266 85 46,75 10 100 3,027 +30,270 9,163 80 45,75 5 25 2,027 +10,135 4,109 75 42,85 0 0 —0,873 0 0,762 70 44,76 —5 25 1,037 —5,185 1,075 65 41,44 —10 100 —2,283 +22,83 5,212 60 37,0 —15 225 —6,723 +100,845 45,199 525 306,05 0 700 +215,55 79,786 Способ 3. Если известны средние квадратические отклонения рядов х, у и коэффициент корреляции между ними, то величины коэффициентов и а0 уравнения прямой линии, не вычисляя то- чек эмпирической линии регрессии, можно найти по формуле или = гху °х sx сх (3.10) (3.11) + — Г ху где — коэффициент регрессии при аргументе х; гху — коэффици- ент корреляции между признаками х и у; ву, ох —сигмы рядов у и х в исходных единицах; sy, sx — сигмы тех же рядов в классо- вых интервалах; су, сх — классовые интервалы рядов у и х. Сво- бодный член уравнения aQ вычисляется по формуле (3.08) из спо- соба 2. Рассчитаем вначале коэффициенты уравнения для той же зависимости веса семян у от продолжительности вегетационного периода х у ячменя, рассмотренной в способах 1 и 2, но с тем отличием, что используем все даты выборки объемом N=214, не вычисляя эмпирической линии регрессии. В § 2.05 для нашего примера уже вычислены: гху—0,2055, sy= 1,203, sx= 1,195, cv=6, сх=5. По формуле (3.11) а± = 0,2055-prni" ’ 4 = 0,24826. Сред- •L ) X Lz няя арифметическая вариант вегетационного периода ранее вы- числялась в разных примерах (см., например, § 1.10): Л4х=75,0. Средняя арифметическая веса семян у ячменя найдена в § 2.10, она может быть вычислена также по формуле (1.37) с использо- ванием данных из табл. 2.05: Л4у=40+6-148/214 = 44,15 г, где 148 —сумма столбца 2 справа. По формуле (3.08) а0 = 44,15— 183
—0,24826-75 = 25,53. Искомое уравнение прямой линии для У = = 214: у=25,53+0,24826*. Ошибка уравнения регрессии = cry /1 — г2, (3.12) где пгу — ошибка теоретических значений функции; ву — среднее квадратическое отклонение ряда у\ г — коэффициент корреляции между х и у. Подставляя известные величины в формулу (3.12), получим ^=7,187-1/1—0,20552 = 7,03. Вместо коэффициента корреляции в формулу (3.12) можно подставлять также корреляционное отно- шение, измеряющее силу связи между теми же признаками при том же объеме выборки (оно вычислено для этих рядов в § 2.09: т)у=0,26). Отсюда по формуле (3.12) ту—7,187“/!—0,262 = 6,94. Формула (3.12) представляет собой упрощенный вариант формулы (3.03), применяемый для сравнительно больших выбо- рок. Для невзвешенных рядов х и у, относящихся к той же самой выборке и представляющих собой точки эмпирической линии ре- грессии, вычисленной по методу из § 2.01 по формуле (1.24), ис- пользуя суммы столбцов 4 и 7 табл. 3.02, получим ох= 10,802, 0^=3,6466. Затем вычислим коэффициент корреляции по форму- ле (2.18). ______________________ г=[2 ~ (у - м,)]// 2 (х - ад 2 (у - муу. По данным из табл. 3.02: г = 215,55/]/700-79,786 = 215,55/ /236,33 = +0,91207, далее по формуле (3.10): а{ = 0,9121 -3,6466/ /10,802 = 0,308. Если число вариант в обоих рядах одинаково, как это обычно и бывает при анализе их взаимосвязей, то коэффи- циент при х в уравнении прямой линии = Гх^^72дгу/^мх, (3.13) где mMXi тМу — ошибки средних'арифметических рядов х и у, вы- численные по формуле (1.09). Подставляя их значения для рас- сматриваемого примера в формулу (3.13), получим а4 = 0,9121 • •1,3783/4,0828 = 0,308. Коэффициент а0 по формуле (3.08) в данном случае равен то- му же значению, что в способе 2. Для оценки меры соответствия изучаемой взаимосвязи закону прямой линии вычисляют показа- тель линейности = /#(1 — r2)s3. (3.14) Значение большее 3, указывает на то, что связь не может считаться прямолинейной. Подставив в формулу (3.14) извест- ные величины, получим К1=/7(1—0,9121)2= 1,09, что меньше 3, следовательно, рассматриваемая связь может быть интерпрети- рована в указанных пределах уравнением прямой линии. Ошиб- ка прогноза ту, т. е. определения значений у', по формуле (3.03) ту = 3,6466 /(7—1) (1 —0,91212)/(7—2) = 1,637 = 1,6 г, 184
Рис. 17. Зависимость дат (в днях от 1 марта) конца цветения у от дат его начала х у травянистых многолетников в Москве го ряда эмпирической линией рег- где все величины уже изве- стны из предыдущих вычис- лений по способу 3. Как видим, первое урав- нение, рассчитанное непо- средственно по всем данным выборки, в значительной степени отражает случай- ные отклонения, большей частью мешающие выявле- нию основной тенденции за- висимости. Ошибка прогно- за по нему поэтому больше (ту=7,03), чем по уравне- нию, вычисленному для то- чек эмпирической линии рег- грессии: у' = 20,628 + 0,30793х, для которого m1/=z±zl,6 г. Далее мы срав- ним эти два уравнения, что- бы оценить правомерность процедуры замены взвешенн рессии. Способ 3 удобен тем, что посредством него можно одновре- менно вычислить величины средних арифметических, дисперсий, средних квадратических отклонений обоих рядов, коэффициента корреляции между ними, коэффициентов уравнения прямой ли- нии и ошибку последнего. Способ 4. Если не предъявляется особых требований к точно- сти определения коэффициентов уравнения прямой линии, то можно их найти непосредственно по графику эмпирических дан- ных. Во многих случаях, особенно при удачном подборе положе- ния глазомерно проводимой прямой, по этому способу можно получить удовлетворительные результаты. На рис. 17 эмпириче- ская линия регрессии, представленная в виде точек, отражает зависимость даты конца цветения от даты зацветания в совокуп- ности из 1351 вида и сорта травянистых многолетников в Москве. Эта зависимось очень близка к прямолинейной и глазомерно вы- ровнена прямой. Измерив угол, под которым эта прямая пересе- кает ось абсцисс, и определив по таблицам тригонометрических функций тангенс этого угла, тем самым найдем величину коэф- фициента при х в уравнении. В нашем примере (см. рис. 17) а = 45°, следовательно: ai = tga = tg45°= 1. Другой коэффициент равен отрезку от начала координат до места пересечения прямой с осью ординат, т. е. а0 = 33 дня. Таким образом, уравнение дан- ной зависимости г/' = 33+х, где у' — дата конца цветения вида или сорта травянистого многолетника; х —дата его зацветания. В столбце 3 табл. 3.03 вычислены по этому уравнению теоретиче- ские значения дат конца цветения, довольно близкие к наблю- даемым срокам. 185
Таблица 3.03. Прямолинейная зависимость даты конца цветения от даты зацветания у травянистых многолетников (дни от 1 марта) Начало цветения X Конец цветения У У’ у" Начало цветения X Конец цветения У У' У” 40 75,7 73 75,4 140 176,4 173 175,4 60 92,4 93 95,4 160 203,6 193 195,4 ’ 80 114,5 ИЗ 115,4 180 216,7 213 215,4 100 134,3 133 135,4 200 230.9 233 235,4 : 120 159,4 153 155,4 220 230 1 Способ 5 (избранных точек). На том же примере (см. табл. 3.03) рассмотрим технику вычислений коэффициентов уравнения прямой линии посредством двух избранных точек (1 и 2 на рис. 17). Координаты этих двух точек: х1 = 40; l/j = 75,7; х2 = = 140; у2 — 176,4. Искомые коэффициенты: а0 = , (3.15) Х2 — *1 аг = У2~У' , (3.16) х2 —*1 т. е. а0= (140-75,7—40-176,4)/(140—40) =35,4, а,= (176,4—75,7)/ /(140—40) = 1, и уравнение прямой приближенно у" = 35,4+%. В столбце 4 табл. 3.03 приведены даты конца цветения, вычис- I ленные по найденному уравнению, которые несколько лучше под- I ходят к эмпирическим данным, чем полученные по предыдущему ] способу. Так как уравнения прямой, полученные по способам 4 5 и 5, являются приближенными, вычисление ошибок прогноза | для них нецелесообразно. Чем лучше выражена прямолинейная зависимость у эмпирических данных, тем меньше ошибки опре- деления коэффициентов уравнения прямой линии по последним < двум способам. В § 3.06 приведен алгоритм вычисления коэффи- ; циентов уравнений парабол, в том числе прямой линии, по спо- ; собу сумм. * Сравнение двух уравнений прямолинейной регрессии При помощи излагаемого метода можно сравнить два любых уравнения прямой линии, чтобы аналитически оценить степень близости линий регрессии, которые они представляют. Рассмотрим технику расчета критериев для сравнения на примере двух уравнений, полученных разными способами, но по одним и тем же данным. Первое из уравнений у = 25,53+0,24826% получено в § 3.01 по способу 3 прямым путем по всем данным выборки, объем которой Л^ = 214. Второе уравнение #=20,628+ +0,30793% рассчитано в § 3.01 (способы 1—3) для той же выбор- 186
к и, но по эмпирической линии регрессии, т. е. фактически лишь но семи точкам, Л/2=7, хотя косвенно и они отражают присущие данной выборке средний уровень варьирования и усредненную и'нденцию изменения веса семян (функции) в зависимости от продолжительности вегетационного периода (аргумента) у яч- меня. Таким образом, надлежит выяснить, насколько репрезен- тативно отражает указанную зависимость уравнение, рассчитан- ное по точкам эмпирической линии регрессии, иначе говоря, мож- но ли считать это уравнение несущественно отличающимся от того, которое было получено прямым способом, по всем датам отой же выборки. Сравнение названных уравнений проводится в три этапа. Этап 1. Проверка гипотезы о близости величин остаточных дисперсий. Сравним остаточные дисперсии, или квадраты ошибок урав- нений: F = (3-17) где F — величина критерия Фишера; ту1, ту2 — ошибки первого и второго уравнений, которые были вычислены раньше и равны соответственно 7,033 и 1,637 г, откуда F = 7,0332/l,6372 = 49,47/ /2,68=18,5. Объем первой выборки AG = 214, второй N2 = 7, число степеней свободы Vi = A/\—2 = 214—2 = 212, v2 = /V2—2 = 7—2 = 5. По табл. 8П при Р3 = 99,9°/о значение критерия для указанных чи- сел свободы равно F' = 23,78, т. е. больше вычисленного (Г= = 18,5), следовательно, при данной, сравнительно нестрогой оценке остаточные дисперсии двух уравнений, или их ошибки, различаются несущественно. Этап 2. Гипотеза о близости величин коэффициентов регрес- сии уравнений проверяется по критерию Стьюдента: Н = г - —. (3.18) aV 1/[(Л\- 1) О^] + 1/[(W2-1) <&] где <т = VЦАТ, — 2) + (N2 - 2) - 4); (3.19) соответственно для первого и второго уравнений а4.2 —коэф- фициенты регрессии, или коэффициенты при х; в2х1, а22—ди- сперсии аргумента, т. е. величин х; о —усредненная величина среднего квадратического отклонения; ЛГЬ —объемы выборок; т* , ту кваДРаты ошибок прогноза, или остаточные диспер- сии; |/| — величина критерия Стьюдента без знака. а = / [(214—2) 49,47 + (7—2)2,681/(214+7—4) = 6,96; Л _____________0,24826 — 0,308___________ Q 217 1 1 6,96 И 1/1(214— 1)5,9892]+1/[(7—I) 10,8022] 187
Число степеней свободы в данном случае v = A\44Vr2—4 = 2144-1 +7—4 = 217. По табл. 4П для этого числа степеней свободы и до-* верительного уровня Р = 95% величина критерия равна l,960j что больше вычисленной величины t. Следовательно, можем счи-1 тать две сравниваемые прямые достаточно параллельными линия- ми, так как их коэффициенты регрессии несущественно различа- ются друг от друга. Этап 3. Гипотеза о близости величин свободных членов урав- нений (aOi и а02) проверяется также по критерию Стьюдента: Wl — +(М2— МУ1 — МУ2 1,1 (yVi— 1) а*! 4 (Л^2— 1) °Х2 МХ1~ МХ2 11 / __________1_________1 / 1 1 \ ' СТ|/ +л/2/ где о — усредненная величина среднего квадратического отклоне- ния по формуле (3.19); соответственно для первого и второго уравнений: Л/\, N2 — объемы выборок; сг*р — дисперсии аргу- мента (ряда х); а1Ч, аР2 — коэффициенты регрессии; Myi, Му2 — средние арифметические функции (ряда у): Мх1, Мх2 — средние арифметические аргумента (ряда х). Вначале вычислим усредненную сигму по формуле (3.19): * 1 о = ]/ [(214—2) 49,47 + (7-2) 2,681/(2144-7—4) = 6,9564, затем величину критерия Стьюдента по формуле (3.20): (214 — 1) 35,868-0,248264- (7—1) 116,683-0,308 44,15 — 43,723 __ _______(214— 1) 35,868 4- (7—1) 116,683 ~~ 75,047 —75 _ 1 1 / 1 ! \ 6,9564 у (214—1)35,868+(7—1) 116,683 + (75,047—75)2\214+ 7 / = —0,15536, или \t 1 = 0,155. Число степеней свободы для оценки величины t по табл. 4П определяется так же, как и в предыдущем пункте: v = Ni+N2—4, т. е. v = 21447—4 = 217. Табличная величина при этом числе сте- пеней свободы и на доверительном уровне Р = 95% равна 1,960, что больше вычисленной: 1,960>0,155. Следовательно, различие между двумя сравниваемыми коэффициентами aGi и а02 урав- нений случайное. Таким образом, в результате проверки по трем этапам уста- навливаем, что два сравниваемых уравнения прямой линии раз- личаются несущественно и могут аналогично интерпретировать вид рассматриваемой зависимости. Для заключения о несущест- венном различии двух уравнений необходимо, чтобы выводы по всем трем этапам проверки совпали. Если хотя бы по одному пункту различие окажется существенным, то дальнейшая про- верка может быть прекращена и уравнения должны считаться в целом достоверно различающимися. 188
Редуцированная форма уравнения прямой линии Многие прямолинейные зависимости можно представить на графике таким образом, что прямая линия регрессии будет ис- ходить непосредственно из точки пересечения осей ординат и абсцисс. Иногда это следует из смысла биологической зависимо- сти, например при числе растений, равном нулю, получаемый с них урожай также равен нулю. В таких случаях вычисление уравнения прямолинейной регрессии упрощается, так как в нем отсутствует свободный член (по = О). Определение коэффициента Hi уравнения у' = а{х, (3.20а) 1де обозначения те же, что и в формуле (3.01), проведем по ме- тоду наименьших квадратов на примере аппроксимации зависи- мости, известной под названием «пропорция золотого сечения», которая имеет большое практическое значение. В табл. 3.04 при- ведены предыдущий (х) и последующий (у) члены ряда Фибо- наччи, отношение которых, начиная с членов 5 и 8, равно вели- чине золотого сечения. Построив точечный график указанных величин х, у, можно убедиться в том, что они образуют простую пропорциональную зависимость, поэтому применим аппроксима- цию по уравнению (3.20а). В столбцах 3 и 4 табл. 3.04 приведе- ны квадраты величин х и произведения ух, их суммы используем для вычисления коэффициента сц уравнения (3.20а): «1=(2й/2а (3-206) т. е. ai= 1575239/974169= 1,618034. По уравнению у'=1,618034х вычисляем теоретические значения функции, т. е. значения по- Таблица 3.04. К вычислению отношения золотого сечения X У X2 ух У' (!/'—У? 5 8 25 40 8,09 0,0081 8 13 64 104 12,94 0,0036 13 21 169 273 21,03 0,0009 21 34 441 714 33,98 0,0004 34 55 1 156 1 870 55,01 0,0001 55 89 3 025 4 895 88,99 0,0001 89 144 7 921 12 816 144,00 0 144 233 20 736 33 552 233,00 0 233 377 54 289 87 841 377,00 0 377 610 142 129 229 970 610,00 0 610 987 372 100 602 070 987,00 0 987 1597 974 169 1 576 239 1 597,00 0 0,0132 189
следующего (у') члена ряда Фибоначчи по значению предыду- щего (х). Эти величины записаны в столбце 5 табл. 3.04. Совпа- дение вычисленных и фактических членов ряда Фибоначчи удо- влетворительное, особенно, начиная с членов 89/144 и дальше. Ошибка прогноза для вычисленного уравнения по формуле (3.04) ^/=0,0132/(12—1) =0,0012, /п,=У0ДЙ2=0,0346. Уравнение прямой в отрезках В исследовательской работе, особенно в области биологии, прямолинейные связи между различными изучаемыми фактора- ми встречаются нечасто, во всяком случае реже, чем криволи- нейные. Однако в практической или хозяйственной деятельности они нередки. В частности, прямолинейная функция может быть полезной при решении ряда плановых, научно-организационных, финансовых и других вопросов. Рассмотрим некоторые возмож- ные случаи применения так называемого уравнения прямой в отрезках: х/а-\- у/Ь—\, (3.20в) где х, у — аргумент и функция; а, b — соответственно абсцисса и ордината точек пересечения прямой с осями координат. Уравнением (3.20в) и особенно его графиком удобно пользо- ваться для решения часто повторяющихся однотипных задач на составление пропорций. Пример 1. При постоянном объеме работ по уходу за расте- ниями (прополка с рыхлением и полив), но при меняющейся численности садовых рабочих можно быстро определять сроки исполнения работ. Для этого начертим график, на оси абсцисс которого откладываем отрезок а, градуированный по числу ра- бочих, а на оси ординат — отрезок Ь, соответствующий срокам выполнения работ по принятым* нормам. На оси абсцисс (рис. 18) отрезок а=60 человек, а отрезок Ь=16 ч. Из рисунка видно, что заданный объем работ за 4 ч выполнит коллектив рабочих в 45 человек, 30 рабочих — за 8 Рис. 18. График уравнения прямой в отрезках ч. Подобный график помогает при контроле расхода средств или материалов оперативно по- лучать информацию об их пе- рерасходе или экономии. Пример 2. Для работы га- зонокосилки в ботаническом саду на 60 дней по норме от- пущено 160 л бензина. Исполь- зуя тот же график на рис. 18, видим, что через 15 дней рабо- ты остаток бензина должен быть равным 120 л, а через 52 дня — 20 л. Также можно 190
контролировать уменьшение с течением времени стоимости ка- кой-либо машины вследствие износа (амортизация). Решение уравнения (3.20в) относительно функции дает у= = Ь—(Ь/а)х, где b — соответствует коэффициенту а0, а Ь/а — коэффициенту сц в уравнении (3.01). Следовательно, уравнение графика на рис. 18 иначе можно представить так: у=16— — (16/60)х; z/=16—0,266х, где для последнего примера коэффи- циент при х означает ежедневный расход бензина (2,66 л). § 3.02. УРАВНЕНИЕ МНОЖЕСТВЕННОЙ РЕГРЕССИИ Аналитическим выражением многофакторных связей явля- ются уравнения множественной регрессии. В рассматриваемом здесь примере о высоте растений, весе 1000 семян и урожайно- сти сои связь между этими факторами оказалась в общем сла- бой. Более или менее целесообразным в данном случае было бы искать лишь параметры уравнения, выражающего зависимость веса семян о г двух других факторов: у=а0 + а^х + a2z, (3.21) где у — функция, зависимая переменная, вес 1000 семян; а0, аь а>—коэффициенты уравнения; независимые переменные: х — высота растений, см, и z— урожайность сои, ц/га. Для вычисления коэффициентов уравнения множественной регрессии по первому способу требуется решить систему трех нормальных уравнений, полученных по методу наименьших квад- ратов: ^y = a0N +a1^1x + a2'^!z, 2 */х = а02х +aiS%2 + й22гх> (3.22) 2 уг = а02 г + аг 2 хг + а2 2 z2. Необходимые для решения уравнений суммы вычислены в табл. 2.15: 2 */ = 2868, 2* = 839, 2^=185 412, 2^ = 55869, 2 уг = 57 737, 2 xz = 16 609, 2 = 5458, 2 2 = 26°- 1. Подставим эти суммы в систему уравнений (3.22): 1) 2868= 13^ + 839^ + 260^, 2) 185412 = 839а0 + 55869а, + 16609а2, 3) 57737=260а0 + 16609а, + 5458а2. 2. Решим систему, состоящую из первого и второго уравне- ний, для чего разделим первое уравнение на 13, а второе — на 191
’J 839 и вычтем из второго первое: _ 220,9916 = а0 + 66,589^ + 19,7962аа j 220,6154 = а0 + 64,5385^ + 20а2 1 0,3762 = 2,0515ах — 0,2038а2 3. Чтобы получить второе уравнение с двумя неизвестными, решим систему, состоящую из первого и третьего уравнений, для чего разделим первое уравнение на 13, а третье — на 260 и вы- чтем из третьего первое: _ 222,0654 =а0 + 63,8808^ +20,9923а2 220,6154 = а0 + 64,5385^ + 20а2 1,4500 = —0,6577^ + 0»9923а2 4. Теперь решим систему двух получившихся уравнений с двумя неизвестными: 0,3762 = 2,0515^!—0,2038а2 1,4500=—0,6577^ + 0,9923^, для чего разделим первое из них на 2,0515, а второе—на 0,6577 и. сложив полученные уравнения, найдем а2: 0,183378 = а± — 0,099342а2 + 2,20465 = —ai+ 1,50874а2 2,388028 = 1,409398а2; а2= 1,694367. 5. Подставляя значение а2 в первое уравнение из системы двух уравнений (п. 4) с двумя неизвестными, определим 0,3762 = 2,0515^-0,2038-1,6944, аА= (0,3762 + 0,3453)/2,0515 = = 0,3517. 6. Подставляя в первое уравнение начальной системы значе- ния aY и a2i найдем а0: 2868 = 1 За0 + 839 - 0,3517 + 260-1,6944, а0= (2868—295,0763—440,5440)/13= 164,030. 7. Уравнение регрессии yxz= 164,030 + 0,3517%+ l,69436z. 8. Проверка: подставляя в первое уравнение начальной си- стемы значения а0, at и а2, получаем 2868=13-164,030 + 839. -0,3517 + 260-1,69436 = 2132,3900 + 295,0763 + 440,5336 = = 2867,9999. Очевидно, что коэффициенты a0, alt а2 определе- ны правильно. 9. Ошибка уравнения множественной регрессии равна где ту—ошибка теоретических значений функции у\ ах, ау, az— отклонения вариант рядов %, у, z от их средних арифметических; 192
«ь аг—коэффициенты уравнения множественной регрессии; N — объем ряда; п — число коэффициентов уравнения, включая сво- бодный член. Суммы отклонений ау, ах, аг: 2 ауах — 2 ух N MyMxi (3.24) 2 ауйг == 2 </z — NMyMz. Пользуясь данными табл. 2.15, определяем средние арифме- тические рядов х, у, z по формуле (1.08): Мх= 839/13—64,5384, Л4„=2868/13=220,615, Л4г=260/13 = = 20,0 и суммы 21/* 1 2 = 634 906, 2#х = 185412, ^уг = 57 737. Подставляя найденные величины в формулу (3.24), найдем: 2 4 = 634 906 — 13 • 220,6152 = 2183,2831, 2 ауах = 185 412 — 13 • 220,615 • 64,5384 = 316,1915, 2 ауаг = 57 737 — 13 • 220,615 • 20,0 = 377,100, после чего определены все величины, необходимые для вычисле- ния ошибки уравнения множественной регрессии по формуле (3.23): ту = /[2183,2831— (0,3517.316,1915+1,6944-377,1)]/(13—3) = = ±11,971. Таким образом, по уравнению yxz= 164,030+ 0,3517x4- + 1,6944г можно рассчитать вес 1000 семян, зная высоту расте- ний и урожайность сои с ошибкой ту= ± 11,97 г. Способ 2. Из системы нормальных уравнений (3.22) можно получить коэффициенты множественного уравнения линейной регрессии следующим образом. 1. Находим по данным того же примера (см. табл. 2.15) те же суммы [они приведены вслед за уравнениями (3.22)] и сред ние арифметические всех трех рядов данных [они приведены к формулам (3.24)]. 2. Определяем промежуточные величины: а=мх—2 +2 х, в=2 х2/2 х—2 +2 z> с=в/А, (3.25) А = 64,53846—55869/839=—2,05152; В=55869/839— 16609/260= =2,70921; С=2,70921 / (—2,05152)= — 1,32059. 1/27 Г. Н. Зайцев 193
I 3. Находим коэффициент уравнения при z: _ с (му—2 yx/2х)—2 yx/2х 2 уг/2г .о \ с (мг~ 2гх/2 *) - 2гх/2х+2 z72г а2 = [—1,32059(220,61538 — 185412/839) — 185412/839 + ' + 57737/260]/[—1,32059(20 — 16609/839) — 16 609/839+ ; + 5458/2601 = 1,69437. ; 4. Определяем коэффициент уравнения при %: aL= Мх 2 У — 2 Ух — а2 (мх 2 2 — 2 zx) /(М*2Х~-2*2) > (3.27) С1 = [ 64,53846 • 2868 — 185 412 — 1,69437 (64,53846 • 260 — — 16 609)]/(64,53846 • 839 — 55 869) = 0,35174. 5. Находим свободный член уравнения множественной ре- грессии: aQ = Му—а^Мх—а2Мг, (3.28) а.=220,61538—0,35174 • 64,53846— 1,69437 -20=164,02709, после чего все неизвестные коэффициенты определены и урав- нение линейной зависимости веса 1000 семян у от высоты рас- тения х и урожая сои z принимает конкретную форму: у'= 164,027+0,35174%+ 1,69437г. Подставляя в это уравнение соответствующие величины х и 2, получим теоретические значения веса 1000 семян у', приведен- ные в столбце 4 табл. 3.05; сумма их разностей с эмпирически- ми значениями у, возведенных в квадрат 2 (у— у')2, подстав- ленная в формулу (3.23), даст величину ошибки прогноза по этому уравнению ту= 11,9635, т. е. примерно ту же, что и по способу 1. Данные в табл. 3.05 ранжированы по у в отличие от данных табл. 2.15, где они не упорядочены. Способ 3. По этому способу коэффициенты уравнения мно- жественной регрессии находят через суммы квадратов и произ- ведений отклонений от средней, что несколько сокращает расче- ты, так как позволяет оперировать с меньшими по абсолютной величине числами. Данный способ может применяться в любых случаях, но особенно он рекомендуется, когда исходные данные представлены многозначными числами, а также когда одновре- менно желательно вычислить дисперсии, сигмы всех трех рядов и коэффициенты корреляции между ними. Рассмотрим технику расчетов по этому способу на том же числовом примере, что и в первых двух способах, описанных в данном параграфе. 1. Вычислим по данным табл. 3.05 средние арифметические наших трех рядов: Л1у=220,62, Мх=64,538, Afz=20; и следую- 194
Таблица 3.05. Зависимость веса 1000 семян у от высоты растений х и урожайности z у сои. у' —теоретические значения веса семян Л, см z, ц/га У, г У', г х—Мх 2— у-Му 66 16 199 214,3 1,462 —4 —21,62 44 17 200 208,3 —20,538 —3 —20,62 77 15 210 216,5 12,462 —5 —10,62 63 20 212 220,1 —1,538 0 —8,62 62 19 217 218,0 —2,538 —1 —3,62 73 12 218 210,0 8,462 —8 —2,62 64 23 218 225,5 —0,538 3 —2,62 74 27 223 235,8 9,462 7 2,38 63 19 225 218,4 —1,538 —1 4,38 74 25 234 232,4 9,462 5 13,38 54 25 235 225,4 —10,538 5 14,38 43 25 235 221,5 —21,538 5 14.38 82 17 242 221,7 17,462 —3 21,38 +0,006 0 0,06 щие суммы (табл. 3.06) :2(х — Afx)2—1721,2,2(1/ — Л!г/)2= 2181,2, 2 (г - Л4г)2 = 258, 2 (* - М) ({/ - Му) = 315,68, 2 (г - Mz) (у - — Л4У) = 377, 2(х-М)(г-М) = -171. 2. Найдем вспомогательные величины: 2 (г - Л1г)2 £(х-Лу(г-Мг) ’ (3.29) В = 258/ (—177)=—! ,5088; А = В 2 (х - Мх)* - 2 (х - МО (г - Мг), (3.30) А=—1,5088 • 1721,2 +171 =—2426. 3. Коэффициент при х: = 4 [в 2 (X - Мх) (у - Му) - 2 (г - М) (У - Му)], а, = I—1.5088 • 315,68 — 377] = 0,35173. х —242b (3.31) 195
Таблица 3.06. Вычисление сумм для определения коэффициентов уравнения множественной регрессии по способу 3 (х-Мх)* (х-Мх)(у-Му) (г-Л^Ху-М,,) (x-Afx)(z-Afz) 1 2 3 4 5 6 2,1374 467,42 16 —31,608 86,48 —5,848 421,81 425,18 9 423,49 61,86 61,614 155,3 112,78 25 —132,35 53,1 —62,31 2,3654 74,304 0 13,258 0 0 6,4414 13,104 1 9,1876 3,62 2,538 71,605 6,8644 64 —22,17 20,96 —67,696 0,28944 6,8644 9 1,4096 —7,86 —1,614 89,529 5,6644 49 22,52 16,66 66,234 2,3654 19,184 1 —6,7364 —4,38 1,538 89,529 179,02 25 126,6 66,9 47,31 111,05 206,78 25 —151,54 71,9 —52,69 463,89 206,78 25 —309,72 71,9 —107,69 304,92 457,1 9 373,34 —64,14 —52,386 1721,2 2181,2 258 315,68 377 —171 4. Коэффициент при z: 5. Свободный член уравнения по формуле (3.28) а0=220,62—0,3517 • 64,538— 1,6944 • 20 = 164,03, т. е. величины всех коэффициентов совпадают с полученными выше. Используя суммы из табл. 3.06, можно также вычислить по формуле (1.24) сигмы всех трех рядов и коэффициенты кор- реляции между ними по формуле (2.18): ох2= 1721,2/(13—1) = = 143,43; ох= 11,976; ои2=2181,2/(13—1) = 181,77; ov= 13,482; о22 = 258/ (13— 1) = 21,5; ог=4,6369; гху= 315,68//1721,8 • 2181,2= = 0,16292; rX2 = —171//1721,2-258 = —0,2566; ггу = 377/ //258-2181,2 = 0,50254. Величины коэффициентов корреляции между этими же признаками совпадают с вычисленными в § 2.13 по другому способу. 196
Оцениваем достоверность значений найденных коэффициен- юв, или, точнее, достоверность их отличия от нуля: t («1) = — |/y.(x-Mx)2(l-rxz), (3.33) (3.34) где /(at), t(a2)—величины критерия Стьюдента, сравниваемые с табличными величинами (см. табл. 4П), при числе степеней свободы v=;A/—3; ту—ошибка уравнения по формуле (3.23); 2(х— Л4Х)2, J (г — М2)2—суммы квадратов отклонений величин х, z из табл. 3.06; rxz— коэффициент корреляции между рядами х, г. Величины критерия Стьюдента соответственно для коэффи- циентов и а2: /(aj = °’®™ К 1721,2(1 —0.25662) = 1,179, t = 4S 1^258(1 — 0,25662) = 2,199. 11,Уоо По табл. 4П при числе степеней свободы v=13—3 = 10 и на 95% доверительном уровне /=2,228, что больше обоих вычис- ленных величин /(aj и /(а2)- Следовательно, вес 1000 семян сои у существенно не зависит ни от средней высоты растений х, ни от урожайности г. Причиной того, что влияние этих факторов на вес семян в данном случае не доказано, является недостаточ- ное число наблюдений. В заключение заметим, что при исследовании комплексов признаков можно установить структуру их связей различными способами. Наиболее простым из них является способ троек признаков, когда исследуются взаимосвязи комплекса призна- ков во всех возможных их сочетаниях по три, а затем устанав- ливается структура связей по максимальным величинам корре- ляционных отношений и коэффициентов корреляции [Зайцев, 1978]. При этом исключаются многие побочные эффекты взаи- модействия, о которых в настоящее время пока еще мало что из- вестно, и сфера исследований не выходит за пределы реально доступного нам трехмерного пространства. § 3.03. ПАРАБОЛА ВТОРОГО ПОРЯДКА Подбор теоретической криволинейной функции, соответ- ствующей данной эмпирической зависимости, пока не формали- зован и осуществляется главным образом на основании имеюще- гося опыта исследователя в этой области методом проб и оши- бок. Наибольшую помощь при подборе кривых, в том числе и 7* Г. Н. Зайцев 197
Таблица 3.07. Вычисление сумм для определения коэффициентов уравнения параболы второго порядка методом наименьших квадратов Высота рас- тений кориан- дра х, см X2 X3 Вес семян с одного расте- ния у, г ху ух2 Р' 112 12 544 1 404 928 157 351 936 24,0 2688,0 301 056,0 22,97 95 9 025 857 375 81 450 625 17,6 1672,0 158 840,0 18,69 78 6 084 474 552 37 015 056 13,2 1029,6 80308,8 15,14 61 3 721 226 981 13 845 841 14,4 878,4 53 582,4 12,34 44 1936 85184 3 748 096 11,2 492,8 21 683,2 10,29 27 729 19 683 531 441 8,0 216,0 5 832,0 8,97 417 34 039 3 068 703 293 942 995 88,4 6976,8 621 302,4 88,40 парабол, оказывает сборник их графиков [Семендяев, 1933], воспроизведенных в § 3.16. В биологии нередко применяется аппроксимация криволи- нейных эмпирических зависимостей параболой второго порядка, уравнение которой в общей форме: у'=aQ + а{х + а2х2, (3.35) где у'—функция, или зависимая переменная; х — аргумент, или независимая переменная; а0, а2—коэффициенты уравнения. Вычисление конкретных значений коэффициентов уравнения (3.35) и является содержанием работы по аппроксимации дан- ной эмпирической зависимости параболой второго порядка. По- пробуем посредством этой параболы отобразить зависимость между высотой растения и урожаем семян на нем у кориандра. Первичные данные были обработаны с построением корреляци- онной решетки (которая здесь не приводится) и вычислением эмпирической линии регрессии (по способу, приведенному в § 2.01). Значения последней и приняты в качестве исходных дан- ных (табл. 3.07) для вычисления коэффициентов параболы, ко- торые находят разными способами. Способ 1. Применяя метод наименьших квадратов в его обычной форме, для определения коэффициентов уравнения (3.35) требуется решить систему нормальных уравнений: «(Л + ai 2х +а2 2 *2 = 2 у> «oSx + ai2x2 + a22x3=: (з.зб) *2 + «12 *3 + сз2 & = 2//х2> 198
где а0, alf a2—искомые коэффициенты уравнения (3.35); N — число точек эмпирической линии регрессии; 2х» 2 2 *3» 2х* > 2.7, 2^х> 2 ДО2— суммы, полученные в результате вычисле- ний, выполненных в табл. 3.07. Подставляя найденные суммы в систему (3.36), получаем: 6а0+417а,+34039а2=88,4, 416а0 4- 34039а! + 3068703а2=6976,8, 34О39ао 4- 3068703а! + 293942995а2=621302,4. Решая эти уравнения относительно а0, а4 и а2, находим: а0 = = 8,41, а4=—0,013937, а2=0,0012852. Уравнение (3.35) в кон- кретной форме: у'=8,41—0,013937x4-0,0012852х2, где у'—теоретические значения функции, т. е. веса семян с одно- го растения, г; х—аргумент, т. е. высота растений у корианд- ра, см. В табл. 3.07, в последней колонке вычислены теоретические значения функции. Подобно тому, как это сделано в табл. 3.01, вычислим попарно разности {у—у'), возведем все разности в квадрат и получим их сумму УАУ- У')2 = 12,025. Пр именив формулу (3.04), определим ошибку уравнения параболы: ту= =У12,025/(6—3)=2,0 г. Точки пересечения параболы с осью ординат и осью абсцисс соответственно: у = а0, х=(—ах±/ а* — 4а0о2)/(2а2). (3.37) По формуле (3.37) подкоренное выражение (дискриминант) для данных по рассматриваемому примеру равно —0,043, т. е. отрицательному числу, поэтому точек пересечения с осью абс- цисс у этой параболы не существует. Абсцисса точки максимума (или минимума) параболы: х= — (aj (2а2)), (3.38) или для нашего примера: х= — (—0,013937/ (2 • 0,0012852)) = 5,42. Обозначения коэффициентов в формулах (3.37) и (3.38) те же, что и в формуле (3.35). Как видно из рис. 19, совпадение эмпирической линии регрессии с теоретической по параболе вто- рого порядка не совсем удовлетворительное. В § 3.04 показано, каким образом в подобных случаях можно улучшить качество аппроксимации, повышая порядок параболы. 199 у**
41 (3.40) Способ 2. Те же вычисления, которые сделаны по способу 1, можно представить в виде формул: __ N (fe — he) + b (hb — de) + c (de — fb) 2 c (c2 — 2be — Ng) 4- Ne2 -\-gb2 a, = [db—fN—a2 (cb—Ne) ]/ (b2—Nc), a0= (d—ad>—a2c)IN, где fc = 2* = 417; c = 2*2 = 34039; d = 2 У = 88,4; e = S^= j = 3 068 703; f = 2 УХ = 6976,8; g = 2 xl = 293 942 995; h=^yx2= J = 621302,4; N— объем совокупности; a0, alt a2—коэффициенты J уравнения. j Рис. 19. Связь между высотой расте- ния кориандра х и урожаем семян с него у Эмпирическая (/) и теоретические линии регрессии: 2 — парабола второго порядка, 3 — парабола третьего порядка Подставив указанные числовые значения из табл. 3.07 в фор- мулы (3.39) — (3.41), получим коэффициенты: а2 = 0,00128; 0t = =—0,01395; ао = 8,41124, которые практически совпадают с най- денными по способу 1. Величины ошибок уравнения, его дискри- минанта, точки максимума по формулам (3.04), (3.37), (3.38) также равны найденным выше. Способы 1 и 2 целесообразно применять в случае малозначных величин х и у. Способ 3. Этот способ целесообразно применять, когда вели- чины х многозначные, а величины у—малозначные, шаг интер- вала в ряду х может быть как одинаковым, так и неравным во всех интервалах. Алгоритм заключается в следующем (числовой пример по техМ же данным из табл. 3.07). 1. Вычислим среднюю арифметическую ряда х по формуле (1.08): Mx=(2ix)/N = 417/6 = 69,5. 2. Кодируем варианты ряда х по формуле х0=х—Мх, полу- чим 42,5; 25,5; 8,5; —8,5; —25,5; —42,5. 200
3. Вычислим суммы: d = ^y = 88,4', Л = 2 */*о= 78 521,3; с = = 2х20 = 5057,5; g = 24 = = 7381 168,375; / = 2^о = 833’> М = 6. Для вычисления этих величин при ручном счете следует составить таблицу, построение которой ясно из перечня сумм, и повторить расчеты 2 раза. 4. Найдем искомые коэффициенты в соответствии с обозна- чениями п. 1—3: a2 = (d — Nh/c)/(c — Ng/c), а\ = f/c, aQ = (d — a2c)/N, (3.42) «1 = — 2a2Mx, a0 = aQ -j- Mx (Mxa2 — a±)9 (3.43) их величины совпадают с найденными выше: а/=0,1647; noz = = 13,65. Квадраты разностей эмпирических и теоретических зна- чений функции в данном примере следующие: 1,058; 2,237; 6,011; 10,243; 11,079, сумма этих величин равна 2(У — у')2 = 12,023, и ошибка по формуле (3.04) составляет 2 г, что и по способу 1. Способ 4. Этот способ как наиболее рациональный рекомен- дуется применять в большинстве расчетов коэффициентов пара- бол, но особенно в тех случаях, когда значения как х, так и у представлены двух-, трех- и многозначными числами. Желатель- но, чтобы варианты ряда х были отделены одинаковым шагом интервала, как в нашем примере, где они следуют через с=17. В табл. 3.08 вычислены суммы, необходимые для дальнейших расчетов. 1. В столбце 2 варианты ряда х кодированы по формуле, при- веденной в его заголовке, где А — начальная (минимальная) ва- рианта ряда. 2. Средняя арифметическая величин из столбца 2 по форму- ле (1.08): Мх = 15/6 = 2,5, где N = объем ряда. Таблица 3.08. К вычислению коэффициентов параболы по способу 4 (4=27, <7=17) X х—А х'= с х0=х'—Мх У 9 о—У Му 2 хо 2 Уо*О УоХо 4 хо 1 2 3 4 5 6 7 8 9 112 5 2,5 24,0 9,27 6,25 57,94 23,18 39,0625 95 4 1,5 17,6 2,87 2,25 6,46 4,31 5,0625 78 3 0,5 13,2 —1,53 0,25 —0,38 —0,76 0,0625 61 2 -0,5 14,4 —0,33 0,25 —0,08 0,17 0,0625 44 1 -1,5 11,2 —3,53 2,25 —7,94 5,29 5,0625 27 0 -2,5 8,0 —6,73 6,25 —42,06 16,83 39,0625 15 0 88,4 +0,02 17,5 + 13,94 +49,02 88,375 201
3. Из величин столбца 2 вычитаем их среднюю xQ=x'—Мх и 1 результаты записываем в столбец 3. ' 4. Средняя арифметическая ряда у по формуле (1.08): Му — = (2уН = 88,4/6 = 14,73. ! 5. Из величин столбца 4 вычитаем их среднюю Уь=у—Му и < результат записываем в столбце 5. з 6. В столбце 6 записаны квадраты чисел из столбца 3. j 7. В столбце 7 — произведения чисел из столбцов 5 и 6. i 8. В столбце 8 — произведения чисел столбцов 3 и 5. ’ 9. В столбце 9 — квадраты чисел столбца 6. 10. Суммируем числа столбцов 2—9. I И. Вычисляем первые промежуточные величины трех коэф- ’ фициентов параболы: °2 = (2Уохо)/2*0 —N-1(Sxo)2 = (3.44) = 13,94/(88,375 - (17,5)2/6] =0,3734, «1 = (2 Уо*о)/2*о = 49,02/17,5 = 2,8011, (3.45) а; = _(а;2Ло)/^ = -(0,3734-17,5)/6 = —1,0891. (3.46) 12. Вычисляем вторые промежуточные величины двух коэф- фициентов: а[ = а[ — 2а2Мх = 2,8011 —2.0,3734 • 2,5 = 0,9341, (3.47) = Му + aQ + Мх(а2Мх —ai) 14,73 — 1,0891 + (3.48) + 2,5 (0,3734-2,5 — 2,8011) = +8,9719. Вторую промежуточную величину коэффициента а2 вычис- лять не надо, так как она совпадает с его первой промежуточной величиной. Полученные величины коэффициентов на этом этапе вычислений уже можно использовать для получения теоретиче- ских значений функции при условии, что в уравнение будут под- ставлены кодированные величины аргумента х'=(х—А)/с, в на- шем примере приведенные в столбце 2 табл. 3.08. Подставляя в уравнение г/7 = 8,9719 + 0,9341х7+0,3734(х7)2 значения х7, полу- чим значения г/7, практически совпадающие с приведенными в последнем столбце табл. 3.07. 13. Если требуется получить уравнение, пригодное для вычис- лений у' по исходным значениям х, то производится дальнейшее преобразование коэффициентов: а2 = а2/с2 = 0,3734/172 = 0,001292, (3.49) ^ = ^—2^4=0,9341/17—2.0,001292.27 =—0,01482, (3.50) - а0 = а9 — A (ailc — a2A) = 8,9719 — 27(0,9341/17— (3.51) ] — 0,001292.27) = 8,4302, 202
3.52) что дает уравнение у'=8,4302—0,01482x4-0,001292х2, т. е. то же, которое было получено по способам 1—3. В § 3.06 приведены алгоритмы вычисления уравнений пара- бол первого, второго и третьего порядка по способу сумм. Определение точек пересечения парабол второго порядка Методика расчета точки пересечения двух парабол пригодна для определения критических точек двух процессов, переходя- щих один в другой, например широтных изменений средней тем- пературы в Северном и Южном полушариях земли. Исходя из уравнений парабол y1 = a1+&iX+c1x2, y2 = a2-\-b2x-\-c2x2 абсцис- са точки пересечения их кривых _ (62 — &i) ± / (bi — 62)2 — 4 (q — f2) (flt — fl2) 0 2 (Ci — c2) Ординату t/0 точки пересечения парабол получим, подставив xQ в любое из двух исходных уравнений. Приведем пример расчета. При определении зоны оптимума для наибольшего накопления массы растительности в связи с некоторыми вопросами интродукции предполагается, что эта зона расположена около термического экватора (ТЭ) Земли, где аборигенные растения находятся в зоне комфорта, так как обес- печены максимальным количеством света и тепла. Однако поло- жение ТЭ известно до сих пор весьма приблизительно и количе- ственные данные об этой важной геофизической константе Зем- ли расходятся. По данным справочной литературы, среднегодо- вая температура воздуха (в °C) на соответствующих градусах широты равна: в Южном полушарии: 90° ю. ш.— минус 32,6, 80 — минус 21,9, 70—минус 12,2, 60 — минус 3,4, 50—4,4, 40— 11,3, 30—17,2, 20—22,1, 10° ю. ш.— 26,1; в Северном полушарии: 10° с. ш.—28,2, 20—23,6, 30—18,5, 40—12,7, 50—6,4, 60— минус 0,54, 70 — минус 8, 80 — минус 16,1, 90° с. ш.— минус 24,8. Ко- эффициенты парабол по этим данным равны для Южного полу- шария: а^ = —32,606, bi= 11,173, с{ =—0,47929; для Северного по- лушария: а2 = 41,619, Ь2= 1,5905, с2=—0,29332. Подставляя ве- личины найденных коэффициентов в формулу (3.52), получим абсциссу х0=4,97о^5° с. ш., что соответствует положению ТЭ по использованным данным. Причина, вызывающая более хо- лодный климат Южного полушария известна — это преоблада- ние в нем океанических масс; в Северном полушарии выше, чем в Южном, процент суши от общей его площади. Найденная ве- личина ТЭ не является постоянной, она колеблется в зависимо- сти от различных циклов изменения средней температуры возду- ха на земле. В свою очередь, систематическое, например ежегод- ное, определение положения ТЭ могло бы помочь в идентифика- ции тех или иных сдвигов параметров климата Земли. Преиму- ществом предлагаемого метода определения ТЭ являются его 203
Рис. 20. Определение точки пересечения парабол / и 2 точность и учет одновременного влияния метеонаблюдений из всех регионов Земли, использованных для расчетов ТЭ. На рис. 20 пунктиром показан перпендикуляр, опущенный из точки пересечения парабол на ось абсцисс, где точка ТЭ соот- ветствует положению термоэкватора. Уравнения линий 1 и 2 дают значения среднегодовой температуры воздуха при подста- новке в них х, равных для уравнения 1 от 0 до 9, а для уравне- ния 2— от 9 до 18. Эти условные градусы широты, приведенные также на рисунке, соответствуют значениям через 10° от 90° ю. ш. до 90° с. ш. Экватору соответствует при этом условная широта 9, § 3.04 . ПАРАБОЛА ТРЕТЬЕГО ПОРЯДКА Если при аппроксимации криволинейной зависимости оказа- лось, что парабола второго порядка неудовлетворительно совпа- дает с эмпирической линией регрессии, то можно попытаться улучшить это совпадение, применяя уравнение параболы третье- го порядка (или кубической параболы): у'=do + aYx + а2х2 + а3х3, (3.53) где у'—функция; а0—as—коэффициенты уравнения; х — аргу- мент. При определении коэффициентов уравнения (3.53) методом наименьших квадратов вычисления становятся слишком гро- моздкими, поэтому для нахождения коэффициентов уравнения кубической параболы рекомендуется применять метод П. Л. Че- бышева, или способ сумм (§ 3.06). Некоторые графики пара- бол приведены в § 3.16. Рассмотрим вычисление коэффициентов уравнения методом Чебышева на данных по кориандру из пре- дыдущего параграфа. Особенность этой схемы расчета состоит в том, что варианты ряда аргумента должны быть расположе- ны через равные интервалы, т. е. с одинаковым шагом. 204
Таблица 3.09. Вычисление коэффициентов параболы третьего порядка по методу Чебышева Расчетные Высота растений х Суммы 27 44 61 78 95 112 величины Be с семян с одного растения у 2г/=88,4 8,0 11,2 Н,4 13,2 17,6 24,0 /1 —5 —3 — 1 +1 -4-3 +5 /*2 +5 —1 —4 —4 —1 +5 2'1=84 /з —5 +7 -4 —4 —7 +5 2/1=1») uii —40,0 —33,6 —14,4 -4-13,2 52,8 120,0 2^1=93,0 Uh- 40,0 — 11,2 —57,6 —52,8 —17,6 120,0 2‘//2=20,8 УН —40,0 78,4 57,6 —52,8 —123,2 120,0 2у/з=40,0 aji -7,0 —4,2 -1,4 1,4 4,2 7,0 1,238 —0,2476 —0,9904 —0,9904 —0,2476 1,238 а'з!з —1,111 1,5554 0,8888 —0,8888 —1,5554 1,111 У’ 7,83 11,87 13,32 14,43 17,44 24,58 \у—у' 1 0,17 0,67 1,08 1,23 0,16 0,50 (у—У')2 0,0289 0,4489 1,1664 1,5129 0,0256 0,2500 2=3,4327 1. Эмпирическая линия регрессии в данном случае состоит из шести точек. В табл. 23П приведены числа Чебышева, при помо- щи которых можно вычислить коэффициенты уравнений пара- болы первого (прямая линия), второго и третьего порядков. Из раздела 6 (число точек эмпирической линии регрессии) табл.23П выписываем числа Чебышева /\, /2, /3 и их суммы в табл. 3.09. 2. Умножаем значения у поочередно на соответствующие им /ь /г и /3; получаем в шестой строке сверху 8,0-(—5)=—40,0; 11,2-(—3) =—33,6 и т. д. Произведения yj{1 yj2, yj3 суммируем по строкам. 3. Находим условные значения коэффициентов уравнения: «0 = (2//Н = 88,4/6 = 14,733; а[ = (У Wi)/2/i = = 98,0/70= 1,40; (3.54) 4= (5 И2)/2 /1 = 20,8/84 = 0,2476; ал = (2 h = = 40,0/180s=0,2222. 205
4. Перемножаем условные коэффициенты а/, а2, а3 на соот- ветствующие числа /\, /2, /з и результаты записываем в строках 9, 10, 11 (сверху): 1,4-(—5) =—7,0; 1,4-(—3) =—4,2 и т. д. 5. Вычисляем теоретические величины функции, для чего суммируем по вертикали (в строках 9, 10, 11) следующие числа: а0'+«//i + «г'Л 4- «з'/з» например: у'= 14,733—7,0+1,238— — 1,111=7,86; у'= 14,733—4,2—0,2476+1,5554= 11,8408 и т. д. 6. Для определения величин истинных коэффициентов урав- нения выпишем четыре любые равноотстоящие (или рядом стоя- щие) величины у' и х и образуем систему уравнений следующего вида: 11,84=а0 + 44 a i + 1936а2+85184а3, 13,23=а0 + 61а1 + 3721а2 + 226981а3, 14,25 = а0 + 78aj + 6084а2+474552а3, 17,13=aQ + 95fli + 9025а2 + 857375а3. Числа при а2 и а3 представляют собой соответственно квад- раты и кубы рядом стоящих величин х: 44, 61, 78, 95. Вычитая предыдущее значение у' из последующего, образуем столбец 1 табл. 3.10: 13,23—11,84=1,39 и т. д. В столбце 2 запи- саны разности величин аргумента при коэффициенте 61—44 = = 17, 78—61 = 17, 95—78=17. В столбце 3 — разности чисел: последующее минус предыдущее при коэффициенте а2, то же самое записано в столбце 4 для чисел при а3 (см. систему четы- рех уравнений выше). В столбце 5 — разности чисел из столб- ца 1, в 6 — разности чисел столбца 3, в 7 — разности чисел столб- ца 4, в 8 — разности чисел столбца 5, в 9 — разности чисел столб- ца 7. Во всех случаях в табл. 3.10 вычитается вышестоящее чис- ло из нижестоящего. 7. Истинные коэффициенты уравнения находим, решая сле- дующие выражения: а3 = (Д"'/)/(Д'"*3) = 2,23/29478 = 0,00007565 (3.55) а2 (К'у' - а3Д"х3)/(Д"х2) = = (—0,37 —0,00007565-105774)/578 = —0,014512, = (Д У — а2 Д'х2 — а3&'х3)/(Д'х) = = ( 1,39 + 0,014512 • 1785 — 0,00007565 -141797)/17 = = 0,974528, а0 = у' — агх — а2х2 — а3х3 — = 11,84 — 0,974528- 44 + 0,014512 • 1936 — — 0,00007565 -85184 = — 9,3882. Уравнение (3.53) в результате получает следующую кон- кретную форму: у'=—9,39 + 0,974х—0,0145х2 + 0,000076х3. Для вычисления теоретических значений функции уравнение (3.53) лучше представить в форме у'=а0 + х[а1+х(а2 + а3х) ]. 206
Таблица 3.10. Таблица приращений для вычисления коэффициентов уравнения кубической параболы по методу П. Л. Чебышева Ь'у' А 'х Д'х2 Д'х3 Д"^' Д"х2 Д"х3 Д'" г/' Д'"х» 1 2 3 4 5 6 7 8 9 1,39 17 1785 141 797 —0,37 578 105 774 2,23 29 478 1,02 17 2363 247 571 1,86 578 135 252 — ——• 2,88 17 2941 382 823 — — — — — 8. Теоретические значения функции, их разности с фактиче- скими значениями (у—у'} и квадраты последних (см. табл. 3.09) необходимы для вычисления ошибки прогноза по формуле (3.04) по данному уравнению: ту=]/3,4327/(6—4) = 1,7. Линия 3 на рис. 19 соответствует уравнению параболы третьего порядка и ближе отражает эмпирическую зависимость (линия /), чем па- рабола второго порядка (линия 2). Ошибка теоретического уравнения регрессии также уменьшилась: с 2,0 (см. § 3.03) до 1,7. Методика вычисления по способу П. Л. Чебышева коэффици- ентов уравнений парабол, которые заданы рядами с неодинако- вым шагом по аргументу, приводится в книге В. И. Хотимского [1959]. Точка пересечения параболы третьего порядка с осью орди- нат равна у=х0, абсцисса ее точки максимума и точка перегиба х = (—а2 — Vai — 3«3^1)/(3«з)» (3.56) х=-[а2/(За3)], (3.57) где обозначения те же, что и в формуле (3.53). В рассматриваемом примере парабола не пересекается с осью абсцисс, так как при подстановке значений коэффициентов в формулу (3.56) в подкоренном выражении получается отрица- тельное число. Абсцисса точки перегиба х= — (—0,0145/3-0,000076) =63,6 см. § 3.05. ОБРАЩЕННАЯ ПАРАБОЛА Зависимость изменений интенсивности физиологических функций или морфологических особенностей организма от ко- личественного изменения какого-либо экологического фактора, например тепла, нередко можно выразить кривой, уравнение ко- торой у'=х/ (а0 +aix + a2x2), (3.58) 207
где у'—теоретическое значение функции; х — аргумент; а0, 1 а2—коэффициенты уравнения. Графики кривой этого вида при- 1 ведены в § 3.16. I Свое название эта кривая получила в связи с тем, что она J легко может быть приведена к уравнению параболы второго, третьего или более высокого порядка делением на х обеих ча- стей уравнения с одновременным их обращением, после чего уравнение (3.58) принимает вид x/y = a0 + aix+a2x2\ обозначив yQ = xly, получим уравнение параболы второго порядка. Конкретные значения коэффициентов можно находить спосо- бом наименьших квадратов (см. способ 2), однако для той же цели применяют также и более простой метод средних. Способ 1. Посредством метода средних выровнена зависи- мость прироста (в мм) грибницы плесневого гриба Coniophora cerebella от температуры. Измерения длины грибницы произво- дились через каждые2сут. Вычисления, приведенные в табл. 3.11, выполняются в следующем порядке. 1. Величины х делим на соответствующие им у (столбец 3). 2. Выбираем пару значений Xi (из столбца 1), (x/r/)i (из столбца 3) в качестве избранной точки, в данном случае х1 = 15; (х/у)1==0,9375, и поочередно вычитаем число 15 из всех чисел столбца 1 и число 0,9375 из всех чисел столбца 3. 4. Числа столбца 5 поделим на соответствующие им числа столбца 4. 4. Для нахождения коэффициентов и а2 применяются урав- нения: г (3.59) V3 Уа где £. — — сумма вариант верхней части ряда в столбце 6, в данном случае она равна 0,23484; У —— сумма нижней, остав- ^2 Ха шейся части того же ряда из столбца 6, в данном случае она равна 1,05854; nt = 5 — число вариант, суммированных в верхней части столбца 6; л2=4 — число вариант, суммированных в ниж ней части столбца 6; У х = 75— сумма соответствующих вари- ант верхней части ряда х из столбца 1; У Х=150 — сумма со- ответствующих вариант нижней части ряда из столбца 1; а/— условное значение коэффициента ас, а1у а2—коэффициенты урав- нения (3.58) . Заметим, что ряды в столбцах 1 и 6 могли бы быть разделены на любые две части; лучше, если они будут прибли- зительно равными; х1=15 — абсцисса избранной точки. Подставим найденные суммы в уравнения (3.59): 0,23484 = 5aL + 75п2, 1,05854 = 4ак + 150я2. 208
209 Таблица 3.11. К вычислению коэффициентов уравнения обращенной параболы по методу средних Температура х, °C Прирост //, ММ х/у ха=х—15 0a=x/f/—0,9375 Уа!ха У1 (у’-У>2 X2 5 5 1 —10 0,0625 —0,00625 3,59 1,9881 25 10 11 0,9091 —5 —0,0284 0,00568 11,07 0,0049 100 х1=15 16 (x/t/)i=0,9375 0 0 0 16,73 0,5329 225 20 15 1,3333 5 0,3958 0,07916 14,56 0,1936 400 25 10 2,5000 10 1,5625 0,15625 10,71 0,5041 625 Stx=75 — — — ХП У а У х -0,23484 ‘-1ха — —‘ 30 8 3,7500 15 2,8125 0,18750 7,94 0,0036 900 35 6 5,8333 20 4,8958 0,24479 6,13 0,0169 1225 40 5 8,0000 25 7,0625 0,28250 4,93 0,0049 1600 45 4 11,2500 30 10,3125 0,34375 4,09 0,0081 2025 150 — — —• — У „ -1,05854 ^ха , — — Ух=225 - 2 .^=35,5132 'У — — —. 3,2571 ] >}х2=7125
Решая эти уравнения с учетом того, что ^/=^+15^2, полу- чаем: 02=0,0096741; а/=—0,098143; «! =—0,24325. 5. Величину коэффициента а0 найдем из уравнения парабо- лы второго порядка: 2-T = -^ao+aiSx + a22х2> (з.бо) где 2“----сумма величин столбца 3; N— объем выборки; а0, аь а2—коэффициенты уравнения (3.58); 2х—сумма величин столбца 1;2%2— сумма квадратов величин столбца 1, в дан- ном случае она равна 7125 (столбец 9). Подставим суммы из табл. 3.11 в уравнение (3.60) : 35,5132= 1 = 9я0 + (—0,24325)-225 + 0,0096741 -7125; отсюда а0 = 2,3686. : Итак, зависимость прироста грибницы от температуры окру- 1 жающей среды может быть аппроксимирована уравнением « /=х/(2,3686—0,24325х + 0,0096741х2). ' Для определения ошибки данного уравнения вычислены по ; нему теоретические значения функции у' (столбец 7), а затем i квадраты их разностей с эмпирическими данными (столбец 8). \ Подставим сумму столбца 8 в формулу (3.04): ту= 1 =УЗ,2571/(9—3)=0,74 мм, что и составляет ошибку прогноза | прироста грибницы по уравнению обращенной параболы j (рис. 21). Абсцисса точки максимума этой кривой 1 х = ]/”а0/а2, (3.61) ; где обозначения те же, что и в формуле (3.58). Для рассмотрен- ного примера абсцисса точки максимума х=У2,3686/0,00967= = 15,6. . | Если кривая, найденная методом средних, не дает удовлетво- рительного совпадения с эмпирическими данными, следует по- пытаться улучшить качество аппроксимации путем повторения | вычислений с другой парой избранных точек. В данном случае | эти точки были выбраны сравнительно удачно, так как ошибка j прогноза невелика. < Способ 2. По способу наименьших квадратов и с преобразо- < ванием исходных данных коэффициенты обращенной параболы 1 вычисляются следующим образом. 1. Приведенные в столбцах 1, 2 табл. 3.12 величины аргумен- та делим на значения функции и результаты (уъ=х!у) записы- ваем в столбце 3. I 2. Для сокращения вычислений преобразуем величины х по ; формуле х'=(х—А)/с, где х'—преобразованные, а х—исход- ] ные величины; А — начальное значение ряда х, который при этом способе должен представлять собой арифметическую про- < грессию с разностью членов, равной с. В нашем примере А=5, < с = 5. 210
Рис. 21. Зависимость прироста грибницы у' (в мм) от температуры среды х (в °C) 1 — эмпирические данные; 2 — теоретическая кривая 3. Найдем среднюю арифметическую по формуле (1.08) ряда х' = 36/9=4. Объем исходных рядов данных Л/=9. 4. Преобразуем величины х' в х0 по формуле xQ=x'—ре- зультаты запишем в столбце 5. 5. В столбцах 6 и 7 записаны квадраты и четвертые степени величин х0. Таблица 3.12. К вычислению коэффициентов обращенной параболы по способу 2 X у УЬ х' х0 2 *0 4 *0 Уо Уо*о 2 thxQ У' 1 2 3 4 5 6 7 8 9 10 н 5 5 1 0 —4 16 256 —2,9459 11,7836 —47,1344 4,35 10 11 0,90909 1 —3 9 81 —3,0368 9,1104 —27,3312 13,1 15 16 0,9375 2 —2 4 16 —3,0084 6,0168 —12,0336 17,8 20 15 1,33333 3 —1 1 1 —2,6126 2,6126 —2,6126 14,4 25 10 2,5 4 0 0 0 —1,4459 0 0 10,4 30 8 3,75 5 1 1 1 —0,1959 —0,1959 —0,1959 7,75 35 6 5,8333 6 2 4 16 1,8874 3,7748 7,5496 6,03 40 5 8 7 3 9 81 4,0541 12,1623 36,4869 4,87 45 4 11,25 8 4 16 256 7,3041 29,2164 116,8656 4,06 - 35,51325 36 0 60 708 0,0001 74,481 71,5944 211
6. Вычислим среднюю арифметическую по формуле (1.08) J ряда уь: ; М2 = (2 Уь)/М = 35,51325/9 = 3,9459. ' 7. Преобразуем величины уь в yQ по формуле yQ — yb—М2 (столбец 8). С величиной у0 произведены вычисления, понятные из заголовков столбцов 9, 10. 8. Найдем коэффициенты параболы для величин х0, у0 по формулам (3.44), (3.45), (3.46): #/=71,5944/(708—6079) =0,23245, «/=74,481/60= 1,24135, а^= — (0,23245-60)/9=—1,54967, что дает уравнение yQ = —1,54967+1,24135х0 + 0,23245х02, по которому с помощью выражения ^=х/(г/о + Л12) (3.62) можно найти теоретические значения функции уравнения обра- щенной параболы, где х0= (%—А)/с—М{. 9. Если требуется получить коэффициенты уравнения обра- щенной параболы в размерности для исходных данных, то далее вычислим: #0 — #0 + Л41 (^2^41 — «О + А [а2 (2Л4г + Л/с) — а{]/с + М2, (3.63) #1 = [#х — 2а2 (А/с + A4JJ/C, а2 = а2/с2, #0= —1,54967 + 4(0,23245-4 — 1,24135) + 5(0,23245(2-4 + + 5/5) — 1,24135 ] /5 + 3,9459=2,0005, а, = (1,24135—2 • 0,23245 (5/5 + 4)) /5=—0,21664, 6z2 = 0,23245/52 = 0,00 9 2 98, что дает уравнение обращенной па- раболы для исходных данных у'=х/ (2,0005—0,21664% + + 0,009298%2). Заметим, что удобнее вычислять теоретические значения функции обращенной параболы по любой из двух формул: у'— l/(#0M+^i+^2x), (3.64) у'=х/[а0 + х(а1 + а2х) ]. (3.65) Теоретические значения функции для нашего примера даны в столбце 11 табл. 3.12, их ошибка по формуле (3.04) ту= = ]/8,6283/(9—3) = 1,2. § 3.06. ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТОВ УРАВНЕНИЙ ПАРАБОЛ СПОСОБОМ СУММ Рассматриваемые в этом параграфе схемы вычисления эф- фективны при использовании как автоматических, так и ручных средств счета, в последнем случае с применением специальных 212
таблиц. Ряды аргумента могут быть с четным и нечетным чис- лом вариант, более желателен второй случай, при котором не- сколько сокращаются расчеты. Варианты ряда аргумента долж- ны располагаться через равные интервалы. Существенно сокра- щает вычисления предварительное приведение рядов аргумента и функции к малозначным числам 0, ±1 порядка, что всегда не- сложно сделать при помощи простейших арифметических пре- образований. По приведенным способам сумм можно сравни- тельно легко рассчитать три уравнения парабол: первого, второ- го и третьего порядка. При этом благодаря системе поэтапной проверки вычислений в значительной степени гарантируются правильные результаты. Алгоритмы способа сумм для четных и нечетных (по числу вариант) рядов различаются, поэтому рас- смотрим их отдельно на биологических примерах. а. Ряд с нечетным числом вариант. В первых двух столбцах табл. 3.13 приведены числа, отражающие зависимость числа по- бегов (/') от числа соцветий (xz) на растениях гелениума осен- него. Как это было рекомендовано, приведем указанные величи- ны по возможности ближе к 0, ± 1 порядку, для чего число по- бегов в столбце 4 выразим в десятках (y=t/'z/10). Число соцве- тий преобразовано в столбце 3 по формуле х— (xz—А)/с = = (xz—486)/134, где х — преобразованные, а х'—исходные ве- личины аргумента; А — центральное число ряда х'\ с —классо- вый интервал ряда х'. В соответствии с данным алгоритмом пре- образование величин ряда функции желательно, а указанное преобразование ряда аргумента обязательно. 1. Дальнейшие действия в столбцах 5—8 являются четырех- кратным суммированием величин у. Поставим семь черточек, начиная с центральной, нулевой строки, так, как показано в таб- Таблица 3.13. Вычисление сумм произведений функции (для нечетного N) Число соцветий х' Число побегов Z X У У1 У2 Уз У* 1 2 3 4 5 6 7 8 84 4,1 —3 0,41 0,41 0,41 0.41 0,41 218 6,9 —2 0,69 1,10 1,51 1,92 — 352 9,7 —1 0,97 2.07 3,58 — 486 10,1 0 1,01 — — — 620 12,4 1 1,24 5,28 11,92 21,16 33 754 14,4 2 1,44 4,04 6,64 9,24 11,84 888 26,0 3 2,6 2,6 2,6 2,6 2,6 с = 134 k = 7 0 8,36 Pi Pi 2,07 5,28 3,58 11,92 1,92 21,16 0,41 33 213
лице. Затем в верхней и нижней строках повторяем крайние ва- рианты ряда функции: 0,41 и 2,6. Суммирование во всех столб- цах ведется по направлению от крайних к центральной строке: 0,41 + 0,69= 1,10; 1,10 + 0,97=2,07 — суммирование прекращаем, так как в следующей клетке — черточка. В нижней части столб- ца 5 числа получены так: 2,6+1,44=4,04; 4,04+1,24=5,28. Так же получены числа в остальных столбцах 6—8. 2. Выписываем внизу таблицы нижнее число (р<) верхней по- ловины и верхнее число (^) нижней половины каждого столбца и вычисляем суммы произведений функции: ^у= Pi + q^ + y^^ = 2,07 + 5,28+1,01=8,36. Сравниваем результат с суммой вари- ант ряда у, они должны совпасть; у0 здесь обозначает централь- ную варианту ряда у. '2iXy — q2 — p2=\\ ,92—3,58 = 8,34, 2 х2у = 2 (р3 +<7з) - 2ху = 2 (1,92+21,16)-8,34=37,82Х(3.66) 2 х*у = [(?4 - р4) - (р3 + рз)] 6 + 2 ху = [(33-0,41) - — (1,92+21,16)1 • 6+8,34 = 65,4. 3. Проверяем вычисление сумм функций, для чего повторяем его по иному способу, который можно использовать при желании и как основной. В табл. 3.14 суммирование производится так же, но в центре таблицы располагаются симметрично девять черточек. В ниж- них строках таблицы: суммы верхних ) и нижних поло- Таблица 3.14. Проверка вычисления сумм произведений функции (для нечетного N) X У У1 &2 УЯ 1 2 3 4 5 —3 0,41 0,41 0,41 0,41 —2 0 69 1,10 1,51 —1 0,97 2,07 —- — 0 1,01 — — 1 1,24 5,28 — 2 1,44 4,04 6,64 — 3 2,6 2,6 2,6 2,6 CQ PSI — 3,58 1,92 0,41 — 11,92 9,24 2,6 si 8,36 15,5 11,16 3 01 di 8,34 7,32 2,19 214
вин столбцов, суммы (s) и разности (d) сумм верхних и нижних половин столбцов. Суммы произведений функции находим по формулам: 2 У = so = 8,36'. 2 ХУ = di = 8,34, 2jX2#= 25а + 8х = 2-11,16+15,5 = 37,82, (3.67' 2-Л/ = 6 (d3 + d2) + = 6 (2,19+7,32) + 8,34 = 65,4. Величины сумм совпали с найденными по формулам (3.66), следовательно, их вычисление выполнено правильно. 4. Коэффициенты уравнений парабол первого, второго и третьего порядков находим при помощи табл. 24П, откуда берем величины множителей —Ms для данного У=7. Парабола пер- вого порядка (прямая линия): а0 = ^12 У = °>14286-8,36= 1,1942, = Л12 2 = 0,035714 • 8,34 = 0,29785, (3.68) у' = 1,1942+0,29785х. Парабола второго порядка: + =мз 2 У — М42 х*У = 0,33333 -8,36—0,047619 -37,82 = = 0,98569; = М2 2 ху = 0,035714 • 8,34 = 0,029785, (3.69) а2 = 2 х*у — М4 2 У = 0,0119048 • 37,82—0,047619 • 8,36 = = 0,052145, у' = 0,98569+0,29785х+0,052145х2. Парабола третьего порядка: а0 = М3 2 У — М* 2 х2У = 0,33333 • 8,36 — 0,047619 • 37,82 = = 0,98569; + = Мв 2 ху — 2 х3У = 0,26257 • 8,34 — 0,032407 • 65,4= =0,0704, (3.70) а2 = М5 2 хгу — М4 2 У = °>°119048 •37,82 — °.°47619 • 8>36 = = 0,052145, а3 = М3 2 х?у — Mr 2 ху = 0,0046296 • 65,4 — 0,032407 • 8,34 = = 0,0325,] у' = 0,98569 + 0,0704х + 0,052145х2 + 0.0325Х3. 215
Во всех трех уравнениях х=0, ±1, ±2, ±3... ; При отсутствии таблиц или при счете на ЭВМ множители —М8 для нечетного числа вариант в ряду можно вычислить по формулам: ' Л42=12/[ЛЦ№-1>], Л43 = [3(32V2 —7)]/[42V^2—4)], = 15/[N (TV2—4)], М5 = 180/[W (ЛГ2-1) (№-4)], (3.71) Мв = {25[№(№—18) + 311)/[ЛГ(№—1)(№—4)(№—9)], М7 = [140(3№—7)]/[ЛГ (№—!)(№—4) (№—9)], ? Ма = 2800/[М (№—1) (№—4) (№—9)1, где N — объем ряда. I Вычисление множителей —М8 можно проверить: . Л4Х = 1/^ М2 = 1/%х2, Л43 = (2 i M4=(2x2)/D2, M^N/D2, M7 = {2^)/Ds, М8=(2*2)/Оз, (3.72) где D2, D3—определители распределения ряда натуральных чи- j сел, их величины приведены в табл. 25П, для которой они вычис- лены по формулам: • D2 = [№(№—1) (№—4) ]/180, £>з = [№(№—1)(№—4). J •(№—9)]/33600. (3.73) j Вычисление определителей можно также проверить: ] d2 = лг 2 - (2 *2)2. d3 = 2^2S^-(S^)2- (3-74) । Суммы степеней отклонений натуральных чисел от их сред- ! ней приведены в табл. 25П, или-они могут быть вычислены для нечетного N в следующих формулах: ! 2x2=[^(№-1)]/12, S^ = (2^2)(3№-7)/20, (3.75) , 2*в = (2*2) [3№ (№ - 6) +31J/112, ’ t и для четного N: 2 = [N (N2 - 1)]/3, 2 ** = (2 *2) (3№ -- 7)/5, (3.76) ' 2хв = (2И(3№(№ — 6) + 31]/7. ! 5. Вычисление коэффициентов парабол, приведенное в преды- дущем пункте, проверяем с помощью табл. 25П по следующим формулам. 216
Парабола первого порядка (прямая): «о = (2 y)i n, ai = (2 +/2 *2> (з .77) аа=8,36/7 = 1,194, at=8,34/28=0,2978. Парабола второго порядка: ао = (2 у 2 — 2 Х*У 2 x2)/D2, аг = 2 ху/^ х2, (3.78) а2 = 2 х2у— 22 x2)/d2, а„ = (8,36 • 196—37,82 •28)/588=0,9857, а, = 8,34/28=0,2978, а2 = (7 • 37,82—8,36 • 28) /588=0,052143. Парабола третьего порядка: «о = (2 у 2 **—2 х2у 2 x2]/d2, ai = (2 ху£ х6 — 2 хзу 2 x*)/d3, (3.79) а2 = [N 2 Х2у— 2 У 2 x^/d2, «з -= $x2%x3y—'£1xi'£1xy}//D3, а0 = (8,36 • 196—37,82 • 28) /588=0,9857, at = (8,34 • 1588—65,4 • 196) /6048=0,070357, а2 = (7 • 37,82—8,36 • 28) /588=0,052143, а2 = (28 • 65,4— 196 • 8,34) /6048=0,0325. По найденным уравнениям парабол удобно вычислять теоре- тические значения функции, представив их в виде: yf=a0Jrx(ai + a2x) —парабола второго порядка; r/,=a04-x[a1 + x(a2 + d3^) ]—парабола третьего порядка, где х = 0, ±1, ±2, ±3... В табл. 3.15 приведено вычисление теоретических значений функции кубической параболы, представленной в форме послед- него уравнения, для рассматриваемого примера. В столбце 6 записаны теоретические значения числа побегов гелениума, ко- торые хорошо соответствуют их эмпирическим значениям (см. столбец 4 табл. 3.13). Теоретические значения функции, вычис- ленные по уравнению параболы первого порядка (у'= 1,194 + + 0,298х): 0,3; 0,6; 0,9; 1,2; 1,5; 1,8; 2,1, а по уравнению парабо- лы второго порядка [z/z=0,985 + х (0,298 + 0,052х) ]: 0,56; 0,60: 0,74; 0.98; 1,33; 1,79; 2,35. б. Ряд с четным числом вариант. 217
Таблица 3.15. Вычисление у по уравнению параболы третьего порядка а3х (1)4*02 (2)-х (3)4*01 (4).х (5)4*00 — у' X 0,0325х (1)4-0,052143 (3)4-0,070357 (5)4-0,98569 1 2 3 4 5 6 7 —0,0975 —0,04536 0,13608 0,20644 —0,61932 0,36637 —3 —о’об5 —0,01286 0,02572 0,096077 —0,19215 0,79354 —2 —0^0325 0,01964 —0,01964 0,050717 —0,050717 0,93497 —1 о’ 0,052143 0 0,070357 0 0,98569 0 0,0325 0,08464 0,0864 0,156757 0,156757 1,14245 1 0,065 0,11714 0,23428 0,30464 0,60928 1,59497 2 0,0975 0,14964 0,44892 0,519277 1,55783 2,5435 3 Таблица 3.16. Суммы произведений функции для вычисления кубической параболы с четным числом вариант в ряду Месяц X' X Средняя температу- ра у, °C У1 У2 Уз у' у* 1 2 3 4 5 6 7 8 1 —5,5 —6,5 —6,5 —6,5 —6,5 -9,7 —12,8 2 -4,5 —7 —13,5 —20 —26,5 —5,0 -4,7 3 —3,5 -4,4 —17,9 —37,9 —64,4 -0,1 1,8 4 -2,5 3,6 —14,3 —52,2 —116,6 4,6 7 5 -1,5 9,8 -4,5 —56,7 — 8,9 10,6 6 —0,5 15,3 10,8 — 12,2 12,8 7 0,5 17,5 46,0 — 14,2 13,6 8 1,5 16 28,5 . 33,8 — 14,6 12,9 9 2,5 11,2 12,5 5,3 —14,5 13,1 10,7 10 3,5 5,7 1,3 —7,2 —19,8 9,1 7,1 11 4,5 —0,3 -4,4 —8,5 —12,6 2,3 2,1 12 5,5 -4,1 -4,1 —4,1 -4,1 -7,5 -4,4 2в 10,8 —45,9 —173,3 —214 2Н 46 79,8 19,3 —51 S 56,8 — —154 d 35,2 125,7 192,6 163 В столбцах 1 и 3 табл. 3.16 представлены данные, отражаю- щие сезонное изменение среднемесячной температуры воздуха в Ленинграде. Рассчитаем ординаты параболы третьего порядка, аппроксимирующей эту зависимость. 218
1. При вычислении по данной схеме следует кодировать ряд аргумента так, чтобы его варианты, начиная от центра, были представлены числами: ±0,5; ±1,5; ±2,5 и т. д. Для этого на- ходим условную среднюю А и величину интервала с, составляя два уравнения по двум центральным вариантам: —0,5= (6—А)/ /с, ±0,5= (7—Л)/с, откуда Л = 6,5; с=1, после чего по форму- ле х={х'—А)/с=(х'—6,5)/1 кодируем варианты аргумента (столбец 2). 2. По тому же принципу, что и в табл. 3.14, суммируем числа в столбцах 4—6, располагая в них шесть черточек указанным способом около центральной линии. 3. Находим суммы верхней и нижне^(21н) половин чисел в тех же столбцах, затем их суммы и разности, причем вычита- ется верхняя сумма из нижней: 4. Находим искомые суммы произведений функции: 2 У = s0 = 56,8, 2 ху = di — d0/2 — 125,7—35,2/2 = 108,1, ^х2у = 2s2 + s0/4 = 2 (—154) + 56,8/4 = —293,8, (3.80) 2^ = 3 (2d3 + d2) + (2 xy)/4 = 3 (2 • 163+192,6) + + (125,7 — 0,5 • 352)/4 = 1582,825. 5. При ручном счете целесообразно далее ввести проверочный расчет, при котором варианты аргумента кодируются, как пока- зано в табл. 3.17, для чего по двум центральным вариантам со- ставляем уравнения: —1 = (6—Л)/с, 1 = (7—А)/с, откуда А = = 6,5, с = 0,5. По формуле х=(х'—А)/с=(х'—6,5)/0,5 вычислим кодированные величины вариант аргумента и запишем их в столбец 2. Суммирование чисел в столбцах 4—7 ведется так же, как и в предыдущей таблице. Черточки около центральной чер- ты необходимо располагать так, как указано в табл. 3.17. Числа над центральной чертой (р) и непосредственно под ней (^) вы- писываем снизу таблицы. Находим суммы произведений: 2 У = Р1 + <71 = 10>8 + 46 = 56,8, $ху = 2 (р2 — р2) — 2 У — 2 (79,8 + 56,7) - 56,8 = 216,2, 2>У = 8 (р3 + 7з) +2// = 8 (19,3—173,3)4-56,8 = -1175,2, (3.81) 2'х3У = 24 [2 - р4) - (р3 + <7з)1 + S ху = 24 [2 (-31,7 + +•214) —(—173,3 + 19,3)] + 216,2 = 12 662,6. 219
Таблица 3.17. Проверка вычисления сумм произведений функции для уравнения кубической параболы (ряд с четным числом вариант) Месяц х' X Средняя температу- ра у, СС У1 Уз Уз и* У' 1 2 3 4 5 6 7 8 1 —11 —6,5 —6,5 —6,5 —6,5 —6,5 -9,7 2 —9 —7 —13,5 —20 —26,5 —33 —5,0 3 —7 -4,4 —17,9 —37,9 —64,4 —97,4 -0,1 4 —5 3,6 —14,3 —52,2 —116,6 —214 4,6 5 —3 9,8 -4,5 —56,7 —173,3 1 — 8,9 6 —1 15,3 10,8 — — 12,2 7 17,5 46 79,8 — —- 14,2 8 4-3 16,0 28,5 33,8 19,3 —31,7 14,6 9 +5 Н,2 12,5 5,3 —14,5 —51 13,1 10 * j — 7 5,7 1,3 -7,2 —19,8 —36,5 9,1 И +9 —0,3 -4,4 —8,5 —12,6 —16,7 2,3 12 4-11 -4,1 —4,1 -4,1 -4,1 —4,1 -7,5 Pi 10,8 —56,7 —173,3 —214 4i 46 79,8 19,3 —31,7 Приводимый в п. 5 алгоритм вычисления сумм может быть применен не только для проверки, но и в качестве самостоятель- ного, в этом случае дальше следует использовать суммы в том виде, как они только что получены по формулам (3.81). Для операции проверки эти суммы надо соответственно разделить на 2°, 21, 22, 23, т. е.: = (2 хг/)/2 = 216,2/2 = 108,1, 2х2У= $хгу)/4 = —1175,2/4 = —293,8, (3.82) 2 х3у = (2 х3у}18 = 12 662,6/8 = 1582,825. 6. По формулам (3.79) с применением табл. 25П вычисляем коэффициенты уравнения кубической параболы: ай = (56,8 • 3038,75 + 293,8 • 143) /16016= 13,4, а1= (108,1-76156,4375—1582,825-3038,75)/1656369 = 2,066379, а2= (-12-293,8—56,8-143)/16016=—0,72727, а3 = (143 • 1582,825 -3038,75 • 108,1) /1656369=—0,061668. 220
Вычисление коэффициентов можно проверить по формулам (3.70) с применением табл. 26П множителей для четных значе- ний N: «0 = 0,1897321 -56,8—0,0089986 (—293,8) = 13,42057, я1 = 0,0459779-108,1—0,0018346-1582,825=2,06636, tz2 = 0,0007493 (—293,8)—0,0089986-56,8 =—0,73126, «3 = 0,0000863-1582,825—0,0018346-108,1 =—0,061722. Из-за приближенных значений множителей, приведенных в табл. 26П, в величинах коэффициентов наблюдаются расхожде- ния. В данном случае эти неточности почти не повлияли на ве- личины ординат параболы, но при необходимости можно уточ- нить значения множителей по формулам (3.71), (3.72). 7. По уравнению у' = 13,4 + %[2,066379 + %(—0,72727— —0,061668%)], где %=±0,5; ±1,5; ±2,5... или %=(%'—6,5)/1,0, вычисляем ординаты кубической параболы, которые записаны в столбце 7 табл. 3.16. Малая величина коэффициента а3 в полученном уравнении кубической параболы дает основание полагать, что данная эм- пирическая зависимость может быть приближенно аппроксими- рована также параболой второго порядка, коэффициенты урав- нения которой находим по формулам (3.78): а0=(56,8- -3038,75 + 293,8-143)/16016= 13,4, а,= 108,1/143 = 0,75594, а2= = (12(—293,8)—56,8-143)/16016=—0,72727. Уравнение этой параболы у" = 13,4 + 0,75594%—0,72727%2, где %=±0,5; ±1,5; ±2,5...; его ошибка по формуле (3.04) ту = 1/^134,28/(12—3) = = 3,86. Ординаты параболы второго порядка у" вычислены по приведенному уравнению и записаны (округленно) в столбце 8 табл. 3.16. Уравнение прямой для данного случая может быть вычислено по формулам (3.77). 8. Рассчитаем также коэффициенты уравнения и ординаты кубической параболы по суммам, найденным в табл. 3.17. По формулам (3.70) и с множителями из табл. 24П коэффициенты равны: а. = 0,189732 - 56,8—0,00223214 (— 1175,2) = 13,4, «1 = 0,0114945-216,2—0,000114662-12662,6= 1,033192, а2 = 0,0000468282 (—1175,2)—0,00223214-56,8=—0,181818, «3 = С,00000134896-12662,6—0,000114662-216,2 = —0,00770858. Ординаты по уравнению /= 13,4+ %[ 1,033192 + %(—0,181818— —0,00770858%) ], где %= ± 1; ±3; ±5. ..или %= (%'—6,5)/0,5, за- писаны в столбце 8 табл. 3.16. 221
Множители Mt—Ms для четного числа вариант в табл. 24П 1 вычислены по формулам: : М2 = 3/[ЛЦЛ^-1)], M3 = [3(3N2-7)]/[4N (W2-4)], < М4 = 15/[4N (АГ2—4)], М5 = 45/I4N (N2— 1)(ЛГ2—4)], Мв = [25 (3Af4—18W2+31)]/[4Af (N2— 1) (№—4) (АГ2—9)], (3.83) ' М7 = [35 (3№—7)]/[4ЛГ (N2—\) (Af2—4) (N2—9)], М8 = 175/[4Л7 (N2—\) (N2—4) (Af2—9)]. В работе H. С. Четверикова [1975] содержатся таблицы ве- , личин множителей Afi_8 до Af=100 с точностью до 6 знаков ман- > тиссы, а в книге А. К. Митропольского [1971] приводится алго- j ритм вычисления способом сумм коэффициентов уравнений па- рабол до четвертого порядка включительно. § 3.07. СТЕПЕННАЯ ФУНКЦИЯ В биологии степенная, или аллометрическая, функция наибо- лее часто применяется при исследовании морфогенеза и корре- ляций органов растений и животных; ее уравнение у'=аох\ (3.84) где у — функция, например величина одного из органов; а0—ко- эффициент, соответствующий константе начального роста вто- рого органа или особи в целом; х — аргумент, или величина, вто- рого органа или особи, измеренная в тот же момент времени; Р — коэффициент, или константа аллометрии, показывающая во сколько раз скорость роста первого органа у превышает ско- рость роста второго органа х. Графики кривой (3.84) приведены в § 3.16. Если р=1, оба органа растут с одинаковой скоростью и находятся по отноше- нию друг к другу в состоянии изометрии. При р>1 скорость роста первого органа у больше скорости второго органа х, что называется положительной аллометрией; при [3<1 скорость ро- ста второго органа х больше скорости первого органа у и орга- ны находятся между собой в состоянии отрицательной алломет- рии. Таким образом, константа [J передает относительную ско- рость органов в онтогенезе, ее величина приблизительно посто- янна для определенных органов и фаз онтогенеза живых су- ществ. Рассмотрим процесс вычисления уравнения степенной, или аллометрической, функции на примере аппроксимации зависи- мости площади листа от его длины у огурца. Вычисления, приведенные в табл. 3.18, выполняются в сле- дующем порядке. 1. Логарифмы величин х и у записаны в столбцах 3 и 4. 2. Логарифмы вариант х (столбец 3) возводим в квадрат (столбец 5). 222
Таблица 3.18. К вычислению параметров уравнения степенной функции Длина листа X, см Площадь листа у, см2 1g X Ig!/ (1g *)2 \gx\gy У' ю II б2 8 67,65 0,9031 1,8303 0,8156 1,6529 69,92 2,27 5,1529 10 110,60 1,0000 2,0438 1,0000 2,0438 109,32 1,28 1,6384 12 153,40 1,0792 2,1858 1,1647 2,3589 157,51 4,11 16,8921 14 224,10 1,1461 2,3504 1,3135 2,6938 214,49 9,61 92,3521 16 297,50 1,2041 2,4735 1,4499 2,9783 280,22 17,28 298,5984 18 369,15 1,2553 2,5672 1,5758 3,2226 354,89 14,26 203,3476 20 460,40 1,3010 2,6132 1,6926 3,3998 438,13 22,27 495,9529 22 514,50 1,3424 2,7114 1,8020 3,6398 530,40 15,90 252,8100 2197,30 9,2312 18,7756 10,8141 21,9899 6* = 1366,7444 3. Перемножаем логарифмы х и у (столбцы 3, 4, 6). 4. Суммируем числа в столбцах 2—6. 5. Для нахождения коэффициентов уравнения (3.84) решаем систему нормальных уравнений: A^l-ga0 + P21gx=S1g^. (3.85) 1g а0 21g х + ₽ 2 (1g *)2 = 2 (1g x ig y}> где N — число точек, или значений эмпирического ряда; а0, £ — искомые коэффициенты уравнения; прочие обозначения — сум- мы из табл. 3.18, подставляя которые в систему (3.85), получим: 81g а0 + 9,2312^=18,7756, 9,2312 1g а0 + 10,8141^ = 21,9899, откуда: р = 2,0018, а0= 1,087, 1gа0=0,037026. Искомое уравне- ние yf= 1,087х2’0018, или в логарифмической форме lgy'= = 0,037026 + 2,00181g х. Решить систему уравнений (3.85) мож- но для проверки также по формулам р = (Д_Му) / (В-Мх), 1g а0=М (3.86) или lga0=4-£B, (3.87) где Му—средняя арифметическая логарифмов значений функ- ции из столбца 4 табл. 3.18; Мх—средняя арифметическая лога- 223
Рис. 22. Зависимость площади листа у от его длины х у огурца / — эмпирическая линия регрессии; 2 — теоретическая кривая степенной функции рифмов значений аргумента из столбца 3 табл. 3.18; B=2(lg*)2/Slg*. (3.88) Мх=9,2312/8= 1,1539, Mv= 18,776/8=2,347, А = 21,99/9,2312 = 2,3821, В = 10,814/9,2312 = 1,1715, подставив эти величины в формулы (3.86), (3.87), получим те же значения коэффициентов £ и а0. В столбцах 7—9 табл. 3.18 приведены теоретические значе- ния площади листа, их разностй с фактическими и квадраты разностей, что необходимо для вычисления ошибки полученного уравнения (3.04): ту= |Л 1366,7444/(8—2) = 15,09 см2. Как видно из рис. 22, фактические данные удовлетворитель- но совпадают с теоретической линией регрессии. Константа [J в 2 раза больше единицы, следовательно, площадь листа возраста- ет в 2 раза быстрее, чем его длина у огурца и эти оба размера листа находятся в отношении положительной аллометрии. Ко* эффициенты аллометрического уравнения можно приближенно найти также способом избранных точек: р = 1п-^-/1п^-, (3.89) У2 / *2 / In Хо In Ул — 1п Хл In у* OQ — exp --------—-----i—~ (3.90) 224
или fl0 = */i/x*i, (3.91) где а0, р — коэффициенты уравнения; х1; ylt х2, у2 — координаты двух избранных точек. Например, для точек с координатами х±= 10, yt = 110,6, х2=20, //2 = 460,4: о < 110,6 Л 10 о In 20 In 110,6—In 10 In 460,4 p = In —— /In — = 2,0576, a0 = exp-------------------------— = 460,4/ 20 r In (20/10) = 0,96448, или a0 = 1 10,6/102*0576 == 0,96661. Более точное приближение к эмпирическим данным дало вы- числение функции при а0, полученном по формуле (3.90): 69,6, 110,4; 160,5; 220,2; 289,8; 369,1; 458,5; 557,9 (для соответствую- щих значений х из первого столбца табл. 3.18). § 3.08. ПОКАЗАТЕЛЬНО-СТЕПЕННАЯ ФУНКЦИЯ Эта функция ценна тем, что позволяет аппроксимировать за- висимости, которые графически передаются двускатной кривой, в чем в биологических исследованиях необходимость возникает не- редко, однако выбор подходящих для этого кривых весьма огра- ничен. Уравнение показательно-степенной функции y = axbecxt или r/ = exp(lna+& Inx-f-cx), (3.92) где у — функция; х — аргумент; а, Ь, с—коэффициенты; е — ос- нование натуральных логарифмов. Коэффициенты этого уравнения можно найти двумя метода- ми: наименьших квадратов и избранных точек. По методу наи- меньших квадратов требуется выполнить следующие вычисле- ния. 1. Найти средние: Mx = (j?x}lN, Л41=(21пх)/^,^2==(21п//)/^- 2. Определить промежуточные величины: А = М± 2 In х {2* 2 'п У lnx(/V + 1) — 2 In у 2 In х + + 2 х in *2 in у — 2 х 1пу 2 in х}+21п2 х(2х in y2inx— — 2 in у inх 2 х) - 2х in х 2 inх 2 in у in х, б=л4х (2^21пх~л/2х1пх)(2х1пх-2х21п х) + + (2xinx2x — 2 х2 2 *n x)(Mi2inx — 2 in2*) • 3. Коэффициенты равны: с=А/Б, a = —M{b—Мхс), Ь = Mi 2 in// “2 in у inx—с (ж2 шх -2 х ш*) (3.93) / /(^i 2 in х~ 2 in2 х) 225
Таблица 3.19. Вычисление теоретических значений показательно-степенной функции X У У' X У У' 0,1 1,781 1,029 0,7 0,691 0,71 0,2 3,183 2,556 0,8 0,404 0,404 0,3 3,193 2,975 0,9 0,228 0,22 0,4 2,54 2,54 1,0 0,126 0,116 0,5 1,768 1,829 1,1 0,068 0,06 0,6 1,183 1,183 1,2 0,036 0,03 Приведенный алгоритм целесообразно выполнять лишь при помощи ЭВМ с достаточным числом знаков в мантиссе, поэтому рассмотрим числовой пример расчета коэффициентов по более простому способу избранных точек, который также может обес- печить приемлемую точность, особенно при удачном подборе этих точек. В столбцах 1, 2 табл. 3.19 приведены данные К. А. Семен- дяева [1933], а в столбце 3 — вычисленные по способу избран- ных точек теоретические значения функции, которые находим в следующем порядке. 1. Из рядов х, у выбираем 3 пары значений аргумента и функ- ции: Xi = 0,4; yt = 2,54; х2 = 0,6; у2= 1,183; х3 = 0,8; г/3 = 0,404. Чис- ло вариант в рядах У= 12. 2. Формулы вычисления коэффициентов: С — (In — In— + In —In \ Уг хз Уз Ь = In —----с(х2— x3)l/ln — , Уз J/ хз ' а = exp (In —b In Xt—cxt), откуда: 2,54 < 0,6 . i 1,183 —----In — + In —---- 1,183 0,8 0,404 (0,6 “0,8) In (3.94) 0,6 0,8 = — 9,16126 b = In 1,183 0,404 + 9,16126 (0,6 — 0,8)] /in = 2,63436, v J/ 0,8 a = exp (In 2,54—2,63436 In 0,4+9,16126 • 0,4) = 1108,225. -3. По уравнению yf= 1 108,225x2’63436e“9’16i26x, или y'= = exp(ln 1108,225+2,63436 In x—9,16126x), находим теоретиче- ские значения функции (столбец 3). 226
Ошибка прогноза вычисляется по формуле (3.04): тУ = V %(У-уУ/(Н-п) = F 1,01045/(12-3) = 0,335. Координаты максимального значения функции: хтах= — (Ь/С) = — (2,63436/—9,16126) =0,28755, (3.95) */таХ=ехр(1па+£ 1пхтах+схтах) =ехр(1п 1108,225+ +2,63436 In 0,28755—9,16126- 0,28755) = 2,9827. В § 3.16 показаны примеры кривых, соответствующих урав- нению (3.92). Из ботанических объектов в соответствии с пока- зательно-степенной функцией происходит, например, хронологи- ческое изменение числа видов травянистых многолетников, у ко- торых начинается весеннее отрастание побегов. § 3.09. ПОКАЗАТЕЛЬНАЯ ФУНКЦИЯ При аппроксимации таких зависимостей, когда величины од- ного из признаков изменяются по геометрической прогрессии при равномерном изменении величин связанного с ним признака, не- редко бывает подходящей показательная функция, уравнение ко- торой у = аеЬх, (3.96) где у — функция; х — аргумент; а, b — коэффициенты; е — осно- вание натуральных логарифмов. Рассмотрим технику расчетов коэффициентов уравнения (3.96) методом наименьших квадратов на примере аппроксима- ции зависимости между датами созревания семян х и начала цве- тения у у травянистых многолетников в Москве. В результате об- работки данных многолетних наблюдений за 1384 видами вы- явилась эмпирическая зависимость между этими датами, пред- ставленная в табл. 3.20. В столбце 1 таблицы приведены даты со- зревания семян многолетников, а в столбце 2 — соответствующие даты начала цветения в том же массиве видов. Даты даны в днях от 1 марта, перевод в которые и обратно производится по табл. 5П. Коэффициенты уравнения равны: Мг = (2 In y)/N, М=(2*+ (Ух1п z/Uy X—Mi b = ----"±1-----, a = exp (Afx — bM), (3.97) 2 x2/2x - M где Mi — средняя арифметическая натуральных логарифмов ве- личин функции; 2In//—сумма натуральных логарифмов вели- чин функции; N — объем ряда; М — средняя арифметическая ве- 227
Таблица 3.20. Даты созревания семян х и начала цветения у у травянистых многолетников в Москве, дни от 1 марта Созревание семян х Начало цветения Созревание семян х Начало цветения У У' У у' 82,5 50,0 55,3 172,5 115,2 112,3 97,5 65,5 62,3 187,5 125,5 126,4 112.5 71,3 70,1 202,5 137,3 142,2 127,5 81,0 78,8 217,5 153,5 160,0 142.5 90,0 88,7 232,5 183,1 180,1 157,5 102,7 99,8 N = И личин аргумента; 2х—сумма величин аргумента; а, b — иско- мые коэффициенты; 2х 1П У— сумма произведений величин аргумента на натуральные логарифмы величин функции; 2 х2 — сумма квадратов величин аргумента. Вычислив требуемые суммы, подставим их в формулы (3.97) и получим: ^ = 50,636/11 = 4,6033, М = 1732,5/11 = 157,5, b = 8 [70,0/1732,5—4,6033 _ Q 78 297630/1732,5 — 157,50 а = ехр (4,6033—0,0078656 • 157,50) = 28,923. Аппроксимирующее уравнение показательной функции, по данным табл. 3.20: г/=28,923е°’0078656х, вычисленные по нему теоре- тические значения функции приведены в столбце 3 табл. 3.20. Качество аппроксимации можно считать вполне удовлетворитель- ным, как это видно из рис. 23, по которому можно заранее прог- нозировать сроки сбора семян травянистых многолетников или восстанавливать даты начала их цветения, если известно лишь время созревания семян. Заметим, что при знаке минус у коэффициента b показатель- ная функция передает зависимость, близкую к гиперболической, в этом случае коэффициент корреляции между признаками так- же со знаком минус. Графики кривой, рассчитанной по уравне- нию (3.96), даны также в § 3.16. Показательная функция может быть представлена также уравнением вида y = abx, (3.98) где у — функция; а, b — коэффициенты уравнения; х— аргумент. Коэффициенты уравнения (3.98) в логарифмированном виде (1g У= а-\-х lg b) несложно найти методом наименьших квад- 228
ратов из системы нормальных уравнении: AHga + = lg«Sx+ № ^x2 = '^1x\gy, (3.99) где N — объем ряда. Решив систему уравнений (3.99) относительно 1g а и 1g b и приняв М = (2 Д = (2* у)//И, В = (2х2)//И» получим формулы: lg6 = (21gt/-4)/(Sx-B), (3.100) \ga = N~1’^llgy — Mlgb. Технику аппроксимации по уравнению (3.98) покажем на данных, приведенных в табл. 3.21, в которой по столбцам выпол- нены следующие действия. 1, 2. Приведены исходные данные из первых двух столбцов табл. 3.20, деленные на 100, для сокращения вычислений. 3. Величины из столбца 1 возведены в квадрат. 4. Десятичные логарифмы чисел из столбца 2, где отрица- тельные логарифмы приведены в естественной форме для облег- чения дальнейших расчетов. 5. Произведения чисел из столбцов 1 и 4. Суммируем числа в столбцах 1, 3—5, затем вычисляем вспо- могательные величины: М = 17,325/11 = 1,575, 4 = 0,82935/1,575 = = 0,52657, В = 29,7616/1,575= 18,896. По формулам (3.100): 1g& = = (—0,01056—0,52657)/(17,325—18,896) =0,3419, 1g <х=—0,01056/ /11 — 1,575 • 0,3419 = = —0,53945. В результате расчета коэффициенты уравнения (3.98) для рассматривае- мой зависимости между датой созревания семян х и началом цветения у у травянистых многолетни- ков в Москве определены: Lgy' = x\gb + Iga = = 0,3419%—0,53945. В со- ответствии с этим послед- ним уравнением в столб- цах 6—9 табл. 3.21 выпол- нены расчеты теоретиче- ских значений функции у'. В столбце 8 отрицатель- Рис. 23. Зависимость дат начала цве- тения у от дат созревания семян х у травянистых многолетников в Мо- скве 1 — эмпирическая, 2 — теоретическая линия регрессии 229
Таблица 3.21. К вычислению коэффициентов уравнения у — аЬх X У X2 1g У х\&у х 1g b 1g У' И В' 1 1 2 3 4 5 6 7 8 9 1 0,825 0,5 0,6806 —0,30103 —0,24835 0,28207 —0,25738 1,74262 0,5529 0,975 0,655 0,9506 —0,18376 —0,17917 0,33335 —0,20610 1,79390 0,6222 ' 1,125 0,713 1,2656 —0,14691 —0,16527 0,38464 —0,15481 1,84519 0,7001 1,275 0,81 1,6256 —0,09161 —0,11680 0,43592 —0,10353 1,89647 0,7879 1,425 0,9 2,0306 —0,04576 —0,06521 0,48721 —0,05224 1,94776 0,8867 . 1,575 1.027 2,4806 0,01157 0,01822 0,53849 —0,00096 1,99904 0,9978 1,725 1,153 2,9756 0,06183 0,10666 0,58978 0,05033 — 1,123 ; 1,875 1,255 3,5156 0,09864 0,18495 0,64106 0,10161 — 1,264 j 2,025 1,373 4,1006 0.13767 0,27878 0,69235 0,15290 — 1,4220 ( 2,175 1,535 4,7306 0,18611 0,40479 0,74363 0,20418 — 1,600 i 2,325 1,831 5,4056 0,26269 0,61075 0,79492 0,25547 — 1,801 17,325 — 29,7616 —0,01056 0,82935 — — ные логарифмы из столбца 7 представлены в искусственной фор- ме (И) для того, чтобы можно было воспользоваться таблица- ми антилогарифмов; положительные логарифмы оставлены без изменения. Как видим, из сравнения у' в табл. 3.20 и 3.21, ка- чество аппроксимации по уравнениям (3.96) и (3.98) примерно одинаковое. При помощи показательного уравнения вида y = abx можно решать некоторые задачи, связанные с прогнозом и ретрогнозом биологических явлений, что покажем на конкретных примерах. 1. У высокорослого травянистого многолетника — сахалин- ской гречихи высота побегов при хороших условиях роста удваи- вается примерно каждый месяц. Определим, чему будет равна высота побегов этого растения через 3 мес, если непосредствен- но перед этим она составляла 30 см. В указанном уравнении приведенные величины будут соответствовать следующим обо- значениям: у — искомая конечная высота побегов; а — началь- ная высота, которая известна и равна 30 см; х = 3— число перио- дов (месяцев), в течение каждого из которых высота удваива- ется (& = 2). Таким образом, # = 30-23 = 240 см. Если, например, 1 мая высота побегов сахалинской гречихи составляла 0,3 м, то к 1 августа того же года она может быть равной 2,4 м. 2. Численность популяции некоторого вида на известной тер- ритории ежегодно сокращалась в 1,5 раза и через 6 лет соста- вила 200 особей. Определить, сколько особей данного вида было на этой территории 6 лет тому назад. Здесь а = 200; Ь= 1,5; х=6, следовательно: г/ = 200-1,56. Логарифмируя, получим 1пг/= = 1п 200+6 In 1,5 = 5,2983+6-0,4055 = 7,731, что соответствует у = 2278 особей. 230
В обеих рассмотренных задачах, относящихся к прогнозу и ретрогнозу жизненных явлений, роль коэффициентов а и b одинакова. Первый из них является начальным (в случае прог- ноза) или конечным (в случае ретрогноза) значением функции в соответствии с логически естественным ходом явления. Коэф- фициент b означает величину, которая показывает, во сколько раз изменяется функция у в течение некоторого периода, или цикла. Число этих циклов, или периодов (месяцы — в первой за- даче и годы — во второй), является аргументом х. § зло. ПОКАЗАТЕЛЬНОЕ УРАВНЕНИЕ ВТОРОГО ПОРЯДКА При подборе подходящей теоретической линии регрессии к некоторой заданной эмпирической зависимости в настоящее вре- мя на практике применяется метод проб и ошибок, так как этот процесс математически пока не формализован. Применение в качестве аппроксимирующей кривой параболы и дальнейшего повышения ее порядка как способа улучшения аппроксимации и отчасти как метода формализации последней ограничивается тем, что далеко не исчерпывает всех видов эмпирических зависи- мостей, и тем, что повышение порядка параболы выше четверто- го обычно нецелесообразно. В связи с этим представляют инте- рес различные виды других функций, в том числе показательных как довольно гибких по своим возможностям. В зависимости от своего строения показательные уравнения принимают вид г/=1 (при х=0), у=ах, у=сР\ что можно назвать показательными уравнениями соответственно нулевого, первого и второго поряд- ков. Чем выше порядок, тем большими возможностями для ап- проксимации обладает показательное уравнение. Однако при нахождении коэффициентов показательных уравнений второго порядка возникают значительные трудности, так как методом наименьших квадратов и методом моментов найти коэффициен- ты не удается. Метод средних — единственный, применяемый с этой целью, довольно громоздкий и не дает достаточной точнос- ти. Итерационные методы, в принципе, видимо, применимые в данном случае, не могут быть эффективно реализованы без ЭВМ. В данной ситуации представляется более целесообразным искать коэффициенты рассматриваемых уравнений методом избранных точек, который, несущественно уступая по точности методу сред- них, в то же время значительно проще по технике вычислений. Найдем коэффициенты показательного уравнения второго по- рядка y — a^bQCX. (3.101) Условием рассматриваемого способа является возрастание ряда аргумента сверху вниз и равный интервал между его вели- чинами. Логарифмируем уравнение (3.101) и напишем его для трех величин аргумента Xt>x2>x3, находящихся на равных рас- 231
стояниях друг от друга и соответствующих им ординат гл, уг, у}: уг = In а + beCXt, у2 — In а + ЬеСХг, (3.102) ya = In а + b^x>. Обозначая \п(у11уг)1\п(уг1у3)=к и решив систему уравнений (3.102) относительно коэффициентов, получим с — (In k)/(x2 — х3), или с = In k/\ Xi — xt+1 |. (3.103) b = In (У1/«/2)/(есд:* — e“*). (3-1 °4) 0 = ^/6*"“. (3.105) Пример. Найдем коэффициенты уравнения (3.101) для ап- проксимации им следующей эмпирической зависимости: х 0 1 2 345 6 7 8 9 10 у 0 0,5 1,6 3,2 5 6,6 7,8 8,6 9,2 9,5 9,6 где х — аргумент; у — функция. Примем за избранные точки x^lO, х2 = 6, х3 = 2, /Л = 9,6, у2= = 7,8, у3=1,6. По формулам (3.103), (3.104), (3.105): с =1п (9’6/7>8) /(6 — 2) = — 0,50785, In (7,8/1,6)/ b = In (9,6/7,8)/(еС10 — еС6) = —5,0312, а = Э.б/е^10 = 9,9062. Таким образом, искомое уравнение теоретической линии ре- грессии предстанет в виде z/=9,9 е~5’03е~0,б08х, коэффициенты кото- рого почти близки к тем, которые были получены методом сред- них К. А. Семендяевым [1933. С. 85] для этих же данных. Форма кривой на рис. 24 указывает, что уравнением (3.101) можно аппроксимировать такие эмпирические зависимости, ко- торые обычно приходится выравнивать более сложными при рас- чете логистическими кривыми. Графики кривой (3.101) даны также в § 3.16. §з.п. ЛОГИСТИЧЕСКАЯ ФУНКЦИЯ Многие явления роста, увеличения численности популяций, из- менений физиологического состояния организмов под воздейст- вием неблагоприятных факторов и другие могут быть моделиро- ваны логистической кривой, уравнение которой = + (3-106) 232
Рис. 24. График показательного урав- нения второго порядка У Рис. 25. Логистическая функция А — прямая, Б — обратная зависимости; В — прирост сухого вещества плодов то- мата у в течение вегетационного пе- риода х, 1 —эмпирическая линия регрессии; 2 — логистическая кривая где у' — функция, или зави- симая переменная; а0—ниж- няя асимптота, или нижний предел функции; а{ — рас- стояние между верхней (fli+ao) и нижней (а0) асимптотами (см. рис. 25, Л, Б); у, р — коэффициенты уравнения, определяющие изгиб и наклон логистичес- кой кривой. Рассмотрим процесс вы- числения значений асимптот и коэффициентов уравнения (3.106) на примере аппрок- симации динамики накопления сухого вещества в рас- тущих плодах томата. В табл. 3.22 приведены следующие данные (по столбцам). 1. Пятидневки вегетационного периода х. Интервалы между величинами аргумента могут быть и неравными. 8 Г. Н. Зайцев 233
Таблица 3.22. К вычислению коэффициентов логистического уравнения X X* У Ю.З/у 80,3/z/-1 Z=lg (80,3/ 2 XZ 1 2 3 4 5 6 1 8 (17) (289) 80,3 1 0 1 - .. (16) (256) 80,3 1 0 —- — 15 225 80,2 1,0012 0,0012 3,0792 —2,9208 —43,812 14 196 77,6 1,03 0,03 2,4771 —1,5229 —21,3206- 13 169 71,5 1,12 0,12 1,0792 —0,9208 —11,9704 12 144 67,8 1,18 0,18 1,2553 —0,7447 —8,9364 11 121 63,8 1,26 0,26 1,4150 —0,5850 —6,4350 10 100 58,7 1.37 0,37 1,5682 —0,4318 —4,3180 9 81 49,0 1,64 0,64 1,8062 —0,1938 —1,7442 8 64 41,7 1 93 0,93 1,9685 —0,0315 —0,2520 7 49 29,9 2 69 1,69 0,2279 0,2279 1,5953 6 36 26,5 3.03 2,03 0,3075 0,3075 1,8450 5 25 11,2 7.17 6,17 0,7903 0,7903 3,9515 4 16 5,28 15,2 14,2 1,1523 1,1523 4,6092 3 9 3,07 26,2 25,2 1,4014 1,4014 4,2042 2 4 1,20 66,9 65,9 1,8189 1,8189 3,6378 1 1 0,312 257 256 2,4082 2,4082 2,4082 120 1240 —• — — — 0,7552 —76,5374 2. Квадраты порядковых номеров пятидневок х2. 3. Прирост сухого вещества в плодах у (на одно растение, г). 4. Расстояние между асимптотами (величина которого де- лится на у в столбце 4) определяется по графику эмпирических данных (рис. 25, В) также, как'и величина нижней асимптоты а0. В данном случае принимаем: 01 = 8О,3, aQ = 0. Значение верхней асимптоты при равноотстоящих величинах аргумента можно определить также аналитически: a1=(2fe—у —y3)l(blik— 1), (3.107) где 0! — расстояние между асимптотами; b=^yiyjy2, уь у2, Уз — три эмпирических значения функции, взятых через одинаковые интервалы аргумента, здесь #4 = 71,5; #2 = 80,2; #3 = 80,3, подста- вив которые в формулу (3.107), получим: Ь = 71,5-80,3/80,2 = 71,589, 0Х = (2-71,589—71,5—80,3)/(71,589/80,2—1) = 80,3. 5. Из чисел столбца 4 вычитается единица. 6. Логарифмы десятичные (в искусственной форме) чисел столбца 5. Поскольку два верхних числа в этом столбце равны 234
нулю, а логарифма нуля не существует, то приходится для срав- нимости сумм в столбцах 1, 2, 7, 8 изъять также два верхних чис- ла в столбцах 1 и 2 (они взяты в скобки), которые при суммиро- вании не учитываются, причем число наблюдений соответственно также сокращается до N= 15. 7. Перевод логарифмов из столбца 6 в естественную форму для удобства арифметических действий с ними. 8. Произведения чисел столбцов 1 и 7. После этого суммируем числа в столбцах I, 2, 7, 8, находим средние по формуле (1.08): Мх— (2х)/^= 120/15 — 8,0; М2 — = (22)/^== 0,7552/15 = 0,05035 и коэффициенты уравнения: Р = (3-108) T = Afz—|ШХ, (3.109) по которым р= (—76,5374/8—0,7552)/(1240/8—120) =—0,2949, 7 = 0,05035+0,2949-8 = 2,4096. Для проверки вычислений решим систему уравнений: (з.по) для чего подставляем в нее известные числа: 15y+i|3120 = 0,7552, у 120+р 1240 = —76,5374, откуда получаехМ те же значения коэф- фициентов. Уравнение (3.106) приобретает для рассматриваемого приме- ра следующую конкретную форму: 80,3 2,4096—0,2949* где у' — теоретические значения функции, которые вычислены в табл. 3.23; в ней по столбцам приведены следующие данные. 1. Аргумент — пятидневки вегетационного периода х. 2. Величина коэффициента [} = —0,2949 умножена на значе- ния аргумента х и к этим величинам прибавлено значение коэф- фициента 7 = 2,4096, результат есть логарифм в естественной форме. 3. Логарифмы чисел столбца 2 в искусственной форме. 4. Антилогарифмы чисел столбца 3. 5. Числа столбца 4, увеличенные на 1. 6. Расстояние между асимптотами Я1 = 80,3, деленное на числа из столбца 5, что в данном примере соответствует теоретическим значениям функции у'. 7. Эмпирические значения функции у. 8. Квадраты разниц соответствующих эмпирических и теоре- тических значений функции, сумма которых 2(#— У'У = 321,69. Приведенный алгоритм вычисления теоретических значений функции кратко может быть записан в виде логарифмированного 235 8*
Таблица 3.23. Вычисление значений функции по уравнению логистической кривой X lg(10V+6*) i+iov+e* у' У (у—у')2 1 2 3 4 5 6 7 8 17 —2,6037 3,3963 0,00249 1,00249 80,1 80,3 0,04 16 —2,3088 3,6912 0,004911 1,004911 79,9 80,3 0,16 15 —2,0139 3,9861 0,009684 1,009684 79,5 80,2 0,49 14 —1,7190 2,2810 0,0191 1,0191 78,8 77,6 1,44 13 —1,4241 2,5759 0,03766 1,03766 77,4 71,5 34,81 12 —1,1292 2,8708 0,07426 1,07426 74,7 67,8 47,61 И —0,8343 1,1657 0,1464 1,1464 70,0 63,8 38,44 10 —0,5394 1,4606 0,2887 1,2887 62,3 58,7 12,96 9 —0,2445 1,7555 0,5695 1,5695 51,2 49,0 4,84 8 0,0504 0,0504 1,123 2,123 37,8 41,7 15,21 7 0,3453 0,3453 2,215 3,215 25,0 29,9 24,01 6 0,6402 0,6402 4,367 5,367 15,0 26,5 132,25 5 0,9351 0,9351 8,611 9,611 8,35 11,2 8,12 4 1,2300 1,2300 17,02 18,02 4,46 5,28 0,67 3 1,5249 1,5249 33,49 34,49 2,33 3,07 0,55 2 1,8198 1,8198 66,04 67,04 1,20 1,20 0 1 2,1147 2,1147 130,2 131,2 0,612 0,312 0,09 — —— —— — • —— 321,69 уравнения (3.106): 1g|1-----1) = у + Р*> где в нашем приме- \у'—ао J ре ао = О. Вычисление у' начинается с нахождения значения выражения у+Рх> которое представляет собой логарифм в естественной фор- ме, далее переводим этот логарифм в искусственную форму и на- ходим по нему число, к которому прибавляем единицу. На полу- ченное выражение делим что и дает значение у'. Например, у' для х=17, по уравнению _lg (80,3/#'—1) = = 2,4096—0,2949%, 2,4096—0,2949-17 = —2,6037 = 3,3963, что соот- ветствует числу 0,00249, к которому прибавляем 1 и делим: 80,3/1,00249 = 80,1 = у'. Ошибка найденной аппроксимации изме- нения прироста сухого вещества в плодах томата в зависимости от номера пятидневки его вегетационного периода по формуле (3.04) my=y321,69/(17—3) =4,7936 г. На рис. 25, В изображены эмпирическая и теоретическая линии регрессии прироста сухого вещества в плодах томата. При анализе логистического уравне- ния важную роль играют точки перегиба кривой и ее пересечения с осями. Точка пересечения логистической кривой с осью ординат №=<*./(!+ Ют)+а0, (3.111) 236
координаты средней точки перегиба кривой Хс = — (?/₽), г/с = О,5а1-+-ло, (3.112) где обозначения те же, что и в формуле (3.106). Для рассматриваемого примера точка пересечения кривой с осью ординат уп = 80,3/(1 +102>4096) +0 = 0,612; координаты точки перегиба кривой хс =— (2,4096/—0,2949) =8,17; ус = 0,5-80,3+ +0=40,15. При более детальном анализе полезно определить координаты также нижней и верхней точек перегиба логистичес- кой кривой: хн = хс—0,5719/1 р |, г/н = 0,211 За х, (3.113) хв = хс+0,5719/1 (31, ув = 0,7887аь (3.114) где хн, Ун — абсцисса и ордината нижней точки перегиба; хв, Ув— абсцисса и ордината верхней точки перегиба; хс — абсцисса средней точки перегиба; — расстояние между асимптотами; |Р| —коэффициент (при х) уравнения без знака. Для нашего примера: хн = 8,17—0,5719/0,2949 = 6,23, ун = 0,2113 • 80,3 =16,97, хв = 8,17+0,5719/0,2949 = 10,11, ув = 0,7887 • 80,3 = 63,33. Для проверки вычислений ординат точек перегиба можно при- менить следующее равенство: Я1 = 1/н+Ув, (3.115) где обозначения те же, что и в формулах (3.113), (3.114): 80,3=16,97+63,33. Для проверки вычислений абсцисс верхней и нижней точек перегиба служит равенство 2хс = Хн+хв, (3.116) 2-8,17=6,23+10,11. Таким образом, в начале пятидневок седьмой (6,23), девя- той (8,17) и одиннадцатой (10,11) в процессе накопления сухих веществ в плодах томата происходят качественные изменения, ко- торые подлежат биологическому объяснению. По-видимому, эти явления связаны с внешними и внутренними признаками созрева- ния, а также с изменениями в биохимическом составе веществ плода томата. Кроме того, эти данные при аналогичных метео- условиях и агротехнике позволяют прогнозировать урожай по- мидор по сухому веществу. Для этого на 31-й день после нача- ла роста плодов следует определить в них содержание сухого ве- щества ун и разделить его на 0,21, что даст величину содержания сухого вещества в конце вегетационного периода aif которую не- трудно пересчитать при желании на вес сырой массы. Например: 01 = 1/н/0,21 = 16,97/0,21 = 80,3. Этот прогноз можно повторить и уточнить его на 41-й день от начала роста плодов: 0i = yc/O,5 и 237
на 51-й день: Я1 = ув/0,79. Значение точки пересечения кривой с | осью ординат уп в данном примере заключается в том, что су- ] ществовал минимум сухой массы (семена, рассада) перед тем, ' как началось ее накопление в процессе роста. В этом же состоит ’ и биологическое значение нижней асимптоты. Значение верхней асимптоты в нашем примере указывает высший предел содержа- ния сухого вещества в плодах томата при существующих эколо- гических условиях, ассортименте сортов и агротехнике. В некоторых случаях качество аппроксимации логистической кривой может повысить применение в показателе степени ее уравнения не прямой линии, а параболы. Рассмотрим пример расчета коэффициентов уравнения такой кривой: / = 1 , + «о, (3.117) где уг — теоретические значения функции; аи aQ — верхняя и нижняя асимптоты; а, р, у — коэффициенты. Требуется аппроксимировать данные о всхожести семян жи- молости через разные сроки их хранения. В табл. 3.24 по столб- цам приведены следующие данные. 1. Сроки хранения семян, в годах. 2. Всхожесть семян, в процентах. 3. Величину верхней асимптоты делим поочередно на эмпи- рические значения функции, т. е. всхожести без величины ниж- ней асимптоты, вычитаем единицу из частного и берем натураль- ный логарифм полученного числа, например: z=ln (-------I1) = 1п(-^-----1W 6,7593. \у— / \0,1 — о / Значение верхней асимптоты принимаем а4 = 86,3, т. е. немно- го больше максимального значения у, а величина aQ здесь равна нулю, что соответствует естественному значению всхожести при полной потере жизнеспособности семян в результате слишком длительного их хранения. 4. Квадраты преобразованных значений аргумента, из кото- рых вычитается его средняя арифметическая, т. е. xQ=x—Мх, где, как обычно, Мх = 2 x/N = 28,6/9 = 3,1778, например: х0 = = 7—3,1778 = 3,8222; последнее число в квадрате равно 14,6092. 5. Преобразованные значения аргумента в четвертой степе- ни, т. е. х04 = (х02)2 = (14,6092)2 = 213,4287. 6. Величины из столбца 3 г = 1п|——-----1| преобразуем по \У — Оо / тому же принципу, что и в столбце 4, т. е. находим среднюю арифметическую: Mz = ^z/N = 0,17254/9 = 0,01917 и вычитаем ее из всех значений г, например: z0 = z—Л42 = 6,7593—0,01917= , = 6,740. Полученные z0 умножаем попарно на величины х02 из j столбца 4. 238
Таблица 3.24. Вычисление коэффициентов уравнения логистической кривой Годы X Всхо- жесть У, % Z 2 *о 4 *0 2 2о*О Zo*O у' 1 2 3 4 5 6 7 8 7 0,1 6,7593 14,6092 213,4287 98,4675 25,762 0,015 6 0,64 4,8968 7,9648 63,438 38,8491 13,7656 0,439 5 6 2,594 3,3204 11,0251 8,5494 4,6918 6,98 4 36 0,33446 0,676 0,457 0,2131 0,2592 40,86 3 52 —0,41612 0,0316 0,001 —0,0138 0,0774 72,95 2 71,4 —1,5667 1,3872 1,9243 —2,2 1,8679 82,14 1 80,3 —2,5943 4,7428 22,4941 —12,3953 5,6917 84,31 0,5 85 —4,1799 7,1706 51,4175 —30,1101 11,2443 84,64 0,1 86 —5,655 9,4729 89,7358 —53,7511 17,4641 84,73 28,6 — 0,17254 49,3755 453,9215 47,6088 80,824 — 7. Произведения преобразованных величин функции и аргу- мента, например г0 = 6,740 и х0 = 3,8222, zoxo = 6,740-3,8222 = = 25,762. Далее находим суммы столбцов 3—7 и после — коэф- фициенты уравнения логистической кривой: а = 2 2о%о/ 2 х*о — (2 xlf/N], 0 = 2 Vo/2 4 — 2аЛ4х, Y =Мг — а 2 — Мх (0 4- аЛ4х), (3.118) (3.119) (3.120) а = 47,6088/ (453,9215—2437,9499/9) = 0,2601, 0=80,824/49,3755— —2 • 0,2601 • 3,1778=—0,0162, у=0,0192— (0,2601 • 49,3755) /9— —3,1778 (—0,01624-0,2601 -3,1778) = —3,9906. 8. Вычисление теоретических значений функции начинаем с выражения у+%(р+ах) =—3,9906+%(—0,0162+0,2601%), затем берем экспоненту от полученного числа, прибавляем к нему еди- ницу, делим на него величину верхней асимптоты и прибавляем величину нижней асимптоты, т. е. вычисляем по уравнению (3.117), которое получило следующие коэффициенты: 86,3 -3,9906+*(-0,0162+0,2601*) Находим ошибку полученного уравнения (3.04): ту = = У596,7/(9—3) = 10%. Значения аргумента по значениям функ- ции можно вычислить, преобразуя уравнение (3.117) следующим 239
образом: —Р ± j/"Р2 + 4а In Д1 У — а0 (3.121) j । Критические точки кривой, рассчитанной по уравнению (3.117), находим следующим образом. Координаты верхней точ- ки максимума равны: Хм = —(р/2а), Ум ~ а0 + Ml + ev+₽*M+a*M), или (3.122) (3.123) Ум = а0 + ах/(1 4- е^~₽2/4а). Вторая производная уравнения (3.117) (3.124) где г=ет+х(Р+аэс). Значение х, при котором у" принимает макси- мальное значение, соответствует абсциссе критической точки Н, значение х, соответствующее r/z/ = 0, равно абсциссе точки С, и значение х, при котором у" принимает минимальное значение, со- ответствует критической точке В. Ординаты точек В, Н находим подобно тому, как и ординату ум, по уравнению (3.123). При отрицательных и положительных значениях х могут быть по две симметрично расположенных точки Н, С, В, так как кривая ста- новится в этом случае двускатной (рис. 26). Придавая аргумен- ту ряд последовательных значений с небольшим шагом, выяв- ляем абсциссы критических точек, которые в данном примере равны: хв = 3,4584; хс = 4,06314; хн = 4,6809; затем по этим абс- циссам находим ординаты: ув = 61,98; г/с = 38,05; ун= 14,11. В рас- сматриваемом примере отрицательные величины х не имеют смысла, поэтому не определяем координат критических точек из левой части кривой на рис. 26. В тех случаях, когда вычисле- ние их желательно, для проверки можно использовать равенство Хв- + Хв+ Хс- + Хс+ Хн- + Хн+ = ₽/а. (3.125) Координаты точки максимума М находим по формулам (3.122), (3.123): хм=—[ —0,0162/ (2 • 0,2601) ] = 0,03115, ум = 86,3/ [ 1 е-3"06-с-°-0162)2/(4 •°'2601’ ] =84,73. 240
Рис. 26. Схематический график кривой (3.117) —а, б — график ее второй про- изводной (3 124) М, В, С, Н — критические точки § 3.12. КРИВАЯ ГАУССА Для аппроксимации таких эмпирических зависимостей, точки которых располагаются по колоколообразной, двускатной кривой и по краям плавно приближаются к оси абсцисс, можно исполь- зовать уравнение кривой Гаусса: у = 6е-Л2^)2, (3.126) где у — зависимая переменная; Ь, й, а — коэффициенты; х — не- зависимая переменная. Логарифмируем уравнение (3.126) и составим систему урав- нений по трем избранным точкам: In yY — In b — h2 (%i — 2ахг + а2), In у2 = In b — h2 (xl — 2ах2 + а2), In у3 — In b — h2 (Хз — 2ях3 + о2). 241
Решая эту систему относительно искомых коэффициентов, по- 1 лучаем: 1 Л2 = In — (3.127) ln(*/2/0i) Л2 (%! X2) J ’ (3.128) b = у1еЛ2(Ж1"Л)2. (3.129) J I Пример. Найдем коэффициенты уравнения (3.126) примени- тельно к эмпирической зависимости, приведенной в табл. 3.25. * При избранных точках: xt = 65, х2 = 79, х3 = 93, ус= 119, у2 = 171, у3= 121 по формулам (3.127)— (3.129) получим уравнение - у* — 171,О2е“0,0018072 (*~79,i65)2, < теоретические частоты по которому представлены в столбце 4 J табл. 3.25. В столбце 1 этой таблицы приведены варианты, во втором — соответствующие им частоты, в третьем — частоты нор- мальной кривой, вычисленные точным способом. ? Лучшее совпадение теоретических рядов с эмпирическими по ] рассмотренному способу достигается, если брать избранные точ- { ки возможно ближе к вершине кривой. Это и понятно, имея в виду наибольшую достоверность частот нормальной кривой в ее середине, в области математического ожидания. Методом избранных точек можно также вычислить среднюю , арифметическую и дисперсию эмпирического распределения, J близкого к нормальному, для чего исходное уравнение (см. ! § 1.25) Nc а У 2л (х-М)2 га2 J логарифмируем и запишем систему уравнений для четырех то- чек: In ft—A—d(xl—М)2, 1п/г=Л—d(x3—Al)2, 1пЛ=Л— d(x3—Al)2, lnf4=A— d(x4—M)2, где Л = 1пА+1пс—ln<T—Inm; /п=У2л; f — частоты. Обозначим d=il/(2a2), a=fjf2, b=f3/fi и решим систему четырех уравнений относительно коэффициентов: М = 0,5 [(х% — л?) In b — (xl — xl) In а]/[(х2—xj In b—(х4—х3) In а], (3.130) d= (Inа)/[ (х2—М)2— (х,—Af)2], (3.131) <r=l/(2d). (3.132) : л I 242
Таблица 3.25. Данные к вычислению коэффициентов уравнения кривой Гаусса X У у' X У у' 1 2 3 4 1 2 3 4 37 2 4,5 6,9 93 121 130,6 121,0 51 29 31,6 40,8 107 42 47,8 42,2 65 119 106,1 119,0 121 16 8,3 7,2 79 171 170,4 171,0 Х2=17,65 Приняв (из столбцов 1 и 2 табл. 3.25) за избранные точки %1 = 37, х2 = 65, х3 = 93, х4 = 121, Л = 2, /2=119, f3=121, /4=16, по формулам (3.130) — (3.132) получим: Л4=88,4; о2=256,7; о= = 16,0. Точные значения этих параметров равны: средняя ариф- метическая Л1 = 80,960; сг2 = 265,06; сигма о= 16,281. Вершина нор- мальной кривой находится в точке с координатами х=М, у== =/тах = Л^с/(о'|/2л), абсциссы точки перегиба кривой равны ±о. Формулы (3.130)— (3.132) можно применять в тех случаях, когда вариационный ряд по каким-либо причинам оказался не- полным; для применения изложенного метода достаточно, чтобы в ряду сохранились четыре варианты с их частотами. § 3.13. ЛОГАРИФМИЧЕСКАЯ ФУНКЦИЯ Кривые этого типа графически отражают такие зависимости, в которых корреляция двух факторов, довольно сильная в нача- ле, становится слабой и почти незначимой в конце данного про- цесса. Технику вычисления коэффициентов уравнения логариф- мической кривой у = а+&х+с In х, (3.133) рассмотрим на примере аппроксимации эмпирической зависимо- сти срока созревания семян от начала цветения у видов травя- нистых многолетников. 1. В столбцах 1 и 2 табл. 3.26 даны сроки этих двух фенофаз в днях от 1 марта. Предстоящие вычисления с этими главным образом трехзначными числами могли бы стать затруднительны- ми, если бы не были преобразованы исходные величины с целью снижения их порядка (столбцы 3 и 4). Заметим, что подобное преобразование желательно делать при аппроксимации любыми типами кривых, особенно тогда, когда исходные величины при расчетах возводят в степень или логарифмируют. Для приведе- ния ряда аргумента к натуральному ряду чисел следует найти 243
Таблица 3.26. Сроки зацветания х и созревания семян у у видо в травянистых многолетников в Москве, дни от 1 марта Зацветание х' Созревание семян у" Кодированные даты Теоретические значения у' х=(х'—20)/20 Г/=£/"/100 40 97,5 1 0,975 0,83283 60 124,4 2 1,244 1,2625 80 138,1 3 1,381 1,5141 100 152,8 4 1,528 1,6926 120 174,2 5 1,742 1,8313 140 198,9 6 1,989 1,9448 160 212,05 7 2,1205 2,0408 180 220,2 8 2,202 2,1239 200 225,8 9 2,258 2,1973 iV=9 4=20, cft=20 45 — —• подходящие значения величин А (начального значения х) и ск (интервала между значениями %). В затруднительных случаях следует с этой целью решить систему уравнений: xt = (х/—Д)/сЛ, х2 = (х2—А)/ск. Например, для данных в столбце 1 табл. 3.26: 1 = (40—Д)/сь 2= (60—Д)/сй, откуда Д = 20, cfe=20. Эта неслож- ная операция существенно снижает трудоемкость расчетов и по- вышает их точность. 1. Найдем суммы величин: х, у, xlnx, Inx, ху, r/lnx, х2, 1п2х, для чего выполним соответствующие вычисления с числами, при- веденными в столбцах 3, 4 табл. 3.26. 2. Средние арифметические обоих рядов по формуле (1.08) равны: Мх = ЛГ12х = 45/9 = 5, Му2У= 15,44/9= 1,7155. 3. Определим вспомогательные величины: А = (2 in х)’12 X1П х = 79,057/12,802 = 6,1754, Б = 2 ху/2 х = 87,144/45 = 1,9365, В = 2 У In х/2 In х = 24,532/12,802 = 1,9163, Г = 2*2/Sx = 285/45 = 31,666, (3.134) Д=2 х In х/2х = 79,057/45= 1,7568, Е = ^21ПХ =12,802/9= 1,4224, Ж= 2 1п2х/2 1п х = 22,348/12,802 = 1,7457. 244
4. Коэффициенты уравнения логарифмической кривой равны: с А (Б - Му) + (В - Б) + Г (Му - В) А (Д - Е) + Мх (Ж - Д) + Г (Е - Ж) ’ \ > 6,1754(1,9365—1,7155)+5(1,9163— 1,9365) +31,666(1,7155—1,9163) __ — 6,1754(1,7568— 1,4224)4-5(1,7457— 1,7568) +31,666 (1,4224—1,7457) ~ ==0,61911, й=[с(Д-Е)+М-Б]/(Мх-Г) (3.136) b = [ 0,61911 (1,7568— 1,4224) + 1,7155— 1,9365 ] / (5—31,666) = =0,00052501, а = М— ЬМХ—сЕ, (3.137) а= 1,7155—0,00052501 -5—0,61911 • 1,4224 = 0,8323. 5. Вычисленные по уравнению у'—0,8323+0,00052501*+ +0,619111п* теоретические значения дат созревания семян при- ведены в столбце 5 табл. 3.26. Величины х в этом уравнении со- ответствуют числам из столбца 3. Ошибка данного уравнения, вычисленная по формуле (3.04) '.ту = У (N-3y^(y-yT^ —V0,091429/ (9—6) =0,123. На рис. 27, а видно, что теоре- тическая линия регрессии 2 удовлетворительно совпадает с эм- пирическими данными 1, Очевидно также, что корреляционная связь между сроками зацветания и созревания семян у видов тра- вянистых многолетников уменьшается в конце сезона. § § 3.14. ГИПЕРБОЛА Для аппроксимации обратных криволинейных зависимостей нередко применяют различные модификации гиперболической функции. Ветви гиперболы не имеют точек пересечения с осями координат, они асимптотически приближаются к ним, что следу- ет принимать во внимание при биологическом толковании соот- ветствующих графиков. Рассмотрим технику расчета различных видов уравнений гиперболы на конкретных примерах из бота- ники. 1. В соответствии с уравнением (3.138) где у, х — функция и аргумент; а, b — коэффициенты, выполним расчет по аппроксимации зависимости продолжительности цвете- ния у от даты его начала х0 у совокупности сортов гелениума осеннего по данным многолетних фенологических наблюдений в Москве. В табл. 3.27, в столбце 1 указаны средние даты зацвета- ния сортов гелениума х0 в днях от 1 марта (табл. 5П); этим да- там соответствуют величины продолжительности цветения у в 245
246 Рис. 27. Связи признаков у травянистых многолетников а — логарифмическая кривая (3.133): сроки созревания семян у” в совокупности из 1300 б —гипербола (3.138): продолжительность цветения у — даты его начала х0 у сортов гелениума; в — гипербола (3 143): продолжительность цве- тения (/ — даты его начала х у сортов гелениума осеннего; г — гипербола (3.146): продолжительность цветения (/ — даты начала весеннего от- растания х у сортов дельфиниума; д — гипербола (3.148): продолжительность цветения у — даты начала отрастания х у сортов дельфиниума; е — степенная функция (3.150): длина соцветий (/ — высота растений х0 (в см) у сортов дельфиниума; 1 — эмпирическая и 2 — теоретическая линия регрессии видов и сортов — даты начала их цветения х'\
«ямв Рис. 27 (окончание)
Таблица 3.27. Зависимость продолжительности цветения у от даты его начала х0 у сортов гелениума осеннего о X х 1 х 1 *4 1 х С4 1 1 * =5) 1 х_ 1 1 т з X X 1 X 1 X ч 1 1 2 3 4 5 6 7 8 9 10 11 12 145,0 1 63,7 1 4-0,702 0,493 +7,8 +5,476 63,7 1 64 0,(9 148,1 4,1 57,1 0,244 —0,054 0,003 +1,2 —0,065 13,932 0,059 55,2 3,61 152,8 8,8 53,90,114 —0,184 0,034 —2 + 0,368 6,1450,013 53,7 0,04 156,7 12,7 52,5 0,079 —0,219 0,048 —3,4 + 0,745 4,148 0,006 53,3 0,64 162,918,9 52,3 0,053 279,51,49 —0,245 0,060—3,6 0,638 + 0,882 7,406 2,772 0,003 90,6971,081 53,0 0,49 4,87 днях (столбец 3). Расчеты уравнений гиперболы облегчает пре- образование аргумента, из величин которого вычитаем постоян- ное число, близкое к минимальной варианте ряда х0. В нашем случае это число Л = 144. Ряд преобразованного по формуле х— = х0—144 аргумента представлен в столбце 2. В столбце 4 — об- ратные величины аргумента 1/х, что иначе записывается в виде лг1. Средняя арифметическая обратных величин аргумента рав- на Mi = 2 X^lN = 1,490/5 = 0,298, где N — число вариант. В столб- це 5 даны разности обратных величин с их средней, а в столб- це 6 — квадраты разностей. Средняя арифметическая величин функции равна My=^y/N = 279,5/5=55,9. Разности величин функции с их средней приведены в столбце 7, а в столбце 8 — произведения разностей функции и аргумента. В столбце 9 — про- изведения обратной величины аргумента на соответствующее значение функции, иначе это действие может быть выполнено делением: у/х. В столбце 10 запишем квадраты величин из столб- ца 4, после чего закончены подготовительные расчеты для вы- числения и проверки коэффициентов уравнения (3.138). По фор- муле ь = 2 (X-1 - Мх) (у - Лу/2 (X-1 - MJ2 (3.139) находим значение коэффициента при аргументе Ь = 7,406/0,638 = = 11,605. Проведенное вычисление коэффициента b желательно проверить. Для этого воспользуемся другой формулой: ь = (2 ух-1 - Му2 X-1)/(2 X2 - ^2 х-1) , (3.140) подставив в которую итоги из табл. 3.27 и другие известные ве- личины, получим Ь= (90,697—55,9-1,49) / (1,081—0,298-1,49) = = 11,626, что с учетом точности расчетов является удовлетвори- 248
тельным совпадением с величиной, вычисленной по формуле (3.139). Находим величину свободного члена уравнения а=М— bMt, (3.141) а=55,9— 11,605 • 0,298=52,442. Проверить вычисления или найти значения коэффициентов а, b иным способом можно, решив систему нормальных уравнений aN + Z>2X"1==S^> а S х~* + Ь 2 х~2 = 2 Ух~1- (3.142) Теоретические значения у' продолжительности цветения сор- тов гелениума осеннего, вычисленные по уравнению у' = 52,4+ + 11,605/х, приведены в столбце 11 табл. 3.27. Напомним, что подставлять в это уравнение следует преобразованные значения аргумента х=х0—144. Вычитая полученные у' из величин у (столбец 3) и возводя разницы в квадрат, получим (у—у')2, в столбце 12, сумма которых необходима для вычисления ошибки уравнения по формуле (3.04) ту=У4,87/(5—2) = 1,27. На рис. 27, б показаны точками эмпирические данные и аппроксимирующая их гипербола, рассчитанная по формуле (3.138), которые позво- ляют заключить, что при более раннем зацветании продолжи- тельность цветения у сортов гелениума больше. Следовательно, при селекции желательно стремиться к получению ранних сор- тов гелениума, что является единственной возможностью увели- чить продолжительность цветения растения в средней полосе СССР, где заморозки наступают в конце периода цветения боль- шинства сортов гелениума. 2. На том же примере покажем технику вычисления коэффи- циентов другого уравнения гиперболы: у=1/(а+Ьх), (3.143) где обозначения те же, что и в формуле (3.138). Графики этой кривой см. § 3.16. В первых двух столбцах табл. 3.28 приведены данные из табл. 3.27, т. е. х — преобразованные даты начала цветения сор- тов гелениума (х=х0—144); у0 — продолжительность их цвете- ния, дни. Преобразуем также и величины yOi вычитая из них 51,3 с тем расчетом, чтобы минимальная величина у была равна еди- нице (столбец 3). В столбце 4 выполнено деление 1/у, иначе у1. В столбце 5 — возведенные в квадрат величины столбца 1, в столбце 6 — произведения величин столбцов 1 и 4. Найти коэффициенты приведенного уравнения можно непо- средственным решением системы нормальных уравнений: = = (3.144) необходимые суммы для этого приведены в табл. 3.28. 249
Таблица 3.28. Аппроксимация гиперболой по уравнению (3.143) X Уо У=Уо—51,3 хг ху~* у' 1 2 3 4 5 6 7 1 63,7 12,4 0,0806 1 0,0806 24,15 4,1 57,1 5,8 0,1724 16,81 0,7068 4,66 8,8 53,9 2,6 0,3846 77,44 3,3845 2,09 12,7 52,5 1,2 0,8333 161,29 10,5829 1,44 18,9 52,3 1 1 357,21 18,9 0,95 45,5 2,4709 613,75 33,6548 Из уравнений (3.144) выведены формулы, дающие те же ре- зультаты: Ь = (мх 2 у-1 - 2 ху-1}/(Мс 2 * - S х*] , (3.145) а = — ЬМХ, где Мх = (2х)/^> Mi = (2 Н+ Подставив из табл. 3.28 известные величины в формулы (3.145), получим: Мх=45,5/5=9,1; ^ = 2,4709/5 = 0,49418; 6 = =-(9,1 -2,4709—33,6548)/(9,1 -45,5—613,75) =0,0559, а = 0,49418— —0,0559-9,1=—0,0145. Для проверки подставим полученные зна- чения коэффициентов и две суммы из табл. 3.28 в первое урав- нение системы (3.144): 2,4709 = —0,0145-5+0,0559.45,5; решив правую часть уравнения, найдем: 2,4709 = 2,4709, следовательно, коэффициенты а и b вычислены верно. Теоретические точки ги- перболы по уравнению у'= 1/(0,0559х—0,0145) приведены в по- следнем столбце табл. 3.28, их совпадение с эмпирическими дан- ными удовлетворительное (см. рис. 27, в) и несколько лучшее, чем по уравнению (3.138). Первая точка гиперболы по своей ор- динате (24,15) значительно отклоняется от эмпирической вели- чины (12,4). В этом месте графика начинается асимптота гипер- болы, поэтому данному отклонению не следует придавать реаль- ного значения. На рис. 28, б представлены различные формы кривых, которые соответствуют уравнению (3.143). 3. Ввиду большего числа коэффициентов в нем довольно гиб- ко в отношении аппроксимации уравнение гиперболы у = йо+^х+Пг/Х, (3.146) где а0, ^1, а2— коэффициенты; у и х — функция и аргумент. Най- дем точки гиперболы, отражающей зависимость средней продол- жительности цветения сортов дельфиниума культурного у (в днях) от начала их отрастания в открытом грунте х (в днях •от 1 марта). В табл. 3.29 в первых двух столбцах приведены эти 250
Таблица 3.29. Зависимость продолжительности цветения дельфиниума у от начала его отрастания в открытом грунте Москвы х X У х~Ч х2 Ух ух-1 у' (у-у')2 0,33 0,54 3,0303 0,1089 0,1782 9,1827 1,6364 0,53 0,0001 0,42 0,407 2,3809 0,1764 0,1709 5,6687 0,969 0,404 0 0,45 0,38 2,2222 0,2025 0,171 4,9382 0,8444 0,37 0,0001 0,48 0,35 2,0833 0,2304 0,168 4,3401 0,7292 0,345 0 0,51 0,288 1,9608 0,2601 0,1468 3,8447 0,5647 0,32 0,0010 0,54 0,29 1,8519 0,2916 0,1566 3,4295 0,5371 0,30 0,0001 0,57 0,287 1,7544 0,3249 0,1635 3,0779 0,5035 0,28 0 0,60 0,238 1,6667 0,36 0,1428 2,7779 0,3967 0,26 0,0005 0,63 0,22 1,5873 0,3969 0,1386 2,5195 0,3492 0,25 0,0009 0,66 0,38 1,5151 0,4356 0,2508 0,2955 0,5757 0,23 0,0225 0,69 0,14 1,4493 0,4761 0,0966 2,1005 0,2029 0,22 0,0196 5,88 3,52 21,5022 3,2634 1,7838 44,1752 7,3088 — 0,0448 данные, но запятая во всех них перенесена на два знака влево для удобства вычислений. Таким образом, х=0,33 соответствует 33 дням от 1 марта, или 2 апреля (табл. 5П), а у = 0,54 означает продолжительность цветения 54 дня. Коэффициенты уравнения (3.146) можно найти, решив систему нормальных уравнений: aoN+ ai 2 х + аг2 х"1 = 2 У> а02х+а12хг + ааЛГ=2//х. (3.147) ао 2 х~* + ajN + «2 2 х~2 = 2 Ух~\ или по приведенным ниже формулам, полученным из системы (3. 147). Выполнив действия, указанные в табл. 3.29, найдем следую- щие величины: Мх = У"х2 X = 5,88/11 = 0,5345, Му= /V’1^ У = 3,52/11=0,32, Mi = ЛГ1 2 х"1 = 21,5022/11 = 1,9547, А = 2 *2/2 х = 3,2634/5,88 = 0,555, В = МГА — 1 = 1,9547. . 0,555 — 1 = 1,0849, К = 2 ftf/S х = 1,7838/5,88=0,3034; D = Мх - А = 0,5345 — 0,555 = -0,0205, Е = (Му - K)/D = = (0,32—0,3034)/—0,0205 = —0,8097, F = (МгК - 2 yx'Wj/B = (1,9547 • 0,3034-7,3088/11)/1,0849= = —0,0657, 251
G = (/И, — w/2 x)/D = (1,9547—11/5,88)/—0,0205 = —4,0976, H = (2 x-1/2 x - 2 x-t/N^B = (21,5022/5,88 — 44,1752/11)/ /1,0849 = —0,331, a2 = (£ — F)/(G — H) = (—0,8097+0,0657)/(—4,0976+0,331) = = +0,1975, 2 у—2 ух—«2 2 x—7V)]//[A1* 2 x—2 *2]= = [0,5345 • 3,52 — 1,7838 — 0,1975 (1,9547 • 5,88—11)]/ /(0,5345.5,88—3,2634) = —0,00083, a„ = My—atMx—a2Mt = 0,32+0,00083 • 0,5345—0,1975-1,9547= = —0,0657. Теоретические значения функции, приведенные в столбце 8 табл. 3.29, вычислены по уравнению у' =—0,0657—0,00083%+ +0,1975/%. В столбце 9 таблицы приведены квадраты разностей эмпирических у и теоретических у' значений функции, сумма ко- торых необходима для вычисления ошибки уравнения (3.04): т/ = 0,0448/11 =0,0041; ту=0,064, или 6,4 дня в исходных дан- ных. На рис. 27, г представлены эмпирическая (/) и теоретическая (2) кривые, совпадение между ними хорошее. Небольшая вели- чина коэффициента 6^ = 0,00083 позволяет предполагать, что при аппроксимации рассматриваемой зависимости можно было при- менить уравнение (3.138) вместо (3.146). 4. Для аппроксимации обратных зависимостей, графическое представление которых соответствует рис. 28, в, можно приме- нять уравнение у' = %/(«+&%), (3.148) где у', х — функция и аргумент; а, b — коэффициенты. По методу наименьших квадратов эти коэффициенты можно найти, решив систему нормальных уравнений: ^y0 = aN + &2Х> 2*//о = «2* + &2*2. (3.149) где у<,=х1у. Рассмотрим технику вычисления коэффициентов уравнения (3.148) по формулам, полученным из системы (3.149), на дан- ных предыдущего примера (см. табл. 3.29). Для решения систе- мы (3.149) дополнительно необходимы суммы 2 у0, 2хУо» ко- торые приведены в табл. 3.30, остальные суммы 2х» 2%2 в 252
Таблица 3.30. Дополнительные данные к табл. 3.29 для расчета коэффициентов уравнения (3.148) Уь=х!у хУь у' Уъ—х/у ХУь у" 0,6111 0,2017 1,508 1,9861 1,1321 0,248 1,0319 0,4334 0,421 2,5210 1,5126 0,235 1,1842 0,5329 0,358 2,8636 1,8041 0,224 1,3714 0,6583 0,316 1,7368 1,1463 0,215 1,7708 0,9031 0,287 4,9286 3,4007 0,207 1,8621 1,0055 0,265 21,8676 12,7307 табл. 3.29 уже вычислены. Расчеты проведем в следующем по- рядке. Мх = £х/ЛГ=5,88/ 11 = 0,5345, Мг = 2 Уо/К = 21,8676/11 = = 1,988; b = (Л4Х 2 У о — 2 хУо}/(м* 2 х — 2 *2) = == (0,5345 • 21,8676— 12,7307)/(0,5345 • 5,88 — 3,2634) = 8,6514, а = М1 — ЬМх = 1,988-8,6514-0,5345 = -2,6362. Теоретические значения гиперболы по уравнению у' = = х/(8,6514х—2,6362) приведены в табл. 3.30; их совпадение с эмпирическими точками удовлетворительное (см. рис. 27, д). § * § 3.15. СТЕПЕННАЯ ФУНКЦИЯ СО СВОБОДНЫМ ЧЛЕНОМ Зависимости, близкие к гиперболе или параболе, иногда со- ответствуют и степенной функции: / = (3.150) где у' — теоретические значения функции; х — аргумент; а, b — коэффициенты. По методу наименьших квадратов коэффициен- ты можно найти из системы уравнений ^y = aN + Ь^х2, 2 Ух2 = а 2 %2+ ь 2 **• (3.151) Рассмотрим технику расчетов на примере зависимости длины соцветий от высоты растений в совокупности сортов дельфиниу- ма по наблюдениям в Москве. В столбце 1 табл. 3.31 приведены через равные интервалы величины высоты растений (в см), ко- торые в столбце 2 преобразованы для удобства расчетов в на- туральный ряд чисел по формуле х= (х0—34)/17, где 34 — число, подобранное так, чтобы варианты были в результате целыми чис- лами (если это возможно); 17 — классовый интервал. Величи- нам высоты в среднем по многим измерениям соответствуют ве- 253
Таблица 3.31. Зависимость длины соцветий у от высоты растений х у сортов дельфиниума в Москве, см Хо X У X2 ух2 X4 у" 1 2 3 4 5 6 7 51 1 10,3 1 10,3 1 18,0 68 2 14,7 4 58,8 16 19,4 85 3 21,1 9 189,9 81 21,7 102 4 22,5 16 360 256 24,9 119 5 30,9 25 772,5 625 29,0 136 6 36,1 36 1299,6 1296 34,1 153 7 36,5 49 1788,5 2 401 40,1 170 8 40 64 2560 4 096 47,0 187 9 56,3 81 4560,3 6 561 54,8 204 10 68 100 6800 10 000 63,5 336,4 385 18399,9 25 333 личины длины соцветий у, приведенные в столбце 3. Дальнейшие действия ясны из заголовков столбцов в табл. 3.31. Вычисления коэффициентов по формулам, полученным из си- стемы (3.151), проводим в следующем порядке. Му = 2 y/N = 336,4/10 = 33,64, Mi = 2 = 385/11 = 35, Рис. 28. Формы кривых первой группы сложности а) у=ае^х (см. § 3.09): /) #=е~9 * 11»69Х, 2) #=е“°»б1х, 3) y=e~Q>^xt 4) #=f~°»22X, 5) #=е“"°»108х, 5) #=e”°»05Jf, 7) у=ё"°»01х, 8) #=е0,01Х, 9) #=е°»06*, 10) #=e°»095x, 11) #=е°»18*; (см- S3-14,: /) #-1/(х+1), 2) У~\/(х-1), 3) у-1/(0,5х-1), 4) #=1/(7 —х), 5) #=1/(8-0,6х), 6) у- — 1/(10—0,5х); ^ = -^(<^§3.14): /) #~х/(0,2+0,2х), 2) #=1/(0,1+0,2х), 3) y~x/(—0,l+Q,2x), 4) #-х/(-0,2+0,2х); г) y=axb+c: 1) #=1+0,бх0»5, 2) #=1-0,2х°»6 7 *, 3) р=1+0,04х2, 4) #=1+0,08х2, 5) #=1+2х“0»6, 6) #=1+Зх~°»5; д) у=аеРх+с: /) #=2—е~0»69*, 2) #=2—3) #=2—е“0,36А', 4) #=2—е~°>22Х, 5) #—2—е—0,1бх, 6) #=2—е~°»105Х, 7) #=2—е"“0>05х, 8) #=2—е—°»03х, 9) #=2—e““°’01x, 10) #=2—е0»01*, 11) #=2—е0,03*, 12) #=2—е°»05х, 13) #=2—e°’068x, 14) #=2—е°’077х; е) у=а+Ьх+сх2 (см. § 3.03, 3.06): 1) #=5—0,5х+0,1^2, 2) #=»0,1х2, 3) #=9—Зх+0,25х2, 4) #=6+х — 0,15х2, 5) #=4—0,1х—0,01х» 254
у 5 У 3 2 / О г ч з в /я х 255
0 Z ¥ 5 8 /8 1Z т 256
b = (Alj, S X2 - 2 yx2}/^ 2 x2 - 2 x4) = (33,64 • 385— — 18 399,9)/(35.385—25 333) = —5448,5/(—11 858) = = +0,45948, a=Mv—bMt = 33,64—0,45948 • 35 = 17,56. Теоретические значения длины соцветий, вычисленные по уравнению у'= 17,56+0,45948х2, приведены в столбце 7 табл. 3.31. На рис. 27, е видим, что совпадение величин у и у' удовлетворительное. § 3.16. МЕТОД ИЗБРАННЫХ ТОЧЕК Для аппроксимации графоаналитических зависимостей при- меняют методы: 1) наименьших квадратов, 2) моментов, 3) сред- них, 4) избранных точек. Два первых метода обеспечивают прак- тически любую требуемую точность аппроксимации, однако при- менимы далеко не ко всем типам зависимостей из-за отсутствия способов аналитического решения некоторых видов уравнений и их систем. Оба первых метода также довольно трудоемки в от- ношении вычислительной работы. Третий метод занимает про- межуточное положение как по точности аппроксимации, так и по объему вычислений между первыми двумя и четвертым мето- дом. Заметим, однако, что благодаря подробно разработанным алгоритмам [Семендяев, 1933] метод средних более универса- Рис. 29. Формы кривых второй группы сложности л) у=ахь (см. § 3.07): 1) у=2х~\ 2) y—Zx"''1, 3) у=2х~°>5, 4) г/=2х0»24, 5) у=2х°>5, 6) у=2х, 7) г/=2х1»5, 8) у=2х2; х 6) у =----г— + с. ' у а+Ьх 1) у—2 — х/( 1,5+0,4х), 2) t/==2 — х/( 1,5+0,5х), 3) t/=2 — х/( 1,5+0,6х), 4) 0,5+х/(1 +1,5х), £) t/=0,5 + x/(l+х), 6) t/=0,5+x/(l+0,6x); <в) lg y=a + bx-i-cx2; /) lg i/=0,8l—0,36х + 0,03х2, 2) lg t/=0,54—0,24x+0,02x2, 3) lg t/=0,27-0,12* *+0,0lx2, 4) lg y= = 0,135—0.06x+0,005x2, 5) lg у--0,135+0,06x — 0,005x2, 6) lg f/=-0,54 + 0,24x—0,02x2; ________1 . V ~ a2+bx+cx2 1) i/=l/(0,lx2 —x+2,5), 2) i/=l/(0,lx2 — x+2,62), 3) y= 1/(0,lx2 — x+2,7), 4) z/=l/(0,lx2 - *+3), 5) r/=l/(—0,4x2+4x+0,l), 6) t/= l/(—0,lx2 (-x+0,1), 7) y= l/(-0,04x2+0,4x+0,l), 8) y- = l/(-0,01x2 + 0,lx+0,l); <д у —----------7" (CM- § 3.05): * a+bx+cx2 9 J) Z/=x/(O,2—0,lx+0,05x2), 2) f/=x/(0,2—0,lx+0,07x2), 3) у = x/(0,2—0,lx + 0,lx2), 4) r/=x/(0,2— O,lx+O,2x2), 5) !/=x/(0,2—0,lx+0,4x2); . b c e) у — a + — + —- : xx2 j) i/=6-10/x+5/x2, 2) i/=6-10/x+10/x2, 3) t/=6-10/x+15/x2, 4) y~6-\0/x + 20/x2. 257
258
лен по сфере приложения, чем методы моментов и наименьших квадратов. Метод избранных точек наиболее прост по технике вычисли- тельной работы, но в общем случае не гарантирует особой точ- ности. Между тем с появлением ЭВМ с программируемым про- цессом вычислений появились новые возможности использова- ния уже известных вычислительных методов. Дело в том, что эф- фективность, или рентабельность, применения ЭВМ складывает- ся в том числе из соотношения между работой по составлению алгоритма и программированию, с одной стороны, и работой по непосредственному машинному счету — с другой. Чем меньше это отношение, тем эффективнее применяется ЭВМ при прочих рав- ных условиях. Иначе говоря, выгоднее меньше тратить времени и сил на составление алгоритма, если есть возможность адекват- но переложить значительную долю работы на машину, конечно, при равной полноте и точности результатов в обоих случаях. Обычно достичь указанной ситуации удается, упрощая алгоритм за счет увеличения числа вычислительных операций, произво- димых ЭВМ. Таковы, например, некоторые вычислительные про- цедуры, связанные с применением итераций. В отношении к ап- проксимации зависимостей итерации часто применяются в таких процедурах, где коэффициенты уравнений функций находятся способом последовательных улучшений, причем критерием оцен- ки качества приближения величин коэффициентов служит обыч- но дисперсия значений функции или величина ошибки послед- ней. Как только при последовательном уменьшении или увеличе- ние. 30. Формы кривых третьей группы сложности «) У=а+Ь Igx+c lg2x: /) i/=I+lg х+0,1 lg2 х О/ппп^-1 * * * 5 6»5 ПРИ igx=-5), 2) t/=4+Ig x-0,01 lg2 x (ym[n=-24 при lg x=-50), 3) z/=l+0,2 lg x+0,3 lg2 x, 4) y=A - lg x + lg2 x, 5) y—\ - Ig x+0,5 lg2 x; <5) f/2=a-]-&x4-cx2: /) i/2=0,lx2 — x+2,51, 2) 1/2=0,lx2 — x+2,7, 5) i/2-0,lx2 — x+3,5, 4) i/2=0,01x2 - 0,lx+0,3, 5) 1/2=4 — x + 0,05x2, 6) f/2=4,9 — x + 0,05x2, 7) t/2=0,25+x — 0,lx2, 8) j/2-0,05+0,5x — 0,05x»t 9) f/2=0,05+0,lx — O.Olx2; e) y—axbo.cx (cm. § 3.08): /) £/=l,5x1»5e~°»92x, 2) t/=3x2e“°’069x, 3) f/=3x”2e°’41x, 4) y~—0,5x1’5e°»29x; г) y—a^bxC: /) r/=2,0e-°’023*2, 2) i/=I,6e-°’046x1,7, 3) z/=l,2e-°>069x1’5, 4) г/=1,Ое“0’092х1,36, 5) r/=0,8e~°’115x1’24, 6) f/=0,6e~°»138x1,12; </) у—аеь&СХ (см. § 3.10): n _ л -|pO,3X a —n — — —o *pO,4X /) r/=e°»ie 9 2) #=e°’ie , 3) 9 4) y=5e 0,ie , <5) y—oe °>ie 9 6) f/=5e °»ie , 7) #=10e &e , 8) r/=10e &e 9 9) z/=10e &e ; e) y=a+bx^ce^x: /) ^=0,5+x-0,01ex, 2) i/=0,5+x-0,001ex, 3) z/=0,5-fx, 4) y==0,5+x+0,00Iex, 5) y~0,5+x+0,01xe 259
Рис. 31. Формы кривых четвертой группы сложности а) у—аеЬх+се^х: /) y=e~x~e~^xt 2) у=е~х—0,ое~5х, 3) у=е~х, 4) z/=e“'x4-0,5e~’5A:, 5) ^=е“А'+е“2х; б) у~еах (с cos bx+d sin bx): /) ^=eO.oix 0 5 cos o.lx-0,5 sin 0,lx), 2) r/=e~°»2x*(l,5 cos 0,5x-0,5 sin 0,5x), 3) г/==е“°’1Х (0,6 cos 0,1x4-0,8 sin 0,lx), 4) r/=e°»lx (0,2 cos 0,3x~0,l sin 0,3x), 5) jy=e0’02x (0,4 cos 0,16x4-0,17 sin 0,16x), 6) y—0,5e~°’lx sin x; в) y=axb+cx: /) i/=2x°’l-x0’2, 2) z/~3x°>5—2,2x0»6, 3) z/=2,3x°’8-2x0»85, 4) z/=O,lx°>14-O,5x0’2, 5) z/—0,33x—0,0012x8, 6) r/=0,25x°’5+0,05x°’8; г) i/=a + 6x+cx2+dx34-... (см. § 3 04, 3.06): 1) y= 1—0, lx, 2) y-l—0.1X+0.01X2, 3) t/= 1—0, lx 4-0,0 lx2—0,00 lx3, 4) y= 1—0,lx+0,01 x2— 0,001x34-0,0001x4, 5) r/=l—0,1 x 4-0,0 lx2—0,00 lx4 4-0,000 lx4—0,0000 lx5, 6) i/=l—0,lx4-0,01x2— 0,001 x34- 0,0001 x4—0,00001 x5 4- 0,000001 x6 нии величины первого коэффициента дисперсия функции переста- ет уменьшаться, переходят поочередно таким же образом к еле* дующим коэффициентам, а затем процедура может повториться нужное число раз до тех пор, когда при начале увеличения или уменьшения каждого коэффициента дисперсия функции будет 260
только увеличиваться. На этом вычисления коэффициентов за- канчиваются. Недостаток описанного способа итераций заклю- чается в том, что исходные значения коэффициентов могут быть заданы с большими отклонениями и потребуется слишком много машинного времени для их уточнения. Сократить время расче- тов при этом можно двумя способами: оперативно изменяя шаг итераций и (или) задавая в качестве исходных величин прибли- женно найденные, например по способу избранных точек, значе- ния коэффициентов уравнения. В последнем случае весьма по- лезны модельные графики кривых, построенные по уравнениям с различными величинами коэффициентов и позволяющие понять закон изменения формы кривой в зависимости от изменения ве- личины коэффициентов ее уравнения. Наиболее полный сборник таких графиков различных кривых, составленный К. А. Семен- дяевым [1933], в настоящее время стал библиографической ред- костью, поэтому в данном параграфе приводится большинство модельных графиков (рис. 28—31) из этого издания. Сравнивая эмпирическую кривую исследуемого явления с этими графиками, можно подобрать тип кривой и подходящее уравнение для ее ап- проксимации методом избранных точек, или итераций. Опреде- лить коэффициенты уравнений некоторых из функций, показан- ных на рис. 28—31, можно также по способам, приведенным в параграфах, номера которых указаны в подписях к этим рисун- кам.
ПРИЛОЖЕНИЕ 1 Таблица 1П. Число классов в зависимости от объема выборки Объем выборки N Число классов k Объем выборки N Число классов k 40—60 6-8 100—200 9—12 60—100 7—10 200—500 и больше 12—17 Таблица 2П. Значения критериев и на уровнях значимости 0,01 (верхнее число) и 0,05 (нижнее число) * fyv (1) N (1) лг <^(1) 4 0,991 0,955 13 0,520 0,410 22 0,414 0,320 5 0,916 0,807 14 0,502 0,395 23 0,407 0,314 6 0,805 0,689 15 0,486 0,381 24 0,400 0,309 7 0,740 0,610 16 0,472 0,369 25 0,394 0,304 8 0,683 0,554 17 0,460 ' 0,359 26 0,389 0,299 9 0,635 0,512 18 0,449 0,349 27 0,383 0,295 10 0,597 0,477 19 0,439 0,341 28 0,378 0,291 И 0,566 0,450 20 0,430 0,334 29 0,374 0,287 12 0,541 0,428 21 0,421 0,327 30 0,369 0,283 • Если вычисленные значения bN или Oi превышают табличные, то варианта отбрасывается* 1 Таблицы приложения, кроме 5П 9П, заимствованы из источников, указанных в списке литературы. 262 .
Таблица ЗП. Критические значения разности между двумя крайними вариантами совокупности Объем сово- купно- сти N Уровни значимости Объем сово- купно- сти N Уровни значимости 0,10 0,05 0,01 0,005 0,10 0,05 0,01 0,005 2 2,33 2,77 3,64 3,97 80 0,83 1,04 1,50 1,70 3 1,79 2,17 2,90 3,20 90 0,82 1,03 1,50 1,67 10 1,18 1,46 2,03 2,27 100 0,81 1,02 1,47 1,57 20 1,03 1,27 1,80 2,00 200 0,75 0,95 1,38 1,55 30 0,96 1,20 1,70 1,90 300 0,72 0,91 1,32 1,50 40 0,91 1,15 1,63 1,85 400 0,70 0,88 1,30 1,47 50 0,88 1,11 1,60 1,80 500 0,68 0,87 1,28 1,45 60 0,86 1,08 1,57 1,76 1000 0,65 0,83 1,22 1,40 70 0,84 1,06 1,53 1,72 Таблица 4П. Значения критерия Стьюдента t Число степеней свободы V Доверительные уровни Число степеней свободы V Доверительные уровни р1=95% Р2=99% Р3=99,9% р'=0,95 Р2=0,99 Р3=0,999 Pi=95% Р*=0,95 />=99% Р'-О,99 />8=99,9% Рз=0,999 1 12,706 63,657 — 2 4,303 9,925 31,598 3 3,182 5,841 12,941 4 2,776 4,604 8,610 5 2,571 4,032 6,859 6 2,447 3,707 5,959 7 2,365 3,499 5,405 8 2,306 3,355 5,041 9 2,262 3,250 4,781 10 2,228 3,169 4,587 11 2,201 3,106 4,437 12 2,179 3,055 4,318 13 2,160 3,012 4,221 14 2,145 2,977 4,140 15 2,131 2,947 4,073 16 2,120 2,921 4,015 17 2,110 2,898 3,965 18 2,101 2,878 3,922 19 2,093 2,861 3,883 20 2,086 2,845 3,850 21 2,080 2,831 3,819 22 2,074 2,819 3,792 23 2,069 2,807 3,767 24 2,064 2,797 3,745 25 2,060 2,787 3,725 26 2,056 2,779 3,707 27 2,052 2,771 3,690 28 2,048 2,763 3,674 29 2,045 2,756 3,659 30 2,042 2,750 3,646 35 2,030 2,724 3,591 40 2,021 2,704 3,551 45 2,014 2,690 3,520 50 2,008 2,678 3,496 55 2,004 2,669 3,476 60 2,000 2,660 3,460 70 1,994 2,648 3,435 80 1,989 2,638 3,416 90 1,986 2,631 3,402 100 1,982 2,625 3,390 120 1,980 2,617 3,373 >120 1,960 2,5758 3,2905 ^1=5%, или W\=0,05 №s=l%, или №'=0,01 СО ' со II § II О S -° S £ Уровни значимости 263 '
Таблица 5П. Перевод календарных дат в непрерывный ряд Месяцы III IV V VI VII VIII IX X XI XII I п 1 32 62 93 123 154 185 215 246 276 307 338 2 33 63 94 124 155 186 216 247 277 308 339 3 34 64 95 125 156 187 217 248 278 309 340 4 35 65 96 126 157 188 218 249 279 310 341 5 36 66 97 127 158 189 219 250 280 311 342 6 37 67 98 128 159 190 220 251 281 312 343 7 38 68 99 129 160 191 221 252 282 313 344 8 39 69 100 130 161 192 222 253 283 314 345 9 40 70 101 131 162 193 223 254 284 315 346 10 41 71 102 132 163 194 224 255 285 316 347 11 42 72 103 133 164 195 225 256 286 317 348 12 43 73 104 134 165 196 226 257 287 318 349 13 44 74 105 135 166 197 227 258 288 319 350 14 45 75 106 136 167 198 228 259 289 320 351 15 46 76 107 137 168 199 229 260 290 321 352 16 47 77 108 138 169 200 230 261 291 322 353 17 48 78 109 139 170 201 231 262 292 323 354 18 49 79 110 140 171 202 232 263 293 324 355 19 50 80 111 141 172 203 233 264 294 325 356 20 51 81 112 142 173 204 234 265 295 326 357 21 52 82 113 143 174 205 235 266 296 327 358 22 53 83 114 144 175 -206 236 267 297 328 359 23 54 84 115 145 176 207 237 268 298 329 360 24 55 85 116 146 177 208 238 269 299 330 361 25 56 86 117 147 178 209 239 270 300 331 362 26 57 87 118 148 179 210 240 271 301 332 363 27 58 88 119 149 180 211 241 272 302 333 364 28 59 89 120 150 181 212 242 273 303 334 365 29 60 90 121 151 182 213 243 274 304 335 (366) 30 61 91 122 152 183 214 244 275 305 336 — 31 — 92 — 153 184 — 245 — 306 337 ___ 264
Таблица 6П. Значения коэффициента h для приближенного определения среднего квадратического отклонения Объем выборки N h Объем выборки N h Объем выборки h 2 1,1 6 2,5 15—30 4,0 3 1,1 7 2,7 30—200 5,0 4 2,1 9 3,0 200—1000 6,0 5 2,3 15 3,5 >1000 7,0 Таблица 7П. Значения критерия Стьюдента для односторонней оценки гипотез Число степеней свободы V Доверительные уровни Число степеней свободы V Доверительные уровни 95% 99% 99,9% 95% 99% 99,9% 1 6,31 31,82 318,31 18 1,73 2,55 3,61 2 2,92 6,97 22,33 19 1,73 2,54 3,58 3 2,35 4,54 10,21 20 1,73 2,53 3,55 4 2,13 3,75 7,17 21 1,72 2,52 3,53 5 2,01 3,37 5,89 22 1,72 2,51 3,51 6 1,94 3,14 5,21 23 1,71 2,50 3,49 7 1,89 3,00 4,79 24 1,71 2,49 3,47 8 1,86 2,90 4,50 25 1,71 2,49 3,45 9 1,83 2,82 4,30 26 1,71 2,48 3,44 10 1,81 2,76 4,14 27 1,70 2,47 3,42 И 1,80 2,72 4,03 28 1,70 2,47 3,41 12 1,78 2,68 3,93 29 1,70 2,46 3,40 13 1,77 2,65 3,85 30 1,70 2,46 3,39 14 1,76 2,62 3,79 40 1,68 2,42 3,31 15 1,75 2,60 3,73 60 1,67 2,39 3,23 16 1,75 2,58 3,69 120 1,66 2,36 3,17 17 1,74 2,57 3,65 ОС 1,64 2,33 3,09 * Г. Н. Зайцев 265
266 Таблица 8П. Значения критерия F' V (1) V (2) 2 3 4 5 6 8 12 16 24 50 П [ри Р± = 9J □% 1 161,4 199,5 215,7 224,6 230,2 234,0 238,9 243,9 246,5 249,0 251,8 254,3 2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,43 19,45 19,47 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,69 8,64 8,58 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,84 5,77 5,70 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,60 4,53 4,44 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,92 3,84 3,75 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,49 3,41 3,32 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,20 3,12 3,03 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,98 2,90 2,80 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,82 2,74 2,64 2,54 И 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,70 2,61 2,50 2,40 12 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,60 2,50 2,40 2,30 13 4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,51 2,42 2,32 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,44 2,35 2,24 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,39 2,29 2,18 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,33 2,24 2,13 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,29 2,19 2,08 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,25 2,15 2,04 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,21 2,11 2,00 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,18 2,08 1,96 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,15 2,05 1,93 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,13 2,03 1,91 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,11 2,00 1,88 1,76 24 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 2,09 1,98 1,86 1,73
Таблица 8П (продолжение) V (1) v (2) 1 2 3 4 5 6 8 12 16 24 50 оо При Pt = 95% 25 4 24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 2,07 1,96 1,84 1,71 26 4 22 3 37 2,98 2,74 2,59 2,47 2,32 2,15 2,05 1,95 1,82 1,69 27 4’21 з’зб 2,96 2,73 2,57 2,46 2,30 2,13 2,03 1,93 1,80 1,67 28 4 20 3,34 2,95 2,71 2,56 2,44 2,29 2,12 2,02 1,91 1,78 1,65 29 4 18 3 33 2,93 2,70 2,54 2,43 2,28 2,10 2,00 1,90 1,77 1,64 30 4 17 332 2,92 2,69 2,53 2,42 2,27 2,09 1,99 1,89 1,76 1,62 35 412 3^26 2,87 2,64 2,48 2,37 2,22 2,04 1,94 1,83 1,70 1,57 40 4 08 3,23 2,84 2,61 2,45 2,34 2,18 2,00 1,90 1,79 1,66 1,51 45 4 06 3,21 2,81 2,58 2,42 2,31 2,15 1,97 1,87 1,76 1,63 1,48 Q 50 4*03 3,18 2,79 2,56 2,40 2,29 2,13 1,95 1,85 1,74 1,60 1,44 60 4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,81 1,70 1,56 1,39 70 3,98 3,13 2,74 2,50 2,35 2,23 2,07 1,89 1,79 1,67 1,53 1,35 80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,88 1,77 1,65 1,51 1,32 90 3,95 3,10 2,71 2,47 2,32 2,20 2,04 1,86 1,76 1,64 1,49 1,30 100 3,94 3,09 2,70 2,46 2,30 2,19 2,03 1,85 1,75 1,63 1,48 1,28 125 3,92 3,07 2,68 2,44 2,29 2.17 2,01 1,83 1,72 1,60 1,45 1,25 150 3,90 3,06 2,66 2,43 2,27 2,16 2,00 1,82 1,71 1,59 1,44 1,22 200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,80 1,69 1,57 1,42 1,19 300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79 1,68 1,55 1,39 1,15 400 3,86 3,02 2,63 2,40 2,24 2,12 1,96 1,78 1,67 1,54 1,38 1,13 500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,66 1,54 1,38 1,11 1000 3 85 3 00 2,61 2,38 2,22 2,10 1,95 1,76 1,65 1,53 1,36 1,08 Т 3,84 2’99 2:60 2^7 2:21 2,09 1,94 1,75 1,64 1,52 1,35 1,00 ч> * ______ 1—
Таблица 8П (продолжение) V (1) V (2) 1 2 3 4 5 6 8 12 16 24 50 оо При Р2 = 99% 1 4052 4999 5403 5625 5764 5859 5981 6106 6169 6234 6302 6366 2 98,49 99,00 99,17 99,25 99,30 99,33 99,36 99,42 99,44 99,46 99,48 99,50 3 34,12 30,81 29,46 28,71 28,24 27,91 27,49 27,05 26,83 26,60 26,35 26,12 4 21,20 18,00 16,69 15,98 15,52 15,21 14,80 14,37 14,15 13,93 13,69 13,46 5 16,26 13,27 12,06 11,39 10,97 10,67 10,29 9,89 9,68 9,47 9,24 9 02 6 13,74 10,92 9,78 9,15 8,75 8,47 8,10 7,72 7,52 7,31 7,09 6,88 7 12,25 9,55 8,45 7,85 7,46 7,19 6,84 6,47 6,27 6,07 5,85 5,65 8 11,26 8,65 7,59 7,01 6,63 6,37 6,03 5,67 5,48 5,28 5,06 4,86 g 9 Ю-56 8,02 6,99 6,42 6,06 5,80 5,47 5,11 4,92 4,73 4,51 4,31 оо 10 10,04 7,56 6,55 5,99 5,64 5,39 5,06 4,71 4,52 4,33 4,12 3,91 11 9.65 7,20 6,22 5,67 5,32 5,07 4,74 4,40 4,21 4,02 3,80 3^60 12 9.33 6,93 5,95 5,41 5,06 4,82 4,50 4,16 3,98 3,78 3,56 3^36 13 9>07 6,70 5,74 5,20 4,86 4,62 4,30 3,96 3,78 3,59 3,37 3,16 14 8,86 6,51 5,56 5,03 4,69 4,46 4,14 3,80 3,62 3,43 3,21 3,00 15 8>68 6,36 5,42 4,89 4,56 4,32 4,00 3,67 3,48 3,29 3,07 2,87 16 8,53 6,23 5,29 4,77 4,44 4,20 3,89 3,55 3,37 3,18 2,96 2,75 17 М° 6,11 5,18 4,67 4,34 4,10 3,79 3,45 3,27 3,08 2,86 2,65 18 8>28 6,01 5,09 4,58 4,25 4,01 3,71 3,37 3,20 3,00 2,79 2,57 19 8>18 5,93 5,01 4,50 4,17 3,94 3,63 3,30 3,12 2,92 2,70 2,49 29 840 5,85 4,94 4,43 4,10 3,87 3,56 3,23 3,05 2,86 2,63 2,42 21 8>02 5,78 4,87 4,37 4,04 3,81 3,51 3,17 2,99 2,80 2,58 2,36 22 7.94 5,72 4.82 4,31 3,99 3,76 3,45 3,12 2,94 2,75 2,53 2,31 23 7,88 5,66 4,76 4,26 3,94 3,71 3,41 3,07 2,89 2,70 2,48 2,26 24 7>82 5,61 4,72 4,22 3,90 3,67 3,36 3,03 2,85 2,66 2,44 2,21
269 Таблица 8П (продолжение) V (1) V (2) 1 2 3 4 5 6 8 12 16 24 50 оо 25 7,77 5,57 4,68 4,18 При Р2 = 99% 3,86 3,63 3,32 2,99 2,81 2,62 2,40 2,17 26 7,72 5,53 4,64 4,14 3,82 3,59 3,29 2,96 2,78 2,58 2,36 2,13 27 7,68 5,49 4,60 4,11 3,78 3,56 3,26 2,93 2,74 2,55 2,33 2,10 28 7,64 5,45 4,57 4,07 3,75 3,53 3,23 2,90 2,71 2,52 2,30 2,06 29 7,60 5,42 4,54 4,04 3,73 3,50 3,20 2,87 2,68 2,49 2,27 2,03 30 7,56 5,39 4,51 4,02 3,70 3,47 3,17 2,84 2,66 2,47 2,24 2,01 35 7,42 5,27 4,40 3,91 3,59 3,37 3,07 2,74 2,56 2,37 2,13 1,90 40 7,31 5,18 4,31 3,83 3,51 3,29 2,99 2,66 2,48 2,29 2,05 1,80 45 7,23 5,11 4,25 3,77 3,45 3,23 2,94 2,61 2,43 2,23 1,99 1,75 50 7,17 5,06 4,20 3,72 3,41 3,19 2,89 2,56 2,38 2,18 1,94 1,68 60 7,08 4,98 4,13 3,65 3,34 3,12 2,82 2,50 2,32 2,12 1,87 1,60 70 7,01 4,92 4,07 3,60 3,29 3,07 2,78 2,45 2,28 2,07 1,82 1,53 80 6,96 4,88 4,04 3,56 3,26 3,04 2,74 2,42 2,24 2,03 1,78 1,49 90 6,92 4,85 4,01 3,53 3,23 3,01 2,72 2,39 2,21 2,00 1,75 1,45 100 6,90 4,82 3,98 3,51 3,21 2,99 2,69 2,37 2,19 1,98 1,73 1,43 125 6,84 4,78 3,94 3,47 3,17 2,95 2,66 2,33 2,15 1,94 1,69 1,37 150 6,81 4,75 3,91 3,45 3,14 2,92 2,63 2,31 2,13 1,92 1,66 1,33 200 6,76 4,71 3,88 3,41 3,11 2,89 2,60 2,28 2,09 1,88 1,62 1,28 300 6,72 4,68 3,85 3,38 3,08 2,86 2,57 2,24 2,06 1,85 1,59 1,22 400 6,70 4,66 3,83 3,37 3,06 2,85 2,56 2,23 2,04 1,84 1,57 1,19 500 6,69 4,65 3,82 3,36 3,05 2,84 2,55 2,22 2,03 1,83 1,56 1,16 1000 6,66 4,63 3,80 3,34 3,04 2,82 2,53 2,20 2,01 1,81 1,54 1,11 ос 6,64 4,60 3,78 3,32 3,02 2,80 2,51 2,18 1,99 1,79 1,52 1,00
270 Таблица 8П (продолжение) V (1) V (2) 1 2 3 4 5 6 8 12 24 ОО 1 405 284 500 000 540 379 При Р3 = 99,9% 562 500 576405 585937 598144 610 667 623 497 636 619 2 998,5 999,0 999,2 999,2 999,3 999,3 999,4 999,4 999,5 999,5 3 167,5 148,5 141,1 137,1 134,6 132,8 130,6 128,3 125,9 123,5 4 74,14 61,25 56,18 53,44 51,71 50,53 49,00 47,41 45,77 44,05 5 47,04 36,61 33,20 31,09 29,75 28,84 27,64 26,42 25,14 23,78 6 35,51 27,00 23,70 21,90 20,81 20,03 19,03 17,99 16,89 15,75 7 29,22 21,69 18,77 17,19 16,21 15,52 14,63 13,71 12,73 11,69 8 25,42 18,49 15,83 14,39 13,49 12,86 12,04 11,19 10,30 9,34 9 22,86 16,39 13,90 12,56 11,71 11,13 10,37 9,57 8,72 7,81 10 21,04 14,91 12,55 . 11,28 10,48 9,92 9,20 8,45 7,64 6,76 И 19,69 13,81 11,56 10,35 9,58 9,05 8,35 7,63 6,85 6,00 12 18,64 12,97 10,80 9,63 8,89 8,38 7,71 7,00 6,25 5,42 13 17,81 12,31 10,21 9,07 8,35 7,86 7,21 6,52 5,78 4,97 14 17,14 11,78 9,73 8,62 7,92 7,43 6,80 6,13 5,41 4,60 15 16,59 11,34 9,34 8,25 7,57 7,09 6,47 5,81 5,10 4,31 16 16,12 10,97 9,00 7,94 7,27 6,81 6,19 5,55 4,85 4,06 17 15,72 10,66 8,73 7,68 7,02 6,56 5,96 5,32 4,63 3,85 18 15,38 10,39 8,49 7,46 6,81 6,35 5,76 5,13 4,45 3,67 19 15,08 10,16 8,28 7,26 6,61 6,18 5,59 4,97 4,29 3,52 20 14,82 9,95 8,10 7,10 6,46 6,02 5,44 4,82 4,15 3,38 21 14,59 9,77 7,94 6,95 6,32 5,88 5,31 4,70 4,03 3,26 22 14,38 9,61 7,80 6,81 6,19 5,76 5,19 4,58 3,92 3,15 23 14,19 9,47 7,67 6,69 6,08 5,65 5,09 4,48 3,82 3,05 24 14,03 9,34 7,55 6,59 5,98 5,55 4,99 4,39 3,74 2,97
Таблица 8П (окончание) V (1) V (2) 1 2 3 4 5 6 8 12 24 оо При Р3 = 99,9% 25 13,88 9,22 7,45 6,49 5,88 5,46 4,91 4,31 3,66 2,89 26 13,74 9,12 7,36 6,41 5,80 5,38 4,83 4,24 3,59 2,82 27 13,61 9,02 7,27 6,33 5,73 5,31 4,76 4,17 3,52 2,75 28 13,50 8,93 7,19 6,25 5,66 5,24 4,69 4,11 3,46 2,70 29 13,39 8,85 7,12 6,19 5,59 5,18 4,64 4,05 3,41 2,64 30 13,29 8,77 7,05 6,12 5,53 5,12 4,58 4,00 3,36 2,59 40 12,61 8,25 6,60 5,70 5,13 4,73 4,21 3,64 3,01 2,23 60 11,97 7,76 6,17 5,31 4,76 4,37 3,87 3,31 2,69 1,90 •о 120 11,38 7,31 5,79 4,95 4,42 4,04 3,55 3,02 2,40 1,56 - =0 10,83 6,91 5,42 4,62 4,10 3,74 3,27 2,74 2,13 1,00 Таблица 9П. Минимальное число наблюдений в зависимости от варьирования данных при доверительном уровне PY — 95% и показателе точности 5% Коэффициент вариации и, % 0 1 2 3 4 5 ь 7 8 9 0 5 5 5 5 5 5 6 8 10 12 10 15 19 22 26 30 35 39 44 50 55 20 61 68 74 81 89 96 104 112 121 129 30 138 148 157 167 178 188 199 210 222 234 40 246 258 271 284 298 311 325 340 354 369 50 384 400 416 432 448 465 482 499 517 535 60 553 572 591 610 630 649 670 690 711 732
ZLZ Таблица 10П. Показательная функция е~х (нуль целых опущен) X 0 1 2 3 4 5 6 7 8 9 0,00 1, 9990 9980 9970 9960 9950 9940 9930 9920 9910 0,0 1, 9900 9802 9704 9608 9512 9418 9324 9231 9139 1 9048 8958 8869 8781 8694 8607 8521 8437 8353 8270 2 8187 8106 8025 7945 7866 7788 7711 7634 7558 7483 3 7408 7334 7261 7189 7118 7047 6977 6907 6839 6771 4 6703 6637 6570 6505 6440 6376 6313 6250 6188 6126 0,5 6065 6005 5945 5886 5827 5769 5712 5655 5599 5543 6 5488 5434 5379 5326 5273 5220 5169 5117 5066 5016 7 4966 4916 4868 4819 4771 4724 4677 4630 4584 4538 8 4493 4449 4404 4360 4317 4274 4232 4190 4148 4107 9 4066 4025 3985 3946 3906 3867 3829 3791 3753 3716 1, 3679 3329 3012 2725 2466 2231 2019 1827 1653 1496 2, 1353 1225 1108 1003 0907 0821 0743 0672 0608 0550 3, 0498 0450 0408 0369 0334 0302 0273 0247 0224 0202 4, 0183 0166 0150 0136 0123 0111 0100 0091 0082 0074 5, 0067 0061 0055 0050 0045 0041 0037 0034 0030 0027 6, 0025 0022 0020 0018 0017 0015 0014 0012 ООН 0010 7, 0009 0008 0007 0007 0006 0006 0005 0005 0004 0004 8, 0003 0003 0003 0002 0002 0002 0002 0002 0002 0001 9, 0001 0001 0001 0001 0001 0001 0001 0001 0001 0000
Таблица 11П. Значения функции ф (t) = О,39894/(е0’6*2) (перед числами в таблице надо поставить О,) t 0 1 2 3 4 5 6 7 8 9 0,0 39894 39892 39886 39876 39862 39844 39822 39797 39767 39733 0,1 39695 39654 39608 39559 39505 39448 39387 39322 39253 39181 0,2 39104 39024 38940 38853 38762 38667 38568 38466 38361 38251 0,3 38139 38023 37903 37780 37654 37524 37391 37255 37115 36973 0,4 36827 36678 36526 36371 36213 36053 35889 35723 35553 35381 0,5 35207 35029 34849 34667 34482 34294 34105 33912 33718 33521 0,6 33322 33121 32918 32713 32506 32297 32086 31874 31659 31443 0,7 31225 31006 30785 30563 30339 30114 29887 29659 29430 29200 0,8 28969 28737 28504 28269 28034 27798 27562 27324 27086 26848 0,9 26609 26369 26129 25888 25647 25406 25164 24923 24681 24439 1,0 24197 23955 23713 23471 23230 22988 22747 22506 22265 22025 1,1 21785 21546 21307 21069 20831 20594 20357 20121 19886 19652 1,2 19419 19186 18954 18724 18494 18265 18037 17810 17585 17360 1,3 17137 16915 16694 16474 16256 16038 15822 15608 15395 15183 1,4 14973 14764 14556 14350 14146 13943 13742 13542 13344 13147 1,5 12952 12758 12566 12376 12188 12001 11816 11632 11450 11270 1,6 11092 10915 10741 10567 10396 10226 10059 09893 09728 09566 1,7 09405 09246 09089 08938 08780 08628 08478 08329 08183 08038 1,8 07895 07754 07614 07477 07341 07206 07074 06943 06814 06687 1,9 06562 06438 06316 06195 06077 05959 05844 05730 05618 05508 2,0 05399 05292 05186 05082 04980 04879 04780 04682 04586 04491 2,1 04398 04307 04217 04128 04041 03955 03871 03788 03706 03626 2,2 03547 03470 03394 03319 03246 03174 03103 03034 02965 02898 2,3 02833 02768 02705 02643 02582 02522 02463 02406 02349 02294 2,4 02239 02186 02134 02083 02033 01984 01936 01888 01842 01797 2,5 01753 01709 01667 01625 01585 01545 01506 01468 01431 01394 2,6 01358 01323 01289 01256 01223 01191 01160 01130 01100 01071 2,7 01042 01014 00987 00961 00935 00909 00885 00861 00837 00814 2,8 00792 00770 00748 00727 00707 00687 00668 00649 00631 00613 2,9 00595 00578 00562 00545 00530 00514 00499 00485 00470 00457 3,0 00443 00430 00417 00405 00393 00381 00370 00358 00348 00337 3,1 00327 00317 00307 00298 00288 00279 00271 00262 00254 00246 3,2 00238 00231 00224 00216 00210 00203 00196 00190 00184 00178 3,3 00172 00167 00161 00156 00151 00146 00141 00136 00132 00127 3,4 00123 00119 00115 00111 00107 00104 00100 00097 00094 00090 3,5 00087 00084 00081 00079 00076 00073 00071 00068 00066 00063 3,6 00061 00059 00057 00055 00053 00051 00049 00047 00046 С0044 3,7 00042 00041 00039 00038 00037 00035 00034 00033 00031 00030 3,8 00029 00028 00027 00026 00025 00024 00023 00022 00021 00021 3,9 00020 00019 00018 00018 00017 00016 00016 00015 00014 00014 4,0 00013 00009 00006 00004 00002 00002 00001 00001 00000 00000 27Я
Таблица 12П. Функция Ф(х) нормированного нормального распределения (перед числами в таблице поставить О,) X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 50000 50399 50798 51197 51595 51994 52392 52790 53188 53586 0,1 53983 54379 54776 55172 55567 55962 56356 56749 57142 57535 0,2 57926 58317 58706 59095 59483 59871 60257 60642 61026 61409 0,3 61791 62172 62552 62930 63307 63683 64058 64431 64803 65173 0,4 65542 65910 66276 66640 67003 67364 67724 68082 68439 68793 0,5 69146 69497 69847 70194 70540 70884 71226 71566 71904 72240 0,6 72575 72907 73237 73565 73891 74215 74537 74857 75175 75490 0,7 75804 76115 76424 76730 77035 77337 77637 77935 78230 78524 0,8 78814 79103 79389 79673 79955 80234 80511 80785 81057 81327 0,9 81594 81859 82121 82381 82639 82894 83147 83398 83646 83891 1,0 84134 84375 84614 84849 85083 85314 85543 85769 85993 86214 1,1 86433 86650 86864 87076 87286 87493 87698 87900 88100 88298 1,2 88493 88686 88877 89065 89251 89435 89616 89796 89973 90147 1,3 90320 90490 90658 90824 90988 91149 91309 91466 91621 91774 1,4 91924 92073 92220 92364 92507 92647 92786 92922 93056 93189 1,5 93319 93448 93574 93699 93822 93943 94062 94179 94295 94408 1,6 94520 94630 94738 94845 94950 95053 95154 95254 95352 95449 1,7 95543 95637 95728 95818 95907 95994 96080 96164 96246 96327 1,3 96407 96485 96562 96638 96712 96784 96856 96926 96995 97062 1,9 97128 97193 97257 97320 97381 97441 97500 97558 97615 97670 2,0 97725 97778 97831 97882 97932 97982 98030 98077 98124 98169 2,1 98214 98257 98300 98341 98382- 98422 98461 98500 98537 98574 2,2 98610 98645 98679 98713 98745 98778 98809 98840 98870 98899 2,3 98928 98956 98983 99010 99036 99061 99086 99111 99134 99158 2,4 99180 99202 99224 99245 99266 99286 99305 99324 99343 99361 2.5 99379 99396 99413 99430 99446 99461 99477 99492 99506 99520 2,6 99534 99547 99560 99573 99585 99598 99609 99621 99632 99643 2,7 99653 99664 99674 99683 99693 99702 99711 99720 99728 99736 2,8 99744 99752 99760 99767 99774 99781 99788 99795 99801 99807 2,9 99813 99819 99825 99830 99836 99841 99846 99851 99856 99860 X 0,0 0,1 0,2 о,з 0,4 0,5 0,6 0,7 0,8 0,9 з,о 99865 99903 99931 99952 99966 99977 99984 99989 99993 99995 274
ООООООООООООООООООООООООООООООООООООООООООООООООООО 0с000^0эсл^соьэ^0000^05сл4^соь5^0000-<1<35сл4>'00с0н^0с000--]<35сл»^001\э^0000--]<35сл>&*с0|\э>-^0 ?l* OOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOO^H-^^h-^b^ н- bojss О ОО Н* lolo ЬО ГО СО СО СО СО £ч 4S СП СП СП СП О О 1 00 00 000 со "со О О^ ^toto OOOW ОООСЛОООООСЛОООСОСЛОО^ОООО^£ч —lOtOCHOOi-^^-^H^^^lb-^^OObOCnCO^OOCOOOOOOOttN^OOCndSCnOOCnW p px OOOO^^^^t0l0[0t0WC0WC04S^jX4SCCnQia>QO4^l^JOOOOQOOOOOO^^LOtOCO^^CnO-^lOOOtOO otocn-<iotocn,<iooocnooocooooH^rf^05cococnoo^4is~q04^^o>i>*^jH^cncocoooto--]toooooo^Jcn>i>*4>'^JCocoo co =3 OOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOH^^^H^^b^h^i-^^i^h^i^^tOtOtO OOOO^^-^A-tOtOtOtOWWWW^^Js^OlUlClQOO-J^l-^OOOOOOCOCOCOOO^^tOtOCOCOjSCnO^lOOOLOOO ^WL3 4 0tO(jl4 0N;ul4 0WUiOO^WOOM^COH>4s-.10W^!000<^OiOW^IM-JIO^IWOQrfsCJWOl^OOO OOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOO^^^^^^^^^K^H^^^tOtOto o"o О o'oi^i^'h^i^'tololo CO CO CO CO rts Ц>* СЛ СИ ел о OT> O<1 4^1 OO QOOOQ О to to CO W СЛ Q <1 ОО О tC p- to -1 О M X LO LT Ч О M из CO O W О О M 4S О W О W QOW -1 О rfs 00 to Ч о о to X Cl W to to О CO O1 275 OOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOObb-1-^^i-^^i-^^^^^h^^h^^tOtO
Таблица 13П (окончание) xi iv+I 0 1 2 3 4 5 6 7 8 9 0,51 0,03 0,03 0,03 0,03 0,04 0,04 0,04 0,04 0,05 0,05 0,52 0,05 0,05 0,06 0,06 0,06 0,06 0,07 0,07 0,07 0,07 0,53 0,08 0,08 0,08 0,08 0,09 0,09 0,09 0,09 0,10 0,10 0,54 0,10 0,10 0,11 0,11 0,11 0,11 0,12 0,12 0,12 0,12 0,55 0,13 0,13 0,13 0,13 0,14 0,14 0,14 0,14 0,15 0,15 0,56 0,15 0,15 0,16 0,16 0,16 0,16 0,17 0,17 0,17 0,17 0,57 0,18 0,18 0,18 0,18 0,19 0,19 0,19 0,19 0,20 0,20 0,58 0,20 0,20 0,21 0,21 0,21 0,21 0,22 0,22 0,22 0,23 0,59 0,23 0,23 0,23 0,24 0,24 0,24 0,24 0,25 0,25 0,25 0,60 0,25 0,26 0,26 0,26 0,26 0,27 0,27 0,27 0,27 0,28 0,61 0,28 0,28 0,28 0,29 0,29 0,29 0,30 0,30 0,30 0,30 0,62 0,31 0,31 0,31 0,31 0,32 0,32 0,32 0,32 0,33 0,33 0,63 0,33 0,33 0,34 0,34 0,34 0,35 0,35 0,35 0,35 0,36 0,64 0,36 0,36 0,36 0,37 0,37 0,37 0,37 0,38 0,38 0,38 0,65 0,39 0,39 0,39 0,39 0,40 0,40 0,40 0,40 0,41 0,41 0,66 0,41 0,42 0,42 0,42 0,42 0,43 0,43 0,43 0,43 0,44 0,67 0,44 0,44 0,45 0,45 0,45 0,45 0,46 0,46 0,46 0,46 0,68 0,47 0,47 0,47 0,48 0,48 0,48 0,48 0,49 0,49 0,49 0,69 0,50 0,50 0,50 0,50 0,51 0,51 0,51 0,52 0,52 0,52 0,70 0,52 0,53 0,53 0,53 0,54 0,54 0,54 0,54 0,55 0,55 0.71 0,55 0,56 0,56 0,56 0,57 0,57 0,57 0,57 0,58 0,58 0,72 0,58 0,59 0,59 0,59 0,59 0,60 0,60 0,60 0,61 0,61 0,73 0,61 0,62 0,62 0,62 0,63 0,63 0,63 0,63 0,64 0,64 0,74 0,64 0,65 0,65 0,65 0,66 0,66 0,66 0,67 0,67 0,67 0,75 0,67 0,68 0,68 0,68 0,69 0,69 0,69 0,70 0,70 0,70 0,76 0,71 0,71 0,71 0,72 0,72 0,72 0,73 0,73 0,73 0,74 0,77 0,74 0,74 0,75 0,75 0,75 0,76 0,76 0,76 0,77 0,77 0,78 0,77 0,78 0,78 0,78 0,79 0,79 0,79 0,80 0,80 0,80 0,79 0,81 0,81 0,81 0,82 0,82 0,82 0,83 0,83 0,83 0,84 0,80 0,84 0,85 0,85 0,85 0,86 0,86 0.86 0,87 0,87 0,87 0.81 0,88 0,88 0,89 0,89 0,89 0,90 0,90 0,90 0,91 0,91 о;82 0,92 0,92 0,92 0,93 0,93 0,93 0,94 0,94 0,95 0,95 0,83 0,95 0,96 0,96 0,97 0,97 0,97 0,98 0,98 0,99 0,99 0,84 0,99 1,00 1,00 1,01 1,01 . 1,02 1,02 1,02 1,03 1,03 0,85 1,04 1,04 1,05 1,05 1,05 1,06 1,06 1,07 1,07 1.08 0,86 1,08 1,09 1,09 1,09 1,10 1,10 1,11 1,11 1,12 1,12 0,87 1,13 1,13 1,14 1,14 1,15 1,15 1,16 1,16 1,17 1,17 0,88 1,18 1,18 1,19 1,19 1,20 1,20 1,21 1,21 1,22 1,22 0,89 1,23 1,23 1,24 1,24 1,25 1,25 1,26 1,26 1,27 1,27 0,90 1,28 1,29 1,29 1,30 1,30 1,31 1,32 1,32 1,33 1,33 0,91 1,34 1,35 1,35 1,36 1,37 1,37 1,38 1,39 1,39 1,40 0,92 1,41 1,41 1,42 1,43 1,43 1,44 1,45 1,45 1,46 1,47 0,93 1,48 1,48 1,49 1,50 1,51 1,51 1,52 1,53 1,54 1,55 0,94 1,55 1,56 1,57 1,58 1,59 1,60 1,61 1,62 1,63 1,64 0,95 1,64 1,65 1,66 1,67 1,68 1,70 1,71 1,72 1,73 1,74 0,96 1,75 1,76 1,77 1,79 1,80 1,81 1,83 1,84 1,85 1,87 0,97 1,88 1,90 1,91 1,93 1,94 1,96 1,98 2,00 2,01 2,03 0,98 2,05 2,07 2,10 2,12 2,14 2,17 2,20 2,23 2,26 2,29 0,99 2,33 2,37 2,41 2,46 2.51 2,58 2,65 2,75 2,88 3,09 276
Таблица 14П. Арифметический треугольник п Коэффициенты долей частных групп при р=0,5 2 1 — 1 1—2 — 1 0,25 3 1 — з _ з _ 1 0,125 4 I _ 4 _ 6 _ 4 _ 1 0,0625 5 1 — 5—10—10 — 5—1 0,03125 6 1 -6—15 — 20—15 — 6 — 1 0,015625 7 1 — 7 — 21 — 35 — 35 — 21 — 7 — 1 0,0078125 8 1 - 8 — 28 — 56 — 70 — 56 — 28 — 8 — 1 0,00390625 9 1 _ 9 _ 36 — 84 —126— 126 — 84 — 36 — 9 — 1 0,001953125 10 1—Ю— 45 —120 — 210—252 — 210 — 120 — 45 — 10 — 1 0,0009765625 Примечание. Таблицу можно легко продолжить до любого п, складывая два рядом стоящих числа строки и записывая сумму в нижеследующей строке в промежутке между ее слагаемыми. Таблица 15П. Значения критерия хи-квадрат Число степеней свободы V Уровни значимости Число степеней свободы V Уровни значимости ;V\=0,05 ’^2^0,01 uz3=o,ooi 1^=0,05 и/з=0,01 uz3=o,ooi 1 3,841 6,635 10,827 16 26,296 32,000 39,252 2 5,991 9,210 13,815 17 27,587 33,409 40,790 3 7,815 11,345 16,268 18 28,869 34,805 42,312 4 9,488 13,277 18,465 19 30,144 36,191 43,820 5 11,070 15,086 20,517 20 31,410 37,566 45,315 6 12,592 16,812 22,457 21 32,671 38,932 46,797 7 14,067 18,475 24,322 22 33,924 40,289 48,268 8 15,507 20,090 26,125 23 35,172 41,638 49,728 9 16,919 21,666 27,877 24 36,415 42,980 51,179 10 18,307 23,209 29,588 25 37,652 44,314 52,620 И 19,675 24,725 31,264 26 38,885 45,642 54,052 12 21,026 26,217 32,909 27 40,113 46,963 55,476 13 22.362 27,688 34,528 28 41,337 48,278 56,893 14 23,685 29,141 36,123 29 42,557 49.588 58,302 15 24,996 30,578 37,697 30 43,773 50,892 59,703 Таблица 16П. Значения 1—К (К) критерия Колмогорова X 0 1 2 3 4 5 6 7 8 9 0,3 99999 99998 99995 99991 99983 99970 99949 99917 99872 99807 0,4 99719 99603 99452 99262 99027 98741 98400 97998 97532 96998 0,5 96394 95719 94969 94147 93250 92282 91242 90134 88960 87724 0,6 86428 85077 83678 82225 80732 79201 77636 76042 74422 72781 0,7 71124 69453 67774 66089 64402 62717 61036 59363 57700 56050 0,8 54414 52796 51197 49619 48063 £6532 45026 43545 42093 40668 0,9 39273 37907 36571 35266 33992 32748 31536 30356 29206 28087 277
Таблица 16П (окончание) к 0 1 2 3 4 5 6 7 8 9 1,0 27000 25943 24917 23922 22957 22021 21114 20236 19387 18566 1,1 17772 17005 16264 15550 14861 14196 13556 12939 12345 11774 1,2 11225 10697 10190 09703 09235 08787 08357 07944 07550 07171 1,3 06809 06463 06132 05815 05513 05224 04949 04686 04435 04196 1,4 03968 03751 03545 03348 03162 02984 02815 02655 02503 02359 1,5 02222 02092 01969 01852 01742 01638 01539 01446 01357 01274 1,6 01195 01121 01051 00985 00922 00864 00808 00756 00707 00661 1,7 00618 00577 00539 00503 00469 00438 00408 00380 00354 00330 1,8 00307 00285 00265 00247 00229 00213 00198 00186 00170 00158 1,9 00146 00136 00126 00116 00108 00100 00092 00085 00079 00073 2,0 00067 00062 00057 00053 00048 00045 00041 00038 00035 00032 2,1 00030 00027 00025 00023 00021 00019 00018 00016 00015 00014 2,2 00013 00011 00010 00010 00009 00008 00007 00007 00006 00006 2,3 00005 00005 00004 00004 00004 00003 00003 00003 00002 00002 2,4 00002 00002 00002 00001 00001 00001 00001 00001 00001 00001 Таблица 17П. Минимальные значения показателя корреляции рангов при данном числе вариант Число вариант N Значение р на двух уровнях значимости* Число вариант N Значение р на двух уровнях значимости * W\=0,05 №2=0,01 №^=0,05 ^2=0,01 4 0,80 13 0,48 0,64 5 0,80 0,90 14 0,46 0,62 6 0,77 0,89 15 0,44 0,60 7 0,68 0,86 16 0,43 0,58 8 0,60 0,81 17 0,41 0,56 9 0,58 0,77 18 0,40 0,55 10 0,55 0,73 19 0,39 0,53 11 0,53 0,70 20 0,38 0,52 12 0,50 0,67 • р недостоверно, если оно меньше табличного. 278
о Таблица 18П. Значение выражений N (N—1), —— и ошибка коэффициента корреляции рангов Кендалла N 2 N тх N N (N—1) 2 ЛА (N— 1) 2 2 1 — 17 272 0,00735 0,1786 3 6 0,3333 — 18 306 0,00654 0,1726 4 12 0,1667 — 19 342 0,00585 0,1671 5 20 0,1000 — 20 380 0,00526 0,1622 6 30 0,0667 — 21 420 0,00476 0,1577 7 42 0,0476 — 22 462 0,00433 0,1535 8 56 0,0357 0,2886 23 506 0,00395 0,1496 9 72 0,0278 0,2665 24 552 0,00362 0,1460 10 90 0,0222 0,2483 25 600 0,00333 0,1426 11 110 0,0182 0,2337 26 650 0,00308 0,1396 12 132 0,0152 0,2214 27 702 0,00285 0,1367 13 156 0,0128 0,2099 28 756 0,00264 0,1338 14 182 0,0110 0,2007 29 812 0,00246 0,1312 15 210 0,0095 0,1922 30 870 0,00230 0,1289 16 240 0,0083 0,1847 31 930 0,00215 0,1265 1 + г Таблица 19П. Функция z = 0,5 In 2 3456789 0,0 0,0000 0,1000 0,0200 0,0300 0,0400 0,0501 0,0601 0,0701 0,0802 0,0902 1 0,1003 0,1105 0,1206 0,1308 0,1409 0,1511 0,1614 0,1717 0,1820 0,1923 2 0.2027 0,2132 0,2237 0,2342 0,2448 0,2554 0,2661 0,2769 0,2877 0,2986 3 0.3095 0,3206 0,3317 0,3428 0,3541 0,3654 0,3769 0,3884 0,4001 0,4118 4 0,4236 0,4356 0,4477 0,4599 0,4722 0,4847 0,4973 0,5101 0,5230 0.5361 5 0,5493 0,5627 0,5763 0,5901 0,6042 0,6184 0,6328 0,6475 0,6625 0,6777 6 0,6931 0,7089 0,7250 0,7414 0,7582 0,7753 0,7928 0,8107 0,8291 0,8480 7 0,8673 0,8872 0,9076 0,9287 0,9505 0,9730 0,9962 1,0203 1,0454 1,0714 8 1,0986 1,1270 1,1568 1,1881 1,2212 1,2562 1,2933 1,3331 1,3758 1,4219 9 1,4722 1,5275 1,5890 1,6584 1,73801,83181,94592,09232,29762,6467 Примечание. Обратное преобразование делается с помощью таблиц гиперболического тангенса (г = thz) или по формуле г — (е2г—1)/(е22-Н)- Достоверность коэффициента корреляции г мож- но оценить, не обращаясь к табл. 19П по формуле t = (°’5 1п где N — объем ряда; t — критерий Стьюдента при числе степеней свободы v = Лг—2 (см. табл. 4П). 279
Таблица 20П. Объем выборки, достаточный для достоверности коэффициента корреляции на трех доверительных уровнях г N г N г N ₽1= =0,95 />2=0,99 />'=0,999 Х= =0,95 ₽2= =0,99 Р3=0,999 р'1= =0,95 />2=0,99 рз= =0,999 01 38407 66503 108903 31 40 68 109 61 11 16 25 02 9603 16628 27228 32 38 63 102 62 10 16 24 03 4269 7392 12103 33 36 60 96 63 10 15 23 04 2403 4159 6809 34 34 56 90 64 10 15 22 05 1539 2263 4359 35 32 53 85 65 9 14 21 06 1069 1850 3028 36 30 50 80 66 9 14 20 07 787 1360 2225 37 28 47 75 67 9 13 20 08 604 1042 1704 38 27 44 71 68 9 13 19 09 477 824 1347 39 26 42 67 69 8 12 18 10 383 661 1081 40 24 40 64 70 8 12 18 11 317 548 896 41 23 38 60 71 8 И 17 12 267 462 754 42 22 36 57 72 8 И 16 13 228 392 640 43 21 34 55 73 7 И 16 14 196 337 550 44 20 33 52 74 7 10 15 15 171 295 481 45 19 31 49 75 7 10 15 16 151 259 422 46 19 30 47 76 7 10 14 17 133 228 373 47 18 29 45 77 7 9 14 18 119 204 332 48 17 27 43 78 7 9 13 19 107 183 297 49 16 26 41 79 6 9 13 20 97 165 270 50 16 25 39 80 6 9 12 21 87 149 242 51 15 24 '37 81 6 8 12 22 80 136 211 52 15 23 36 82 6 8 11 23 73 124 202 53 14 22 34 83 6 8 И 24 68 114 185 54 14 21 33 84 6 7 10 25 62 105 170 55 13 20 32 85 5 7 10 26 57 97 157 56 13 20 30 86 5 7 10 27 53 90 145 57 12 19 29 87 5 7 9 28 49 83 135 58 12 18 28 88 5 7 9 29 46 78 125 59 И 18 27 89 5 6 8 30 43 73 117 60 И 17 26 90 5 6 8 Примечание. Коэффициент корреляции приведен в виде первых двух знаков после запятой. 280
Таблица 21П. Таблица Келли—Вуда (сокращенно) Q PQ Vpq 5 X р 0,50 0,2500 0,5000 0,3989 0,0000 0,50 0,49 0,2499 0,4999 0,3988 0,0251 0,51 0,48 0,2496 0,4996 0,3984 0,0502 0,52 0,47 0,2491 0,4991 0,3978 0,0753 0,53 0,46 0,2484 0,4984 0,3969 0,1004 0,54 0,45 0,2475 0,4975 0,3958 0,1257 0,55 0,44 0,2464 0,4964 0,3944 0,1510 0,56 0,43 0,2451 0,4951 0,3928 0,1764 0,57 0,42 0,2436 0,4936 0,3909 0,2019 0,58 0,41 0,2419 0,4918 0,3887 0,2275 0,59 0,40 0,2400 0,4899 0,3863 0,2533 0,60 0,39 0,2379 0,4877 0,3837 0,2793 0,61 0,38 0,2356 0,4854 0,3808 0,3055 0,62 0,37 0,2331 0,4828 0,3776 0,3318 0,63 0,36 0,2304 0,4800 0,3741 0,3585 0,64 0,35 0,2275 0,4770 0,3704 0,3853 0,65 0,34 0,2244 0,4737 0,3664 0,4125 0,66 0,33 0,2211 0,4702 0,3621 0,4399 0,67 0,32 0,2176 0,4665 0,3576 0,4677 0,68 0,31 0,2139 0,4625 0,3529 0,4958 0,69 0,30 0,2100 0,4583 0,3477 0,5244 0,70 0,29 0,2059 0,4538 0,3423 0,5534 0,71 0,28 0,2016 0,4490 0,3366 0,5828 0,72 0,27 0,1971 0,4440 0,3306 0,6128 0,73 0,26 0,1924 0,4386 0,3244 0,6433 0,74 0,25 0,1875 0,4330 0,3178 0,6745 0,75 0,24 0,1824 0,4271 0,3109 0,7063 0,76 0,23 0,1771 0,4208 0,3036 0,7388 0,77 0,22 0,1716 0,4142 0,2961 0,7722 0,78 0,21 0,1659 0,4073 0,2882 0,8064 0,79 0,20 0,1600 0,4000 0,2800 0,8416 0,80 0,19 0,1539 0,3923 0,2714 0,8779 0,81 0,18 0,1476 0,3842 0,2624 0,9154 0,82 0,17 0,1411 0,3756 0,2530 0,9542 0,83 0,16 0,1344 0,3666 0,2433 0,9945 0,84 0,15 0,1275 0,3571 0,2332 1,0364 0,85 0,14 0,1204 0,3470 0,2226 1,0803 0,86 0,13 0,1131 0,3363 0,2115 1,1264 0,87 0,12 0,1056 0,3250 0,2000 1,1750 0,88 0,11 0,0979 0,3129 0,1880 1,2265 0,89 0,10 0,0900 0,3000 0,1755 1,2816 0,90 0,09 0,0819 0,2862 0,1624 1,3408 0,91 0,08 0,0736 0,2713 0,1487 1,4051 0,92 281
Таблица 21П (окончание) Q pq Vpq 5 X р 0,07 0,0651 0,2551 0,1343 1,4758 0,93 0,06 0,0564 0,2375 0,1191 1,5548 0,94 0,05 0,0475 0,2179 0,1031 1,6448 0,95 0,04 0,0384 0,1960 0,0862 1,7507 0,96 0,03 0,0291 0,1706 0,0680 1,8808 0,97 0,02 0,0196 0,1400 0,0484 2,0537 0,98 0,01 0,0099 0,0995 0,0266 2,3263 0,99 Таблица 22П. Таблица Сопера для вычисления ошибки бисериального коэффициента корреляции q ’I Х3 q >4 х3 0,50 1,5708 2,5000 0,25 1,8567 2,7166 0,49 1,5711 2,5003 0,24 1,8874 2,7399 0,48 1,5722 2,5011 0,23 1,9208 2,7654 0,47 1,5741 2,5024 0,22 1,9574 2,7933 0,46 1,5766 2,5043 0,21 1,9974 2,8240 0,45 1,5799 2,5068 0,20 2,0414 2,8578 0,44 1,5839 2,5098 0,19 2,0898 2,8951 0,43 1,5886 2,5134 0,18 2,1437 2,9364 0,42 1,5943 2,5177 0,17 2,2035 2,9825 0,41 1,6007 2,5225 0,16 2,2703 3,0341 0,40 1,6079 2,5279 0,15 2,3453 3,0923 0,39 1,6161 2,5341 0,14 2,4303 3,1582 0,38 1,6251 2,5409 0,13 2,5272 3,2337 0,37 1,6351 2,5484 0,12 2,6389 3,3208 0,36 1,6461 2,5568 0,11 2,7687 3,4224 0,35 1,6582 2,5659 0,10 2,9221 3,5427 0,34 1,6714 2,5759 0,09 3,1057 3,6873 0,33 1,6858 2,5868 0,08 3,3299 3,8648 0.32 1,7015 2,5986 0,07 3,6110 4,0879 0,31 1,7186 2,6115 0,06 3,9748 4,3777 0,30 1,7371 2,6256 0,05 4,4652 4,7723 0,29 1,7573 2,6409 0,04 5,1715 5,3410 0,28 1,7791 2,6575 0,03 6,2859 6,2485 0,27 1,8028 2,6755 0,02 8,3600 7,9572 0,26 1,8286 2,6952 0,01 13,9393 12,6086 282
Таблица 23П. Числа Чебышева 5 6 7 8 9 10 —2 4-2 —1 —5 4-5 —5 —3 +5 —1 —7 +7 —7 —4 +28 —14 —9 +6 —42 —1 —1 4-2 —3 —1 +7 —2 0 4-1 -5 +1 +5 -3 +7 +7 —7 4-2 +14 0 —2 0 —1 —4 4-4 —1 —3 +1 —3 —3 4-7 —2 —8 +13 —5 —1 +35 +1 —1 —2 4-1 —4 —4 0—4 0 —1 —5 4-3 —1 —17 +9 —3 —3 +31 4-2 4-2 4-1 +3 —1 —7 4-1 —3 —1 +1 —5 —3 0 —20 0 —1 —4 +12 10 14 10 +5 +5 +5 4-2 0 —1 4-3 —3 —7 +1 —17 —9 4-1 —4 —12 70 84 180 +3 +5 +1 +5 +1 -5 +2 —8 —13 4-3 —з —31 28 84 6 +7 +7 +7 +3 +7 —7 +5 1 —35 168 168 264 +4 +28 +14 +7 +2 —14 60 2772 990 +9 +б +42 330 132 8580 И 12 13 14 15 16 —5 4-15 —30 —И 4-55 —33 —6 +22 —11 —13 4-13 —143 —7 +91 —91 —15 +35 -455 —4 _|_6 4-6 —9 4-25 4-3 —5 +11 0 —И +7 _ц —6 +52 —13 —13 4-21 —91 —3 —1 4-22 —7 4-1 +21 —4 +2 +6 —9 +2 4-66 —5 +19 +35 —И +9 +143 —2 —6 4-23 —5 —17 +25 —3 —5 +8 —7 —2 4-98 —4 —8 +58 —9 —1 +267 —1 —9 4-14 —3 —29 +19 —2 —10 +7 —5 —5 4-95 —3 —29 4-61 —7 —9 +301 0 —10 0 —1 —35 4-7 —1 —13 +4 —3 —7 4-67 —2 —44 4-49 —5 —15 +265 4-1 —9 —14 4-1 —35 —7 0 —14 0 —1 —8 4-24 —1 —53 4-27 —3 —19 +179 _1_2 —6 —23 4-3 —29 —19 +1 —13 —4 4-1 —8 —24 0 —56 0 —1 —21 +63 4-3 —1 —22 4-5 —17 —25 +2 —10 —7 +3 —7 —67 4-1 —53 —27 4-1 —21 -63 4-4 4-6 —6 4-7 +1 —21 +3 —5 —8 4-5 —5 —95 4-2 —44 —49 +3 —19 —179 4-5 4-15 4-30 4-9 +25 —3 +4 —2 —6 4-7 —2 —98 4-3 —29 —61 +5 —15 —265 4-И +55 4-33 +5 +11 0 +9 +2 —66 +4 •—8 —58 +7 —9 —301 11U ООО 572 12012 5148 +6 +22 +11 +11 +7 +11 +5 +19 —35 +9 —1 —267 182 2002 572 4-13 +13 +143 +6 +52 +13 +11 4-9 —143 910 728 97240 +7 4-91 4-91 +13 4-21 4-91 280 37128 39780 4-15 4~35 4-455 1 — 1360 5712 100776
284 Таблица 23П (продолжение) 17 18 19 20 21 22 —8 +40 —28 —17 +68 —68 —9 +51 —204 —19 +57 —969 —10 +190 —285 —21 +35 —133 —7 +25 —7 —15 +44 —20 —8 +34 —68 —17 +39 -357 —9 +133 —114 —19 +25 —57 —6 +12 +7 —13 +23 +13 —7 +19 +28 —15 +23 +85 —8 +82 +12 —17 +16 0 —5 -Fl +15 —И +5 +33 —6 +6 +89 —13 +9 +377 —7 +37 +98 —15 +8 +40 —4 —8 +18 —9 —10 +42 —5 —5 +120 —И —3 +539 —6 —2 +149 —13 +1 +65 —3 —15 +17 —7 —22 +42 —4 —14 +126 —9 —13 +591 —5 —35 +170 —И —5 +77 —2 —20 +13 —5 —31 +35 —3 —21 +112 —7 —21 +553 —4 —62 +166 —9 —10 +78 —1 —23 +7 —3 —37 -j-23 —2 —26 +83 —5 —27 +445 —3 —83 +142 —7 —14 +70 0 -24 0 —1 —40 +8 —1 —29 +44 —3 -31 +287 —2 —98 +103 —5 —17 +55 +1 —23 —7 +1 —40 —8 0 —30 0 —1 —33 +99 —1 —107 +54 —3 —19 +35 +2 —20 —13 +3 —37 —23 +1 . —29 —44 +1 —33 —99 0 —НО 0 —1 —20 +12 +3 —15 —17 +5 —31 —35 +2 —26 —83 +3 —31 —287 +1 —107 —54 +1 —20 —12 +4 —8 —18 +7 —22 —42 +3 —21 —112 +5 —27 -445 +2 -98 —103 +3 —19 —35 +5 +1 —15 +9 —10 —42 +4 —14 —126 +7 —21 —553 +3 —83 —142 +5 —17 —55 +6 +12 —7 +11 +5 —33 +5 —5 —120 +9 —13 —591 +4 —62 —166 +7 —14 —70 +7 +25 +7 +13 + 23 —13 +6 +6 —89 +11 —3 —539 +5 —35 —170 +9 —10 —78 +8 +40 +28 +15 +44 +20 +7 +19 -28 +13 +9 -377 +6 —2 —149 +И —5 —77 408 7752 3876 + 17 1938 +68 23256 +-68 23256 +8 +9 570 +34 + 51 13566 +68 +204 213180 +15 +17 +19 2660 +23 +39 +57 17556 —85 +357 +969 4903140 +7 +8 +9 +10 770 +37 +82 +133 +190 201894 —98 —12 +114 +285 432630 +13 +15 +17 +19 +21 3542 +1 +8 +16 +25 +35 7084 —65 —40 0 +57 +133 96140
285 Таблица 23П (продолжение) 23 24 25 26 27 —И +77 +56 4-37 —77 —23 +253 +187 —1771 —12 +92 —506 —25 + 50 —1150 —13 +325 —130 10 —35 —21 —847 —11 +69 —253 —23 +38 —598 —12 +250 —70 9 —3 —19 +127 —133 —10 +48 —55 —21 +27 —161 —И +181 —22 —8 +20 +5 —8 +20 —17 +73 +391 —9 +29 +95 —19 +17 +171 —10 +118 +15 7 +35 —15 +25 +745 —8 +12 +196 —17 +8 +408 —9 +61 +42 6 +43 —13 —17 +949 —7 —3 +259 —15 0 +560 —8 +10 +60 5 —19 +45 —И —53 +1023 +987 —6 -16 +287 —13 —7 +637 —7 —35 +70 4 —28 +42 —9 —83 —5 —27 +285 —И —13 +649 —6 —74 +73 з 35 +35 +25 —7 —107 +861 —4 —36 +258 —9 —18 +606 —5 —107 +70 2 —40 —5 —125 +665 —3 —43 +211 —7 —22 +518 —4 —134 +62 1 —43 +13 о —3 —137 +419 —2 —48 +149 +77 —5 —25 +395 —3 —155 +50 0 —44 —1 —143 +143 —1 —51 —3 —27 +247 —2 —170 +35 -4-1 —43 —13 +1 —143 —143 0 —52 0 —1 —28 +84 —1 —179 +18 i 1 4-2 —40 —25 +3 —137 —419 +1 —51 —77 +1 —28 —84 0 —182 0 4-3 —35 —35 +5 —125 —665 +2 —48 —149 +3 —27 —247 +1 —179 —18 Т° 4-4 —28 —42 +7 —107 —861 +3 —43 —211 +5 —25 —395 +2 —170 —35 4-5 19 —45 +9 +11 —83 —987 +4 —36 —258 +7 —22 —518 +3 —155 —50 +6 +7 +8 +9 +10 +11 8 —43 —53 —1023 +5 —27 —285 +9 -18 —606 +4 —134 —62 4-5 —35 1 +13 +15 +17 +19 +21 —17 —949 +6 +7 +8 +9 +10 +11 —16 —287 +11 —13 —649 +5 —107 —70 +20 +37 +56 +77 —20 +3 +35 +77 +25 +73 +127 +187 +253 —745 —391 +133 +847 +1771 —3 +12 +29 +48 +69 —259 —196 —93 +55 +253 +13 +15 +17 +19 +21 —7 0 +8 +17 +27 —637 —560 —408 —171 +161 +6 +7 +8 +9 -1-10 —74 —35 +10 +61 +118 —73 —70 —60 -42 —15 1012 35420 32890 +23 J. V +181 +250 +12 +92 +506 +23 +25 +38 +598 +1150 +11 +12 22 4000 394680 17760600 1300 53820 1480050 +50 — । о 5850 16380 7803000 +13 +325 — 13<* 1638 712530 11 >1790
Таблица 23П (окончание) 28 29 30 31 32 —27 +117 —585 —14 +126 —819 —29 +203 —1827 -15 +145 -1015 —31 +155 —899 —25 +91 —325 —13 +99 —463 —27 +161 —1071 —14 +116 —609 —29 +125 —551 —23 +67 —115 —12 +74 —182 —25 +122 —450 —13 +89 —273 —27 +97 —261 —21 +45 +49 —И +51 +44 —23 +86 +46 —12 +64 —2 —25 +71 —25 —19 +25 +171 —10 +30 +215 —21 +53 +427 —И +41 +209 —23 +47 +161 —17 +7 +255 —9 +11 +336 —19 +23 +703 —10 +20 +365 —21 +25 +•301 —15 —9 +305 —8 —6 +412 —17 —4 +884 —9 +1 +471 —19 +5 +399 —13 —23 +325 —7 —21 +448 —15 —28 +980 —8 —16 +532 —17 —13 -j-459 —И —35 +319 —6 —34 +449 —13 —49 +1001 —7 —31 +553 —15 —29 -|-485 —9 —45 +291 —5 —45 +420 —И -67 +957 —6 —44 +539 —13 —43 +481 —7 —53 +245 —4 -54 +366 —9 —82 +858 —5 —55 +495 —11 —55 +451 —5 —59 +185 —3 —61 +292 —7 —94 +714 —4 —64 +426 —9 —65 -j-399 —3 —63 +115 —2 —66 +203 —5 —108 +535 —3 —71 +337 —7 —73 -j-329 —1 —65 +39 —1 —69 +104 —3 —109 +331 —2 —76 +233 —5 —79 +245 +1 —65 —39 0 —70 0 —1 —112 +112 —1 —79 —119 —3 —93 -j-151 1 4-3 —63 —115 +1 —69 —104 +1 —112 —112 0 —80 0 —1 —85 +51 +5 —59 —185 +2 —66 —203 +3 —109 —331 +1 —79 —119 +1 —85 —51 4-7 — 53 —245 +3 —61 —292 +5 —108 —535 +2 —76 —233 +3 —83 —151 4-9 —45 —291 +4 —54 —366 +7 —94 —714 +3 —71 —337 +5 —79 —245 +11 —35 —319 +5 —45 —420 +9 —82 —858 +4 —64 —426 +7 —73 —329 +13 —23 -325 +6 —34 —449 +11 —67 —957 +5 —55 —495 +9 —65 —399 +15 —9 —305 +7 —21 —448 +13 —49 —1001 +6 —44 —539 +11 —55 —451 4-17 +7 —255 +8 —6 —412 +15 —28 —980 +7 —31 —553 +13 —43 —481 +19 +25 —171 +9 +11 —336 +17 —4 —884 +8 —16 —532 +15 —29 —485 +21 +45 —49 +10 +30 —215 +19 +23 —703 +9 +1 —471 +17 —13 —459 +23 +67 +115 +11 +51 —44 +21 +53 -427 +10 +20 —365 +19 +5 —399 +25 +91 +325 +12 +74 +182 +23 +86 —46 +11 +41 —209 +21 +25 —301 +27 +117 +585 +13 +99 +468 +25 +122 +450 +12 +64 +2 -|-23 +47 —161 7308 95004 2103660 +14 +126 +819 +27 +161 +1071 +13 +89 +273 ЛАП -j-25 97 +71 I Q7 +25 4-‘261 2030 113274 4207320 +29 8990 +203 302064 +1827 21360240 +14 +15 2480 +И6 +145 158224 Н-609 +1015 6724520 +29 +31 -f-У/ +125 +155 +551 +899 10912 185504 5379616
Таблица 24П. Множители для вычисления коэффициентов уравнений парабол (нуль целых опушен, в скобках число нулей между запятой и первой цифрой мантиссы) ЛА м2 М3 мб мв м7 м8 5 2 1 4857143 1428571 0714286 9027778 2361111 0694444 6 1666667 0142857 3945313 0195313 (2)167411 112675 (2)487076 (3)241127 7 1428571 0357143 3333333 047619 0119048 2625661 0324074 (2)462963 8 125 (2)595238 2890625 (2)78125 (3)372024 0419635 (3)973274 (4)263047 9 1111111 0166667 2554113 021645 (2)324675 1143378 (2)827721 (3)701459 10 1 (2)30303 228906 (2)390625 (3)118371 0204013 (3)296434 (5)50586 11 0909091 (2)909091 2074593 011655 (2)11655 0603794 (2)288138 (3)161875 12 0833333 (2)174825 1897321 (2)223214 (4)468282 0114945 (3)114662 (5)134896 13 0769231 (2)549451 1748252 (2)699301 (3)4995 0358461 (2)121406 (4)485625 14 0714286 (2)10989 1621094 (2)139509 (4)214629 (2)712567 (4)518655 (6)446347 15 0666667 (2)357143 1511312 (2)452489 (3)242405 0230459 (3)583068 (4)174571 16 )625 (3)735294 1415551 (3)93006 (4)109419 (2)4726 (4)262201 (6)172274 17 0588235 (2)245098 1331269 (2)309598 (3)128999 015702 (3)308164 (5)716661 18 0555556 (3)515996 125651 (3)651042 (5)604683 (2)329671 (4)144079 (7)746522 19 0526316 (2)175439 1189739 (2)221141 (4)737137 0111832 (3)175256 (5)325755 20 05 (3)37594 1129735 (3)473485 (5)356004 (2)239172 (5)844838 (7)354081 21 047619 (2)12987 1075515 (2)163452 (4)445778 (2)824851 (3)10562 (5)160517 22 0454545 (3)282326 1026278 (3)355114 (5)220567 (2)179056 (5)521881 (7)180582 23 0434783 (3)988142 0981366 (2)124224 (4)282326 (2)625908 (4)667207 (6)844567 24 0416667 (3)217391 0940232 (3)273164 (5)142521 (2)137548 (5)336458 (8)977507 25 04 (3)769231 0902415 (3)966184 (4)185805 (2)486235 (4)438236 (6)469203 26 0384615 (3)17094 0867531 (3)214629 (6)953907 (2)107959 (5)224803 (8)556168 27 037037 (3)610501 0835249 (3)766284 (4)12631 (2)385274 (4)297453 (6)272893 28 0357143 (3)136836 0805288 (3)171703 (6)657867 (3)862955 (5)154823 (8)330112 29 < 3344828 (3)492611 0777407 (3)617971 (5)882815 (2)310473 (4)207641 (6)165056 30 ( 3333333 (3)111235 0751395 (3)139509 (6)465547 (3)700681 (5)10944 (8)203194 31 0322581 (3)403226 072707 (3)505612 (5)632015 (2)25387 (4)148503 (6)103271 32 03125 (4)916422 0704274 (3)11489 (6)33692 (3)576715 (6)79131 (8)129088 33 030303 (3)334225 0682866 (3)418936 (5)462062 (2)210245 (4)10848 (7)665521 34 0294118 (4)763942 0662722 (4)957414 (6)248679 (3)480378 (6)583624 (9)843143 35 0285714 (3)280112 0643735 (3)351 (5)344118 (2)176078 (5)807344 (7)440209 36 0277778 (4)643501 0625806 (4)806244 (6)186775 (3)404376 (6)438065 (9)564371 287
Таблица 25П. Вспомогательные величины для вычисления коэффициентов уравнений парабол способом сумм 2“ D2 2 0,5 0,125 0,03125 0 0 3 2 2 2 2 0 4 5 10,25 22,8125 16 9 5 10 34 130 70 144 6 17,5 88,375 511,09375 224 1134 7 28 196 1588 588 6 048 8 42 388,5 4187,625 1344 24 948 9 60 708 9 780 2 772 85 536 10 82,5 1208,625 20 795,15625 5 280 254 826 И 110 1 958 41 030 9 438 679 536 12 143 3 038,75 76 156,4375 16 016 1 656 369 13 182 4 550 134 342 26 026 3 747 744 14 227,5 6 608,875 226 994,21875 40 768 7 963 956 15 280 9 352 369 640 61 880 16 039 296 16 340 12 937 582 951,25 91 392 30 837 456 17 408 17 544 893 928 131 784 56 930 688 18 484,5 23 377,125 1 337 250,28125 186 048 101 407 788 19 570 30 666 1 956 810 257 754 174 978 144 20 С 65 39 667,25 2 807 434,0625 351120 293 452 929 21 770 50 666 3 956 810 471 086 479 700 144 22 885,5 63 977,375 5 487 625,34375 623 392 766 187 730 23 1012 79 948 7 499 932 814 660 1198 248 480 24 1150 98 957,5 10113 746,375 1 052 480 1 838 222 100 25 1300 121 420 13 471 900 1 345 500 2 770 653 600 Таблица 26П. Множители М для четных рядов (нуль целых опущен) N Mi Af2 M3 M4 M5 Mt 6 1666667 0571429 3945313 078125 0267857 4507 0779391 0154321 8 125 0238095 2890625 03125 0059524 1678541 0155724 0016835 10 1 0121212 2291233 0156398 0018957 0816053 0047429 0003238 12 0833333 0069930 1897321 0089986 0007493 0459779 0018346 0000863 14 0714286 0043956 1621094 0055804 0003434 0285027 0008298 0000286 16 0625 0029412 1415551 0037202 0001751 0189040 0004195 000011 18 0555556 002064 125651 0026042 0000967 0131869 0002305 0000048 20 05 0015038 1129735 0018939 000057 0095669 0001352 0000023 22 0454545 0011293 1026278 0014197 0000353 0071622 0000835 0000011 24 0416667 0008696 0940232 0010927 0000228 0055019 0000538 0000006 288
289 Таблица 27П. Показательная функция ех X 0 1 2 3 4 5 6 7 8 9 0,00 1,0000 1,0010 1,0020 1,0030 1,0040 1,0050 1,0060 1,0070 1,0080 1,0090 0,0 1,0000 1,0101 1,0202 1,0305 1,0408 1,0513 1,0618 1,0725 1,0833 1,0942 1 1,1052 1,1163 1,1275 1,1388 1,1503 1,1618 1,1735 1,1853 1,1972 1,2092 2 1,2214 1,2337 1,2461 1,2586 1,2712 1,2840 1,2969 1,3100 1,3231 1,3364 3 1,3499 1,3634 1,3771 1,3910 1,4049 1,4191 1,4333 1,4477 1,4623 1,4770 4 1,4918 1,5068 1,5220 1,5373 1,5527 1,5683 1,5841 1,6000 1,6161 1,6323 0,5 1,6487 1,6653 1,6820 1,6989 1,7160 1,7333 1,7507 1,7683 1,7860 1,8040 6 1,8221 1,8404 1,8589 1,8776 1,8965 1,9155 1,9348 1,9542 1,9739 1,9937 7 2,0138 2,0340 2,0544 2,0751 2,0959 2,1170 2,1383 2,1598 2,1815 2,2034 8 2,2255 2,2479 2,2705 2,2933 2,3164 2,3396 2,3632 2,3869 2,4109 2,4351 9 2,4596 2,4843 2,5093 2,5345 2,5600 2,5857 2,6117 2,6379 2,6645 2,6912 1, 2,718 3,004 3,320 3,669 4,055 4,482 4,953 5,474 6,050 6,686 2, 7,389 8,166 9,025 9,974 11,023 12,182 13,464 14,880 16,445 18,174 3, 20,09 22,20 24,53 27,11 29,96 33,12 36,60 40,45 44,70 49,40 4, 54,60 60,34 66,69 73,70 81,45 90,02 99,48 109,95 121,51 134,29 5, 148,41 164,02 181,27 200,34 221,41 244,69 270,43 298,87 330,30 365,04 6, 403,4 445,9 492,7 544,6 601,8 665,1 735,1 812,4 897,8 992,3 7, 1097 1212 1339 1480 1636 1808 1998 2208 2441 2697 8, 2981 3294 3641 4024 4447 4915 5432 6003 6634 7332 9, 8103 8955 9897 10938 12088 13360 14765 16318 18034 19930 ю, 22026 24343 26903 29733 32860 36316 40135 44356 49021 54176
Таблица 28П. Числа, производные от е и л е — 2,7182818 е2 = 7,3890561 Иё" = 1,6487213 1/е = 0,3678794 1/е2 = 0,1353353 I/УТ = 0,6065307 1g е = 0,4342945 1g е2 = 0,8685890 1g /Г = 0,2171472 1g (1/е) = 1,5657055 1g (1/е2) = 1,1314110 1g (1//Г) = 1,7828528 Iglge = 1,6377843 л = 3,1415927 2л = 6,2831853 л2 = 9,8696044 Ил" = 1,7724539 И 2л" = 2,5066283 /л/2= 1,2533141 >'л" = 1,4645919 4л/3= 4,1887902 1g л = 0,4971499 1g (2л) = 0,7981799 1g л2 = 0,9942997 1g /Г = 0,2485749 1g /2л" = 0,3990899 1g Ил/2= 0,0980599 1g у'ЗГ = 0,1657166 1g (4л/3) = 0,6220886 1/л = 0,3183099 1/(2л) =0,1591549 1/л2 = 0,1013212 1/И«~ = 0,5641896 1//2Й" = 0,3989423 /2/л = 0,7978846 1/^л" = 0,6827841 л/6 = 0,5235988 1g (1/л) = 1,5028501 1g (1/2л) = 1' 2018201 1g (1/л2) = 1,0057003 lg (l/KiT) = 1,751451 lg (l//2jT) = 1,6009101 lg /2/л = 1,9019401 lg(l/t/n") = 1,8342834 lg (n/6) = 1,7189986
ЛИТЕРАТУРА Браунли К. А. Статистическая теория и методология в науке и технике. М.: Наука, 1977. 407 с. Бреев К. А. Применение негативного биномиального распределения для изу- чения популяционной экологии паразитов. Л.: Наука, 1972. 73 с. Венецкий И. Г., Венецкая В. И. Основные математико-статистические поня- тия и формулы в экономическом анализе. М.: Статистика, 1974. 279 с. Вентцель Е. С. Теория вероятностей. М.: Наука, 196-9. 576 с. Воробьев И. И. Числа Фибоначчи. М.: Наука, 1969. НО с. Воронцов-Вельяминов Б. А. Сборник задач и практические упражнения по астрономии. 7-е изд. М.: Наука, 1977. 262 с. Ганьшин В. И. Простейшие измерения на местности. 3-е изд. М.: Недра, 1983. 109 с. Доерфель К. Статистика в аналитической химии. М.: Мир, 1969. 247 с. Дружинин Н. К. Математико-статистические методы анализа эксперименталь- ных данных в товароведении. М.: Госторгиздат, 1959. 164 с. Зайцев Г. Н. Методика биометрических расчетов. М.: Наука, 1973. 256 с. Зайцев Г. Н. Фенология травянистых многолетников. М.: Наука, 1979. 150 с. Зайцев Г. Н. Фенология древесных растений. М.: Наука, 1981. 120 с. Зайцев Г. Н. Математическая статистика в экспериментальной ботанике. М.: Наука, 1984. 424 с. Кендалл М., Стьюарт А. Теория распределений. М.: Наука, 1966. 587 с. Лахтин Л. К. Кривые распределения и построение для них интерполяционных формул по способу Пирсона и Брунса. М.: ГИЗ, 1922. Леонтьев Н. Л. Техника статистических вычислений. М.: Гослесбумиздат, 1966. 250 с. Липкин М. И. Кривые распределения в экономических исследованиях. М.: Статистика, 1972. 144 с. Митропольский А. К. Техника статистических вычислений. М.: Наука, 1971. 576 с. Пановский Г. А., Брайер Г. В. Статистические методы в метеорологии. Л.: Гидрометеоиздат, 1967. 242 с. Плохинский Н. А. Биометрия. Новосибирск: Изд-во АН СССР, 1961. 364 с. Плохинский Н. А. Математические методы в биологии. М.: Изд-во МГУ, 1978. 265 с. Поморский Ю. Л. Вариационная статистика. Л., 1930. Ч. 2. 463 с. Пустылъник Е. И. Статистические методы анализа и обработки наблюдений. М.: Наука, 1968. 282 с. Рокицкий П. Ф. Биологическая статистика. Минск: Вышейш. шк., 1967. 327 с. Романовский В. И. Применения математической статистики в опытном деле. М.: Гостехиздат, 1947, 247 с. Селиванов Н. А. Математические методы в собирании и исследовании дока- зательств. М.: Юрид. лит., 1974. 120 с. Семендяев К. А. Эмпирические формулы. М.; Л.: Гостехиздат, 1933. 88 с. Сепетлиев Д. Статистические методы в научных медицинских исследованиях. М.: Медицина, 1968, 419 с. Смирнов Е. С. Таксономический анализ. М.: Изд-во МГУ, 1969. 187 с. 291
Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и мате- матической статистики для технических приложений. 3-е изд. М.: Наука, 1969. 511 с. Снедекор Д. У. Статистические методы в применении к исследованиям в сель- ском хозяйстве и биологии. М.: Сельхозиздат, 1961. Терентьев П. В., Ростова Н. С. Практикум по биометрии. Л.: Изд-во ЛГУ, 1977. 152 с. Урбах В Ю. Математическая статистика для биологов и медиков. М.: Нау- ка, 1963. 323 с. Хан Г., Шапиро С. Статистические модели в инженерных задачах. М.: Мир, 1969. 395 с. Хастингс Н., Пикок Дж. Справочник по статистическим распределениям. М.: Статистика, 1980. 96 с. Хотимский В. И. Выравнивание статистических рядов по методу наименьших квадратов (способ Чебышева). М.: Гоостатиздат, 1959. 88 с. Четвериков Н. С. Статистические исследования: (Теория и практика). М.: Наука, 1975. 388 с. Шторм Р. Теория вероятностей. Математическая статистика. Статистический контроль качества. М.: Мир, 1970. 368 с. Юл Д. Э., Кендэл М. Д. Теория статистики. М.: Госстатиздат, 1'960. 779 с. Ястремский Б. С. Избранные труды. М.: Статистика, 1964. 391 с. Martin R. Lehrbuch der Anthropologie in systematischer Darstellung mit be- sonderer Beriicksichtigung der anthropologischen Methoden. 2. Aufl. Jena: Fischer, 1928. Bd. 1. Weber E. Grundriss der biologischen Statistik. 6. Aufl. Jena: Fischer, 1967. 674 S. Таблицы Большее Л. H., Смирнов Н. В. Таблицы математической статистики. М.: ВЦ АН СССР, 1968. 474 с. (Б-ка мат. табл.; Вып. 46). Келли Т. Л. Статистические таблицы. М.: ВЦ АН СССР, 1966. 194 с. (Б-ка мат. табл., Вып. 35). Митропольский А. К. Статистическое исчисление. Л., 1952—1954. Вып. 1—4. Митропольский А. К. Краткие математические таблицы. М.: Наука, 1968. 95 с. О'Рурк. Таблицы умножения. М.: Госстатиздат, 1962. 336 с. Сегал Б. И., Семендяев К. А. Пятизначные математические таблицы. 3-е изд. М.: Физматгиз, 1962. 464 с. Таблицы Барлоу/Под ред. и доп. Л. С. Хренова. М.: Мир, 1965. 326 с. Янко Я. Математико-статистические таблицы. М.: Госстатиздат, 1961. 243 с. Pearson К. Tables for statisticians and biometricians. 3rd ed. L., 1931. Pt 2.
ОГЛАВЛЕНИЕ Введение ......................................................... 3 Глава 1. Статистические показатели вариационного ряда ... 5 § 1.01 . Составление вариационных рядов...................... 5 § 1.02 . Оценка сильноотклоняющихся вариант...................Н § 1.03 , Средняя арифметическая невзвешенного ряда. Уровни зна- чимости ...................................................... 12 § 1.04 . Средняя арифметическая взвешенного ряда .... 16 § 1.05 . Общая средняя арифметическая по частным средним . . 18 § 1.06 . Средняя гармоническая..............................20 § 1.07 . Средняя квадратическая и средняя кубическая ... 21 § 1.08 . Средняя геометрическая..............................23 § 1.09 . Среднее квадратическое отклонение невзвешенного ряда 24 § 1.10. Среднее квадратическое отклонение взвешенного ряда . 28 § 1.11. Приближенные способы вычисления среднего квадратиче- ского отклонения...............................................35 § 1.12. Объединение выборок по их дисперсиям......................37 § 1.13. Коэффициент вариации......................................37 § 1.14. Показатель точности опыта.................................40 § 1.15. Медиана...................................................40 § 1.16. Вычисление основных параметров невзвешенного ряда . 41 § 1.17. Мода......................................................43 § 1.18. Моменты распределения.....................................44 § 1.19. Асимметрия.............................................. 57 § 1.20. Эксцесс...................................................60 § 1.21. Энтропия..................................................61 § 1.22. Вычисление параметров взвешенного ряда .... 65 § 1.23. Доверительные интервалы статистических параметров . 72 § 1.24. Определение репрезентативности и методы отбора вари- ант выборок....................................................74 § 1.25. Нормальное распределение..................................78 § 1.26. Альтернативное распределение..............................86 § 1.27. Биномиальное распределение................................89 § 1.28. Гипергеометрическое распределение.........................96 § 1.29. Распределение Пуассона...................................100 § 1.30. Негативное биномиальное распределение.....................ЮЗ § 1.31. Мультиномиальное распределение......................... 111 § 1.32. Распределение Максвелла..................................112 § 1.33. Распределение Рэлея......................................117 § 1.34. Показательное распределение..............................119 293
§ 1.35. Распределение Парето............................................................124 § 1.36. Равномерное распределение.......................................................127 § 1.37. Логнормальное распределение.....................................................130 Глава 2. Корреляция.....................................................................136 § 2.01 . Корреляционная решетка и эмпирическая линия регрессии 139 § 2.02 . Показатель корреляции рангов по Спирмену .... 140 § 2.03 . Коэффициент корреляции рангов по Кендаллу . . . 143 § 2.04 . Коэффициент корреляции для малых выборок . . . 147 § 2.05 . Коэффициент корреляции для больших выборок . . . 151 § 2.06 . Определение линейной и нелинейной связей между взве- шенными рядами...............................................155 § 2.07 . Критерии криволинейности.......................................................158 § 2.08 . Корреляционные отношения для невзвешенных рядов . 159 § 2.09 . Корреляционные отношения для взвешенных рядов . . 164 § 2.10. Полихорический коэффициент сопряженности Чупрова . 166 § 2.11. Тетрахорический коэффициент сопряженности .... 168 § 2.12. Бисериальный коэффициент корреляции............................................169 § 2.13. Частные и множественные коэффициенты корреляции . 174 Глава 3. Регрессия......................................................................178 § 3.01 . Уравнение прямой линии.........................................................179 § 3.02 . Уравнение множественной регрессии.................191 § 3.03 . Парабола второго порядка.......................................................197 § 3.04 . Парабола третьего порядка......................................................204 § 3.05 . Обращенная парабола............................................................207 § 3.06 . Вычисление коэффициентов уравнений парабол способом сумм.........................................................212 § 3.07 . Степенная функция..............................................................222 § 3.08 . Показательно-степенная функция.................................................225 § 3.09 . Показательная функция..........................................................227 § 3.10. Показательное уравнение второго порядка .... 231 § 3.11. Логистическая функция.............................................232 § 3.12. Кривая Гаусса...................................................................241 § 3.13. Логарифмическая функция.........................................................243 § 3.14. Гипербола.......................................................................245 § 3.15. Степенная функция со свободным членом...........................................253 § 3.16. Метод избранных точек...........................................................257 Приложение..............................................................................262 1П. Число классов в зависимости от объема выборки . . . 262 2П. Значения критериев и на уровнях значимости 0,01 (верхнее число) и 0,05 (нижнее число)...................262 ЗП. Критические значения разности между двумя крайними ва- риантами совокупности...................................363 4П. Значения критерия Стьюдента t.....................................................263 5П. Перевод календарных дат в непрерывный ряд .... 264 6П. Значения коэффициента h для приближенного определения среднего квадратического отклонения.....................265 7П. Значения критерия Стьюдента для односторонней оценки гипотез.................................................265 294
8П. Значения критерия F'................................... 9П. Минимальное число наблюдений в зависимости от варьиро- вания данных при доверительном уровне Pi = 95% и показа- теле точности 5%........................................... 266 10П Показательная функция е-х................................... ПГТ. Значения функции ф(/) =0,39894/е0)5<2...................... 12П. Функция Ф(х) нормированного нормального распределения 271 272 273 274 13П. Значения ностей . —функции, обратной к интегралу вероят- 14П. Арифметический треугольник............................. 15П. Значения критерия хи-квадрат........................... 16П. Значения 1—К(Х) критерия Колмогорова................... 17П. Минимальные значения показателя корреляции рангов при данном числе вариант....................................... 18П. Значение выражений N (N—1), 2/[7V(Ar—1)] и ошибка коэф- фициента корреляции рангов Кендалла ........................ 19П. Функция z = 0,5 1п[(1Н-г)/( 1—г)] ... . . . 20П. Объем выборки, достаточный для достоверности коэффи- циента корреляции на трех доверительных уровнях 21П. Таблица Келли—Вуда (сокращенно)........................ 22П. Таблица Сопера для вычисления ошибки бисериального ко- эффициента корреляции ..................................... 23П. Числа Чебышева......................................... 24П. Множители для вычисления коэффициентов уравнений пара- бол ....................;.................................. 25П. Вспомогательные величины для вычисления коэффициентов уравнений парабол способом сумм ........................... 26 П. Множители М для четных рядов.......................... 27П. Показательная функция ех............................... 28П. Числа, производные от е и л............................ 275 277 277 277 278 279 279 280 281 282 283 287 288 288 289 290
Научное издание Зайцев Геннадий Николаевич МАТЕМАТИКА В ЭКСПЕРИМЕНТАЛЬНОЙ БОТАНИКЕ Редактор издательства Л. К- Соколова Художник Н. Н. Михайлович Художественный редактор В. В. Алексеев Технический редактор Т. С. Жарикова Корректоры А. Б. Васильев, Р. 3. Землянская ИБ № 46992 Сдано в набор 28 11.89. Подписано к печати 9.02.90. Формат 60X90716 Бумага книжно-журнальная Гарнитура литературная Печать высокая Усл. печ. л. 18,5 Усл. кр. отт. 18,5 Уч.-изд. л. 19,2 Тираж 1500 экз. Тип. зак 3759 Цена 4 р. 30 к. Ордена Трудового Красного Знамени издательство «Наука» 117864, ГСП-7, Москва, В-485 Профсоюзная ул., 90 2-я типография издательства «Наука» 121099, Москва, Г-99, Шубинский пер., 6.