Текст
                    м. в. козлов ;

ПЛАНИРОВАНИЕ
ЭКОЛОГИЧЕСКИХ
ИССЛЕДОВАНИЙ

Университет г. Турку (Финляндия) М. В. Козлов Планирование экологических исследований: теория и практические рекомендации Товарищество научных изданий КМК Москва ♦♦♦ 2014
УДК 574.01 ББК 20.1в676 К59 М. В. Козлов К59 Планирование экологических исследований: теория и практические рекомендации. — М.: Товарищество научных изданий КМК, 2014. — 171 с., ил. Как правильно спланировать эксперимент, чтобы с наименьшими затратами получить убедительные результаты? Как повысить шанс публикации своей работы в престижном журнале? Ответы на эти и многие другие вопросы дает предлагаемое вниманию читателей практическое руководство по пла- нированию экологических исследований. Подробно обсуждаются все этапы планирования — от постановки цели и задач исследования до составления инструкций и подготовки форм для записи полученной информации. Книга написана простым языком и снабжена многочисленными примерами в сти- ле «что такое хорошо и что такое плохо»; ее понимание и практическое ис- пользование не требуют специальных математических знаний. Книга может быть полезна студентам, аспирантам и молодым ученым биологических, ле- сохозяйственных и сельскохозяйственных специальностей, сотрудникам за- поведников и всем заинтересованным специалистам. M.V. Kozlov. Planning of ecological research: theory and practical recommenda- tions. — M.: KMK Scientific Press. 2014. — 171 p., ill. How to design the ecological experiment which will yield significant results with minimum investments? How to increase the chance of acceptance of your manu- script by a high-rank journal? The reader will find answers to these and many oth- er questions in this easy to read book. It describes practical approaches to plan- ning of ecological research, from chosing study aim and objectives to preparing the manual for data collection and recording, and includes numerous examples from scientific publications. The book will be useful for students and young sci- entists working in the fields of ecology, forestry, agriculture, environmental moni- toring and nature protection. ISBN 978-5-87317-978-7 © Товарищество научных изданий KMK, издание, 2014 ©M.B. Козлов, 2014
Введение, или зачем и как читать эту книгу — Значит, ты все еще не понял, Дженри, зачем мы совершенствуем и практикуем искусство пред- сказания? — Наверное, нет... — Чтобы доказать полную бессмысленность получения ответа на вопрос, который задан не- правильно. Урсула Ле Гуин. Левая рука Тьмы Любопытство — хорошее качество для исследователя. Мы часто бываем очарованы или заинтригованы наблюдаемыми в природе яв- лениями. При этом, будучи учеными, мы задаемся вопросами о том, насколько эти явления типичны и отражают ли наши наблюдения реальную картину мира. Для получения корректного ответа на эти и многие другие вопросы необходимо проведение научных исследова- ний. При этом исследование должно быть тщательно спланировано; в противном случае мы рискуем, потратив силы и время, не полу- чить однозначного ответа на наши вопросы. Предлагаемая вниманию читателя книга посвящена планирова- нию экологических экспериментов (в широком смысле этого сло- ва) как части научно-исследовательской работы (НИР). Она может быть использована как набор инструкций, выполнение которых тех- нически возможно для любого человека, владеющего математикой в объеме средней школы. Читатели, которые собираются использо- вать книгу подобным образом, могут пропустить основной текст и составлять экспериментальные планы, ориентируясь на примеры и следуя практическим рекомендациям. Однако осмысленное владе- ние методами планирования исследований, по глубокому убеждению автора, в долгосрочной перспективе оправдает те затраты времени и умственных усилий, которые необходимы для понимания логиче- ских и математических основ описанных в книге методик. Книга ориентирована на читателей, разделяющих убежденность автора в том, что результат научного творчества обязательно дол- жен быть опубликован. Более того, только публикация в одном из международных (выходящих на английском языке) журналов, рефе- рируемых Институтом научной информации, сделает вашу работу доступной всему мировому научному сообществу. Именно поэтому 3
планирование эксперимента рассматривается как один из ключевых моментов подготовки научной публикации, а в качестве «стандар- тов» выступают требования, которые международное научное со- общество предъявляет к методам проведения экологических иссле- дований и к формам представления их результатов. Одна из задач книги — помочь российским экологам в подготовке рукописей для международных журналов с высокими импакт-факторами. Определение 1. Импакт-фактор (англ, impact factor, IF) — чис- ленный показатель цитирования публикаций научного журнала. Он ежегодно рассчитывается Институтом научной информации (англ. Institute for Scientific Information, ISI) как отношение коли- чества ссылок на статьи, опубликованные в течение двух (либо пяти) предшествующих лет в конкретном журнале, к количеству статей, опубликованных в данном журнале за те же годы. Владение методиками планирования экспериментов необходимо, но не достаточно для успешной научно-исследовательской работы. Автор ожидает от читателя осознанного понимания того факта, что на современном этапе развития экологии при проведении НИР не- возможно обойтись без применения всего арсенала статистических методов. Отказ от использования статистических методов выглядит столь же экстравагантно, как, например, отказ от полетов на самоле- тах в пользу передвижения на лошадях, или использование голуби- ной почты вместо электронной. Конечная цель, теоретически, может быть достигнута и в том, и в другом случае; вопрос заключается в за- тратах на ее достижение и в убедительности полученных результатов для других ученых. Минимизация затрат, необходимых для получения максимально информативного и доказательного заключения, достигается за счет тщательного планирования всех этапов НИР, в первую очередь — процедуры сбора данных, то есть экологического эксперимента в широком смысле этого понятия (см. определение 5). Определение 2. Планирование эксперимента — комплекс про- цедур, направленных на эффективное выполнение исследований (включая выбор экспериментальных единиц [см. определение 14], типа и числа экспериментов и условий их проведения) и по- зволяющий решить поставленную задачу с требуемой точностью при минимальных затратах. 4
Теория планирования эксперимента — молодая наука, сфор- мировавшаяся немногим более полувека тому назад для решения прикладных (в первую очередь — сельскохозяйственных) задач. Основоположником этой теории принято считать выдающегося ан- глийского статистика Р. Фишера, написавшего книгу «The design of experiments» [Планы экспериментов] (Fisher, 1935). В настоящее время теория планирования эксперимента развивается на стыке вы- числительной математики, математической статистики, дискретной математики и теории оптимизации, а ее методы применяются, в пер- вую очередь, в точных науках, например, при анализе физических процессов. В результате для понимания учебных пособий, описы- вающих теорию оптимального эксперимента, от читателя требуется глубокое знание некоторых разделов высшей математики. Такими знаниями биологи, как правило, не обладают; однако это не означает, что логический аппарат и практические приложения этой теории не могут быть использованы в повседневной работе экологов. Курсы, в той или иной мере затрагивающие вопросы планирова- ния эксперимента, давно входят в программу подготовки биологов в большинстве западных университетов. В то же время многие из отечественных экологов, к сожалению, даже не подозревают о суще- ствовании не только теории планирования эксперимента, но и эле- ментарных расчетных методик, позволяющих, например, определить объем выборки, необходимой для решения стоящей перед исследо- вателем задачи. Это, в первую очередь, связано с отсутствием разде- ла по планированию эксперимента во всех известных мне пособиях по статистическому анализу, изданных в последние десятилетия на русском языке и предназначенных для студентов биологических спе- циальностей. В результате многие исследователи осознанно либо не- осознанно копируют экспериментальные планы своих предшествен- ников, не учитывая то обстоятельство, что экспериментальный план зависит от выбранного уровня значимости, ожидаемой величины эф- фекта и необходимой мощности статистического критерия. Все эти характеристики, в свою очередь, зависят как от цели, так и от объ- екта исследования. Слепое копирование схем, когда-то примененных одним из авторитетных ученых, уже привело к тому, что значитель- ное количество опубликованных экологических работ основано на экспериментальных планах, которые практически не оставляют ис- следователю шансов на решение поставленных задач. 5
Автор попытался изложить некоторые аспекты планирования экс- периментов в сочетании с избранными разделами математической статистики (в максимально адаптированной форме) таким образом, чтобы приведенные рекомендации было легко использовать в прак- тической работе. Рассматриваемый набор экспериментальных пла- нов, безусловно, не полон, однако он достаточен для решения наибо- лее часто встречающихся экологических задач. Читателя, желающего получить более глубокие знания в этой области, автор отсылает к третьей части списка литературы. В нее, в частности, включены по- собия, рассматривающие математический аппарат построения моде- ли исследуемого объекта, выбор параметра оптимизации и решение экстремальных задач, посредством которых находят оптимальные ус- ловия протекания изучаемого процесса. Одна из особенностей книги заключается в том, что ко многим понятиям и проблемам читатель будет возвращаться несколько раз, с постепенным повышением уровня сложности обсуждаемого мате- риала. Это связано с тем, что для тщательного планирования эколо- гического эксперимента необходимо довольно много информации, включая предварительную оценку величины эффекта, который на- деется обнаружить исследователь. Более того, различные параметры экспериментального плана, например, объем выборки и вероятности ошибок первого и второго рода, взаимосвязаны друг с другом, что делает практически невозможным «линейный» путь изложения мате- риала (от простого к сложному). Выбранный автором «спиральный» путь, естественно, также не лишен недостатков, однако для облегче- ния понимания материала в текст включены перекрестные ссылки на предыдущие и последующие разделы, в которых обсуждаются упо- минаемые понятия и проблемы. Книга снабжена многочисленными примерами (в стиле «что такое хорошо и что такое плохо»), большинство из которых взято из пуб- ликаций российских ученых или основано на личном опыте автора. Каждая из приведенных формул сопровождается примером расчета с использованием конкретных значений переменных и с объяснением полученного результата. При этом все справочные материалы, необ- ходимые для расчетов, включены в книгу; это, однако, не означает, что автор призывает выполнять все расчеты вручную, отказываясь от использования статистических программ и онлайн калькулято- ров. Поскольку книга представляет собой учебное пособие, ссылки 6
на предшествующие публикации (за исключением случаев прямого цитирования) в тексте, как правило, не приводятся; однако все источ- ники перечислены в списке использованной литературы. Книга основана на лекционном курсе, подготовленном в 2000 г. для молодых ученых Кольского научного центра при финансовой поддержке Совета министров Северных стран. Этот курс был моди- фицирован в 2003 г. для сотрудников кафедры геоботаники Санкт- Петербургского государственного университета и существенно пе- реработан в 2012-2013 гг. для студентов и сотрудников Северного (арктического) федерального университета им. М. В. Ломоносова (г. Архангельск). Завершение работы над рукописью стало возмож- ным благодаря поддержке Университета г. Турку (программа раз- вития стратегических исследований). Автор глубоко признателен первым читателям рукописи — Е. Л. Зверевой, Б. Ю. Филиппову, Е. Л. Воробейчику, В. Ш. Баркану, Н. М. Зверевой и Т. Т. Горбачевой, критические замечания которых позволили существенно улучшить содержание книги. Автор будет считать свою задачу выполненной, если книга по- может читателю научиться правильно формулировать вопросы. связанные с планированием экологических исследований. Все при- веденные в книге расчетные методы представляют собой лишь вспо- могательные инструменты; их применение для поиска ответов на не- корректно сформулированные вопросы не имеет смысла.
Условные обозначения С1р — доверительный интервал, в который с вероятностью Р по- падет индивидуальное значение случайной величины CV — коэффициент вариации dabs — абсолютная ошибка измерения (выраженная в единицах измерения) Dabs — минимальное абсолютное различие между двумя средними значениями, которое планирует обнаружить исследователь (D = | х,-х9|) drel — относительная ошибка измерения (то есть отношение аб- солютной ошибки измерения к действительному или изме- ренному значению исследуемой переменной, выраженное в процентах) Drel — минимальная относительная величина различий, которую планирует обнаружить исследователь (Drel = |х, - х2| / о) df — число степеней свободы ES — величина эффекта F — значение критерия Фишера G — объем конечной генеральной совокупности Но — нулевая гипотеза Ц — альтернативная гипотеза к — количество групп, сравниваемых в дисперсионном анализе К — параметр негативного биномиального распределения п — объем выборки nG — объем выборки из генеральной совокупности конечного объема G пк — число повторностей в каждой из сравниваемых к групп Р — вероятность события либо достигнутый уровень значимо- сти г — коэффициент линейной корреляции Пирсона га — критическое значение коэффициента линейной корреляции для уровня значимости а t — расчетное значение критерия Стьюдента ta — критическое значение критерия Стьюдента для уровня зна- чимости а W — размах варьирования (W = х - х ) х — среднее значение признака 8
Xmax — максимальное значение признака xmm — минимальное значение признака Y — накопленное значение признака (то есть сумма значений признака во всех проведенных наблюдениях) Zp — относительное (измеренное в значениях о: Z = | х - | / о) расстояние от среднего значения нормально распределен- ной случайной величины х до значения х экстремальнее которого располагается лишь равная Р доля значений этой величины а — уровень значимости (вероятность совершить ошибку пер- вого рода, то есть отклонить истинную нулевую гипотезу) Р — вероятность совершить ошибку второго рода, то есть при- нять ошибочную нулевую гипотезу (величину 1 - р назы- вают мощностью анализа) о — среднеквадратическое отклонение Ф — коэффициент, применяемый при определении объема вы- борки для экспериментальных планов, предусматрива- ющих сравнение между двумя и более группами, а также при определении мощности дисперсионного анализа
Глава 1. Статистический образ мышления 1.1. Вероятность случайного события Определение 3. Вероятность — это численная мера возможности наступления некоторого события. Одно из ключевых понятий, используемых в данной книге, — ве- роятность некоторого события. Более корректно говорить о вероят- ности случайного события, то есть единичного события, результат которого невозможно точно предсказать. Классические примеры случайных событий относятся к области азартных игр, изучение ко- торых в XVII веке привело к созданию основ теории вероятностей. Например, при подбрасывании игральной кости может выпасть зна- чение от одного до шести; если кость идеально сбалансирована, то мы не можем точно предсказать результат одного броска. Однако когда случайное событие повторяется несколько раз, мы можем опре- делить средние вероятности различных его исходов. В примере с бросанием кости вероятности выпадения всех возможных значений одинаковы и равны 1/6. Вероятность события обозначают латинской буквой Р (от англ. probability — вероятность); она изменяется в интервале от 0 (не- возможное событие, то есть событие, которое никогда не происхо- дит) до 1 (событие происходит всегда). Применительно к бросанию игральной кости в условиях Земли невозможным событием (Р = 0) можно считать зависание кости в воздухе, в то время как вероятность падения кости на стол (или любую другую поверхность) равна еди- нице. Важно запомнить, что если событие имеет всего два возмож- ных исхода, то сумма их вероятностей равна единице. Например, пойманная птица окажется либо самцом, либо самкой; интересую- щий нас вид будет либо присутствовать, либо отсутствовать в пробе; экспериментальное растение либо выживет, либо погибнет. Как при планировании экспериментов, так и при анализе их ре- зультатов экологи используют вероятностный подход. Наиболее важ- ный результат любого статистического теста — это достигнутый уровень значимости. Определение 4. Достигнутый уровень значимости (Р) — это ве- роятность получения такого же (или более экстремального) зна- чения статистического критерия в длинной серии повторных вы- 10
борок при условии справедливости нулевой гипотезы (подробнее о гипотезах см. в разделе 6.1). При этом чем меньше значение Р, тем больше оснований для отклонения нулевой гипотезы. 1.2. Статистический подход к событиям повседневной жизни Практически все дееспособные люди, сами того не осознавая, широко используют теорию вероятностей и математическую стати- стику в повседневной жизни. В качестве дидактического примера рассмотрим поездку некоего субъекта из дома на работу (с оценкой средней продолжительности каждого из этапов в минутах): • выйти из квартиры, запереть дверь квартиры — 0,5 минуты; • спуститься на 1-й этаж — 1,5 минуты; • выйти из дома и дойти до остановки автобуса — 2 минуты; • дождаться нужного автобуса — 10 минут; • войти в автобус, доехать до нужной остановки, выйти из автобу- са— 10 минут; • дойти от остановки автобуса до места работы — 4 минуты. Отметим, что оценки среднего времени, необходимого для про- хождения различных этапов маршрута, сильно отличаются по одно- му из компонентов точности, а именно — по разбросу индивидуаль- ных значений относительно среднего значения. Если этот разброс мал (как, например, при оценке времени, необходимого для того, чтобы дойти от остановки автобуса до места работы), то говорят, что оценка имеет высокую точность (англ, precision; см. раздел 9.2). Если этот разброс велик (как, например, при оценке времени, необходи- мого для того, чтобы дождаться нужного автобуса), то говорят, что оценка имеет низкую точность. Суммируя приведенные оценки, получим, что в среднем нашему субъекту необходимо 28 минут для того, чтобы добраться от квар- тиры до рабочего места. Эта величина получена в результате не- осознанного анализа множественных наблюдений без применения методов математической статистики и представляет собой часть жиз- ненного опыта конкретного человека. В то же время с точки зрения математической статистики полученное значение представляет собой математическое ожидание — одну из важнейших характеристик рас- пределения случайной величины. И
Итак, в нашем примере некий субъект в среднем тратит на поезд- ку из дома на работу 28 минут. Зададимся вопросом, за сколько ми- нут до начала рабочего дня нашему субъекту необходимо начать свое путешествие с тем, чтобы не опоздать на работу? Совершенно очевидно, что полностью избежать опозданий невоз- можно, то есть вероятность опоздания — величина ненулевая (Р > 0). Поэтому для решения поставленной задачи нам необходимо оце- нить тяжесть последствий опоздания для нашего субъекта. Рассмот- рим следующие варианты: • скорее всего, никто не заметит; • шеф накричит; • штраф в размере дневной зарплаты; • штраф в размере 5-дневной зарплаты; • тюремное заключение на срок от 4 до 6 месяцев. Примем, что наш субъект установил для себя следующее соответ- ствие между ожидаемой тяжестью последствий и приемлемой веро- ятностью опоздания на работу: • Скорее всего, никто не заметит: Р = 0,20, то есть допустимо одно опоздание в течение 5 рабочих дней. • Шеф накричит: Р = 0,10, то есть допустимо одно опоздание в течение 10 рабочих дней. • Штраф в размере дневной зарплаты: Р = 0,05, то есть допустимо одно опоздание в течение 20 рабочих дней (примерно один месяц). • Штраф в размере 5-дневной зарплаты: Р = 0,004, то есть допусти- мо одно опоздание в течение 250 рабочих дней (примерно один год). • Тюремное заключение на срок от 4 до 6 месяцев: Р = 0,0001, то есть допустимо одно опоздание в течение 10000 рабочих дней (при- мерно 40 лет). Если в учреждении, где работает наш субъект, за опоздание нака- зывают штрафом в размере дневной зарплаты, то необходимо опре- делить такое граничное значение времени поездки, что вероятность его превышения (т. е. более продолжительной поездки) составит 5%. Таким образом, задача планирования поездки из дома на рабо- ту сводится к анализу частотного распределения продолжительности поездки. В нашем случае граничная величина составляет около 33 минут с момента выхода из дома (рис. 1). Это значение может быть как оценено интуитивно, так и рассчитано на основании некоторого количества эмпирических данных. При этом естественным образом 12
16 20 21 22 23 24 26 26 27 28 29 30 31 32 33 34 37 38 Время поездки (минуты) Рис. 1. Частотное распределение продолжительности поездки из дома на работу. Стрелками показаны приближенные значения времени, которое необходимо запланировать на поездку для того, чтобы вероятность опоз- дания на работу составляла 20, 10 и 5% (пояснения в тексте). возникают вопросы о том, сколько раз необходимо измерить продол- жительность поездки и с какой точностью следует производить эти замеры. Ответы на эти (и многие другие) вопросы можно получить, используя описанные ниже (см. главы 7 и 9) методы. 1.3. Суждения вероятностные и истинные Предыдущий раздел был призван убедить читателя в том, что су- щественная часть «жизненного опыта» представляет собой результат неосознанной статистической обработки множественных наблюде- ний. Подобно герою Мольера, который и не подозревал, что говорит прозой, мы используем теорию вероятностей гораздо чаще, чем сами об этом догадываемся, и многие наши суждения носят вероятност- ный характер, например: • команда А сильнее команды Б; • овощи на колхозном рынке дешевле, чем в супермаркете; 13
• питбули агрессивнее пуделей; • черемуха зацветает раньше рябины. Все эти высказывания справедливы «в среднем», поскольку осно- ваны на интуитивной обработке значительного количества наблюде- ний. При этом отдельные наблюдения вполне могут противоречить общей (центральной) тенденции: команда А может проиграть матч команде Б, а несущийся к Вам со всех ног питбуль может оказаться самой доброй собакой на свете. Именно наличие исключений делает эти суждения вероятностными, в отличие от истинных высказыва- ний, например: • площадь квадрата равна квадрату длины его стороны (функцио- нальная связь); • свинец тяжелее меди (фундаментальные свойства вещества); • Эйфелева башня выше главного здания Московского государ- ственного университета (сравнение конечного количества однознач- но определенных объектов); • вчера в центре Архангельска шел дождь (событие уже сверши- лось). В экологических исследованиях функциональные связи не встре- чаются (или встречаются исключительно редко), а свойства объ- ектов, как правило, несводимы к фундаментальным свойствам ве- щества. При этом экологи стремятся сделать выводы, имеющие предсказательную ценность, о неопределенном количестве объектов (например, о всех особях, принадлежащих к изучаемому виду). Как результат, экология основана на вероятностных суждениях. Следова- тельно, в научной публикации любое утверждение должно сопрово- ждаться оценкой вероятности того, что оно истинно. 1.4. Учимся понимать статистические выводы Как это ни странно, многие экологи затрудняются ответить на ка- жущийся элементарным вопрос: вероятность какого именно события определяет значение Р, рассчитанное в ходе статистического анали- за эмпирических данных? Поскольку четкое понимание смысловой нагрузки достигнутого уровня значимости необходимо как для пла- нирования экспериментов, так и для интерпретации их результатов, мы обсудим этот вопрос с использованием ряда примеров различной сложности. 14
Пример 1 (интерпретация вероятности случайного события). Газета Guardian сообщила об участившихся случаях раковых за- болеваний в городе Олдермастон в Великобритании (где находится производство радиоактивных веществ) с использованием следую- щей вероятностной оценки: «probability of chance occurrence is 1 of 10,000,000» [вероятность случайного наблюдения составляет 1 к 10 млн.]. Вероятность какого именно события приведена в газетной заметке? Объяснение: Скорее всего, в данном примере приведена вероятность того, что наблюдаемая картина (то есть повышенная заболеваемость в городе Олдермастон и его окрестностях) могла возникнуть при случайном распределении частот раковых заболеваний (выраженных как коли- чество заболевших за год из 1000 человек населения) по сравнивае- мым административным территориям в пределах страны. Однако для однозначного ответа на поставленный вопрос нам недостает инфор- мации о том, какую именно гипотезу (см. определение 21 и 22) про- веряли авторы цитируемого в газете исследования. Здесь возможны как минимум три варианта. Вариант 1: • Нулевая гипотеза: частоты раковых заболеваний распределены по территории страны случайным образом. • Альтернативная гипотеза: распределение частот раковых забо- леваний по территории страны отличается от случайного. Вариант 2: • Нулевая гипотеза: частота раковых заболеваний в городе Олдер- мастон не отличается от средней по стране. • Альтернативная гипотеза: частота раковых заболеваний в горо- де Олдермастон отличается от средней по стране. Вариант 3: • Нулевая гипотеза: частота раковых заболеваний в городе Олдер- мастон не отличается от средней по стране. • Альтернативная гипотеза: частота раковых заболеваний в горо- де Олдермастон выше, чем в среднем по стране. Все три варианта, исходя из логических принципов, имеют пол- ное право на существование. Однако, забегая вперед, отметим, что вариант 1 отличается от вариантов 2 и 3 методами как сбора, так и обработки данных. Вариант 3 отличается от варианта 2 мето- 15
дом обработки данных, причем для проверки гипотезы 3 требуется меньшая выборка, чем для проверки гипотезы 2 (поскольку альтер- нативная гипотеза 3 предсказывает направленность ожидаемых из- менений, то при ее проверке можно использовать более мощный односторонний тест; подробнее см. пример 56 и любой курс матема- тической статистики). Данный пример иллюстрирует как важность четкой формулировки гипотез (подробнее см. в разделе 6.2), так и необходимость тщательного планирования любого исследования, вы- воды которого будут носить вероятностный характер. Отметим также, что опубликованный вывод не содержит инфор- мации о величине эффекта (см. определение 25), хотя для жителей города Олдермастон она может оказаться более важной, чем вероят- ность того, что в их городе раковые заболевания наблюдаются чаще, чем в среднем по стране. Для принятия решения (в данном случае — о модернизации производства либо об эвакуации жителей города) ве- личина эффекта обычно гораздо важнее его статистической значимо- сти: сравним, например, возрастание частоты раковых заболеваний на 10% при 95%-ной значимости данного результата и на 0,1% при значимости 99,9%. Очевидно, что первая ситуация встревожит жи- телей города гораздо больше, хотя вероятность ошибочного вывода ниже во втором случае. Пример 2 (интерпретация вероятности случайного события). Длина листа (точнее, листовой пластинки) березы пушистой умень- шается с возрастанием широты места сбора материала (г = -0,76, п [объем выборки, для которой рассчитан коэффициент корреля- ции] = 10 [мест сбора материала], Р = 0,01). Вероятность какого со- бытия составляет 0,01? Объяснение: В данном примере Р = 0,01 — это вероятность того, что на самом деле (то есть в исследуемой нами генеральной совокупности: см. опре- деление 11) корреляция между длиной листа березы и широтой места сбора листьев отсутствует (истинное значение г = 0,00), а вычисленное нами (на основании выборки из генеральной совокупности, включаю- щей 10 пар значений — широты места сбора листьев и средней дли- ны листа в этом месте сбора) значение коэффициента корреляции (г = -0,76) возникло в результате слепой игры случая при взятии выборки. Пример 3 (интерпретация вероятности случайного события). Длина листа березы пушистой не зависит от широты места сбора ма- 16
териала (г = -0,36, п = 10, Р = 0,31). Вероятность какого события со- ставляет 0,31? Объяснение: В данном примере Р = 0,31 — это вероятность того, что в иссле- дуемой нами генеральной совокупности корреляция между средней длиной листа березы и широтой места сбора листьев отсутствует (г = 0,00), а вычисленное нами значение коэффициента корреляции (г = -0,36) возникло случайно. При сравнении примеров 2 и 3 необходимо обратить внимание на то, что исследователь, получив разные оценки вероятности истин- ности нулевой гипотезы (1% в примере 2 и 31% в примере 3), при- шел к принципиально разным выводам: корреляция есть (пример 2) и корреляции нет (пример 3). Подобный переход от интервальной оценки вероятности к бинарному выводу (да/нет) возможен лишь потому, что ученые договорились отклонять нулевую гипотезу, если вероятность того, что она верна, не превышает 5%. При переходе от интервальной оценки к бинарному выводу, естественно, происходит некоторая потеря информации. Поэтому солидные журналы требуют от авторов приводить численные значения достигнутого уровня зна- чимости для всех статистических тестов. Практическая рекомендация 1. Не следует абсолютизировать «критическое» значение Р = 0,05 — это лишь условная граница меж- ду, скорее всего, верными и, скорее всего, ошибочными гипотезами. Избегайте крайностей, подобных следующей: «Значимые различия были найдены между популяциями А и В (Р = 0,045), в то время как популяции В и С не различались (Р = 0,055)» (пример приведен по: Yoccoz, 1991). В примерах 2 и 3 исследователь получил разные оценки силы связи (г = -0,76 и г = -0,36) между длиной листа и широтой мест- ности. Однако для вывода о справедливости гипотезы об отсутствии связи между длиной листа и широтой места сбора эти различия не представляют интереса. Пример 4 (зависимость вероятности случайного события от объема выборки). Не удовлетворившись результатом, описанным в примере 3, исследователь собрал дополнительный материал и при- шел к выводу, что длина листа березы уменьшается с широтой места сбора материала (г = -0,35, п = 50, Р = 0,01). Почему при увеличении объема выборки изменился результат исследования? Объяснение: 17
Чем меньше выборка, тем больше вероятность того, что получен- ный результат отражает лишь игру случая, а не реально существую- щую закономерность. Именно поэтому с использованием малых вы- борок можно изучать только сильные эффекты (см. ниже, табл. 11 и пример 62). Сравнение примеров 3 и 4 показывает, что малый объем выборки сам по себе не служит препятствием для корректной оценки величи- ны эффекта, поскольку в обоих случаях исследователь получил прак- тически одинаковые оценки силы связи (г = -0,36 и г = -0,35) между длиной листа и широтой местности. Однако при проверке нулевой гипотезы об отсутствии связи между длиной листа и широтой места сбора это сходство не представляет интереса и не связано с выводом исследователя, который отклонил нулевую гипотезу в примере 4, но не в примере 3. Сопоставление этих примеров наглядно демонстри- рует отсутствие однозначного соответствия между силой связи (ве- личиной эффекта) и вероятностью принятия либо отклонения нуле- вой гипотезы, поскольку эта вероятность зависит как от силы связи, так и от объема выборки. В целом примеры 2-4 демонстрируют не- обходимость учета обоих параметров при планировании эксперимен- тальной проверки выдвинутой гипотезы. 1.5. Что значит «достоверно»? Четкость формулировок чрезвычайно важна при описании как методики исследований, так и полученных результатов. Особенно важно стремиться к максимальному сужению смыслового спектра научных терминов. В этом отношении описанию результатов стати- стического анализа явно «не повезло» в русскоязычной биологиче- ской и медицинской литературе, где прочно закрепилось слово «до- стоверность» (подробнее см.: Козлов, Воробейчик, 20126). «Достоверность» подсознательно ассоциируется с «абсолютной доказанностью», «надежностью», «несомненностью», «безошибоч- ностью», а «достоверная связь» — с причинно-следственной, что не- корректно по отношению к вероятностным выводам. Статистика не занимается «определением достоверности» — статистический ана- лиз позволяет лишь определить вероятность того, что некоторая ги- потеза верна. 18
Изначально использование понятия «достоверность» было свя- зано с некорректным переводом английского термина «significance». Не исключено также, что определенную роль в его широком рас- пространении сыграла ошибочная ассоциация с одним из понятий теории вероятности — достоверным событием (то есть событием, вероятность которого равна единице). В любом случае, поскольку слово «достоверность» перегружено смыслом, в строго статистиче- ском значении его лучше не употреблять, используя термин «стати- стическая значимость».
Глава 2. Экспериментальный метод в современной экологии 2.1. Базовые понятия Определение 5. Эксперимент (лат. experimentum — проба, опыт) — метод познания, при помощи которого в контролируе- мых или управляемых условиях исследуются явления действи- тельности с целью проверки гипотез (подробнее см. раздел 6.1), сформулированных до начала эксперимента. Эксперимент, как одна из форм практики, выполняет функцию критерия истинности научного познания в целом. Исследования, проводимые без активного оперирования изучаемым объектом и без выдвижения определенной гипотезы, называются наблюдениями (подробнее см. раздел 6.1). Определение 6. Эксперимент называется активным, либо конт- ролируемым (англ, manipulative), если он проводится с приме- нением искусственного воздействия на часть объектов по спе- циальной программе, причем экспериментатор может при его постановке выбирать между некоторыми возможными совокупно- стями условий. Эксперимент называется пассивным, либо измери- тельным (англ, mensurative), если экспериментатор не вмешива- ется в естественный ход событий, а регистрирует характеристики объекта, пребывающего в обычных для него условиях. Пример 5 (описание активного и пассивного экспериментов). Как экспериментально проверить гипотезу о том, что березы, расту- щие в загрязненной сернистым газом атмосфере, формируют более короткие побеги, чем березы, растущие в незагрязненной атмосфере? Решение: 1. Активный эксперимент: провести фумигацию части берез, ра- стущих в контролируемых условиях, сернистым газом (с момента распускания почек и до окончания роста побегов) и сравнить длины побегов у фумигированных и контрольных особей. 2. Пассивный эксперимент: в конце вегетационного сезона изме- рить длины побегов у берез, растущих на разных расстояниях от про- мышленного предприятия, которое выбрасывает в атмосферу значи- тельные количества сернистого газа. 20
Иногда понятие «эксперимент» применяют только к активным экспериментам, а пассивные эксперименты называют наблюдени- ями. Однако в данной книге принято широкое толкование термина «эксперимент», и вопросы планирования рассматриваются примени- тельно ко всем типам экспериментов. Это объясняется тем, что как активные, так и пассивные эксперименты требуют формулировки цели и задач исследования (подробнее см. раздел 4.1), разработки гипотез (подробнее см. раздел 6.1), выбора экспериментальных и из- меряемых единиц (подробнее см. раздел 5.1) и разработки методов регистрации результатов (подробнее см. главу 9), отличаясь лишь на- личием либо отсутствием воздействия экспериментатора на изучае- мый объект. Важная характеристика экспериментального метода — конструи- рование предметов и ситуаций, многие из которых до этого не суще- ствовали в природе. «Полигоном» для такого конструирования часто служит лаборатория — место, которое создано разумом, а не природой. Не следует думать, что планирование применимо только к актив- ным экспериментам. Напротив, планирование пассивного экспери- мента, особенно многолетнего (например, организация мониторинга популяций животных и растений), не только необходимо, но и пред- ставляет собой гораздо более сложную задачу, чем планирование ак- тивного экспримента. Это связано с тем, что при равных требовани- ях к качеству результатов в пассивном эксперименте исследователь лишен возможности манипулировать объектами (например, изменять их положение в пространстве) и вынужден использовать более изо- щренные методы для придания доказательной силы результатам ис- следования (подробнее см. раздел 5.5). Определение 7. Мысленный эксперимент — это система мыс- ленных, практически не осуществляемых (и часто практически не осуществимых) процедур, обычно проводимых над идеальными объектами. Как правило, мысленные эксперименты проводятся над моделями реальных ситуаций для проверки согласованности неких теоретиче- ских построений. Мысленный эксперимент типичен для фундамен- тальных исследований в области точных наук. Однако в определен- ных случаях мысленный эксперимент может оказаться полезен и для предварительной проверки экологических теорий. 21
Пример 6 (описание мысленного эксперимента). Одна из ос- новных теорий биогеографии утверждает, что количество видов, населяющих определенную территорию, прямо пропорционально логарифму площади этой территории. Альтернативная теория (так называемый эффект малых островов; англ, small island effect) ут- верждает, что указанное соотношение выполняется только в опреде- ленном диапазоне размеров сравниваемых территорий, а ниже неко- торого граничного значения количество видов не зависит от площади участка (подробнее см.: Lomolino, Weiser, 2001). Какой мысленный эксперимент может быть использован для сравнения этих двух тео- рий? Решение: Зададимся вопросом, сколько видов можно обнаружить на участ- ке бесконечно малой (практически нулевой) площади. Мысленно уменьшая площадь участка, выясним, что базовая модель предсказы- вает уменьшение числа видов, так что на участке нулевой площади будет обитать ноль видов. В то же время, согласно альтернативной модели, на участке нулевой площади будет обитать ненулевое коли- чество видов. Таким образом, мысленный эксперимент показывает, что базовая модель лучше согласуется с реальностью, чем альтерна- тивная. Френсис Бэкон, один из родоначальников экспериментального метода, считал, что в древности не было научного эксперимента (под которым он понимал активный эксперимент), и видел в этом при- чину неудач античной науки. В отличие от хаотичного, случайного блуждания в поисках знаний, экспериментальный метод создает ус- ловия для уверенного движения познающего разума к новым откры- тиям. Именно контролируемые эксперименты позволили отойти от традиционного для античных ученых описания природы и перейти к естествоиспытанию. 2.2. Установление причинно-следственных связей в активном и пассивном эксперименте Особую важность имеют экспериментальные исследования, на- целенные на установление причинно-следственных связей. Как пра- вило, такие исследования основываются на активных экспериментах. При этом объекты эксперимента должны быть специально отобраны 22
и подвергнуты запланированным воздействиям (при фиксированных или, по меньшей мере, контролируемых внешних условиях) для того, чтобы выявить статистически значимые отличия их реакции от реак- ции сходных объектов, которые этому воздействию не подвергались. Устанавливаемые таким образом связи между событиями после их критического анализа обычно считаются причинно-следственными. Однако даже и при использовании активных экспериментов причин- но-следственные связи удается установить далеко не во всех случаях (подробнее см.: Fabricius, De’ath, 2004). Пример 7 (интерпретация результатов активного экспери- мента). «Согласно публикациям в не очень научной литературе, омагниченная вода творила чудеса: растворяла почечные камни, выращивала утраченные зубы, невиданно повышала урожайность сельскохозяйственных культур. Этот последний аспект выросшему в деревне Пете показался особенно важным. Как это делается в на- уке, Петя выдвинул гипотезу, что существует волшебное сочетание напряженности магнитного поля и времени обработки, и приступил к опытному ее подтверждению... Для создания магнитного поля на институтском заводе изготовили похожий на здоровенную катушку соленоид диаметром около метра и длиной метра три. К сельсовету подъехали около полудня. Соленоид на платформе, обвитый толстыми проводами, был похож на лазерную пушку и на ракетную пусковую установку одновременно. Около него мгновенно образовалась толпа. Председатель колхоза встретил ученых, как во- дится, хлебом-солью. После плотного обеда поехали подсоединять соленоид к системе орошения. Петя принял на грудь несколько лиш- них рюмок и его вдруг понесло. Он стал прозрачно намекать на се- кретные разработки и ввернул совсем не к месту радиацию. С этого момента местные решили, что от опытного поля лучше держаться подальше... Собирать урожай с опытного поля прислали подмогу из об- ластного центра. Машины с магнитными огурцами пошли в город. Колхозники, как всегда, воровали огурцы ведрами, мешками и при- цепами, но только с обычного поля, которое в данном случае было контрольным. Даже председатель, говоря между нами, на опытном поле старался бывать пореже, магнитные огурцы не ел и гостей ими не угощал. Зато в областном центре они шли нарасхват. Их туда от- 23
правляли почти каждый день, но поспевали все новые и новые, и казалось, что этой огуречной реке не будет конца. Впервые в исто- рии хозяйства план поставок огурцов в город был выполнен и пере- выполнен без всяких приписок. Председатель... с радостью выдал Пете совершенно честную справку в том, что урожай на опытном поле превысил урожай на контрольном почти втрое.» (История при- водится в сокращенном виде; полный текст: http://www.anekdot.ru/an/ an0704/o070417.html#10) Комментарии: 1. Данный пример демонстрирует необходимость строго контроли- ровать ход эксперимента, минимизируя влияние побочных факторов. 2. Население (действия которого, как выясняется, выступали в ка- честве основного побочного фактора) было информировано о том, на каком поле проводится эксперимент и, следовательно, не были вы- полнены условия «слепого теста» (подробнее см. раздел 5.3). 3. Легко предположить, что рачительный председатель отдал под опыты то поле, которого было не жалко (или наименее жалко), по- скольку урожаи там всегда были хуже, чем на втором (контрольном) поле или же, наборот, лучшее поле, если он был лично заинтересо- ван в результате эксперимента или верил в то, что испытываемый метод действительно увеличит урожайность. Следовательно, выбор опытного поля не был случайным. 4. Таким образом, описанный выше опыт был заложен с грубы- ми методическими ошибками, главные из которых — отсутствие повторностей и неслучайное соотнесение опыта и контроля с инди- видуальными участками (экспериментальными единицами, см. опре- деление 14). При любом исходе опыта эти методические ошибки дают основание усомниться в обоснованности полученных выводов. Интерпретация результатов пассивного эксперимента в терми- нах причинно-следственных связей гораздо более сложна. К сожале- нию, экологи далеко не всегда задумываются об этом. Так, например, вблизи крупных металлургических предприятий часто формируются техногенные пустоши, представляющие собой очень яркие примеры крайней деградации лесных экосистем, вызванной промышленным загрязнением. Причина образования пустошей столь очевидна, что у исследователей невольно формируется своеобразный стереотип — априорное принятие гипотезы о том, что пустоши возникли в ре- 24
зультате длительного воздействия промышленных выбросов. Однако это именно гипотеза, и ее доказательство представляет собой непро- стую задачу (см. ниже, пример 8). Для установления причинно-следственных связей в условиях пас- сивного эксперимента (как, например, в случае промышленных пу- стошей, где некоторое воздействие произошло не только без участия экспериментатора, но и при отсутствии контроля со стороны экспе- риментатора) можно использовать критерии Хилла, разработанные в эпидемиологии. Эти критерии включают: 1. Силу (англ, strength) и устойчивость (англ, consistency) наблю- даемых связей между явлениями, причинно-следственный характер которых мы планируем доказать. 2. Специфичность этих связей (англ, specificity). 3. Согласованность этих связей во времени (англ, temporality). 4. Существование зависимости между дозой воздействия (пред- полагаемой причиной) и величиной эффекта (предполагаемым след- ствием) (англ, dose dependence). 5. Согласованность с известными экологическими и биологиче- скими фактами, общее правдоподобие (англ, plausibility). 6. Возможность воспроизведения исследуемой причинно-след- ственной связи (либо ее отдельных элементов) в условиях экспери- мента. 7. Аналогию со сходными, лучше изученными ситуациями. Важно отметить, что ни один из критериев Хилла, взятый отдель- но от других, не доказывает наличия причинно-следственной связи. С другой стороны, ни один из критериев не считается абсолютно не- обходимым для доказательства этой связи. Чем большему количеству критериев удовлетворяет изучаемая связь, тем более обоснован будет наш вывод о ее причинно-следственном характере (подробнее см.: Hill, 1965; Fox, 1991; Fabricius, De’ath, 2004). К сожалению, не суще- ствует способа оценки статистической значимости подобного доказа- тельства. Пример 8. Можно ли считать доказанной гипотезу о том, что именно длительное воздействие атмосферных выбросов послужило причиной возникновения промышленных пустошей вблизи крупных предприятий цветной металлургии? Решение: 1. Воспользуемся информацией о промышленных пустошах, со- держащейся в обзорной работе (Kozlov, Zvereva, 2007). Проверим, 25
каким из перечисленных выше критериев удовлетворяет эта инфор- мация. 2. Большая часть известных пустошей (33 из 35) расположена во- круг предпрятий цветной металлургии (выполнены критерии 1 и 2: устойчивость и специфичность связей). 3. Во всех случаях пустоши возникли после начала работы заво- дов (выполнен критерий 3: согласованность этих связей во времени). 4. Размеры промышленных пустошей примерно пропорциональ- ны объему атмосферных выбросов предприятий, возле которых они расположены, а их внешние границы примерно совпадают с зоной сильного загрязнения почвы тяжелыми металлами (выполнен крите- рий 4: существует зависимость между дозой воздействия и величи- ной эффекта). 5. Экспериментально доказано, что как сернистый газ, так и тя- желые металлы (то есть основные компоненты атмосферных выбро- сов предприятий цветной металлургии) оказывают угнетающее воз- действие на живые организмы, часто приводя к их гибели (выполнен критерий 6: исследуемая причинно-следственная связь может быть частично воспроизведена в условиях эксперимента). 6. Феноменологическая модель, описывающая возможный путь развития промышленной пустоши на месте лесной экосистемы (опу- бликованная в цитированной выше работе) не противоречит ни од- ной из общепринятых экологических теорий (выполнен критерий 5: согласованность с известными экологическими и биологическими фактами, общее правдоподобие). 7. Основываясь на приведенном анализе, мы можем считать гипо- тезу о наличии причинно-следственной связи между атмосферными выбросами предприятий цветной металлургии и развитием промыш- ленных пустошей доказанной (приведено по: Kozlov et al., 2009). 2.3. Мета-анализ как эффективный способ статистического обобщения результатов независимых исследований Выявление закономерностей на основе обобщения частных ре- зультатов — наиболее интересная, но в то же время и наиболее труд- ная задача любого научного исследования (что, в частности, показы- вает рассмотренный выше пример 8). Хотя статистический анализ 26
первичных данных широко применяется в экологии начиная с первой четверти XX в., вплоть до 1970-х гг. не существовало формализо- ванных способов количественного анализа и синтеза накопленной информации. Вследствие этого обзорные работы страдали от неиз- бежного, порой неосознанного, субъективизма: их выводы были не- воспроизводимы из-за отсутствия строгих критериев как подбора рассматриваемых публикаций, так и оценки качества содержащихся в них данных. Эта проблема была решена с появлением мета-анализа — относи- тельно нового статистического подхода, позволяющего количествен- но объединять результаты нескольких независимых исследований. Суть мета-анализа заключается в переводе разнородных данных из отобранных по определенным критериям публикаций в сопостави- мые величины эффектов (англ, effect sizes) с последующим анализом полученных оценок для нахождения общих закономерностей, а так- же для выявления факторов, определяющих изменчивость резуль- татов исследований. При этом мета-анализ в явном виде учитывает репрезентативность каждого из первичных исследований, придавая больший вес тем работам, которые основаны на большем количестве независимых повторностей (подробнее см.: Handbook of meta-analy- sis in ecology and evolution, 2013). Далеко не каждая задача заслуживает применения мета-анали- за для ее решения. Этод метод наиболее эффективен в тех случаях, когда накоплен значительный объем информации, а ее предваритель- ный анализ показал, что величины эффектов в среднем относительно малы, результаты различных исследований противоречивы и трудно сопоставимы, а также есть основания подозревать смещение оценок величины и направленности эффекта из-за предвзятости исследова- телей и/или редколлегий журналов. Объективность мета-анализа достигается сочетанием двух обсто- ятельств — четко сформулированными критериями отбора публика- ций и объединением результатов первичных исследований на основе статистического подхода. Теоретически, выводы любого мета-ана- лиза полностью воспроизводимы: любой профессионал, используя описанные критерии отбора публикаций и методы поиска информа- ции, соберет тот же самый набор первичных исследований, извлечет из них те же данные и придет к тем же заключениям, что и его пред- шественники. 27
Следует признать, что мета-анализ не лишен недостатков. Одна из основных проблем — крайняя сложность анализа взаимодействия даже двух факторов, а также практическая невозможность статисти- ческого учета иерархии исследуемых факторов. Тем не менее, ме- та-анализ получил широкое распространение во многих областях, особенно в медицине; он широко применяется и в современной эко- логии, постепенно вытесняя традиционные обзоры и приобретая статус негласного стандарта для обобщения информации (подробнее см.: Козлов, Воробейчик, 2012а). Весьма вероятно, что в недалеком будущем ведущие международные журналы перестанут публиковать традиционные обзоры, и все обобщающие работы будут основаны на мета-аналитическом подходе. Простейший мета-анализ проводят для поиска общих закономер- ностей в совокупности первичных исследований, авторы которых пришли к различным, иногда противоречащим друг другу, выводам. Например, в некоторых работах не была обнаружена связь между уровнем промышленного загрязнения и разнообразием раститель- ных сообществ; более того, в ряде случаев разнообразие возрастало с загрязнением. Тем не менее, мета-анализ всей совокупности пу- бликаций показал, что в целом загрязнение ведет к уменьшению раз- нообразия сосудистых растений (детальное описание исследования: Zvereva et al., 2008). В то же время мета-анализ не сводится к простому суммирова- нию опубликованных данных. Наиболее важная и интересная его составляющая — поиск причин, определяющих различия между ре- зультатами индивидуальных исследований. При этом часто удается получить принципиально новую информацию, которая не содержа- лась ни в одной из первичных публикаций. Например, в упомянутом мета-анализе работ, посвященных изменению разнообразия расти- тельных сообществ в окрестностях источников промышленных вы- бросов, был сделан вывод о влиянии климата на величину эффекта: оказалось, что отрицательные эффекты загрязнения слабее выраже- ны в высоких широтах. Немаловажно, что мета-анализ позволяет выявить наименее изу- ченные аспекты анализируемой проблемы, тем самым определяя стратегию дальнейших исследований. Это достигается четкой визу- ализацией того, насколько равномерно представлен материал по той или иной группе объектов; при этом нередко выявляется недостаток 28
данных для количественного подтверждения тех закономерностей, которые считаются тривиальными и поэтому не изучаются. Мета-анализ может быть реализован только в том случае, если публикации с изложением первичных материалов позволяют рас- считать величину эффекта. Для этого описание результатов долж- но удовлетворять нескольким элементарным требованиям. Как правило, для расчета величины эффекта необходимы либо (а) зна- чение коэффициента корреляции между изучаемыми переменны- ми, а также количество повторностей, либо (б) средние значения, характеристики изменчивости (среднеквадратические отклонения или стандартные ошибки) и количество повторностей для «опыта» и «контроля». Если хотя бы один из этих элементов в публикации отсутствует или не обозначен (например, не указано, какая именно величина находится после знака «±» — стандартная ошибка или среднеквадратическое отклонение), то такая работа не может быть использована в мета-анализе. Фактически это равносильно тому, что ценная информация, на сбор и анализ которой были потрачены существенные усилия, не будет использована для поиска общих за- кономерностей. Помимо очевидных негативных последствий для автора такой публикации, невозможность включения в мета-анализ недостаточно полно изложенных результатов корректно проведен- ных исследований потенциально может привести к тому, что оценки величин эффектов, полученные с применением мета-анализа, ока- жутся смещенными (то есть недостаточно точными; подробнее см. раздел 9.2). 2.4. Описание методики и результатов эксперимента Современная экология развивается в основном за счет экспери- ментальных исследований. Чем выше в экологическом журнале доля работ, основанных на результатах контролируемых экспериментов, тем выше импакт-фактор журнала, то есть тем чаще (в среднем) ци- тируются опубликованные в этом журнале статьи (табл. 1). Журналы с наиболее высокими импакт-факторами, такие как Nature и Science, практически не публикуют описательные экологические работы. Однако для того, чтобы иметь шанс опубликовать свое исследо- вание в международном журнале с высоким импакт-фактором, автор должен не только спланировать и поставить эксперимент, но и тща- 29
тельно описать как его результаты (см. выше, раздел 2.3), так и ме- тодику исследования. Знание требований, которые международные журналы предъявляют к рукописям экологических статей, необходи- мо для понимания важности детальной проработки всех элементов экспериментального плана до начала исследования. Таблица 1 Доля экологических статей, основанных на контролируемых экспериментах, в некоторых международных и российских журналах (данные за 1999-2000 гг.) Журнал ИФ п Типы статей (%) ТГ (%) 1 2 3 Ecology 3,70 45 40 44 24 42 Journal of Applied Ecology 2,94 86 69 36 38 20 Plant Ecology 1,06 40 68 38 5 3 Boreal Environment Research - 33 73 18 9 0 Экология 0,14 64 81 11 13 0 Известия РАН. Серия биологическая - 28 61 11 32 0 Зоологический журнал 0,11 35 77 14 14 3 Ботанический журнал - 36 94 3 6 0 Примечания. ИФ — импакт-фактор журнала за 2001 г.; п — количество просмотренных статей; типы статей: 1 — эксперименты не проводились, 2 — эксперименты проводились в полевых условиях, 3 — эксперименты прово- дились в лабораторных условиях; ТГ — процент статей, в которых тестиро- валась хотя бы одна гипотеза. Международные журналы предъявляют более жесткие требо- вания к методической части статьи, чем российские. Как резуль- тат, методика исследований и обработки данных в международных журналах излагается более подробно, чем в российских. Так, объем раздела «Материалы и методы» в случайной выборке статей из оте- чественных журналов, публикующих работы по экологической тема- тике (Экология, Почвоведение, Известия РАН. Серия биологическая) в среднем равен 2,8 тысячам знаков, в то время как в аналогичных международных журналах (Oikos, Applied Soil Ecology, Environmental Pollution) — 7,0 тысячам знаков. Даже если нивелировать различия в общем объеме текста (в международных журналах он в среднем в 1,5 раза больше), отмеченная диспропорция сохраняется: в российских журналах доля раздела «Материалы и методы» составляет 18,5% от 30
общего объема текста, в зарубежных — 29,4% (подробнее см.: Коз- лов, Воробейчик, 2012а). Первая задача, стоящая перед исследователем, — предоставить читателю достаточное количество данных для повторения экспери- мента. То есть информация, содержащаяся в разделе «Материалы и методы», должна быть достаточна для того, чтобы другой специ- алист мог воспроизвести результаты опубликованного исследования. Для полевого эксперимента это означает, в частности, возможность отыскать участки, на которых работал исследователь, а также повто- рить сбор и анализ материала с использованием тех же самых (одно- значно определенных) методов. Вторая задача — предоставить читателю достаточное количество информации для обоснованного суждения об адекватности выбранно- го метода статистического анализа данных. Для этого всегда указыва- ются не только использованный метод (если возможно — со ссылкой на стандартные процедуры широко распространенных пакетов при- кладных программ), но и те свойства данных и характеристики экс- периментальных планов, которые определяют применимость выбран- ного метода анализа в данной конкретной ситуации. В то же время в отечественных журналах описание метода обработки данных часто вообще не приводится, либо это описание сформулировано весьма расплывчато, например: «Измерения обрабатывали методами матема- тической статистики с использованием программы MS Excel». Международные журналы отличаются от отечественных и по полноте представления результатов. Во-первых, результаты измере- ний (подсчетов) всегда включаются в статью — как правило, в виде таблиц или графиков. Если объем информации велик, то она публи- куется в виде электронных приложений к статье. Во-вторых, любые характеристики центральной тенденции (чаще всего среднее арифметическое) всегда приводятся в совокупности с характеристикой разброса данных (чаще всего со стандартной ошиб- кой) и с объемом выборки, на основании которой получены эти зна- чения. Отсутствие в публикации любой из трех указанных выше величин приводит к исключению количественной информации из на- учного оборота, в частности из-за невозможности ее использования в мета-анализе (см. выше, раздел 2.3). В-третьих, любое вероятностное утверждение, сделанное ав- тором, сопровождается ссылкой на статистический тест, с приведе- 31
нием расчетного значения критерия, числа степеней свободы и до- стигнутого уровня значимости. При этом автор всегда четко говорит «да» или «нет», то есть интерпретирует результаты статистического анализа и разграничивает ситуации, когда эффект обнаружен и ког- да эффект не наблюдался. Сложности возникают, если достигнутый уровень значимости оказывается в интервале от 0,05 до 0,10; в этом случае многое зависит от политики выбранного журнала и от важ- ности полученного результата для решения теоретических либо при- кладных задач экологии. Пример 9 (полнота описания результатов). Некий эксперимент проводили на четырех участках, выбранных в сосновых лесах. При этом для корректной интерпретации результатов критическое значе- ние имеет сопоставимость экспериментальных участков по плотно- сти древостоя. Какую информацию о плотности древостоя на этих экспериментальных участках необходимо включить в рукопись науч- ной работы? Решение: Вариант 1: «Плотность древостоя на экспериментальных участках была оди- накова». Неудовлетворительно: так подобрать участки просто невоз- можно; данные по плотности древостоя отсутствуют; вероятностное утверждение не сопровождается результатами статистического ана- лиза. Вариант 2: «Плотность древостоя на экспериментальных участках 1^4 (сред- нее арифметическое ± стандартная ошибка; п = 3 [измерения плотно- сти древостоя на каждом из участков]) составляла 921 ± 20, 934 ± 28, 952 ± 24 и 941 ±27 стволов с диаметром на высоте груди более 5 см на 1 га соответственно». Удовлетворительно: приведены данные, по- зволяющие сравнить плотность древостоя между участками. Вариант 3: «Плотность древостоя на экспериментальных участках не раз- личалась (F38 = 0,41, Р = 0,68)». Удовлетворительно: вероятностное утверждение сопровождается результатами статистического анализа (расчетная величина критерия Фишера, степени свободы и достигну- тый уровень значимости), однако данные по плотности древостоя от- сутствуют. 32
Вариант 4: «Экспериментальные участки не различались по плотности дре- востоя (среднее арифметическое ± стандартная ошибка для пло- щадок 1-Л; п = 3: 921 ± 20, 934 ± 28, 952 ± 24 и 941 ± 27 стволов с диаметром на высоте груди более 5 см на 1 га соответственно; F3 8 = 0,41, Р = 0,68)». Отлично: приведены как данные по плотности дре- востоя, так и результаты их статистического анализа, из которых сде- лан однозначный вывод об отсутствии значимых (на уровне 5%) раз- личий между участками по плотности древостоя.
Глава 3. Планирование эксперимента в экологических исследованиях 3.1. Планирование эксперимента в практике работы зарубежных и российских ученых В зарубежных университетах подавляющее большинство иссле- дований проводится за счет внешнего финансирования. Поэтому подготовка к проведению НИР, как правило, начинается с написа- ния грантовой заявки. Эта заявка в обязательном порядке включа- ет как детальное описание экспериментальных планов (что сильно дисциплинирует исследователя), так и информацию о публикациях, которые предполагается подготовить на основании полученных ре- зультатов. Таким образом, ученый уже на этапе планирования ис- следования думает о написании статьи (статей) по итогам работы, то есть он постоянно ориентирован на конечный результат своей дея- тельности. В то же время в России большинство ученых находится на бюд- жетном финансировании, что позволяет им относиться к составле- нию планов НИР как к формальной деятельности. Хотя отсутствие четкого плана может сделать научную работу безрезультатной, в России до сих пор исследователь часто задумывается о подготовке публикации лишь после завершения сбора материала. В результате «средний» ученый чаще ориентирован на процесс добычи данных, чем на конечный результат, а научный фольклор именует эту страте- гию «методом Д2ПР: давай, давай, потом разберемся». Такой подход вряд ли перспективен, в том числе и с экономической точки зрения, поскольку планирование исследования позволяет достичь цели с ми- нимальными затратами. Интересно отметить, что в России традиции планирования экс- перимента, существующие в некоторых узких областях биологии (вспомним, например, эксперименты И. П. Павлова по физиологии животных, а также опыты генетиков по скрещиванию различных организмов) странным образом сочетаются с практически полным пренебрежением экологов к этой части НИР. Такой подход, по мне- нию автора, отчасти объясняет, почему российские экологи гораздо реже выходят на международный уровень, чем представители других биологических дисциплин. Экология в России до сих пор остается 34
описательной наукой, в то время как современное понимание эколо- гических процессов в значительной степени базируется на экспери- ментальных данных. Практически во всех зарубежных университетах студенты биоло- гических специальностей в той или иной форме получают базовую информацию о методах составления экспериментальных планов. Эта информация может входить в курс прикладной статистики или в курс по подготовке грантовых заявок, но чаще всего она выделена в отдельный предмет под названием «планирование эксперимента» (англ, design of experiments или experimental design). Существует до- вольно много учебных пособий по планированию эксперимента, ко- торые ориентированы на студентов биологических специальностей; однако на русский язык они пока что не переведены (см. список ре- комендуемой литературы). Востребованность знаний по планированию эксперимента под- тверждается существованием платных курсов (со стоимостью обу- чения 3-4 тысячи долларов за пять дней), а также частных кон- сультационных фирм, оказывающих подобные услуги. Некоторые западные университеты (например, Purdue University) создали меж- дисциплинарные центры, консультирующие сотрудников по вопро- сам разработки экспериментальных планов и оптимизации схем экспериментов. В то же время курсы планирования эксперимента студентам биологических специальностей в России до последнего времени не читались. 3.2. Планирование эксперимента как часть научного исследования Проведение научного исследования можно условно разделить на четыре этапа: планирование, выполнение, интерпретацию результа- тов и подготовку публикации. При этом первые два этапа — плани- рование и выполнение — более тесно связаны друг с другом, чем с двумя финальными этапами, поскольку экспериментальные планы могут предусматривать пошаговую коррекцию на основе результатов выполненных исследований. В общем случае планирование включает разработку гипотезы (модели), которая поддается экспериментальной проверке (см. опре- деления 19-20 и раздел 6.1), и схемы для анализа результатов плани- 35
руемого эксперимента. На практике чаще всего планирование сопро- вождается выбором экспериментальных единиц (см. определение 14), измеряемых единиц (см. определение 15), числа опытов и усло- вий их проведения, необходимых для решения поставленной задачи с требуемой точностью (см. главы 5-9). Планирование основывается как на информации о свойствах изу- чаемых объектов, так и на заданных исследователем условиях, кото- рым должен удовлетворять разрабатываемый эксперимент. На пер- вых этапах планирования исследователь определяет генеральную совокупность (см. определение 11), которую предполагается изучить и к которой должны быть применимы результаты планируемого ис- следования (подробнее см. раздел 4.1). Затем исследователь, исходя из некоторых общих соображений, задает точность, с которой требу- ется определить величину каждого из измеряемых параметров (под- робнее см. раздел 9.2), минимальную величину эффекта, который планируется обнаружить (подробнее см. раздел 7.3), а при тестиро- вании гипотез — допустимые вероятности ошибок первого и второго рода (подробнее см. раздел 6.4). При этом он также выбирает методы статистического анализа, которые будут использованы при обработке эмпирических данных, поскольку разным методам анализа соответ- ствуют различные типы экспериментальных планов и разные методы расчета объемов выборок (подробнее см. главу 7). К числу наиболее часто используемых характеристик объекта относятся тип распре- деления (см. примеры 53 и 54) и величина изменчивости исследуе- мого параметра, а также объем генеральной совокупности, которую планируется изучить. Способ планирования и детальность экспериментального плана зависят от количества и качества доступной информации. При этом чем выше уровень и объем знаний об изучаемой системе, тем более тонкие свойства системы можно выявить в результате экспериментов и тем более сложными становятся применяемые планы. Использование математической теории планирования экспери- мента возможно лишь в тех случаях, когда существует модель изуча- емого явления. Использование таких моделей, чаще всего линейных, для разработки многофакторных экспериментов в применении к био- логическим и сельскохозяйственным исследованиям описано доста- точно подробно (Рафалес-Ламарка, Николаев, 1971; Планирование..., 1991) и в данном пособии обсуждаться не будет. 36
3.3. Выбор экспериментальной схемы с помощью критерия оптимальности В экологических исследованиях повышение точности (подробнее см. раздел 9.2) обычно достигается путем увеличения объема иссле- дованного материала и сопровождается увеличением затрат, что тре- бует нахождения приемлемого баланса между точностью результата и стоимостью работ. Таким образом, одна из частных практических задач, возникающих на этапе планирования эксперимента, может быть сформулирована следующим образом: какой объем выборки оптима- лен для планируемого исследования? Найти ответ на подобный вопрос возможно только в том случае, если задан критерий оптимальности. Определение 8. Критерий оптимальности (или критерий оптими- зации) — признак, на основании которого производится сравни- тельная оценка возможных решений (альтернатив) и выбор наи- лучшего решения. Задачи выбора наилучшего решения можно подразделить на три типа: • выбор решения, обеспечивающего достижение заданного ре- зультата при минимальном расходе ресурсов; • выбор решения, обеспечивающего достижение наилучшего ре- зультата при заданном (то есть ограниченном) количестве ресурсов; • выбор решения, обеспечивающего достижение наилучшего ре- зультата при минимальном расходе ресурсов (то есть нет жестких требований к конечному результату и нет жестких ограничений по объему используемых ресурсов). Решение любой из этих задач сводится к сравнительной оценке множества альтернатив с последующим выбором наилучшей. При- мер 10 демонстрирует выбор критерия оптимальности для решения задачи первого типа. Пример 10 (выбор критерия оптимальности). Из пункта А в пункт Б можно попасть разными путями, причем дороги, соединяю- щие начальный и конечный пункты поездки, отличаются не только протяженностью, но и качеством дорожного покрытия, количеством светофоров и интенсивностью движения транспорта. Какой крите- рий оптимальности необходимо использовать для выбора маршрута поездки из пункта А в пункт Б? Решение: 37
В общем случае задача не имеет решения, поскольку критерий оптимальности будет зависеть от индивидуальных предпочтений во- дителя, выполняющего поездку (либо от предпочтений заказчика, оплачивающего эту поездку). В качестве возможных вариантов мож- но привести следующие примеры: • время в пути; • прямые расходы (стоимость горючего); • косвенные расходы (износ машины). Тем не менее, очевидно, что любой водитель (или заказчик) оце- нивает все три приведенных выше показателя (а также и многие дру- гие) и, например, не выберет вдвое более длинный маршрут, даже если он позволит использовать дороги идеального качества. Таким образом, критерий оптимальности будет представлять собой сумму всех расходов (включая расход времени) с приданными им весовыми коэффициентами, отражающими предпочтение конкретного субъек- та. Если удается рассчитать (либо оценить) расход времени в денеж- ных единицах, то критерий оптимальности будет представлять собой сумму всех расходов на поездку, что позволит выбрать самый деше- вый вариант. Если для каждой из экспериментальных схем, приводящих к же- лаемому результату (при равной точности оценок параметров и/или равной вероятности ошибок первого и второго рода), можно рассчи- тать величину затрат (как в примере 10), то задача заключается в вы- боре такой схемы эксперимента, затраты на реализацию которой бу- дут минимальны. В отличие от приведенного выше примера 10 и от курса планиро- вания экспериментов для представителей точных наук, где оптималь- ное решение находится однозначно (путем построения некоторой функции и исследования ее свойств), экологи обычно вынуждены довольствоваться «интуитивной» оптимизацией. Кроме того, при составлении экспериментальных планов исследователю приходит- ся учитывать трудно поддающиеся численному определению риски, связанные, например, с поломкой автомашины, предназначенной для поездки на экспериментальные участки, с перебоями в теплоснабже- нии, а также с проблемами, возникающими при приобретении необ- ходимого оборудования. Все эти (и многие другие!) факторы, есте- ственно, необходимо принимать во внимание. Однако следует четко осознать: если эксперимент нельзя поставить так, чтобы с требу- 38
емой точностью получить однозначный результат, то необходимо менять схему эксперимента. Жертвовать точностью измерений, зна- чимостью выводов, а также мощностью анализа можно только в том случае, если результат работы Вам совершенно безразличен. Конкретное содержание критерия оптимальности может быть предложено только после рассмотрения цели исследования и уста- новления степени соответствия различных сочетаний параметров экспериментального плана как задачам, которые стоят перед иссле- дователем, так и имеющимся у него ресурсам. Например, при не- обходимости получения результата в кратчайшие сроки в качестве ключевых затрат целесообразно рассматривать время, необходимое для реализации экспериментального плана, в то время как при от- сутствии особой спешки в условиях скудного финансирования пре- имущество получают те экспериментальные схемы, реализация ко- торых требует минимальных расходов. Основной методологический принцип разработки критерия оптимальности — системный подход к оценке возможных решений. Таким образом, задачи планирования — это, во-первых, форми- рование критерия оптимальности, который будет использован при решении конкретной задачи, а во-вторых — подсчет затрат на реали- зацию каждой из экспериментальных схем. При этом критерий опти- мальности зависит от внешних условий, в которых работает исследо- ватель. Практическая рекомендация 2. Решение сложной задачи по- ручайте самому ленивому сотруднику: он найдет более легкий путь (научный фольклор). 3.4. Широта выводов, их реалистичность и точность полученных оценок При проведении экологического исследования в общем случае не- возможно одновременно максимизировать следующие характеристи- ки: широту выводов (англ, generality), реалистичность (англ, realism) и точность полученных оценок (англ, precision). В связи с этим еще одно стратегическое решение, которое исследователь должен при- нять на стадии планирования эксперимента, заключается в выборе приоритетной характеристики из трех перечисленных выше, либо в 39
придании этим трем характеристикам различного веса, который бу- дет учитываться критерием оптимальности. В экологических экспериментах широта выводов, как правило, достигается закладкой однотипных экспериментов с разными объ- ектами в разных условиях. Например, феномен, называемый от- сроченной индуцированной устойчивостью (англ, delayed inducible resistance), т. е. ухудшение роста насекомых при питании листьями деревьев, испытавших сильное повреждение в предыдущем году, впервые наблюдали при выкармливании гусениц осенней пяденицы на березе пушистой. На следующем этапе были заложены идентич- ные эксперименты с осенней пяденицей на четырех видах древесных растений, что позволило сделать выводы о распространенности этой реакции на повреждение среди растений. Дальнейшие обобщения были сделаны после накопления значительного количества данных, полученных в лабораторных и полевых экспериментах с различными видами растений и насекомых, а также с использованием механиче- ского повреждения растений (подробнее см.: Karban, Baldwin, 1997). Реалистичность максимальна у полевых экспериментов, мини- мальна у лабораторных экспериментов, заложенных в предельно упрощенных условиях, и имеет промежуточные значения у экс- периментов в мезокосмах. Низкую реалистичность экологических экспериментов, проводимых в лабораторных условиях, отражает их жаргонное название «эксперименты в пробирках». Это название ос- новано на том, что в этих экспериментах часто используют неболь- шие популяции мелких организмов (таких как бактерии, дрожжи, мухи-дрозофилы), которые всю свою жизнь проводят в условиях садка, колбы или пробирки. Интересно отметить, что некоторые ис- следователи скептически относятся к результатам лабораторных эко- логических экспериментов, считая, что эти эксперименты изучают искусственно созданные объекты, процессы либо явления, по край- ней мере часть из которых не существует за пределами лаборатории. И, наконец, максимальная точность достигается в лабораторных экс- периментах, в которых исследователь контролирует существенно больше факторов, чем в условиях мезокосма и, тем более, в полевых исследованиях. Кроме того, точность результатов повышается при увеличении количества экспериментов, то есть при закладке одно- типных экспериментов с одинаковыми объектами в одинаковых ус- ловиях. 40
Глава 4. Цель и задачи исследования, генеральная совокупность и выборка 4.1. Цель и задачи иследования Научное исследование — это процесс получения новых научных знаний. Планирование научного исследования требует обработки значительного количества информации и предполагает такие мыс- лительные операции, как сравнение, анализ, синтез, обобщение, си- стематизация, моделирование и формулировка гипотез. Первый итог этих действий — постановка цели и определение задач исследова- ния. В научных публикациях цель и задачи исследования обычно по- мещают в конце «Введения». Определение 9. Цель исследования (англ, study goal или goal of the study) — это конечный результат, на достижение которого ори- ентирован исследователь. Цель следует формулировать кратко и предельно точно, выра- жая тот основной результат, который предполагается достичь. Цель должна быть созвучна заголовку научной работы, написание которой планируется по результатам исследования. Целью может быть описа- ние некоторого объекта, явления или процесса, изучение его характе- ристик, выявление причинно-следственных связей между определен- ными событиями, а также поиск закономерностей путем анализа уже существующей информации. Как правило, определяется единствен- ная цель исследования; ее формулировка обычно начинается со слов «разработка...», «обоснование...», «выявление...», «уточнение...» и им подобных. Необходимо подчеркнуть, что на современном этапе развития науки сбор каких-либо данных сам по себе не может рас- сматриваться как цель научного исследования. Наиболее частые ошибки, допускаемые при выборе и формули- ровке цели исследования: • неопределенность (расплывчатость) формулировки: если цель исследования не определена однозначно, то ее невозможно достичь; • несогласованность с имеющимися ресурсами (материальными и временными): сбор и обработка данных, необходимых для достиже- ния цели исследования, не могут быть выполнены имеющимися си- лами в отведенные для исследования сроки; 41
• принципиальная недостижимость на данном уровне развития науки (либо в данных конкретных обстоятельствах): «Если эта цель [планируемой наземной экспедиции] на расстоянии миллион кило- метров, то это уже и не цель» (А. и Б. Стругацкие. Град обреченный). Пример 11 (формулировка цели исследования). Вариант 1. «Цель работы — изучение влияния промышленного загрязнения на северотаежные леса». Комментарии: 1. Формулировка неконкретна, поскольку предполагает анализ воздействия всех типов промышленного загрязнения на все компо- ненты экосистем северотаежных лесов в масштабах всего мира. 2. Конечный результат исследования не ясен. 3. Маловероятно, что исследователь способен привлечь достаточ- ное количество ресурсов для достижения столь глобальной цели. 4. Подобная цель могла бы, например, быть поставлена перед кол- лективом академического института на период 15-20 лет. Вариант 2. «Цель исследования — описание морфологических изменений древесных растений Кольского полуострова под воздействием вы- бросов медно-никелевой промышленности». Комментарии: 1. Формулировка более конкретна, чем в варианте 1, поскольку предполагает анализ воздействия определенного типа промышлен- ного загрязнения на древесные растения в пределах относительно небольшой территории. Однако понятие «морфологические измене- ния» допускает слишком широкое толкование, от ультраструктурных изменений до изменений архитектуры кроны. 2. Конечный результат исследования не ясен. Кроме того, форму- лировка цели (начинающаяся со слова «описание...») подразумевает нацеленность на сбор данных, а не на их анализ, что существенно понижает научную ценность планируемого исследования. 3. На Кольском полуострове встречается несколько десятков видов древесных растений. Учитывая широту понятия «морфологические изменения», маловероятно, что исследователь способен привлечь до- статочное количество ресурсов для достижения поставленной цели. 4. Подобная цель могла бы, например, быть поставлена перед кол- лективом двух-трех лабораторий академического института на пери- од 5-10 лет. 42
Вариант 3. «Цель работы — изучение изменений размеров листа и побега березы пушистой под воздействием выбросов комбината Северони- кель». Комментарии: 1. Формулировка достаточно конкретна, объект исследования чет- ко определен. Однако не ясно, каким именно образом предполагается изучить воздействие выбросов — путем активного либо пассивного эксперимента (см. пример 5). 2. Если работа предполагает проведение пассивного эксперимен- та, то есть сравнительное исследование берез, растущих на разном расстоянии от комбината, то она, безусловно, выполнима силами од- ного исследователя. Если же планируется активный эксперимент, то возможность выполнения работы зависит от имеющихся в распоря- жении исследователя ресурсов. 3. Подобная цель могла бы, например, быть поставлена перед сту- дентом (в случае пассивного эксперимента) либо аспирантом (в слу- чае активного эксперимента) на период 1-2 месяца либо 2-3 года со- ответственно. Вариант 4. «Цель работы — экспериментальная проверка гипотезы о том, что уменьшение размеров листа и побега березы пушистой в окрест- ностях комбината Североникель вызвано воздействием накапливаю- щихся в почве пылевидных выбросов, содержащих соединения нике- ля, меди и кобальта». Комментарии: 1. Формулировка предельно конкретна, объект исследования чет- ко определен. Ясно, что планируется активный эксперимент. 2. Конечный результат исследования очевиден: будет принята либо отклонена сформулированная гипотеза. 3. Возможность выполнения работы зависит от наличия догово- ренности между автором и комбинатом Североникель, поскольку для экспериментов необходима пыль, собранная системами очистки от- ходящих газов. Впрочем, нет сомнений в том, что некоторое количе- ство этой пыли можно просто купить. 4. Подобная цель могла бы, например, быть поставлена перед аспирантом на период 2-3 года. Определение 10. Задачи исследования (англ, study aims или aims of the study) дополняют и развивают (конкретизируют) цель иссле- 43
дования, и/или отражают выбор путей и средств для достижения цели в соответствии с выдвинутой гипотезой (либо выдвинутыми гипотезами), а также действия по получению промежуточных ре- зультатов, направленных на достижение цели. Если цель исследования достаточно конкретна и достижима за относительно короткий срок (как, например, в вариантах 3 и 4 при- мера 11), то формулировать задачи исследования не обязательно. На- против, при проведении длительного многопланового исследования требуется тщательная проработка формулировок как цели, так и за- дач работы (которых, в отличие от цели, ставится как минимум две). При этом формулировки задач обычно начинаются со слов «разрабо- тать...», «обосновать...», «выявить...», «уточнить...» и им подобных. Пример 12 (формулировка цели и задач исследования). «Цель данной работы заключалась в том, чтобы провести эволюционно- экологический анализ проявления фенетической изменчивости го- мологичных вариаций (фенов) морфоструктур черепа модельных грызунов на разных уровнях таксономической иерархии: от внутри- видовых форм разных видов до агрегаций видов со сходной эколо- гической специализацией в пределах семейства Cricetidae. При этом на основе многомерной ординации гомологичных фенов черепа была сделана попытка решить две задачи: сравнить направленность фе- ногенетической изменчивости симпатрических южных и северных подвидов двух видов: полевки-экономки и узкочерепной полевки; попытаться дифференцировать группы видов грызунов (Cricetidae) с разной экологической специализацией по частотам гомологичных морфоструктур черепа» (Васильев и др., 2010). Комментарии: 1. Сформулированы как цель, так и задачи исследования. 2. Формулировка цели исследования недостаточно конкретна, но ее дополняют и развивают поставленные задачи; их комбинация по- зволяет понять структуру исследования. Пример 13 (формулировка цели и задач исследования). «Цель данной работы — исследование генетического полиморфизма карли- ковых сосен в двух популяциях на юге Средней Сибири» (Тихонова, Семериков, 2010). Комментарии: 1. Сформулирована только цель исследования. 2. Цель исследования достаточно конкретна, так что формулиров- ка задач исследования не обязательна. 44
Пример 14 (формулировка цели и задач исследования). «Це- лью нашей работы было провести сравнительный анализ спектров внешне проявляющихся морфологических аномалий серой и зеленой жаб, определить длину тела животных при помощи штангенциркуля с ценой деления 0,1 мм, а также оценить закономерности формиро- вания брачных пар у вышеупомянутых видов» (Вершинин, 2010). Комментарии: 1. Цель исследования отсутствует; перечисленные «цели», как по форме, так и по содержанию, представляют собой задачи исследова- ния. 2. Именно отсутствие четко сформулированной цели не позво- ляет понять, почему решение трех перечисленных задач, на первый взгляд весьма слабо связанных друг с другом, объединено в рамках одного исследования. 3. Вторая задача просто вызывает недоумение. Заявленная точ- ность измерений вряд ли достижима на практике (подробнее см. раз- дел 9.2); кроме того, напомним, что в настоящее время сбор данных сам по себе не может считаться целью научного исследования. 4. Формулировки первой и третьей задач не конкретны; конечный результат их решения не очевиден. 5. Формулировка третьей задачи некорректна. Фраза «оценить за- кономерности» вряд ли отражает намерение автора дать некую оцен- ку выявленным закономерностям; скорее всего, автор предполагал выявить некоторые закономерности. Пример 15 (формулировка цели и задач исследования). «Для обоснованного суждения о возможном радиоэкологическом состо- янии системы необходимо знание закономерностей или моделиро- вание процессов биологического поглощения. В этих целях мы ис- следовали зависимость между содержанием урана и радия в почве, загрязненной отходами бывшего радиевого промысла, и накоплени- ем этих элементов различными видами растительности» (Носкова и др., 2010). Комментарии: 1. Цель и задачи отсутствуют. 2. Цель и задачи подменены описанием того, что именно сделали авторы. 3. Такой стиль характерен для исследований, планированию ко- торых не было уделено достаточного внимания. Очевидно, что ис- 45
следователи были первично ориентированы на сбор некоторой ин- формации, а не на решение четко сформулированной проблемы (подробнее см. раздел 3.1). Часто бывает полезно ранжировать задачи по степени их важно- сти, поскольку некоторые эксперименты дают для ряда запланиро- ванных сравнений высокую точность, в то время как другие выводы могут отличаться низкой точностью. При формулировке цели исследования всегда следует очертить область генерализации, то есть определить группу объектов, на кото- рую можно будет корректным образом распространить выводы про- веденного исследования. Для обсуждения этого вопроса необходимо рассмотреть понятия «генеральная совокупность» и «выборка». 4.2. Генеральная совокупность и выборка Определение 11. Генеральная совокупность (англ, population или statistical population) — это совокупность (множество) объектов либо явлений, в отношении которого формулируется научная ги- потеза и/или на которое предполагается распространить выводы конкретного исследования. Определение 12. Выборка (англ, sample) — это множество объек- тов, выбранных для изучения из генеральной совокупности. Генеральная совокупность должна быть определена на стадии планирования эксперимента и в явном виде отражена в эксперимен- тальном плане (например, в формулировке задачи исследования). Важно подчеркнуть, что выбор генеральной совокупности — это экологическая, а не статистическая задача. Исследовать всю генеральную совокупность, как правило, невоз- можно, поэтому для проведения эксперимента используется некая выборка, взятая из генеральной совокупности. Эта выборка должна быть репрезентативной (представительной, то есть включать боль- шинство возможных вариантов изучаемого объекта или процесса) и несмещенной (то есть частоты вариантов изучаемого объекта или процесса в выборке не должны отличаться от частот, наблюдаемых в генеральной совокупности). Разработка процедур получения подоб- ной выборки представляет собой одну из главных задач, решаемых при подготовке экспериментального плана. 46
Взятие выборки — ключевой момент исследования, поскольку характеристики выборки выступают в качестве приближенных оце- нок для характеристик генеральной совокупности. При корректном взятии выборки методы статистики позволяют рассчитать довери- тельный интервал (см. определение 13), в который с заданной ве- роятностью попадет истинное (то есть присущее генеральной сово- купности) значение параметра. Напротив, при некорректном взятии выборки неправомерно делать вероятностные выводы о генеральной совокупности. Определение 13. Доверительный интервал (англ, confidence inter- val) для вероятности Р (обычно обозначаемый С/р) — это интер- вал, в который с вероятностью Р попадет индивидуальное значе- ние случайной величины. Одна из наиболее обычных ошибок экологического исследова- ния — неоправданное распространение выводов на более широкую генеральную совокупность, чем та, из которой были взята выборка. Пример 16 (выбор генеральной совокупности). Какое множе- ство объектов будет выступать в качестве генеральной совокупности при изучении связи между диаметром дерева на высоте груди и био- массой листьев (хвои)? Решение: Формулировка цели исследования недостаточно конкретна, что не позволяет однозначно определить генеральную совокупность. Не ясно даже, ограничено ли исследование одним видом древесных рас- тений, или его результаты должны быть применимы к различным видам деревьев, хотя формулировка «листьев (хвои)» косвенно ука- зывает на второй вариант. В качестве возможных генеральных сово- купностей можно привести следующие примеры: • леса; • леса умеренного пояса; • хвойные леса; • сосновые леса; • сосняки-беломошники; • сосняки-беломошники Архангельской области. Чем больше генеральная совокупность — тем глобальнее выводы, и тем больший интерес вызывает исследование. С другой стороны, чем больше генеральная совокупность — тем сложнее получить ре- презентативную и несмещенную выборку, и тем выше вероятность 47
воздействия случайных (то есть не учтенных в процессе взятия вы- борки) эффектов на результат исследования. Так, исследователь, же- лающий распространить свои выводы на все леса мира, должен взять случайную и репрезентативную выборку (подробнее см. раздел 5.3) из всех типов лесов всего мира. Пример 17 (выбор генеральной совокупности). Возможно ли в условиях ограниченного финансирования корректно оценить ско- рость разложения березовых листьев в прибрежной зоне (на глуби- нах около 1 м) озер Кольского полуострова? Решение: 1 . Поскольку задача исследования определяет генеральную сово- купность как все озера Кольского полуострова, то эксперимент дол- жен быть заложен с использованием случайной выборки озер из этой генеральной совокупности. Например, можно составить пронумеро- ванный список всех озер Кольского полуострова и взять выборку с помощью генератора (или таблицы) случайных чисел (об определе- нии объема выборки, то есть количества озер, необходимого для по- становки эксперимента, см. раздел 7.1). 2 . Большая часть озер Кольского полуострова находится вдали от автомобильных дорог и может быть достигнута только на вертолете либо в результате длительных пеших переходов. Таким образом, в условиях ограниченного финансирования подобный план на практи- ке вряд ли осуществим, то есть корректно решить поставленную за- дачу не удастся. 3 . Необходимо либо отказаться от задуманного исследования, либо переформулировать задачу таким образом, чтобы она соответ- ствовала имеющимся возможностям. Например: «Оценить скорость разложения березовых листьев в прибрежной зоне (на глубинах око- ло 1 м) озер центральной части Кольского полуострова». При этом центральную часть Кольского полуострова можно ограничить райо- ном относительно хорошей транспортной доступности. В этом слу- чае можно сделать вероятностный вывод о скорости разложения листьев в озерах центральной части Кольского полуострова, а затем обсудить применимость этого результата к озерам периферической (то есть не включенной в генеральную совокупность, из которой по- лучена случайная выборка) части Кольского полуострова. 48
4.3. Отражение выбора генеральной совокупности в названии работы Практическая рекомендация 3. Название работы не должно вво- дить читателя в заблуждение относительно исследованной генераль- ной совокупности. Необходимо отметить, что эта рекомендация в первую очередь относится к исследованиям достаточно небольших генеральных со- вокупностей, когда четкое обозначение всех ограничений (район, объект, ситуация) помогает потенциальному читателю однозначно решить, может ли эта работа содержать необходимую ему информа- цию. Это особенно важно при сборе данных для мета-анализа, когда исследователю приходится добывать полные тексты многих «лиш- них» работ лишь для того, чтобы убедиться, что их содержание го- раздо уже их названия. Например, при подготовке базы данных по влиянию точечных источников загрязнения на наземные экосистемы, которая включает только результаты наблюдений и пассивных экс- периментов (подробное описание см.: Воробейчик, Козлов, 2012), более половины работ, названия которых позволяли надеяться на их пригодность для планируемого исследования, были отсеяны при просмотре полного текста. При этом существенная часть отбракован- ных работ описывала результаты контролируемых экспериментов, однако это не было отражено в названиях статей (см. пример 23). С другой стороны, детальная конкретизация противоречит другим требованиям к названию — лаконичности и «привлекательности». Если при поиске оптимального варианта названия работы автор ори- ентируется на лаконичность, то генеральная совокупность должна быть однозначно определена в реферате. Пример 18 (отражение выбора генеральной совокупности в названии работы). Какую информацию читатель может найти в книге «Лесные экосистемы и атмосферное загрязнение. Под ред. В. А. Алексеева. Л.: Наука, 1990. 197 с.»? Объяснение: Название книги определяет генеральную совокупность как лес- ные экосистемы, подверженные влиянию атмосферного загрязнения. Соответственно, читатель вправе ожидать информации о влиянии всех типов атмосферного загрязнения на все типы лесных экосистем и на все компоненты лесных экосистем. 49
К сожалению, эти ожидания не оправданы, поскольку предисло- вие уточняет: «Авторы... исследовали влияние различных загрязни- телей — преимущественно окислов серы с разнообразными приме- сями — на лесные экосистемы, причем основными объектами были северотаежные хвойные леса...». Далее из текста можно узнать, что исследовалось воздействие не окислов серы как таковых, а выбросов медно-никелевых заводов, а из компонентов экосистем авторы изуча- ли лишь почвы и растительность. Кроме того, вывод о воздействии сделан на основании сопоставления пробных площадей, располо- женных на разном расстоянии от завода, то есть воздействие как та- ковое не изучалось, хотя были зарегистрированы его результаты. Таким образом, название книги существенно шире ее содержания и вводит потенциального читателя в заблуждение. Более адекватным было бы название: «Почвы и растительность северотаежных хвой- ных лесов в окрестностях медно-никелевых заводов». Пример 19 (отражение выбора генеральной совокупности в названии работы). Какую информацию читатель может найти в книге «Влияние промышленного атмосферного загрязнения на со- сновые леса Кольского полуострова. Ред. Б. Н. Норин, В. Т. Ярмиш- ко. Л.: Ботан. ин-т им. В. Л. Комарова АН СССР. 1990. 195 с.»? Объ- яснение: Название книги определяет генеральную совокупность как сосно- вые леса Кольского полуострова, подверженные влиянию атмосфер- ного загрязнения. И хотя (как и в примере 18) собственно влияние загрязнения авторы не изучали, заглавие книги в целом соответству- ет ее содержанию. Количество опубликованной экологической (да и любой другой) информации растет лавинообразно, ставя все более сложные задачи перед разработчиками систем поиска информации. Однако ни одна поисковая система не сможет помочь читателю, если автор «зашиф- ровал» название своей работы таким образом, что о ее содержании можно лишь догадываться. Пример 20 (отражение выбора генеральной совокупности в названии работы). Какую информацию читатель может найти в книге «И. И. Коршиков, Н. С. Терлыга, С. А. Бычков. Популяционно- генетические проблемы дендротехногенной интродукции. Донецк: Лебедь, 2002. 326 с.»? Объяснение: 50
Название книги не определяет никакой генеральной совокупно- сти. Поиск слова «дендротехногенный» в интернете не дал никаких результатов. Цитата из предисловия: «В монографии изложены результа- ты сравнительных исследований аллозимной изменчивости сосны крымской (Pinus pallasiana D. Don) в природных популяциях Крыма и в пионерных насаждениях Приазовья и Криворожья». Таким обра- зом, заглавие книги абсолютно не соответствует ее содержанию. Обратите внимание, что приведенное в примере 20 название кни- ги не имеет шансов быть найденным при помощи любой из поиско- вых систем именно теми читателями, которых интересует аллозим- ная изменчивость сосны крымской. Таким образом, авторы, по сути, резко ограничили доступность своих результатов для заинтересован- ных читателей. Практическая рекомендация 4, Пишите коротко и ясно (англ. KISS: keep it short and simple). В частности: • избегайте многословности; • избегайте жаргона (терминов, не понятных широкому кругу чи- тателей); • избегайте «умных слов»: «О друг мой... об одном прошу тебя: не говори красиво» (И. С. Тургенев. Отцы и дети); • избегайте сокращений (кроме общепринятых, например ДНК); • тщательно редактируйте текст; • если вы рассчитываете на внимание со стороны зарубежных ученых, то всегда думайте о том, удастся ли адекватно перевести на английский язык название вашей работы. Пример 21 (пишите коротко и ясно). Какую информацию чи- татель может найти в работе И. Н. Агикова (2011), озаглавленной «Биоиндикация воздействия аэротехногенных поллютантов цветной металлургии на сосну обыкновенную как показатель состояния лес- ных экосистем»? Комментарии: Можно сделать лишь самые общие предположения («сосна и про- мышленное загрязнение»), поскольку название работы неконкрет- но (не ясно, какой именно из параметров сосны изучал автор, и где именно он проводил исследования). Кроме того, это название многословно, перегружено термино- логией («аэротехногенные поллютанты»), которую легко заменить 51
простыми словами (в данном контексте — «атмосферные выбро- сы»), стилистически некорректно («Биоиндикация... как показатель состояния») и в результате не поддается адекватному переводу на английский язык. Все это уменьшает вероятность того, что данная публикация будет найдена и использована (а соответственно, и про- цитирована) заинтересованными коллегами. Пример 22 (пишите коротко и ясно). Какую информацию чита- тель может найти в работе П. В. Мещерякова с соавторами (2003), озаглавленной «Экологические условия реализации биогенно- аккумулятивных ЭПП в техногенных ландшафтах в зоне влияния СУМЗа»? Комментарии: Название работы непонятно из-за использования сокращений (ЭПП, элементарные почвообразовательные процессы; СУМЗ, Сред- неуральский металлургический завод). Авторы переоценивают ин- формированность читателя о региональной специфике (название завода) и узкоспециальной терминологии (сокращение «ЭПП» не относится к числу общепринятых; при поиске в интернете первое найденное значение — «электроснабжение промышленных предпри- ятий», второе — «электропневматический позиционер»). За счет использования сокращений авторы резко понизили веро- ятность нахождения своей работы с использованием поисковых си- стем. Пример 23 (пишите коротко и ясно). Какую информацию чита- тель может найти в работе А. А. Онучина и Л. Н. Козловой (1993), озаглавленной «Структурно-функциональные изменения хвои сосны под влиянием поллютантов в лесостепной зоне Средней Сибири»? Комментарии: Название работы неконкретно (не ясно, какой именно из параме- тров сосны изучали авторы) и допускает неоднозначную интерпре- тацию, поскольку заголовок может равным образом относиться как к описательной работе, выполненной в окрестностях промышленного предприятия, так и к лабораторному либо полевому эксперименту. Кроме того, заголовок подчеркивает наличие причинно-след- ственной связи («изменения... под влиянием»), доказательство су- ществования которой представляет собой специальную задачу (см. выше, раздел 2.2). Если авторы наблюдали различия между загряз- ненными и контрольными участками, то это вовсе не значит, что ав- 52
торы доказали наличие причинно-следственной связи между загряз- нением и обнаруженными различиями. Эти различия могут с равной вероятностью отражать исходные различия между участками (напри- мер, по типу и плодородию почвы) либо результат воздействия фак- торов, не имеющих никакого отношения к загрязнению (например, пожары, сенокос, вытаптывание и многие другие). Даже если статья основана на результатах контролируемого экс- перимента, то корректнее было бы написать «после обработки», ука- зав применявшееся в эксперименте вещество (например, сернистый ангидрид). Пример 24 (пишите грамотно). Какую информацию читатель может найти в работе Г. Д. Катаева и А. С. Гилязова (2005), озаглав- ленной «Роль позвоночных животных в изучении процессов техно- генной трансформации северо-таежных экосистем (Кольский полу- остров)»? Комментарии: Название работы указывает на то, что позвоночные животные изучали некие процессы. Из всех позвоночных животных способно- стью изучать процессы техногенной трансформации экосистем обла- дает лишь человек. Знакомство с публикацией показывает, что в ней описаны «ре- зультаты многолетнего экологического мониторинга зверей и птиц», то есть позвоночные животные выступают в качестве объектов из- учения. К сожалению, нормы русского языка не позволяют истолко- вать приведенный заголовок подобным образом. Писательский труд — неотъемлемая часть работы ученого, и от- носиться к нему следует столь же внимательно и ответственно, как и к любому другому этапу НИР. Научные тексты пишутся в расчете на читателя, и если читатель не понял (или неправильно понял) науч- ный текст, то виноват в этом не читатель, а автор. Учитывая количе- ство публикуемой информации, краткие публикации (по отношению к количеству материала, на котором они основаны), написанные яс- ным и простым языком, имеют гораздо больше шансов быть прочи- танными и процитированными, чем многословные работы, перегру- женные специальными терминами.
Глава 5. Основные принципы организации эксперимента 5.1. Экспериментальная единица и измеряемая единица Определение 14. Экспериментальная единица (англ, experimental unit) — это наименьшее подразделение материала, которое может быть подвергнуто воздействию изучаемого фактора независимо от других экспериментальных единиц. Ключевой элемент определения 14 — независимость экспери- ментальных единиц, которая должна соблюдаться на всех стадиях эксперимента. Независимость в контексте данного определения озна- чает, что любые два объекта, подвергающиеся одинаковым либо раз- ным воздействиям, в остальном находятся в сходных условиях. При этом сходство между условиями, в которых находятся эти объекты, в среднем не превышает сходства между условиями, в которых нахо- дится любая пара используемых исследователем экспериментальных единиц. На необходимость четкого соблюдения независимости экс- периментальных единиц (которые он называл «настоящими повтор- ностями») впервые (еще в конце 1930-х гг.), по-видимому, обратил внимание А. А. Любищев (1986). Выбор экспериментальной единицы зависит от цели исследова- ния. Один и тот же объект в некоторых исследованиях может высту- пать в качестве экспериментальной единицы, в то время как в других исследованиях он окажется лишь измеряемой (оцениваемой) едини- цей (см. ниже, определение 15). Определение 15. Измеряемая (оцениваемая) единица (англ, evalu- ation unit) — это элемент экспериментальной единицы, служащий основой для получения индивидуальной оценки либо замера. Хотя экспериментальная единица выступает в качестве наимень- шего независимого элемента экспериментального воздействия, она может (но не обязана) состоять из нескольких измеряемых единиц. При этом все экспериментальные единицы должны быть случайным образом выбраны из исследуемой генеральной совокупности (см. определение 11) для того, чтобы на эту генеральную совокупность можно было распространить полученные выводы (см. выше, раздел 4.2). 54
Четкое разграничение между экспериментальной и измеряемой единицами чрезвычайно важно, поскольку при оценке результатов воздействия экспериментальная единица должна рассматриваться как единое целое. Ошибки в разграничении понятий эксперимен- тальной единицы и измеряемой единицы приводят к некорректной интерпретации результатов статистического анализа, известной как проблема мнимых повторностей (подробнее см.: Козлов, 2003; Коз- лов, Хелберт, 2006). Принципиально важно, что статистический вывод о сходстве либо различии двух групп объектов может быть сделан тогда и только тогда, когда различия между группами сравниваются со внутригруп- повой изменчивостью. При этом элементами группы выступают не- зависимые экспериментальные единицы, а не измеряемые единицы, которые (при несовпадении с экспериментальными единицами) нель- зя считать независимыми. Очевидно, что внутригрупповая изменчи- вость может быть оценена только в тех случаях, когда группа состоит из двух и более объектов (хотя в исключительных случаях возможно применение линейной регрессии либо дисперсионного анализа для корректного выявления различий между единственной эксперимен- тальной единицей и группой экспериментальных единиц). Пример 25 (экспериментальные и измеряемые единицы). Сле- дующие объекты представляют собой экспериментальные единицы и измеряемые единицы по отношению к приведенным в сочетании с ними целям исследования и способам проведения экспериментов. Задача исследования Способ проведения эксперимента Эксперимен- тальная единица Измеряемая единица Изучение эффектов загрязнения воды на физиологию и био- химию рыб Внесение загрязняю- щего вещества в воду некоторых случайно вы- бранных аквариумов Аквариум вместе со всеми находящимися в нем рыбами Отдельная рыба Изучение эффектов удобрения на уро- жайность растений Внесение удобрения в почву некоторых случайно выбранных делянок Делянка вместе со всеми на- ходящимися на ней растениями Отдельное растение Изучение эффектов кормовых добавок на скорость роста цыплят Введение кормовых до- бавок в рацион цыплят, содержащихся в некото- рых случайно выбран- ных вольерах Вольер со всеми находящимися в нем цыплятами Отдельный цыпленок 55
Задача исследования Способ проведения эксперимента Эксперимен- тальная единица Измеряемая единица Изучение влияния методики обучения на усвоение мате- риала Случайное соотнесение групп студентов с ис- пользуемыми методика- ми обучения Группа студен- тов Отдельный студент Изучение эффек- тов удаления части листвы на годичный прирост растения Удаление заданного количества листьев у некоторых случайно вы- бранных растений Отдельное рас- тение Отдельное растение Изучение эффектов вакцинации на ско- рость роста цыплят Введение вакцины некоторым случайно выбранным цыплятам Отдельный цыпленок Отдельный цыпленок Пример 26 (разграничение между экспериментальной и изме- ряемой единицами). К. А. Смирнов (2001) изучал влияние лося на формирование подроста и подлеска в ельниках южной тайги путем сравнения характеристик молодых особей древесных растений вну- три огороженного участка леса размером 450 м2 (ограда использо- валась для того, чтобы предотвратить объедание молодых деревьев лосями) и вне этого участка. В каждом из вариантов (огорожен- ный и неогороженный участки) было заложено 35 площадок (каж- дая размером 5 м2), на которых проводились некоторые измерения. Статистический анализ, выполненный автором, показал различия в росте молодых деревьев между 35 площадками, расположенными в пределах огороженного участка, и 35 площадками, расположенны- ми вне этого участка. Можно ли на основании этого анализа заклю- чить, что огораживание повлияло на рост молодых деревьев? Объ- яснение: Поскольку организация данного эксперимента однозначно опре- деляет огороженный участок как экспериментальную единицу (см. определение 14), эффект огораживания может быть статистически выявлен только по отношению к изменчивости между подобными (то есть огороженными) участками. Изменчивость между экспери- ментальными площадками внутри огороженного участка относится к другому, более низкому уровню (между измеряемыми единицами в пределах одной экспериментальной единицы), и поэтому ее исполь- зование для выявления эффекта огораживания некорректно. И хотя изменчивость между измеряемыми единицами технически может быть использована для выявления различий между огороженным и 56
неогороженным участками, подобный анализ не может статисти- чески доказать, что наблюдаемые различия возникли именно вслед- ствие огораживания. Эти различия могли существовать до начала эксперимента, а также могли появиться в результате случайных (не- контролируемых) событий, затронувших один из двух эксперимен- тальных участков (например, вытаптывание, заготовка березовых ве- ников, установка палаточного лагеря и тому подобные). Финансовые и организационные проблемы, связанные с огора- живанием относительно крупных площадок, естественным образом ограничивают экспериментатора. Однако эту проблему можно ре- шить — хотя и не оптимальным образом, но с минимальными затрата- ми. Создание контрольных участков, как правило, менее трудоемко — хотя бы потому, что их не нужно огораживать. Если исследователь в состоянии огородить лишь один участок, ему следует выбрать не- сколько контрольных участков того же размера и той же формы, как и огороженный участок. Подчеркнем, однако, что участок для огоражи- вания должен быть случайным образом выбран среди всех участков, предназначенных для проведения эксперимента. Подобный экспери- ментальный план не лишен недостатков, но он, несомненно, пред- почтительнее, чем сравнение одного огороженного участка с одним контрольным участком, поскольку позволяет провести корректный статистический анализ. В частности, сравнение единственного огоро- женного участка с несколькими неогороженными участками возмож- но с применением критерия Стьюдента (проверка принадлежности огороженного участка к той же генеральной совокупности, к которой принадлежат неогороженные участки). Основной недостаток данного экспериментального плана — ничем не обоснованное предположе- ние о том, что изменчивость между огороженными участками (если бы их было несколько) не отличалась бы от изменчивости между не- огороженными (контрольными) участками. Вызывает удивление частая публикация российскими учеными результатов экологических исследований, основанных на изучении единственной экспериментальной единицы. И хотя отсутствие ста- тистически независимых повторностей само по себе нельзя считать ошибкой, необходимо отдавать себе отчет в тех ограничениях, кото- рые подобный экспериментальный план накладывает на интерпрета- цию полученных результатов. Смешение понятий эксперименталь- 57
ной и измеряемой единицы, ведущее к некорректно проведенному статистическому анализу, представляет собой гораздо более серьез- ную ошибку, чем полный отказ от статистического анализа. Пример 27 (разграничение между экспериментальной и из- меряемой единицами). Г. С. Малышева и П. Д. Малаховский (2000) озаглавили свою статью «Пожары и их влияние на растительность сухих степей». В статье приведены два описания растительности, одно из которых сделано через несколько месяцев после пожара на невыгоревшем участке степи, а другое — на следующий год после пожара на выгоревшем год назад участке степи. Различия между двумя описаниями авторы интерпретируют как результаты пожара; статистический анализ результатов не проводился. Каковы основные методические ошибки, допущенные авторами исследования? Объяс- нение: Статья описывает последствия одного пожара, то есть экспери- ментальное воздействие (пожар) произошло однократно. Однако, как и в примере 18, название статьи существенно шире ее содержания и вводит потенциального читателя в заблуждение. В пределах каждой из двух экспериментальных единиц (выго- ревшего и невыгоревшего участков степи) авторы выбрали по един- ственной измеряемой единице (площадке, на которой было проведе- но описание растительности). При этом процедура выбора площадок в статье не описана. И хотя формально это нельзя рассматривать как ошибку, подобный выбор (в силу его явной субъективности — см. ниже, раздел 5.5), существенно понижает ценность исследования. Поскольку описания выгоревшего и невыгоревшего участков сте- пи выполнены в разные годы, то обсуждаемые различия между ними могут отражать: (1) исходно существовавшие различия, не имею- щие никакого отношения к пожару; (2) межгодичную изменчивость в структуре растительного покрова; (3) результат случайных (некон- тролируемых) событий, затронувших лишь один из двух описанных участков; и (4) результат пожара. Скорее всего, свой вклад в наблю- даемые различия внесли все перечисленные выше факторы, однако схема эксперимента не позволяет разделить их влияние на структуру растительного покрова. И хотя авторы справедливо отметили, что «какие-либо значитель- ные выводы делать преждевременно», тем не менее, в заголовке они 58
необоснованно распространили результаты единичного наблюдения, к тому же не имеющего корректно выбранного контроля, на воздей- ствие всех пожаров на растительность всех сухих степей. Практическая рекомендация 5. Сосчитайте в своем эксперимен- тальном плане все, что поддается подсчету. Если какой-либо из объ- ектов (озеро, грядка, дерево, аквариум, вольер, климатическая каме- ра) имеется в единственном числе, — подумайте, не совершаете ли вы ошибку. 5.2. Статистическая независимость и структура экспериментального плана Смешение понятий экспериментальной единицы и измеряемой единицы, к сожалению, встречается довольно часто. Лишь немногие из авторов, обсуждающих различные аспекты планирования экспе- римента, используют четкие формулировки и однозначно указывают, что именно считать статистически независимой экспериментальной единицей. Это касается как работ, написанных статистиками, так и работ, написанных биологами, психологами либо представителями других научных дисциплин. Одна из наиболее распространенных ошибок заключается в том, что статистическую независимость считают неотъемлемой чертой элемента выборки либо индивидуального замера, зависящей исклю- чительно от того, как была взята выборка либо произведен замер. На самом деле, статистическая независимость может быть оценена только по отношению как к структуре данных, так и к проверяемой гипотезе. Если мы имеем несколько случайным образом полученных оце- нок плотности популяции некоего вида насекомых на каждой из двух площадок, то эти оценки будут обладать статистической не- зависимостью, необходимой для проверки нулевой гипотезы (см. определение 21) об отсутствии различий между двумя площадками. Это связано с тем, что мы не выдвигаем никаких предположений о факторах, которые могли повлиять на плотность популяций; соответ- ственно, мы не знаем, на какие участки в пределах выбранных пло- щадок эти факторы влияли. Таким образом, по отношению к неиз- вестным факторам наш выбор мест, в которых проводилась оценка плотности, будет случайным. 59
Однако если одна из площадок была обработана инсектицидом, те же самые оценки не будут обладать статистической независимо- стью, необходимой для проверки нулевой гипотезы об отсутствии различий между опытом и контролем (аналогично эффекту огора- живания, рассмотренному в примере 26). Это связано с тем, что мы выдвигаем предположение о факторе, который мог повлиять на плотность популяции насекомых. Поскольку инсектицидом была обработана вся площадка, то это однозначно определяет ее как экс- периментальную единицу. Таким образом, для корректного опреде- ления эффекта инсектицида на плотность популяции исследуемого вида необходимо обработать инсектицидом несколько площадок (как минимум две), причем эти площадки должны быть случайным образом выбраны из всех площадок, предназначенных для экспери- мента. 5.3. Взятие репрезентативной выборки Для того, чтобы параметры выборки могли служить приближен- ными оценками параметров генеральной совокупности, выборка должна быть репрезентативной (представительной). Это означает, что исследователь должен принять меры к обеспечению встречае- мости в выборке всех существующих в генеральной совокупности значений признаков в той же пропорции, как и в генеральной сово- купности. Описание этих мер представляет собой важную часть экс- периментального плана. Если подобные меры не приняты, то выбо- рочная оценка может оказаться смещенной (то есть будет обладать низкой точностью; подробнее см. раздел 9.2) и, соответственно, даст искаженное представление о генеральной совокупности. Чаще всего для получения несмещенной оценки используют слу- чайный выбор объектов, который если и не исключает, то существен- но уменьшает субъективизм исследователя. Один из методов слу- чайного выбора — составление списка объектов и взятие выборки с помощью таблицы случайных чисел — описан в примере 17. Другие способы приведены в примерах 28 и 29. Пример 28 (метод взятия случайной выборки). Т. В. Пааль и Я. Л. Пааль (1989) использовали следующий алгоритм для случайно- го выбора мест закладки учетных площадок: «Вдоль каждой пробной площади, примерно в середине ее, отмечали кольями через 20 м базис- 60
ную линию. Из таблиц случайных чисел последовательно брали две величины: первая из них показывала число метров, откладываемых на базисной линии от ее начала; вторая — расстояние от базисной линии под углом 90°. Если второе число оказывалось четным, то двигались вправо, если нечетным — влево. Для нахождения следующей точки повторяли эту процедуру от конца первой координаты и т.д. В зави- симости от ширины пробных площадей пользовались разными табли- цами случайных чисел (до 24, до 49). Каждая установленная точка служила углом блока учетных площадок размерами 1 х 4 м.» Пример 29 (метод взятия случайной выборки). Ф. Моуэт (1993) описывает другой метод случайного выбора площадок для из- учения болотной растительности: «...я взялся за исследования плот- ности [растительного] покрова. Обычно для этого пользуются кру- гом Раункиера — инструментом, придуманным не иначе как самим дьяволом. С виду это невинная вещица, обыкновенный металличе- ский обруч; но на деле это дьявольский механизм, предназначенный сводить с ума нормальных людей. Пользуются им так: нужно встать на открытом участке болота, закрыть глаза, повернуться несколько раз, словно волчок, и бросить круг как можно дальше. Вся эта слож- ная процедура, якобы обеспечивающая бросок «наугад», на самом деле неизбежно приводила к тому, что я каждый раз терял круг и тра- тил уйму времени на его поиски...». Одна и та же выборка может дать смещенную оценку по одному из исследуемых параметров, однако оказаться пригодной для полу- чения несмещенной оценки другого параметра (пример 30). Пример 30 (метод взятия случайной выборки). Если ученого интересуют исторические данные об уровнях повреждения листвы растениеядными насекомыми, то анализ гербарных образцов, со- бранных флористами десятилетия тому назад, скорее всего, даст за- ниженную оценку, поскольку ботаники, несомненно, отбраковывали сильно поврежденные растения в процессе сбора образцов. Однако те же самые образцы можно использовать для получения историче- ских данных о фоновой концентрации тяжелых металлов в тканях растений, поскольку ботаники не имели возможности оценить этот параметр в процессе сбора материала. Соответственно, по отноше- нию к концентрации тяжелых металлов выборку можно считать слу- чайной. 61
Даже в случае корректно взятой (т. е. случайной и репрезентатив- ной) выборки возможно получение смещенной оценки, поскольку любой измерительный инструмент находится под управлением че- ловека. Так, например, при проверке гипотезы о возрастании флук- туирующей асимметрии листа березы под воздействием загрязнения исследователь, осведомленный о проверяемой гипотезе, может не- осознанно округлять промежуточные (в пределах точности измере- ния) значения замеров в «нужную» сторону. Бороться с такими яв- лениями можно с использованием так называемого «слепого теста», когда человек, проводящий замеры, не имеет информации об ожида- емом результате. Если по каким-либо причинам невозможно органи- зовать сбор всех данных подобным образом, то необходимо провести «слепой тест» с частью выборки и сравнить результаты, полученные лицами, знакомыми и не знакомыми с проверяемой гипотезой. Опасность искажения получаемой информации особенно высока при изучении социальных и психологических явлений, проводимом с помощью опросов либо анкетирования. В этих случаях не только опросчик может невольно подсказать опрашиваемому «нужный» от- вет, но и опрашиваемый может вольно или невольно «подыграть» исследователю. Именно поэтому в методических разделах статей по этим дисциплинам часто встречаются фразы типа «Сущность про- веряемой гипотезы была неизвестна как респондентам, так и лицам, проводившим опрос». Однако с подобной проблемой могут стол- кнуться и представители других дисциплин (см. пример 7). 5.4. Способы борьбы с ошибками в контролируемых экспериментах Все контролируемые эксперименты подвержены различного рода воздействиям, как случайным, так и закономерным, которые могут привести к ошибочным выводам. Для осознания необходимости тща- тельного соблюдения рекомендованных ниже процедур рассмотрим основные источники ошибок в контролируемом эксперименте. Исследуемый объект может изменяться с течением времени: де- ревья растут, животные стареют, перелетные птицы улетают и воз- вращаются, в растительных сообществах происходят сукцессии... Именно поэтому в биологических исследованиях обязательно ис- пользуют контрольные экспериментальные единицы, наблюдения за 62
которыми должны вестись одновременно с наблюдениями за теми экспериментальными единицами, которые испытывают интересую- щее исследователя воздействие. На исследуемый объект может повлиять не только интересую- щий исследователя фактор, но и экспериментальная процедура. На- пример, при изучении влияния тяжелых металлов на рост растений металлы обычно вносят в почву в виде растворов. Чтобы отличить влияние металлов от влияния полива, контрольные растения необхо- димо поливать одновременно с экспериментальными — естественно, используя для их полива чистую воду. Экспериментатор может допустить ошибку в проведении опыта, на- пример, перепутать растения и случайно полить одно из контрольных растений раствором тяжелых металлов. Последствия подобной ошиб- ки будут тем незначительнее, чем больше экспериментальных единиц подвергается воздействию каждой комбинации изучаемых факторов. Если же каждой комбинации соответствует единственная эксперимен- тальная единица, то результатом подобной ошибки будет либо необхо- димость повторения всего эксперимента (если ошибка будет замече- на), либо ошибочный вывод (если ошибка замечена не будет). Экспериментальные единицы, особенно при проведении полевых экспериментов, могут исходно (т. е. до начала исследования) отли- чаться друг от друга. Способы учета этих различий и предотвраще- ния их влияния на результаты исследования рассмотрены ниже (при- меры 33 и 34). Во время эксперимента всегда происходит множество событий, которые невозможно было предусмотреть при его планировании. Так, при работе в лесу на одной из площадок грибники разведут ко- стер, на второй нарежут березовые ветки на веники, по третьей про- едет непонятно откуда взявшийся трактор, на четвертой случится вспышка массового размножения какого-то листогрызущего насе- комого, пятую вы просто не сможете найти... В теплице перегорят лампочки, испортится отопление, хулиганы разобьют стекла, слу- чится потоп из-за засоренной канализации... Бороться с последстви- ями подобных событий крайне трудно, особенно в тех случаях, когда варианты исходно сопряжены (и, соответственно, потеря любого из элементов пары исключает из анализа и второй элемент). Поэтому во всех случаях, когда это возможно, в эксперименте следует предусма- тривать некоторый «запас прочности»: так, если расчеты (описанные 63
в главе 7) показывают, что для получения значимого результата необ- ходимо 5 пар экспериментальных единиц (контроль — воздействие), то лучше всего заложить 6-8 пар (в зависимости от трудоемкости ра- бот и продолжительности эксперимента). Успех эксперимента зависит от способности исследователя умень- шить воздействие всех перечисленных (и не перечисленных) «вредо- носных» факторов до такой степени, чтобы они не могли повлиять на результат исследования. При этом даже в тех случаях, когда экс- периментатор убежден в том, что некоторый источник ошибок в его экспериментальном плане отсутствует, большинство из приведенных способов борьбы с ошибками следует считать обязательными. Практическая рекомендация 6. План любого контролируемого эксперимента в обязательном порядке должен предусматривать: • наличие контрольных экспериментальных единиц; • более чем одну экспериментальную единицу для каждой комби- нации изучаемых факторов; • случайное соотнесение каждой из комбинаций изучаемых фак- торов с определенной экспериментальной единицей; • пространственное (либо временное — в зависимости от схемы эксперимента) «перемешивание» изучаемых воздействий. 5.5. Выбор контроля в условиях активного эксперимента Наличие контроля — обязательное условие проведения любого экологического эксперимента. Необходимость контроля диктуется тем, что любая биологическая система претерпевает некоторые из- менения с течением времени, и при отсутствии контроля результаты этих изменений могут быть спутаны с результатами эксперименталь- ного воздействия. Контроль вовсе не подразумевает отсутствие каких бы то ни было манипуляций: в качестве контроля используют экспериментальные единицы, не получавшие интересующее экспериментатора воздей- ствие. При этом, как и во многих обсуждавшихся ранее случаях, вы- бор контроля зависит от цели эксперимента и от проверяемой гипо- тезы. Пример 31 (выбор контроля). Изучали влияние некоторого ле- карственного препарата на мышей. Четыре группы мышей получали: 64
• группа 1: инъекцию препарата в солевом растворе; • группа 2: инъекцию солевого раствора; • группа 3: введение иглы (без инъекции); • группа 4: никакого воздействия. Какую группу следует считать контрольной? Объяснение: Ответ на поставленный вопрос возможен только при наличии ин- формации о цели исследования. При этом, в зависимости от цели, одна и та же группа мышей может быть как экспериментальной, так и контрольной. В данном опыте группы 2, 3 и 4 выступают в качестве контроля по отношению к группам 1, 2 и 3 соответственно, при проверке сле- дующих гипотез: • об эффекте препарата (1 — эксперимент; 2 — контроль); • об эффекте солевого раствора (2 — эксперимент; 3 — конт- роль); • об эффекте укола иглой (3 — эксперимент; 4 — контроль). Пример 32 (выбор контроля). С. А. Остроумов (2000) изучал влияние химических сигналов на количество поднимающейся по ру- чью кеты. Через определенные промежутки времени исследователь вносил в ручей различные экстракты и регистрировал появление рыб в устье ручья. До внесения в ручей изучаемых экстрактов рыбы не заходили из пруда в ручей, однако стали заплывать в поток через 40 мин после внесения в него экстракта. Можно ли считать наблюде- ние, проведенное до внесения в ручей экстрактов, контролем по от- ношению к наблюдениям, проведенным после внесения экстрактов? Объяснение: Рассматриваемый экспериментальный план содержит единствен- ную экспериментальную единицу (ручей, впадающий в пруд, в которм обитает популяция кеты). Поскольку контрольная экспериментальная единица отсутствует, то связать заход рыб в ручей с применением экс- тракта можно только логически, но не статистически. Автор использует в качестве контроля наблюдения, проведенные в том же ручье до начала внесения экстракта; однако поскольку эти наблюдения проводились в иное время, чем опыт, рассматривать их в качестве контроля нельзя. Более того, поднимавшиеся по ручью рыбы не возвращались об- ратно в пруд к началу следующего эксперимента, то есть следующий 65
эксперимент проводился на части исходной популяции кеты (кото- рая, например, могла отличаться пониженной чувствительностью к применяемым экстрактам). Следовало не повторять опыт в одном ручье, а провести одинако- вые опыты в разных ручьях, и обязательно использовать контроль- ные экспериментальные единицы (ручьи, в которые не вносили ни- какие вещества) для исключения того, что заход рыб в ручей был вызван не экспериментальным воздействием, а некоторым неучтен- ным фактором (например, магнитная буря и т.п.). 5.6. Рандомизация в условиях активного эксперимента Применять статистические методы для получения вероятностных выводов можно тогда и только тогда, когда имеется более чем одна повторность для каждой комбинации факторов, и каждая комбина- ция факторов случайным образом соотнесена с определенными экс- периментальными единицами. Определение 16. Рандомизация (от англ, random — выбранный наугад, случайный) — процедура случайного выбора элементов генеральной совокупности при взятии выборки, а также процеду- ра случайного соотнесения экспериментальных единиц с опреде- ленным типом воздействия. Рандомизация уменьшает влияние экспериментатора на результат эксперимента, тем самым приближая выборочное значение к истин- ному значению. С теоретической точки зрения, только рандомизация (то есть случайный выбор из полного множества возможных вари- антов: см. пример 17) позволяет корректно оперировать с вероятно- стями событий. Это и только это условие дает возможность вычис- ления значений статистических критериев и точного определения а (вероятности ошибки первого рода; подробнее см. раздел 6.4). Если принцип рандомизации нарушен (то есть выбор экспериментальной единицы для заданного воздействия не случаен или «не вполне слу- чаен»), то значение а определить нельзя. В этом случае интерпрета- ция результатов становится субъективной. Рандомизация не исключает учета различий между эксперимен- тальными единицами, существующих до начала эксперимента, при соотнесении воздействия с определенной экспериментальной еди- 66
ницей. Такой учет особенно важен при постановке полевых экспе- риментов, когда затруднительно подобрать идентичные эксперимен- тальные единицы (примеры 33 и 34). Пример 33 (случайный выбор экспериментальных единиц при наличии существенных различий между ними). Для оценки влияния двух уровней удаления хвои текущего года (50% и 100%) на вертикальный прирост молодых деревьев сосны обыкновенной на экспериментальном участке выбрали 15 примерно одновозрастных сеянцев. Высота выбранных сеянцев составляет от 42 до 68 см. Есть основания считать, что годичный прирост в высоту зависит от раз- мера сеянца. Какая схема случайного соотнесения уровня удаления хвои с индивидуальным сеянцем позволит минимизировать влияние исходных различий в высоте сеянцев на результат эксперимента? Ре- шение: 1. Пронумеруем сеянцы в порядке возрастания их высоты: № 1 получит самый маленький, а № 15 — самый большой из выбранных сеянцев. 2. Разделим все сеянцы на 5 групп, по 3 сеянца с последовательно увеличивающимися номерами в каждой группе (группа 1 включает сеянцы с номерами 1-3, группа 2 — с номерами 4-6 и т.д.). 3. В пределах каждой группы соотнесем одно из воздействий (контроль, удаление 50% и 100% хвои) с индивидуальным сеянцем с использованием таблицы случайных чисел. В тех случаях, когда количество экспериментальных единиц ве- лико, а изменчивость относительно мала, можно составить экспери- ментальный план без учета различий между экспериментальными единицами, а затем проверить, не различаются ли группы экспери- ментальных единиц, к которым планируется применять различные воздействия, по интересующему нас признаку. Пример 34 (случайный выбор экспериментальных единиц при наличии существенных различий между ними). Для изуче- ния влияния различных уровней удаления листовой поверхности (0, 2, 4, 8 и 16% ежегодно) на рост сеянцев березы пушистой были вы- браны два экспериментальных участка (на расстоянии около 50 км друг от друга), на каждом из которых выбрали по три площадки раз- мером примерно 10 х 20 м. В пределах каждой площадки пометили 20 случайно выбранных сеянцев березы, то есть всего 120 сеянцев. 67
Их высота на момент начала эксперимента составляла от 16 до 60 см (среднее значение ± стандартная ошибка: 33,3 ± 10,9 см). В пределах каждой площадки планируемые уровни повреждения были случай- ным образом соотнесены с индивидуальными сеянцами. Проверка показала, что сеянцы, выбранные для каждого из уровней поврежде- ния, до начала эксперимента не различались по высоте (F4115= 1,18, Р = 0,33). Таким образом, различия по высоте, появившиеся во время эксперимента, можно считать результатом повреждения листвы (де- тальное описание исследования: Zvereva et al., 2012). 5.7. Пространственное размещение экспериментальных единиц в условиях активного эксперимента При проведении лабораторных экспериментов эксперименталь- ные единицы, как правило, более сходны друг с другом, чем в поле- вых экспериментах. Однако лабораторные условия сами по себе соз- дают неоднородную среду, вынуждая исследователя принимать меры для уменьшения риска воздействия неучтенных факторов и случай- ных (неконтролируемых) событий на результаты эксперимента. Пример 35 (размещение экспериментальных единиц в неодно- родной среде). Для оценки влияния четырех концентраций водного раствора хлористого кадмия на прорастание семян пшеницы иссле- дователь подготовил 50 чашек Петри (экспериментальных единиц), каждая из которых содержит 25 семян (измеряемых единиц). Про- нумеровав чашки (от 1 до 50), исследователь с помощью генератора случайных чисел соотнес каждое из пяти воздействий (контроль и четыре различные концентрации хлористого кадмия) с индивидуаль- ной чашкой Петри. Можно ли считать данный экспериментальный план полностью рандомизированным? Объяснения: Казалось бы, все хорошо, поскольку экспериментальные едини- цы случайным образом соотнесены с планируемыми воздействиями. Однако разработка экспериментального плана пока что не заверше- на, и исследователь все еще рискует совершить фатальную ошибку, которая не позволит корректно интерпретировать результаты опыта. При планировании активного эксперимента корректное размеще- ние экспериментальных единиц представляет собой одну из важней- ших задач исследователя. В связи с этим критически важно обсудить 68
вопрос о том, где и каким образом будут размещены эксперимен- тальные единицы во время проведения эксперимента. Для простоты предположим, что эксперимент будет проводиться на лабораторном столе, на котором будут стоять все 50 чашек Петри (5 рядов по 10 чашек в каждом). Вариант 1: Чашки Петри скомбинированы по экспериментальным воздей- ствиям (первый ряд: 10 контрольных чашек Петри; второй ряд: 10 ча- шек Петри с минимальной концентрацией хлористого кадмия, и т.д.). Вариант 2: Чашки Петри расставлены по номерам (первый ряд: № 1-10; вто- рой ряд: № 11-20, и т.д.), вне зависимости от того, какое воздействие применяется к индивидуальной чашке Петри. Вариант 1, описанный выше, представляет собой грубую методи- ческую ошибку. В частности, поскольку столы обычно стоят вдоль окон, а между столом и окном часто расположена батарея, вариант 1 не позволит отличить эффект концентрации хлористого кадмия от эффекта освещенности и/или температуры, которые связаны с рас- стоянием от чашки Петри до окна и/или батареи. Таким образом, перемешивание экспериментальных единиц (вариант 2) необходимо для уменьшения возможного влияния неконтролируемых факторов на результат эксперимента. В некоторых случаях во время лабораторного эксперимента, по- мимо исходной рандомизации, целесообразно время от времени из- менять расположение экспериментальных единиц в пространстве. Случайная перестановка обеспечивает выравнивание средних усло- вий, в которых в течение опыта находится каждая эксперименталь- ная единица. Соответственно, уменьшается случайная изменчивость между экспериментальными единицами, что облегчает обнаружение исследуемого эффекта. Пример 36 (размещение экспериментальных единиц в не- однородной среде). Для изучения эффекта опушенности листа ивы на пищевое поведение лапландского листоеда (Chrysomela lapponica) жукам, помещенным в чашки Петри, предлагали на выбор ди- ски диаметром 10 мм, вырезанные из листьев ивы северной (Salix myrsinifolia ssp. borealis). В каждую чашку Петри были помещены 69
две пары дисков (опыт и контроль); каждая пара дисков была выре- зана из одного и того же листа; две пары дисков были вырезаны из листьев разных особей ивы северной; с экспериментальных дисков были удалены все волоски. Через 24 часа регистрировали площадь погрызов каждого диска. Поскольку большинство насекомых проявляет четко выраженный фототаксис (стремление к свету или избегание света), исходную ори- ентацию чашек Петри на лабораторном столе (определяющую, какой из четырех дисков будет расположен ближе всего к окну) задавали случайным образом. Дополнительно в ходе эксперимента все чашки трижды поворачивали на 90 градусов по часовой стрелке, так что ус- редненное за время опыта положение всех дисков по отношению к окну было одинаковым. Это позволило минимизировать эффект фо- тотаксиса на предпочтение листового диска (подробное описание ис- следования см.: Zvereva, Kozlov, 1996). Если количество экспериментальных единиц равно квадрату ис- следуемых значений фактора (например, предполагается сравнить урожайность четырех сортов картофеля, высадив каждый сорт на четырех делянках), то задачи случайного соотнесения каждой экспе- риментальной единицы с одним из экспериментальных воздействий и пространственного перемешивания различных вариантов опыта можно решить одновременно путем использования случайно вы- бранной схемы латинского квадрата с длиной стороны, равной коли- честву исследуемых значений фактора. Определение 17. Латинский квадрат и-го порядка — таблица раз- мера п х п, заполненная п элементами таким образом, что в каж- дой строке и в каждом столбце таблицы каждый элемент встреча- ется в точности один раз. Использовать латинские квадраты для планирования сельскохо- зяйственных экспериментов впервые предложил Р. Фишер в 1925 г. Действительно, эти схемы наиболее удобны при использовании оди- наковых делянок, непосредственно примыкающих друг к другу. С увеличением п количество вариантов латинских квадратов стре- мительно возрастает: 12 при п = 3 (рис. 2), 576 при п = 4 (примеры показаны на рис. 3), 161280 при п = 5 (примеры показаны на рис. 4) и свыше 800 миллионов при п = 6. 70
ABC' CAB В C A В C A AB С С A В CAB В C A ABC A ; С I В BA C C B| A ВАС' С В С В A AC AC В BA А С В BA С В A AC ВАС С В А А В C В i CAB С В C A __J '_J_-J-_ C CAB Bi В!C A Aj ABC BiC А а!в с С А В С В А ВАС А С В Рис. 2. Все варианты латинских квадратов для п = 3. A BCD С DA В В CD А DAB С В С D А DA В С С D А В АВ CD В С d!a А ' В С D D А ВС CD А i В i Рис. 3. Примеры латинских квадратов для п = 4. А В CD Е С D | Е А В Е А В С D В CD Е А D Е А ВС A D В Е С С A D В Е ECAD В В ЕС A D D В Е С А Рис. 4. Примеры латинских квадратов для п = 5. 71
Пример 37 (размещение экспериментальных единиц в неодно- родной среде). Задача исследования — оценить влияние кислотно- сти атмосферных осадков на рост и плодоношение брусники. Схема эксперимента: в сосновом лесу выбран экспериментальный участок размером 15 х 15 м, над которым на высоте 3 м сооружена крыша из пленки, пропускающей фотосинтетически активную радиацию. Уча- сток разбит на 16 площадок размером 2 х 2м, разделенных буферны- ми зонами шириной 1 м. В опыте предполагается поливать участки дождевой водой, собранной с крыши (контроль; pH ~ 5,7) и дополни- тельно подкисленной (три градации: pH = 5, pH = 4 и pH = 3). Какая схема случайного соотнесения индивидуальных площадок с уровнем кислотности используемой при поливе воды обеспечит простран- ственное перемешивание повторностей? Решение: Любой случайно выбранный латинский квадрат для п = 4 обеспе- чит решение поставленной задачи. В предложенном эксперименталь- ном плане (рис. 5) использован второй из трех латинских квадратов, показанных на рис. 3. рН=5.0 рН=4.0 i 1 рН=3.0 1 рН®5.7 рН=3.0 1 рН®5.7 ! ! ! \ \ рН=5.0 1 1 рН=4.0 I рН=4.0 1 рН=3.0 рН«5.7 рН=5.0 рН«5.7 рН=5.0 рН=4.0 рН=3.0 Рис. 5. Схема экспериментального участка для изучения влияния кислот- ности атмосферных осадков на рост и плодоношение брусники (поясне- ния в тексте: пример 37). Размещение вариантов опыта, различающихся по кислотности осадков, основано на втором из трех латинских квадра- тов, показанных на рис. 3. 72
В тех случаях, когда в эксперименте изучают совместное влияние двух различных факторов, причем известно, что факторы не взаи- модействуют друг с другом, для уменьшения количества изучаемых сочетаний можно использовать так называемые греко-латинские ква- драты. Определение 18. Греко-латинский квадрат и-го порядка — табли- ца размера п х л, заполненная парами элементов, значение каж- дого из которых изменяется от 1 до л, таким образом, что (1) в каждой строке и в каждом столбце таблицы каждый элемент встречается один раз на первом месте в паре и один раз на вто- ром, и (2) при этом каждый элемент встречается в паре с каждым другим элементом и с самим собой по одному разу. Такие квадраты, как видно из их названия, тесно связаны с латин- скими квадратами, для которых выполняется лишь первое правило. Названия и латинских, и греко-латинских квадратов пошли от Эйле- ра, который для обозначения элементов исследуемых множеств ис- пользовал латинские и греческие буквы. При этом греко-латинский квадрат можно рассматривать как наложение двух латинских квадра- тов (рис. 6). А ВС 1. D а у 8 Аа 1 Вр Су D8 В A D С ; 4. У 5 а р = Ву ASiDa Ср С D А В р У р а |С₽ Dy Ар Ва D С!В । L А i i 8 а 8 у D8 Са В8 Ау Рис. 6. Два латинских квадрата для п = 4 и полученный их наложением греко-латинский квадрат. Экспериментальные планы, основанные на греко-латинских ква- дратах и производных от них схемах, чаще всего используются в точ- ных науках. Отчасти это связано с тем, что в экологических иссле- дованиях практически невозможно выбрать факторы так, чтобы они априорно не взаимодействовали друг с другом. Более того, большин- ство факториальных экспериментов в экологии нацелено, в первую очередь, на поиск взаимодействия между факторами. И хотя учебные пособия, посвященные планированию эксперимента, традиционно 73
рассматривают латинские и греко-латинские квадраты (например, Fisher, 1935; Cochran, Сох, 1957), в практике автора необходимость разработки экспериментального плана на основе греко-латинских квадратов не возникала ни разу. Различные варианты перемешивания и соответствующие им экс- периментальные схемы, равно как и некорректные способы про- странственного размещения экспериментальных единиц, детально рассмотрены в работе Hurlbert (1984). 5.8. Выбор экспериментальных единиц в условиях пассивного эксперимента В рассмотренных выше примерах 28 и 29 исследователь сначала выбирал участок относительно небольшого размера (то есть экспе- риментальную единицу), и лишь затем формировал случайную вы- борку из измеряемых единиц в пределах выбранного участка. В тех случаях, когда участки подбирают по принципу соответствия опре- деленным, априорно заданным требованиям (например, тип леса в примере 28, болото в примере 29), их неслучайный выбор не может поставить под сомнение результаты статистического анализа. Ситу- ация, однако, значительно усложняется, когда необходимо провести анализ различий между участками. В этом случае выбор участков, по сути, предопределяет результаты исследования. Типичный пример подобной работы — описание последствий воздействия промышленного загрязнения на различные параметры экосистем. При этом экспериментальные участки, выбранные на разном расстоянии от точечного источника атмосферных выбро- сов (чаще всего — крупного промышленного предприятия), рас- сматриваются как разные стадии нарушения экосистем (подробнее см.: Воробейчик, Козлов, 2012). После того, как территория вокруг предприятия условно разделена на некоторое количество «зон за- грязнения», исследователь должен в пределах каждой зоны выбрать один либо несколько экспериментальных участков и заложить в пределах этих участков некоторое количество пробных площадей (ПП). Существуют по крайней мере два подхода к выбору ПП в преде- лах территории с определенным уровнем загрязнения. Первый из них требует соблюдения базового принципа статистики — незави- 74
симости испытаний, то есть абсолютно случайного выбора места для закладки ПП. На практике такой подход чаще всего невозможен (например, из-за наличия населенных пунктов и агроландшафтов, где ПП явно не следует закладывать, или ввиду трудности посеще- ния некоторых участков из-за отсутствия вблизи них дорог). Но даже близкий к случайному выбор из-за значительной естественной из- менчивости природных условий требует закладки очень большого количества ПП для достижения приемлемой мощности статистиче- ского анализа (подробнее см. раздел 8.1). Противоположный подход заключается в тщательном подборе «типичного» места, где может быть заложена ПП. Вряд ли следует доказывать, что такой подбор в силу его субъективности может при- вести к существенному искажению истинной картины. Строго гово- ря, неслучайный подбор экспериментальных единиц накладывает запрет на использование статистического анализа. Более того, при таком подборе получаемые результаты зависят от исходных устано- вок исследователя, особенно в тех случаях, когда возможный резуль- тат (например, степень повреждения растений) может быть оценен на этапе выбора ПП (подробнее см.: Zvereva, Kozlov, 2010). Таким образом, оба рассмотренных подхода по-своему ущербны. С одной стороны, отказываясь от тщательного подбора участков, мы заведомо увеличиваем изменчивость и снижаем мощность анализа, с другой — без рандомизации применение статистического анализа некорректно и, следовательно, невозможно распространить получен- ные выводы на другие участки импактного региона. Проблема выбора ПП в пассивном эксперименте тесно связана с вопросом о том, что именно считать генеральной совокупностью (см. выше, раздел 4.2). Поскольку воздействие загрязнения наложи- лось на ранее существовавшую мозаику биотопов, генеральная сово- купность представляет собой множество всех участков импактного региона, где исходно, т. е. до начала действия загрязнения, был пред- ставлен исследуемый вариант биотопа. Естественно, объем опре- деленной таким образом генеральной совокупности зависит от ис- пользуемой классификации биотопов. Например, в одном случае это могут быть лесные сообщества в целом, в другом — только сосняки черничные. Принципиально важно, что отнесение биотопа к опре- деленному классу должно основываться только на тех признаках, на которые не могло повлиять загрязнение. Например, безлесные про- 75
мышленные пустоши должны быть отнесены к тому типу леса, кото- рый существовал на этих участках до постройки завода. В данных условиях целесообразно использовать двухэтапную схему выбора ПП, сочетающую их тщательный подбор и случайный выбор. На первом этапе следует сформировать набор потенциальных ПП, пригодных для характеристики исследуемого варианта биото- па. Естественно, отнесение конкретного участка к тому или иному варианту биотопа представляет собой достаточно сложную задачу, поскольку требует реконструкции условий, существовавших до на- чала действия загрязнения. Эта задача может быть решена квалифи- цированным исследователем на основе учета характеристик биотопа, остатков ранее существовавшей растительности (например, пней) и почвенного покрова, а также информации о предполагаемом ходе ди- грессионных смен. На втором этапе из сформированного набора по- тенциальных ПП случайным образом выбирают некоторое, заранее определенное количество ПП, которые составят итоговую выбор- ку. Важно, чтобы количество потенциальных ПП, подобранных на первом этапе, было значительно больше итогового количества ПП, необходимого для решения поставленной задачи (методика расчета необходимого количества ПП описана в главе 7). В результате до- стигается «законный» компромисс между статистической корректно- стью и минимизацией затрат (подробнее см.: Воробейчик, Козлов, 2012). Необходимо отметить, что рандомизация требуется не только при выборе экспериментальных единиц и при соотнесении воздействия с определенной экспериментальной единицей, но и при определении последовательности проведения процедур (и/или измерений) в тех случаях, когда эта последовательность может повлиять на результат исследования. Пример 38 (рандомизация в условиях пассивного экспери- мента). Изучали эффективность фотосинтетической системы II у березы пушистой в градиенте промышленного загрязнения. Экспе- риментальные участки расположены вдоль шоссе, пересекающего загрязненную территорию по направлению с юга на север; расстоя- ние между крайними (контрольными) участками составляет 63 км. Известно, что один из замеряемых параметров сильно зависит от температуры воздуха. Какая схема проведения замеров позволит от- 76
личить эффект загрязнения от эффекта суточных колебаний темпера- туры воздуха? Решение: Если проводить замеры, начиная с одного из крайних (контроль- ных) участков, и постепенно двигаться в сторону источника выбро- сов, а затем — к противоположному краю зоны загрязнения, то все измерения на наиболее загрязненных участках будут выполнены в середине дня, когда температура воздуха максимальна. Напротив, все измерения на контрольных участках будут выполнены утром либо вечером, когда температура воздуха минимальна. При такой схеме эксперимента эффект суточных колебаний температуры воздуха не удастся отличить от эффекта загрязнения. Полностью рандомизированный план требует посещения экспе- риментальных площадок в порядке, определенном с помощью табли- цы случайных чисел. Однако при этом средний ожидаемый пробег автомашины составит около 450 км, а времени на проведение заме- ров практически не останется. Для достижения приемлемого баланса между случайным рас- пределением времени проведения измерений и практической невоз- можностью использования полностью рандомизированного плана был реализован следующий вариант. Для каждой экспериментальной площадки случайным образом определили принадлежность к первой либо второй серии измерений. Первую серию измерений провели в течение первой половины дня при движении с южного контрольно- го участка до северного контрольного участка, а вторую серию — во второй половине дня при движении с севера на юг. При этом провер- ка показала, что время проведения измерений оказалось независи- мым от расстояния до источника выбросов, что позволило выявить изучаемый эффект на фоне суточных колебаний температуры возду- ха (детальное описание исследования: Kozlov et al., 2009). И наконец, интерпретация результатов пассивного эксперимента в той же степени зависит от наличия контроля, как и в случае активно- го эксперимента. Пример 39 (выбор контроля). Б. П. Ильяшук и Е. А. Ильяшук (2000) изучали ископаемые останки (головные капсулы) комаров- звонцов в колонке донных отложений, взятой из одного озера в зоне промышленного загрязнения. Указанные авторы обнаружили опреде- ленные различия в составе реконструируемых сообществ комаров- 77
звонцов между прериодами до и после середины XX века. Можно ли интерпретировать обнаруженные различия как результат воздействия выбросов медно-никелевого комбината, вышедшего на плановую мощность в 1946-1947 гг.? Объяснение: Рассматриваемое исследование использует единственную экспе- риментальную единицу (озеро) в зоне воздействия выбросов комби- ната. В данном случае связать изменение состава сообщества с про- мышленным загрязнением сложно даже логически, поскольку оно могло возникнуть в результате различных случайных событий. Для проверки гипотезы о влиянии промышленного загрязнения на сообщества комаров-звонцов следовало бы статистически срав- нить характеристики их сообществ между как минимум двумя за- грязненными и двумя незагрязненными (контрольными) озерами в пределах одних и тех же временных интервалов (то есть как до, так и после начала воздействия загрязнения). В англоязычной литера- туре эта схема обозначается как ВАСЦ что расшифровывается как «До — После — Контроль — Воздействие» (англ. Before — After — Control — Impact), и широко используется при анализе последствий различного рода воздействий на окружающую среду. 5.9. Способы увеличения точности эксперимента Одна из основных задач планирования эксперимента — повыше- ние точности выводов. Эта задача может быть решена различными способами, которые в основном сводятся к следующим практиче- ским рекомендациям: Практическая рекомендация 7. Используйте как можно более сходные экспериментальные единицы. Этот совет достаточно легко выполним при проведении лабораторных экспериментов, однако по- левые экологи, как правило, испытывают существенные трудности при подборе сходных объектов (см. в частности примеры 33 и 34). Практическая рекомендация 8. Используйте информацию о факторах, которые могут повлиять на результат эксперимента (в до- полнение к изучаемому фактору; см. примеры 33 и 34). Эта инфор- мация может быть включена в статистическую модель при обработке результатов. 78
Практическая рекомендация 9. Используйте как можно больше экспериментальных единиц! Это самый простой способ повышения точности, который может быть рекомендован всем, у кого есть вре- мя, силы и средства. Практическая рекомендация 10. Используйте наиболее эффек- тивные варианты экспериментальных планов. Сбалансированный план, в котором число экспериментальных единиц одинаково для каждой из градаций изучаемого фактора, как правило, позволяет достигнуть более высокой мощности анализа (подробнее см. раздел 8.1), чем несбалансированный план (с тем же суммарным числом экспериментальных единиц). Из-за неоднородно- сти и ограниченного количества изучаемых объектов полевым эколо- гам приходится уделять особое внимание созданию сбалансирован- ных экспериментальных планов, а также использовать сопряженные экспериментальные единицы для повыщения мощности статистиче- ского анализа.
Глава 6. Формулировка гипотез и подготовка к их экспериментальной проверке 6.1. Наблюдения и разработка гипотез Гипотезы — это леса, которые возводят перед постройкой здания и сносят, когда здание готово; они необходимы для работника, но не следует принимать леса за здание. Иоганн Вольфганг Гете. Максимы и размышления Определение 19. Гипотеза (др.-греч. Ьлдвеак; — предположе- ние) — предположение или догадка; утверждение, предполагаю- щее доказательство (в отличие от аксиом, принимаемых без дока- зательств). Определение 20. Научная гипотеза — гипотеза, которая потенци- ально может быть проверена критическим экспериментом (крите- рий Поппера). Знаменитая книга Чарльза Кребса «Экологическая методология» (Krebs, 1989) начинается со следующего утверждения: «Экологи со- бирают данные и, как в других областях биологии, эти данные долж- ны использоваться для проверки гипотез». Это утверждение, несо- мненно, верно в той его части, которая подчеркивает необходимость осмысленного сбора данных. Однако при таком подходе остается не- понятным, каким образом возникают новые гипотезы. Большинство теорий, включая открытый Ньютоном закон все- мирного тяготения и эволюционную теорию Дарвина, было разрабо- тано на основе систематических или случайных наблюдений. Более близкий по времени пример — накопление данных по кислотности дождевых осадков, которое долгое время не имело под собой ника- кой теоретической основы, однако в середине прошлого века позво- лило понять происхождение кислоты в атмосфере и оценить экологи- ческие последствия кислотных дождей. Важность наблюдений (которые проводятся без выдвижения какой- либо гипотезы и поэтому не могут быть названы пассивными экспе- риментами; см. определения 5 и 6), несомненно, остается высокой, особенно для экологов, перед которыми быстрое развитие цивилиза- ции часто ставит новые проблемы, требующие оперативного решения. 80
Таким образом, не вызывает сомнений, что дальнейшее развитие как теоретической, так и прикладной экологии требует накопления информации как о естественном ходе экологических процессов на разных уровнях организации живого вещества, так и об изменениях этих процессов, вызванных деятельностью человека. Эта информа- ция необходима для выдвижения новых гипотез, которые могут быть проверены в ходе контролируемых экспериментов (см. определе- ние 6) в полевых либо лабораторных условиях. Не следует забывать, что подтверждающие (англ, confirmatory) исследования, то есть проверка некоторых гипотез с помощью ана- лиза собранных данных, вторичны по отношению к поисковым (англ, exploratory) исследованиям, включающим поиск и анализ ин- формации, которая не поддается интерпретации в рамках существу- ющих теорий. Именно поисковые исследования приводят к созданию новых теоретических моделей, для проверки которых разрабатыва- ются новые гипотезы. При этом способность формулировать гипо- тезы в настоящее время служит одной из важнейших предпосылок успеха научной карьеры. 6.2. Принципы формулировки гипотез и их статистической проверки Определение 21. Нулевая гипотеза (Но) — утверждение, противо- речащее выдвинутой научной гипотезе. Как правило, в качестве нулевой гипотезы выбирается гипотеза о случайности события или об отсутствии эффекта. Определение 22. Альтернативная гипотеза (Н ) — утверждение, согласующееся с выдвинутой научной гипотезой. Как остроумно отмечал Дэвид Колхун (Colquhoun, 1971), основ- ная задача статистики — не дать исследователю обмануть самого себя и заявить, что его любимая теория подтверждается наблюдени- ями, которые на самом деле ничего не подтверждают. Именно для подобной проверки и служит процедура тестирования гипотез: на основании существующей теории (или модели некоторого явления) исследователь выдвигает предположения (гипотезы), допускающие возможность экспериментальной проверки. Хотя методы анализа данных и зависят от характера информации, получаемой в ходе экс- 81
перимента, само понятие статистической гипотезы и методологиче- ские подходы к ее проверке одинаковы для всех областей научного знания. Прежде чем переходить к принципам формулировки научных ги- потез, необходимо напомнить, что статистическая гипотеза выдвига- ется относительно свойств генеральной совокупности (см. опреде- ление 11), однако проверка статистической гипотезы, как правило, основывается на изучении свойств выборки (см. определение 12), взятой из генеральной совокупности. При этом, как уже говорилось (см. раздел 4.1), нарушение принципов взятия выборки может при- вести к ошибочным выводам относительно свойств генеральной со- вокупности. Одно из важнейших требований, предъявляемых к статистиче- ской гипотезе, — принципиальная возможность ее эксперименталь- ной проверки. Пример 40 (корректные формулировки нулевой гипотезы). 1. Соотношение полов в популяции равно 1 : 1 [Но: х = 1 -х = 0,5]. 2. Связь между двумя изучаемыми признаками отсутствует, то есть коэффициент корреляции равен нулю [Но: г = 0]. 3. Средние значения признака в выборках 1 и 2 не различаются [Но: х,=х2]. Пример 41 (некорректная формулировка гипотезы). — Эй вы, херувимы и серафимы! — сказал Остап, вызывая вра- гов на диспут. — Бога нет! [Но] — Нет, [Бог] есть, [HJ — возразил ксендз Алоизий Морошек. В примере 41 (взятом из романа И. Ильфа и Е. Петрова «Золо- той теленок») как Но, так и Н принципиально непроверяемы, то есть их нельзя считать научными (см. определение 20), и лучшее дока- зательство тому — последующий спор Остапа с ксендзами. В таких спорах побеждают не аргументы, а эмоции. Как правило, экспериментальные данные отличаются от значе- ний, предсказанных теорией. Допустим, при проверке нулевой гипо- тезы о равном соотношении полов в популяции (первая из гипотез в примере 40) мы обнаружили в выборке 13 самок и 4 самца; доля самцов составляет 0,235, что существенно отличается от ожидае- мого значения (0,500). Значит ли это, что проверяемая гипотеза не верна? 82
Отклонение экспериментальных данных от ожидаемых значений может быть вызвано как ошибочностью гипотезы, так и случайными причинами. Задача исследователя — выяснить, насколько вероятно случайное отклонение от ожидаемых значений, и на основе этой ве- роятности либо принять, либо отвергнуть нулевую гипотезу. Процесс проверки нулевой гипотезы (Но) может быть представ- лен как последовательность следующих действий: • выбираем статистический критерий (в зависимости от характе- ра анализируемых данных и проверяемой гипотезы; подробнее см. любой учебник математической статистики); • по имеющейся выборке вычисляем наблюдаемое значение вы- бранного статистического критерия; • поскольку закон распределения статистического критерия из- вестен, по заданному уровню значимости а (обычно используют а = 0,05) определяем (с помощью имеющихся в справочниках и в интер- нете таблиц) критическое значение статистического критерия, разде- ляющее область отклонения гипотезы (иначе называемую критиче- ской областью) и область принятия гипотезы; • если вычисленное значение попадает в область принятия ги- потезы, то принимаем нулевую гипотезу; если в критическую об- ласть — отвергаем нулевую гипотезу. Пример 42 (проверка статистической гипотезы). Проверить гипотезу № 3 из примера 40 в следующей формулировке: особи бе- резы пушистой, растущие у верхней границы леса, не отличаются по длине листа от особей березы пушистой, растущих в нижней части склона той же горы [то есть Но: = xv где х — длина листовой пла- стинки]. Исходные данные: х = 32 мм, Oj = 10 мм, = 20 деревьев, х2 = 38 мм, о2 = 12 мм, п2 = 20 деревьев; распределение эмпириче- ских данных не отличается от нормального на уровне значимости 0,05; выборочные дисперсии не различаются на уровне значимости 0,05. Решение: 1. Поскольку распределение эмпирических данных не отличается от нормального и выполнено условие равенства дисперсий, то для проверки нулевой гипотезы можно использовать критерий Стьюден- та (/), рассчитываемый следующим образом: j I ~ X2 I Q ) 7(<Т12/«|) + (<Т22/и2) 83
2. Подставляя численные значения в формулу (1), получим: t = | 32 - 38 | / ((102 / 20) + (122 / 20))1/2 = 1,72. 3. Поскольку наблюдаемое значение t = 1,72 оказалось меньше, чем критическое значение Z005 = 2,02 при 38 степенях свободы (df = 20 + 20 - 2), то мы не можем отклонить нулевую гипотезу об отсут- ствии различий в длине листа между популяциями березы пушистой из сравниваемых местообитаний. 6.3. Отношение экологов к тестированию гипотез Описанная выше процедура проверки нулевой гипотезы широко применяется в экологии с середины прошлого века. В 1970 г. око- ло половины статей, опубликованных в престижных экологических журналах (Ecology и Journal of Ecology), содержали результаты про- верки статистических гипотез. В начале 2000-х гг. доля подобных статей в журналах с высоким импакт-фактором достигла 90%. В то же время российские экологи лишь изредка формулируют гипотезы при постановке задач исследования (см. табл. 1). Сравнение результатов эксперимента с нулевой гипотезой из- вестно в англоязычной литературе под названием «Доктрина NHST» (англ. Null Hypothesis Significance Testing — проверка значимости ну- левой гипотезы). В России эта доктрина не получила широкого рас- пространения, по-видимому, в связи с общим отставанием от миро- вого научного сообщества в применении статистических методов. Одна из причин широкого распространения доктрины NHST за- ключается в том, что статистические тесты представляются объ- ективными и точными. Кроме того, их относительно просто рас- считать, студентов обучают их использованию и, как результат, эти методы вошли в повседневную практику научной работы. Редакторы престижных журналов делают акцент на тестиро- вании гипотез как на важнейшем критерии качества публикации. Например, инструкция для авторов журнала Global Ecology and Biogeography (импакт-фактор 5,15) подчеркивает, что редакция предпочитает рукописи, в которых описаны результаты тестирова- ния глобальных экологических гипотез. Более прикладной журнал The Science of the Total Environment (импакт-фактор 3,29) предла- гает рецензентам в обязательном порядке указать в отзыве на ру- копись, тестируются ли в ней четко сформулированные гипотезы. 84
Таким образом, без формулировки и проверки гипотез в настоя- щее время достаточно сложно опубликовать результаты экологиче- ского исследования в международном журнале с высоким импакт- фактором. С другой стороны, доктрина NHST в течение последнего десяти- летия подвергается серьезной критике. В первую очередь, критики указывают на то, что эта доктрина придает неоправданно высокую значимость нулевой гипотезе, которая часто лишена как экологиче- ского смысла, так и научного интереса. При этом за счет перехода от количественной оценки вероятности того, что нулевая гипоте- за верна либо ошибочна, к бинарной оценке в терминах статисти- ческой значимости (см. раздел 1.4), исследователи при отсутствии значимого эффекта часто делают вывод об отсутствии эффекта во- обще. Более того, происходит неосознанное смешение статистиче- ской значимости и научной ценности либо практической важности полученного результата (вплоть до тенденции публиковать только статистически значимые результаты). И, наконец, многие исследо- ватели настолько увлекаются проверкой статистической значимости гипотез, что оставляют в стороне величину исследуемого эффекта, которая сама по себе может представлять большую ценность, чем результат тестирования гипотезы (см. раздел 1.4). В конце 1990-х гг. примерно в половине статей в международных экологических жур- налах приводились только значения вероятностей отклонения нуле- вых гипотез, без средних значений, объемов выборок и меры измен- чивости исследованных признаков. Такая подача материала, как уже говорилось (разделы 2.3-2.4), делает эти статьи непригодными для мета-анализа. Предложено несколько путей достижения компромисса между сторонниками и противниками доктрины NHST. Некоторые из них просты в выполнении, другие требуют специальной логической и статистической подготовки. Во-первых, необходимо во всех возможных случаях формулиро- вать не только нулевую, но и альтернативную гипотезу, что позволит рассчитывать (и приводить в публикациях) вероятности ошибок как первого, так и второго рода (см. раздел 6.4). Простое отклонение ну- левой гипотезы, как правило, означает наличие некоторого эффекта, но само по себе не дает никакой информации об этом эффекте. Вы- бор из двух альтернативных гипотез более осмыслен. 85
Во-вторых, в публикациях необходимо приводить численную ин- формацию об опытной и контрольной группах (средние значения, ха- рактеристики изменчивости и объемы выборок) независимо от того, удалось ли доказать значимость различий между ними. В-третьих, рекомендуется шире использовать байесовскую веро- ятность, определяемую как степень уверенности в истинности суж- дения. Этот подход, рассматриваемый как одна из альтернатив док- трины NHST, лишь недавно стал применяться в экологии и в науках об окружающей среде (подробнее см.: Ellison, 2004; Clarck, 2005; McCarthy, 2007). В настоящее время лишь около 5% статей, публи- куемых в престижных экологических журналах, использует этот под- ход, однако доля таких публикаций постепенно растет. 6.4. Два типа ошибок при тестировании гипотез Поскольку статистическая гипотеза выдвигается относительно свойств генеральной совокупности, а тестируется путем изучения свойств выборки, то исследователь не в состоянии исключить воз- можность ошибки. При этом он может как отклонить истинную ги- потезу, так и принять ошибочную гипотезу (табл. 2). Таблица 2 Два типа ошибок при тестировании гипотез Наше решение Истина Нп верна Нп ошибочна Отклонить Но Ошибка первого рода (вероятность = а) Верное решение Принять Но Верное решение Ошибка второго рода (вероятность = 0) Определение 23. Уровень значимости (а) — это вероятность со- вершения ошибки первого рода (то есть отклонения истинной ну- левой гипотезы). Определение 24. Мощность анализа, или статистического теста (1 - Р) — это вероятность избежать ошибки второго рода (то есть принятия ошибочной нулевой гипотезы). Уровень значимости интерпретируется как вероятность случайно- го получения такого наблюдаемого значения статистического крите- 86
рия (см. выше, раздел 6.2), которое попадает в критическую область (то есть область отклонения гипотезы) при условии справедливости нулевой гипотезы. В частности, уровень значимости а = 0,05 означа- ет, что при сравнении значений длины листа, измеренной в 100 парах выборок, взятых из не различающихся по длине листа популяций бе- резы (см. пример 42), в среднем в 5 из этих 100 сравнений расчетное значение критерия Стьюдента будет превышать граничное значение Z005 = 2,02. Соответственно, в 5 случаях из 100 мы ошибочно откло- ним верную нулевую гипотезу. Чем меньше значение а, тем больше должно быть отклонение выборочной оценки признака от истинного (наблюдающегося в ге- неральной совокупности) значения для того, чтобы привести нас к ошибочному выводу. Значение а задается исследователем произвольно, исходя из неко- торых общих соображений (см. ниже, раздел 6.5). Для экологических исследований чаще всего принимают а = 0,05. Пример 43 (проверка статистической гипотезы). Случайная выборка, взятая из исследуемой популяции, состоит из 13 самцов и 4 самок. Вопрос 1: Какова вероятность того, что данная выборка взята из генеральной совокупности, в которой соотношение полов составляет 1:1? Решение: 1. Общее количество возможных вариантов выборок, в которой каждая из 17 особей может оказаться либо самцом, либо самкой, со- ставляет 217 = 131 072. 2. Общее количество возможных вариантов выборок, состоящих из 13 самцов и 4 самок, представляет собой число сочетаний из 17 по 4 (подробнее см. любое пособие по комбинаторике) и составляет 17! / [4! х (17-4)!] = 2380. 3. Таким образом, вероятность того, что данная выборка взята из генеральной совокупности, в которой соотношение полов равно 1:1, составляет 2380 / 131 072 = 0,01816, то есть чуть меньше 2%. Вопрос 2: Можем ли мы на основании анализа данной выборки отклонить нулевую гипотезу о том, что соотношение полов в популя- ции равно 1 : 1, на уровне значимости а = 0,05? Решение: 1. Рассчитаем (как описано в пп. 1-3) вероятности того, что при равном соотношении самцов и самок в исследуемой популяции коли- 87
Количество самок в выборке из 17 особей Рис. 7. Распределение вероятностей получения случайной выборки из 17 особей с различным количеством самок из популяции с соотношением полов 1:1. чество самок в нашей выборке равно 0, 1 и так далее вплоть до 17, и построим частотное распределение (рис. 7). 2. Теперь разделим это распределение на две области: ту, попада- ние в которую будет рассматриваться как событие, согласующееся с нулевой гипотезой, и ту, попадание в которую будет рассматривать- ся как событие, не согласующееся с нулевой гипотезой. Именно на данном этапе нам потребуется уровень значимости а, поскольку в область принятия гипотезы должны попасть все события (начиная с наиболее вероятных), совокупная вероятность которых составляет 1 - а (то есть в нашем случае 95%). 3. Если мы приняли а = 0,05, то в область отклонения гипотезы попадут варианты, при которых в выборке из 17 особей оказалось от 0 до 4 либо от 13 до 17 самок (рис. 8, верхняя панель). При этом наша выборка (13 самцов и 4 самки) попадает в область отклонения нулевой гипотезы. 88
20 О 1 2 3 4 6 в 7 8 9 10 11 12 13 14 16 16 17 Количество самок в выборке из 17 особей ис. 8. Распределение вероятностей получения случайной выборки из 17 собей с различным количеством самок из популяции с соотношением олов 1:1, разделенное на области принятия и отклонения нулевой гипо- гзы при а = 0,05 (верхняя панель) и а = 0,01 (нижняя панель). В область ринятия нулевой гипотезы попадают 95% (верхняя панель) и 99% (ниж- яя панель) случайно взятых выборок. 89
Вопрос 3: Можем ли мы на основании анализа данной выборки отклонить (на уровне значимости а = 0,01) нулевую гипотезу о том, что соотношение полов в популяции равно 1:1? Решение: 1. Если мы задали а = 0,01, то в область отклонения гипотезы по- падут варианты, при которых в выборке из 17 особей оказалось от 0 до 3 либо от 14 до 17 самок (рис. 8, нижняя панель). При этом наша выборка (13 самцов и 4 самки) попадает в область принятия нулевой гипотезы. Очевидно, что если мы будем и дальше понижать значение а, то практически любая выборка попадет в область принятия нулевой ги- потезы. Однако так поступать не стоит, поскольку при этом возраста- ет опасность совершить ошибку второго рода, то есть ошибочно при- нять ложную нулевую гипотезу. Если Но не верна, логично заключить, что верна некоторая гипо- теза Нр отличная от Но (Н / Но). Вероятность ошибки второго рода может быть рассчитана тогда и только тогда, когда мы можем одно- значно сформулировать Нр В нашем примере это означает задание численного значения интересующего нас параметра. Пример 44 (проверка статистической гипотезы). Предполо- жим, что у нас есть теоретические основания считать, что самцов в исследуемой популяции в два раза меньше, чем самок, то есть соот- ношение полов составляет 1 : 2 (альтернативная гипотеза). Нулевая гипотеза остается той же, что и в примере 43, то есть соотношение полов в исследуемой популяции составляет 1:1; уровень значимо- сти а = 0,01. Какова вероятность того, что случайно взятая выборка позволит нам сделать обоснованный выбор в пользу одной из двух гипотез? Решение: 1. Рассчитаем (как описано в примере 43, пп. 1-3) вероятности того, что при соотношении самцов и самок в исследуемой популя- ции, равном 1 : 2, количество самок в выборке равно 0, 1 и так далее вплоть до 17, и построим частотное распределение (нижняя панель на рис. 9). 2. Спроецируем (рис. 9) границы зоны принятия нулевой ги- потезы с рис. 8 (нижняя панель: а = 0,01) на полученное частотное распределение (нижняя панель). Получим, что примерно 87% ча- стотного распределения, соответствующего альтернативной гипоте- зе (соотношение полов 1 : 2), попадает в область принятия нулевой 90
20 18 12 10 8 4 2 О Область отклонения нулевой гипотезы Область отклонения нулевой гипотезы JL,___, _ , 14 16 18 17 О 1 2 3 4 6 8 7 8 8 10 11 12 13 14 16 18 17 Количество самок в выборке из 17 особей Рис. 9. Распределение вероятностей получения случайной выборки из 17 особей с различным количеством самок из популяции с соотношением полов 1 : 1 (нулевая гипотеза [Но], верхняя панель) и с соотношением по- лов 1 : 2 в пользу самок (альтернативная гипотеза [HJ, нижняя панель), разделенная на области, позволяющие и не позволяющие сделать одно- значный выбор в пользу Но либо Hj при а = 0,01. Пояснения в тексте (пример 44). 91
гипотезы (соотношение полов составляет 1:1). Это означает, что в среднем 87% выборок, взятых из генеральной совокупности, не по- зволят сделать однозначный выбор в пользу нулевой либо альтерна- тивной гипотезы. То есть, если нулевая гипотеза ошибочна (а аль- тернативная гипотеза, соответственно, верна), то при однократном взятии выборки вероятность совершить ошибку второго рода (то есть принять ошибочную нулевую гипотезу) составит 87%. 3. Таким образом, вероятность получения выборки, которая по- зволит нам отклонить нулевую гипотезу и принять альтернативную, составляет около 13%. Эта величина, равная 1 - Р, где Р — вероят- ность ошибки второго рода (см. табл. 2), обозначается как мощность анализа или статистического теста (определение 24). Этот пример наглядно показывает, что прежде чем проводить эксперимент, целесообразно рассчитать мощность статистического анализа (подробнее см. главу 8). Для экологических исследований рекомендована мощность анализа 80% (подробнее см. раздел 8.2), хотя, как показывают различные наукометрические исследования, это пожелание до сих пор выполняется лишь незначительным коли- чеством ученых. Однако если мощность анализа при запланирован- ном количестве экспериментальных единиц окажется ниже 50%, то целесообразно подумать об изменении экспериментального плана. Сопоставление рис. 8 и 9 показывает, что при увеличении а зона перекрытия распределений, соответствующих двум моделям (и, со- ответственно, вероятность совершения ошибки второго рода) умень- шается. Таким образом, исследователь имеет возможность найти приемлемый баланс между вероятностями ошибок первого и второго рода и объемом выборки, необходимым для достижения этих вероят- ностей (подробнее см. разделы 7.3 и 8.1). 92
6.5. Ответственность перед обществом и учет малых вероятностей Нам разрешается прослыть невеждами, мистиками, суеверными дураками. Нам одного не простят: если мы недооценили опасность. И если в нашем доме вдруг завоняло серой,.. — мы обязаны предположить, что где-то рядом объявился черт с рогами, и принять соответствующие меры, вплоть до производства святой воды в промышленных масштабах. А. и Б. Стругацкие. Жук в муравейнике В общем случае, как уже говорилось выше, исследователь зада- ет приемлемые для целей планируемого исследования вероятности ошибок первого и второго рода в достаточной степени произвольно, исходя из некоторых общих соображений. В данном разделе рассмо- трены факторы, которые могут повлиять на эту процедуру. Практическая рекомендация 11. Разумные меры предосторож- ности определяются произведением вероятности события на тяжесть его последствий (Л. Э. Цырлин, физик-теоретик). В повести А. и Б. Стругацких «Жук в муравейнике», отрывок из которой выбран в качестве эпиграфа, работники Комиссии по кон- тролю проверяли гипотезу о внедрении в земное общество агентов некой сверхцивилизации. В соответствии с традициями, сформули- руем нулевую гипотезу следующим образом: агентов внеземной ци- вилизации на Земле нет. Тогда ценой ошибки первого рода (агентов нет, но мы считаем, что они есть) будет жизнь человека, которого спецслужба считает таким агентом. Цена ошибки второго рода (аген- ты внедрены, но мы считаем, что их нет) — благополучие или даже само существование человечества. Герой Стругацких, чьи слова вы- несены в эпиграф, предпочел совершить ошибку первого рода. Кста- ти говоря, мы так и не знаем, совершил ли он ошибку... Переходя к более близким нам ситуациям, рассмотрим консилиум хирургов, обсуждающих диагноз некоего пациента. Ошибка первого рода: пациент здоров, а хирурги считают, что он нуждается в сроч- ной операции. Ошибка второго рода: пациент нуждается в срочной операции, а хирурги считают, что он здоров. В этом случае послед- ствия обеих ошибок могут оказаться одинаково трагичными. И, не- сомненно, в этом случае выбранный врачами баланс между вероят- 93
ностями ошибок первого и второго рода заслуживает гораздо более серьезного обоснования, чем в обсуждавшемся выше (пример 44) случае проверки гипотез о соотношении полов в популяции. Один из самых известных случаев принятия ошибочного реше- ния на основании неправильной интерпретации статистических дан- ных — это печальная история Салли Кларк (Sally Clark, 1964-2007), жившей во время описываемых событий в небольшом городе Уим- слоу в Великобритании. Первый сын Салли Кларк внезапно умер че- рез несколько недель после рождения. После того, как внезапно умер ее второй сын, она была арестована. В ноябре 1999 г. Салли была признана виновной в убийстве двух своих сыновей. В деле Салли Кларк нулевая гипотеза может быть сформулирова- на как две смерти подряд от естественных причин; альтернативная гипотеза — два убийства собственных детей. Цена ошибки первого рода — осуждение невиновной; цена ошибки второго рода — безна- казанность убийцы. В качестве эксперта в судебном заседании выступал Сэр Рой Ме- доу (Sir Roy Meadow), в прошлом — профессор педиатрии в Универ- ситете города Лидс. Эксперт заявил, что для состоятельной семьи не- курящих родителей вероятность внезапной смерти новорожденного составляет 1 к 8543; соответственно, вероятность двух смертельных случаев в одной семье составляет 1 к 73 миллионам (то есть к 8543 х 8543). На основании этих данных эксперт заявил, что одна внезапная младенческая смерть в семье — трагедия, два — подозрительный случай, а три — убийство, если только не доказано обратное. В январе 2002 г., через три года после вынесения приговора, Ко- ролевское Статистическое Общество обратилось к Лорд-канцлеру с заявлением о том, что вычисления, на которых была основана оцен- ка вероятности двух внезапных смертей новорожденных, некоррек- тны. Вероятность наступления двух событий равна произведению их вероятностей только в том случае, если эти события не зависят друг от друга. Профессор Рэй Хилл (Ray Hill, Математический факультет Университета города Солфорд) доказал, что существуют некие фак- торы предрасположенности новорожденных к внезапной смерти. По его оценке, вероятность второй внезапной смерти составляет 1 к 100, а не 1 к 8500. Кроме того, во время суда многие газеты писали, что 1 к 73 мил- лионам — это вероятность того, что Салли невиновна. Такая интер- 94
претация некорректна. В предыдущие годы две смерти подряд от естественных причин регистрировались в Великобритании в 4-9 раз чаще, чем двойное убийство собственных детей. Если основываться на этих статистических данных, то вероятность того, что Салли не- виновна, составляла 80-90%. Интересно отметить, что расчет байе- совской вероятности (см. раздел 6.3), проведенный впоследствии на основании статистических данных, подтвердил, что вероятность ви- новности Салли Кларк составляла всего лишь около 10%. Салли Кларк провела в заключении более трех лет. Обвинение было снято в январе 2003 г., и этот случай был официально при- знан одной из крупнейших ошибок правосудия в современной юри- дической истории Великобритании. После оправдания Салли Кларк ее осуждение, со статистической точки зрения, следует считать ошибкой первого рода (ошибочное отклонение нулевой гипотезы о естественных причинах смерти детей). Салли впала в тяжелейшую депрессию, безуспешно лечилась от серьезных психиатрических проблем, и умерла в 2007 г. от отравления алкоголем. Приведенные примеры призваны убедить читателя в том, что ни в теоретических построениях, ни в практических решениях нельзя иг- норировать вероятность ошибки ни первого, ни второго рода. Вместе с тем, по неизвестным автору причинам, во всех российских посо- биях по прикладной статистике, предназначенных для биологов, по- нятие ошибки второго рода и сопряженное с ней понятие мощности анализа (статистического теста) не рассматриваются. Этим россий- ская школа биологической статистики отличается от всего мира, при- чем явно не в лучшую сторону. В описанных выше примерах (повесть А. и Б. Стругацких, дело Салли Кларк) построение критерия оптимальности (см. определе- ние 9) в общем случае невозможно, поскольку подразумевает этиче- ский выбор и вследствие этого субъективно. К счастью, в большин- стве случаев, особенно в ситуациях, с которыми имеют дело экологи, цена ошибки может быть измерена достаточно объективно. 6.6. Использование последовательного статистического анализа В большинстве случаев для задач, решаемых с применением ста- тистического анализа, объем выборки можно (и нужно) определять 95
заранее (см. главу 7). Исключение представляет последовательные статистический анализ, при котором объем выборки заранее не опре- делен, а измерения (опыты) продолжаются до тех пор, пока собран- ных данных не окажется достаточно для принятия решения (табл. 3). Таблица: Различия между классическим и последовательным статистическим анализом (по Krebs, 1989, с изменениями) Тип анализа Объем выборки Варианты выводов Классический Определен заранее Принять Но Отвергнуть Но Последовательный Не определен Принять Но Отвергнуть Но Увеличить выборку Последовательный метод применяется, как правило, когда об работка пробы достаточно проста (как в примере 46), либо требуе: значительных затрат (как в примере 45). Например, когда плотносп популяции какого-либо вида насекомых определяют, пересчиты вая всех особей на одном растении, учет продолжают (то есть пере ходят к учету на следующем растении) до тех пор, пока собранна) информация не позволит принять одно из двух альтернативных ре шений, а именно — применять или не применять инсектициды. Пре имущество последовательного анализа заключается в том, что объел выборки оказывается минимально возможным; часто он составляв лишь около половины объема, который потребовался бы для реше ния проблемы с помощью классического метода. Подготовка к проведению последовательного анализа включае следующие этапы: • сформулировать альтернативные гипотезы, включающие в се& граничные значения исследуемого признака (Но: среднее значение признака меньше Xj [х < xj; Н : среднее значение признака больше х [х > х2]); при этом сравниваемые интервалы не должны перекрывать ся (то есть х2 > Xj); • определить приемлемые уровни ошибок первого и второго рода • построить график принятия решения: накопленное значени< признака (У, сумма значений признака во всех проведенных наблю дениях) как функция от объема выборки (числа проб, п). На это» 96
графике вся область возможных сочетаний указанных переменных будет разбита на три части: (1) принять Но, (2) принять Ц и (3) нахо- дящуюся между ними зону неопределенности, до выхода из которой невозможно принять ни Но, ни Нр а поэтому необходимо продолжить сбор материала (рис. 10 и 11). Исходные данные, необходимые для построения графика приня- тия решения, зависят от характера распределения исследуемого па- раметра. Так, в случае нормального распределения для построения линий, разделяющих график принятия решения на три области, по- мимо граничных значений признака (Xj и х2) необходимо знать его среднеквадратическое отклонение. Эту величину можно оценить путем проведения пробной серии замеров либо одним из способов, описанных в разделе 7.1. Области принятия решения разграничиваются двумя прямыми, описываемыми следующими уравнениями: нижняя линия: Y = Вп + Со, (2) верхняя линия: У=Ви + Ср (3) При этом параметры В, Со и Ср входящие в эти уравнения, рас- считывают следующим образом: В = 0,5(Xj+х2), (4) Со = о21п[(1 - р)/а]/(Х]-х2), (5) С, = о21п[(1-а)/0]/(х2-х(). (6) После того, как график построен, можно приступать к проведе- нию эксперимента. По результатам обработки каждой пробы на гра- фик наносят накопленное значение признака. Замеры продолжают до тех пор, пока полученное значение не окажется за пределами зоны неопределенности. Как только это произошло, принимают ту гипоте- зу, в зону принятия которой попало накопленное значение признака. Пример 45 (последовательный статистический анализ). Из- вестно, что при содержании в аквариуме с чистой (но не проточной) водой при прочих фиксированных условиях эксперимента форель гибнет не ранее, чем через 36 часов. Однако при наличии в воде про- мышленных стоков форель гибнет существенно раньше. Соответ- ственно, формулируем Но (промышленных стоков нет): средняя про- должительность жизни форели в опыте превышает 40 часов (то есть большее граничное значение х2 = 40); Н (вода загрязнена промыш- 97
ленными стоками): средняя продолжительность жизни в опыте мень- ше 36 часов (то есть меньшее граничное значение = 36). Известно, что о = 16,4 часа. Задаем а = 0,01, Р = 0,10. Решение: 1.В = 0,5 х (36+ 40) = 38. 2. Со = (16,4)2 х In [(1 - 0,10) / 0,01] / (36 - 40) ~ -303. 3. Cj = (16,4)2 х In [(1 - 0,01) / 0,10] / (40 - 36) ~ 154. 4. Нижняя линия: Y = 38п - 303. 5. Верхняя линия: Y= 38п + 154. 6. Строим график принятия решения (рис. 10). 7. В показанном на рис. 10 примере после замеров продолжитель- ности жизни 20 форелей (каждая из которых была помещена в слу- чайно отобранную из исследуемого ручья пробу воды) была принята гипотеза Ц (вода загрязнена промышленными стоками). Количество взятых проб Рис. 10. График принятия решения для оценки качества воды по продол- жительности жизни форели в условиях эксперимента (пример 45). Чер- ными квадратами показано изменение суммарной продолжительности жизни форели в ходе последовательного анализа проб воды (по Krebs, 1989, с изменениями). 98
В случае анализа частот признака, подчиняющегося биномиаль- ному распределению, параметры В, Со и Cj рассчитывают следую- щим образом: В = 1п[(1 -х,)/(1 -х2)]/1п[х2(1 -х,)/х,(1 -х2)], (7) C0 = -ln[(l -a)/p]/ln[x2(l -х,)/х,(1 -х2)], (8) С, =1п[(1 - Р)/а]/1п[х2(1 -х,)/х, (1 -х2)]. (9) Пример 46 (последовательный статистический анализ). На рыбоводных заводах при уровне заражения форели паразитами, пре- вышающем 10%, необходимо использовать препараты для уничто- жения паразитов. Но: зараженность <5% (то есть меньшее граничное значение = 0,05); Ц: зараженность >10% (то есть большее гранич- ное значение х2 = 0,10). а = Р = 0,05. Решение: 1. В = In [(1 - 0,05) / (1 - 0,10)] / In [(0,10 х (1 - 0,05)) / (0,05 х (1 - 0,10))] = 0,054067 / 0,747214 = 0,0724. Рис. 11. График принятия решения для оценки зараженности форели па- разитами (пример 46) (по Krebs, 1989, с изменениями). 99
2. Со = -In [(1 - 0,05) I 0,05] I In [(0,10 x (1 - 0,05)) I (0,05 x (1-0,10))] = -3,94. 4. C, = In [(1 - 0,05) / 0,05] / In [(0,10 x (1 - 0,05)) I (0,05 x (1-0,10))] = 3,94. 4. Нижняя линия: Y = 0,0724и - 3,94. 5. Верхняя линия: Y = 0,0724и + 3,94. 6. Строим график принятия решения (рис. 11). 7. В ходе последовательного осмотра особей форели на этот гра- фик исследователь напротив порядкового номера осмотренной рыбы (по горизонтали) будет наносить накопленное количество заражен- ных паразитами особей (по вертикали) до тех пор, пока полученная линия не выйдет из зоны неопределенности. При проведении последовательного анализа теоретически воз- можно «зависание» в зоне статистической неопределенности: напри- мер, это произойдет, если средняя продолжительность жизни форели в примере 45 окажется равна 38 часам, или уровень заражения па- разитами в примере 46 окажется в пределах 7-8%. Для того, чтобы избежать подобных ситуаций, рекомендуется рассчитать объем вы- борки, необходимой для сравнения двух альтернативных гипотез ме- тодами классической статистики (см. раздел 7.3) и использовать его как верхний предел, при достижении которого эксперимент следует прекратить. После этого с учетом полученных результатов необхо- димо пересмотреть граничные значения х и х2 и повторить экспе- римент.
Глава 7. Определение объема выборки 7.1. Объем выборки, необходимой для оценки изучаемого параметра с заданной точностью Выбор точности оценки изучаемого параметра — задача экологи- ческая, а не статистическая, поскольку точность оценки зависит от цели исследования. Кроме того, всегда следует принимать во внима- ние уровень ответственности решений, которые будут основываться на полученных данных. Можно задать как абсолютную, так и относительную ошибку из- мерения. В первом случае исследователь, например, формулирует требование, что истинное (то есть присущее изучаемой генеральной совокупности) значение длины листа с вероятностью 95% должно попасть в интервал ± 2,8 мм от средней оценки, полученной при ана- лизе выборки. Во втором случае оценка определяется в процентах от среднего значения, например 95%-ный доверительный интервал (см. определение 13) задается как ± 6% от истинного значения. Связь этих оценок очевидна: относительная ошибка = (абсолют- ная ошибка / среднее значение признака) х 100%. Величину относи- тельной ошибки иногда называют показателем точности опыта (либо точности оценки параметра). Почему в приведенном выше примере выбраны именно эти зна- чения, 2,8 мм и 6%? Мы этого не знаем, но предполагаем, что выдви- нувший это условие исследователь может при необходимости обо- сновать свой выбор. Дать общие рекомендации по допустимому (приемлемому) уров- ню относительной ошибки (англ, allowable или permissible relative error) весьма затруднительно. Например, национальный центр ме- дицинской статистики США, как правило, не публикует данные, если их относительная ошибка превышает 30%. Агенство по охране окружающей среды США при измерении концентраций токсикан- тов в природных средах требует, чтобы относительная ошибка не превышала 25%. Различные документы и инструкции по сбору эко- логической, природоохранной и медицинской информации считают приемлемыми относительные ошибки в диапазоне от 10 до 50%. Проведенный автором анализ случайной выборки биомедицинских публикаций на английском языке (25 публикаций, первое значение 101
из публикации) показал, что относительная ошибка изменяется от 2 до 522%, а медиана составляет 50%. В связи с этим рекомендация (Ивантер, Коросов, 2005) добиваться в экологических исследованиях относительной ошибки <3%, а при относительной ошибке >5% про- водить сбор дополнительного материала или повторять эксперимент, представляется слишком консервативной. Если нет оснований для принятия однозначного решения о допустимой величине ошибки, то в экологических исследованиях (особенно в лабораторных) можно ориентироваться на относительную ошибку 10%, допуская в опре- деленных случаях (полевые эксперименты, предварительные иссле- дования, трудоемкие или дорогостоящие методики) относительную ошибку до 25%. Если для измеряемого параметра ожидается распределение значе- ний, близкое к нормальному, то объем выборки (п), необходимой для определения среднего значения с заданной точностью, определяется по формуле: « = ('ЛЧьЛ (Ю) где о — среднеквадратическое отклонение, dabs — абсолютная ошиб- ка измерения (задается исследователем), t — значение критерия Стьюдента для df= п - 1 и доверительной вероятности 1 - а. На практике принимают: Га = 1,7 для 90% уровня значимости; ta = 2,0 для 95% уровня значимости; t = 2,7 для 99% уровня значимости. Приблизительное значение о можно получить одним из следую- щих способов: • использовать значение, полученное ранее в сходных условиях; • рассчитать по результатам замеров относительно малой выбор- ки (имеет смысл в тех случаях, когда предполагается существенный объем измерений); • рассчитать на основе размаха изменчивости (W = х - х .). г г v max min7 Последний способ наиболее прост, поскольку для его применения необходимо измерить только максимальное и минимальное значения признака в выборке некоторого объема. Тогда o = WCf. (11) При этом коэффициент пересчета Cf (англ, conversion factor) на- ходят в табл. 4 по заданному объему выборки (это — объем выборки, 102
для которой известны максимальное и минимальное значения, а не объем выборки, который необходимо оценить). Таблица 4 Коэффициенты пересчета (Cf) для вычисления среднеквадратичного отклонения на основании размаха изменчивости в выборке объема п (по Dixon, Massey, 1983) п Cf 2 0,886 3 0,591 4 0,486 5 0,430 6 0,395 7 0,370 8 0,351 9 0,337 10 0,325 11 0,315 12 0,307 п Cf 13 0,300 14 0,294 15 0,288 16 0,283 17 0,279 18 0,275 19 0,271 20 0,268 25 0,254 30 0,245 40 0,231 п Cf 50 0,222 60 0,216 70 0,210 80 0,206 90 0,202 100 0,199 150 0,189 200 0,182 300 0,174 500 0,165 1000 0,154 Можно также провести сбор информации в два этапа: на первом этапе взять выборку объема определить Oj и рассчитать объем вы- борки nv которую осталось взять для решения поставленной задачи, по формуле: +(2/n,))]-«r (12) Пример 47 (вычисление объема выборки из бесконечной гене- ральной совокупности). Какой объем выборки необходим для того, чтобы 95%-ный доверительный интервал для среднего значения длины листа березы составлял ± 2,8 мм? Известно, что в выборке из 100 листьев максимальное и минимальное значения составляют 54 и 17 мм соответственно. Решение: 1. Определяем размах изменчивости: W = 54 - 17 = 37 мм. 2. Из табл. 4 определяем коэффициент пересчета для выборки объемом 100 листьев: Cf = 0,199. 3. Подставляя полученные значения в формулу (11), получим: о = 37 мм х 0,199 = 7,4 мм. 4. Подставляя численные значения в формулу (10), получим п = (2 х 7,4 / 2,8)2 = 27,94, то есть необходимо измерить 28 листьев. 5. На практике имеет смысл измерить 30 листьев. 103
Если известен коэффициент вариации (CV = о/х), то расчет объ- ема выборки может быть проведен по формуле: rt = (100CVra/deI)2. (13) где drel — заданная исследователем относительная ошибка (отноше- ние абсолютной погрешности измерения к действительному или из- меренному значению исследуемой переменной, выраженное в про- центах). Для грубых расчетов можно ориентироваться на средние значения коэффициента вариации, определенные для различных ти- пов экспериментальных данных, например для различных методов определения плотности популяций (табл. 5). Таблица 5 Коэффициенты вариации плотности популяций (по Eberhardt, 1978) Среда обитания Организмы и способы учета CV Водная Планктон 0,70 Бентос 0,40-0,80 Моллюски 0,40 Рыбы 0,50-2,00 Наземная Учеты вдоль дорог с автомашины 0,80 Учеты птиц по голосам 0,70 Маршрутные учеты 0,50-2,00 Подсчет экскрементов 1,00 Пример 48 (вычисление объема выборки из бесконечной гене- ральной совокупности). Известно, что коэффициент вариации плот- ности планктона в среднем составляет 0,70. Какое число проб необ- ходимо для определения средней плотности планктона с точностью 25%? Решение: По формуле (13) объем выборки п = [(100 х 0,70 х 2) / 25]2 = 31,36. 2. На практике целесообразно взять 35 проб. Приведенные выше формулы подразумевают, что выборка со- ставляет бесконечно малую часть генеральной совокупности. В тех случаях, когда генеральная совокупность мала, а расчетный объем выборки превышает 5-10% от общего числа изучаемых объектов, вводится поправка на размер генеральной совокупности (G): «0 = и/[1 + (w/G)]. (14) 104
В этой формуле nG — объем выборки из генеральной совокупно- сти конечного объема G, а п — объем выборки, определенный по лю- бой из приведенных выше формул. Пример 49 (вычисление объема выборки из конечной гене- ральной совокупности). Какой объем выборки необходим для того, чтобы 95%-ный доверительный интервал для среднего значения дли- ны листа березового саженца, у которого всего около 150 листьев, составлял ± 2,8 мм? Известно, что в выборке из 100 листьев макси- мальное и минимальное значения составляют 54 и 17 мм соответ- ственно. Решение: 1. Расчет (пример 48) дает объем выборки 28 листьев. 2. По формуле (14) получаем: nG = 28 / [1 + (28 / 150)] = 23,60 ли- стьев. 3. На практике имеет смысл измерить 25 листьев. Другой часто встречающийся случай — определение процентного соотношения особей, относящихся к двум разным категориям (сам- цы и самки, живые либо мертвые, здоровые либо больные, повреж- денные либо неповрежденные). В этом случае если доля особей пер- вого типа равна х, то доля особей второго типа составляет 1 - х. Для расчета объема выборки в этом случае необходимо задать допусти- мую абсолютную ошибку dabs, величину а и ориентировочное значе- ние х. Если ожидаемое значение х неизвестно, то принимают х = 0,5. Размер выборки, достаточной для того, чтобы оценка среднего значения х попала в интервал х ± dabs с вероятностью 1 - а, определя- ется по формуле: n = 2Zax(l-x)/dJ. (15) Пример 50 (вычисление объема выборки из бесконечной гене- ральной совокупности). Какой объем выборки необходим для того, чтобы оценить соотношение полов в популяции благородного оленя с точностью 20% (то есть dabs = 0,20)? Ожидаемая доля самцов х = 0,40. Решение: По формуле (15) находим п = [2 х 2 х 0,40 х (1 - 0,40)] / (0,20)2 = 24 особи. Поскольку формула (15) содержит в знаменателе квадрат абсо- лютной ошибки, то при повышении требований к точности оценки исследуемого параметра объем выборки стремительно возрастает (сравните примеры 50 и 51). 105
Пример 51 (вычисление объема выборки из бесконечной гене- ральной совокупности). Какой объем выборки необходим для того, чтобы оценить соотношение полов в популяции благородного оле- ня с точностью 5% (то есть dabs = 0,05)? Ожидаемая доля самцов х = 0,40. Решение: По формуле (15) находим п = [2 х 2 х 0,40 х (1 - 0,40)] / (0,05)2 = 384 особи. Как и в случае непрерывно распределенной величины, при огра- ниченном объеме генеральной совокупности объем выборки можно скорректировать по формуле (14). Пример 52 (вычисление объема выборки из конечной гене- ральной совокупности). Какой объем выборки необходим для того, чтобы оценить соотношение полов в популяции благородного оленя с точностью 20% (то есть dabs = 0,20)? Ожидаемая доля самцов х = 0,40. Популяция насчитывает 70 особей. Решение: 1. Расчет для бесконечной популяции (пример 50): п = 24 особи. 2. По формуле (14) вводим поправку на размер популяции: nG = 24/[1 +(24/70)] = 17,9. 3. На практике имеет смысл изучить 20 особей. В тех случаях, когда изучаемый параметр подчиняется распре- делению Пуассона (например, число яиц в кладке), объем выборки определяют по формуле: п = (100?a)2/(xdre|2), (16) где drel — заданная исследователем относительная ошибка, выражен- ная в процентах от среднего значения. Упрощая формулу (16), для a = 0,05 получим: для точности 5%: п ~ 1600/х; для точности 10%: п ~ 400/х; для точности 25%: п ~ 64/х; для точности 50%: и ~ 16/х. Пример 53 (вычисление объема выборки из бесконечной гене- ральной совокупности). Известно, что число яиц в кладке большой синицы составляет в среднем 6 и подчиняется распределению Пуас- сона. Сколько кладок нужно учесть, чтобы оценить среднее значение с точностью 10%? Решение: 1. По формуле (16) получаем: п = (100 х 2)2 / (6 х Ю2) = 67 кладок. 2. На практике имеет смысл изучить 70 кладок. 106
Негативное биномиальное распределение (в отличие от распреде- ления Пуассона) описывает распределение особей в выборке в том случае, когда особи тяготеют друг к другу (скученное распределе- ние). В этом случае расчет объема выборки (по формуле 17) требует знания не только среднего значения, но и параметра К, который либо определяют по небольшой выборке, либо оценивают на основании результатов ранее опубликованных работ. п = [(1/х) + (1/К)] (100/a)2/dre2. (17) Упрощая (17), для a = 0,05 получим: для точности 5%: п ~ 1600 [(1 /х) + (1 /К)]; для точности 10%: п ~ 400 [(1 /х) + (1 / К)]; для точности 25%: п ~ 64 [(1 /х) + (1 / К)]; для точности 50%: п ~ 16 [(1 /х) + (1 /К)]. Пример 54 (вычисление объема выборки из бесконечной ге- неральной совокупности). Известно, что распределение гороховой тли по стеблям гороха описывается негативной биномиальной мо- делью. Среднее число особей на одном стебле равно 3,46, К = 2,65. Сколько стеблей нужно обследовать, чтобы оценить среднее значе- ние плотности популяции вредителя с точностью 15%? Решение: 1. По формуле (17) получим: п = [((1 / 3,46) + (1 / 2,65)) х (100 х 2)2] /152 = 118 растений. 2. На практике лучше учесть 120 растений. Необходимо подчеркнуть, что некорректное отнесение эмпири- ческого распределения к определенному типу может привести к су- щественной ошибке в оценке необходимого для работы объема вы- борки. Например, если мы ошибочно решим, что распределение гороховой тли (пример 54) описывается моделью Пуассона, то полу- чим сильно заниженный объем выборки (51 растение вместо 118). 7.2. Объем выборки, необходимой для нахождения редко встречающегося объекта Если ожидаемая частота встречаемости признака равна х, то объ- ем выборки, в которой с вероятностью 1 - а встретится хотя бы одна особь с заданным значением признака, может быть рассчитан по формуле: п = [log(l -a)] / [log(l-х)]. (18) 107
Объемы выборок, необходимых для нахождения редко встречаю- щегося объекта, в зависимости от частоты изучаемого признака для трех уровней значимости приведены в табл. 6. Таблица 6 Величина выборки с гарантированным (на заданном уровне значимости) наличием хотя бы одной особи, обладающей признаком с частотой встречаемости х (по Мхеидзе, Мирвис, 1975) 1 -а Частота встречаемости признака (х) 0,001 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009 0,95 3252 1446 1001 765 591 500 420 372 334 0,99 5000 2222 1538 1176 909 769 645 571 513 0,999 7500 3333 2308 1765 1364 1153 968 857 769 1 -а Частота встречаемости признака (х) 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,95 296 148 99 74 58 48 41 36 32 0,99 455 277 152 113 90 74 63 55 49 0,999 682 341 227 169 135 112 95 83 73 1 -а Частота встречаемости признака (х) 0,1 0,2 о,з 0,4 0,5 0,6 0,7 0,8 0,9 0,95 28 13 9 6 4 3 2 2 1 0,99 44 21 13 9 7 5 4 3 2 0,999 66 31 20 14 10 8 6 4 3 Пример 55 (вычисление объема выборки из бесконечной ге- неральной совокупности). На основании исследования 124 павиа- нов был сделан вывод об отсутствии у павианов особей с группой крови 0 (Moor-Jankowski et al., 1964). Правомерен ли этот вывод? Решение: Из табл. 6 находим, что на уровне значимости 0,99 данная вы- борка позволяет сделать вывод лишь о том, что в исследованной популяции частота особей с группой крови 0 не превышает 4%. И действительно, при увеличении объема выборки до 684 особей удалось обнаружить трех павианов с группой крови 0 (Wiener, Moor- Jankowski, 1969), то есть частота этого признака оказалась около 0,5%. 108
7.3. Объемы выборок, необходимых для проверки статистических гипотез о коэффициентах корреляции Определение объема выборки, необходимой для проверки стати- стической гипотезы при заданных вероятности ошибки первого рода (а) и мощности анализа (1 - Р) требует информации об ожидаемой величине эффекта. Предварительная оценка этой величины позволя- ет экономить силы и средства, поскольку экспериментальный план, с помощью которого можно на заданном уровне значимости дока- зать наличие большого эффекта, может оказаться непригодным для обнаружения малого эффекта. И напротив, экспериментальный план, нацеленный на обнаружение малого эффекта, скорее всего, окажется избыточным (то есть неоправданно трудоемким) при поиске большо- го эффекта. Решение о том, какую именно величину эффекта предполагается обнаружить, исследователь принимает на основании существующей информации о свойствах изучаемого объекта (явления, процесса). Например, при испытании лекарственных препаратов можно доста- точно точно рассчитать, какое повышение эффективности (по срав- нению с существующими препаратами) окупит затраты на регистра- цию, производство и рекламу нового препарата. И если, допустим, это пороговое значение составляет 10%, то на более слабые эффекты исследователь может просто не обращать внимание (см. пример 60). В экологических исследованиях можно ориентироваться на сред- нюю величину эффекта, обнаруженного ранее в сходных условиях. Например, если средняя величина коэффициента корреляции между уровнем промышленного загрязнения и биологическими эффекта- ми, вызываемыми загрязнением в наземных экосистемах, составляет около 0,4 по модулю (Kozlov et al., 2009), то бессмысленно планиро- вать исследование подобных эффектов таким образом, что оно смо- жет обнаружить лишь сильные связи, намного превышающие сред- нюю величину (см. пример 63). При проведении корреляционного анализа объем выборки, необ- ходимой для корректного отклонения ошибочной нулевой гипотезы об отсутствии связи между изучаемыми признаками [Но: г = 0] при достижении коэффициентом корреляции некоторой фиксированной величины гх и при заданной мощности анализа 1 - Р определяют по формуле: 109
« = [(Z₽ + Zo)/z,]2 + 3, (19) где Zp и Za — относительные (измеренные в значениях о: Z= |х -xj / о) расстояния от среднего значения нормально распределенной случай- ной величины х до значения х , экстремальнее которого располагается лишь равная Р или а соответственно доля значений этой величины, а Zj — z-преобразованное значение коэффициента корреляции гр рас- считываемое по следующей формуле: z, = o,51n[(l+r1)/(l -г,)]. (20) Пример 56 (вычисление объемов выборок для проверки ста- тистической гипотезы). Какой объем выборки необходим для того, чтобы отклонить нулевую гипотезу об отсутствии связи между двумя признаками [Но: г = 0], тестируемую на уровне значимости a = 0,05, с вероятностью 99% (то есть 1 - Р = 0,99) в случае, если абсолют- ное значение коэффициента корреляции достигнет 0,50? (То есть гх = 0,50). Решение: 1. Поскольку рассматривается абсолютное (то есть взятое по мо- дулю) значение коэффициента корреляции, то по отношению к ну- левому значению (заданному нулевой гипотезой) оно может лишь увеличиться. В связи с этим при проверке гипотезы целесообразно использовать односторонний статистический тест (подробнее см. в любом курсе математической статистики). 2. Проводим z-преобразование альтернативного значения коэффи- циента корреляции по формуле (20) или используем табл. 7: значе- нию г = 0,50 соответствует значение z = 0,5493. 3. Поскольку табл. 8 составлена для одностороннего теста, в ос- новной части таблицы ищем значение a/2, то есть 0,025; ему соот- ветствует Za = 1,96. 3. Из табл. 8 по значению Р = 0,01 находим Zp = 2,3263. Поиск зна- чения Zp проводится так же, как Za; однако в основной части таблицы мы ищем значение Р = 0,01, а не значение р/2. 5. Подставляя полученные значения в формулу (19), получим: п = [(2,33 + 1,96) / 0,5493]2 + 3-64. 6. Вывод: мощность анализа достигнет 99% при использовании выборки объемом 64 объекта. Для решения подобных задач разработаны онлайн калькуляторы, например http://power.phs.wfubmc.edu/index.cfm. При использовании этого калькулятора для решения описанной выще задачи на панели ПО
Available Calculators» выбираем «Correlation». Подстановка в этот алькулятор численных значений из примера 56 показана на рис. 12, результат расчетов — на рис. 13. Таблица 7 Значения z-преобразования для коэффициентов линейной корреляции (по Шмидту, 1984) г Z г Z г Z г Z 0,01 0,0100 0,26 0,2661 0,51 0,5627 0,76 0,9962 0,02 0,0200 0,27 0,2769 0,52 0,5763 0,77 1,0203 0,03 0,0300 0,28 0,2877 0,53 0,5901 0,78 1,0454 0,04 0,0400 0,29 0,2986 0,54 0,6042 0,79 1,0714 0,05 0,0501 0,30 0,3095 0,55 0,6148 0,80 1,0986 0,06 0,0601 0,31 0,3206 0,56 0,6328 0,81 1,1270 0,07 0,0701 0,32 0,3317 0,57 0,6475 0,82 1,1568 0,08 0,0802 0,33 0,3428 0,58 0,6625 0,83 1,1881 0,09 0,0902 0,34 0,3541 0,59 0,6777 0,84 1,2212 0,10 0,1003 0,35 0,3654 0,60 0,6931 0,85 1,2562 0,11 0,1105 0,36 0,3769 0,61 0,7089 0,86 1,2933 0,12 0,1206 0,37 0,3884 0,62 0,7250 0,87 1,3331 0,13 0,1308 0,38 0,4001 0,63 0,7414 0,88 1,3758 0,14 0,1409 0,39 0,4118 0,64 0,7582 0,89 1,4219 0,15 0,1511 0,40 0,4236 0,65 0,7753 0,90 1,4722 0,16 0,1614 0,41 0,4356 0,66 0,7928 0,91 1,5275 0,17 0,1717 0,42 0,4477 0,67 0,8107 0,92 1,5890 0,18 0,1820 0,43 0,4599 0,68 0,8291 0,93 1,6584 0,19 0,1923 0,44 0,4722 0,69 0,8480 0,94 1,7380 0,20 0,2027 0,45 0,4847 0,70 0,8673 0,95 1,8318 0,21 0,2132 0,46 0,4973 0,71 0,8872 0,96 1,9459 0,22 0,2237 0,47 0,5101 0,72 0,9076 0,97 2,0923 0,23 0,2342 0,48 0,5230 0,73 0,9287 0,98 2,2976 0,24 0,2448 0,49 0,5361 0,74 0,9505 0,99 2,6467 0,25 0,2554 0,50 0,5493 0,75 0,9730 111
Таблица 8 Величины параметра Zp (одностороннее распределение; по Zar, 1984) Z р Р 0,00 0,5000 0,01 0,4960 0,02 0,4920 0,03 0,4880 0,04 0,4840 0,05 0,4801 0,06 0,4761 0,07 0,4721 0,08 0,4682 0,09 0,4641 0,10 0,4602 0,11 0,4562 0,12 0,4522 0,13 0,4483 0,14 0,4443 0,15 0,4404 0,16 0,4364 0,17 0,4325 0,18 0,4286 0,19 0,4248 0,20 0,4207 0,21 0,4168 0,22 0,4129 0,23 0,4090 0,24 0,4052 0,25 0,4013 0,26 0,3974 0,27 0,3936 0,28 0,3897 0,29 0,3859 0,30 0,3821 0,31 0,3783 0,32 0,3745 0,33 0,3707 0,34 0,3669 0,35 0,3632 0,36 0,3594 Z р Р 0,37 0,3557 0,38 0,3520 0,39 0,3483 0,40 0,3446 0,41 0,3409 0,42 0,3372 0,43 0,3336 0,44 0,3300 0,45 0,3264 0,46 0,3228 0,47 0,3192 0,48 0,3156 0,49 0,3121 0,50 0,3085 0,51 0,3050 0,52 0,3015 0,53 0,2981 0,54 0,2946 0,55 0,2912 0,56 0,2877 0,57 0,2843 0,58 0,2810 0,59 0,2776 0,60 0,2743 0,61 0,2709 0,62 0,2676 0,63 0,2643 0,64 0,2611 0,65 0,2578 0,66 0,2546 0,67 0,2514 0,68 0,2483 0,69 0,2451 0,70 0,2420 0,71 0,2389 0,72 0,2358 0,73 0,2327 Z р Р 0,74 0,2297 0,75 0,2266 0,76 0,2236 0,77 0,2207 0,78 0,2117 0,79 0,2148 0,80 0,2119 0,81 0,2090 0,82 0,2061 0,83 0,2033 0,84 0,2005 0,85 0,1977 0,86 0,1949 0,87 0,1922 0,88 0,1894 0,89 0,1867 0,90 0,1841 0,91 0,1814 0,92 0,1788 0,93 0,1762 0,94 0,1736 0,95 0,1711 0,96 0,1685 0,97 0,1660 0,98 0,1635 0,99 0,1611 1,00 0,1587 1,01 0,1562 1,02 0,1539 1,03 0,1515 1,04 0,1492 1,05 0,1469 1,06 0,1446 1,07 0,1425 1,08 0,1401 1,09 0,1379 1,10 0,1357 Z р Р 1,11 0,1335 1,12 0,1314 1,13 0,1292 1,14 0,1271 1,15 0,1251 1,16 0,1230 1,17 0,1210 1,18 0,1190 1,19 0,1170 1,20 0,1151 1,21 0,1131 1,22 0,1112 1,23 0,1093 1,24 0,1075 1,25 0,1056 1,26 0,1038 1,27 0,1020 1,28 0,1003 1,29 0,0985 1,30 0,0968 1,31 0,0951 1,32 0,0934 1,33 0,0918 1,34 0,0901 1,35 0,0885 1,36 0,0869 1,37 0,0853 1,38 0,0838 1,39 0,0823 1,40 0,0808 1,41 0,0793 1,42 0,0778 1,43 0,0764 1,44 0,0749 1,45 0,0735 1,46 0,0721 1,47 0,0708 112
Окончание табл. 8 Z р Р 1,48 0,0694 1,49 0,0681 1,50 0,0668 1,51 0,0655 1,52 0,0643 1,53 0,0630 1,54 0,0618 1,55 0,0606 1,56 0,0594 1,57 0,0582 1,58 0,0571 1,59 0,0559 1,60 0,0548 1,61 0,0537 1,62 0,0526 1,63 0,0516 1,64 0,0505 1,65 0,0495 1,66 0,0485 1,67 0,0475 1,68 0,0465 1,69 0,0455 1,70 0,0446 1,71 0,0436 1,72 0,0427 1,73 0,0418 1,74 0,0409 1,75 0,0401 1,76 0,0392 1,77 0,0384 1,78 0,0375 1,79 0,0367 1,80 0,0359 1,81 0,0351 1,82 0,0344 1,83 0,0336 1,84 0,0329 1,85 0,0322 Z р Р 1,86 0,0314 1,87 0,0307 1,88 0,0301 1,89 0,0294 1,90 0,0287 1,91 0,0281 1,92 0,0274 1,93 0,0268 1,94 0,0262 1,95 0,0256 1,96 0,0250 1,97 0,0244 1,98 0,0239 1,99 0,0233 2,00 0,0228 2,01 0,0222 2,02 0,0217 2,03 0,0212 2,04 0,0207 2,05 0,0202 2,06 0,0197 2,07 0,0192 2,08 0,0188 2,09 0,0183 2,10 0,0179 2,11 0,0174 2,12 0,0170 2,13 0,0166 2,14 0,0162 2,15 0,0158 2,16 0,0154 2,17 0,0150 2,18 0,0146 2,19 0,0143 2,20 0,0139 2,21 0,0136 2,22 0,0132 2,23 0,0129 Z р Р 2,24 0,0125 2,25 0,0122 2,26 0,0119 2,27 0,0116 2,28 0,0113 2,29 0,0110 2,30 0,0107 2,31 0,0104 2,32 0,0102 2,33 0,0099 2,34 0,0096 2,35 0,0094 2,36 0,0091 2,37 0,0089 2,38 0,0087 2,39 0,0084 2,40 0,0082 2,41 0,0080 2,42 0,0078 2,43 0,0075 2,44 0,0073 2,45 0,0071 2,46 0,0069 2,47 0,0068 2,48 0,0066 2,49 0,0064 2,50 0,0062 2,51 0,0060 2,52 0,0059 2,53 0,0057 2,54 0,0055 2,55 0,0054 2,56 0,0052 2,57 0,0051 2,58 0,0049 2,59 0,0048 2,60 0,0047 2,61 0,0045 Р 2,62 0,0044 2,63 0,0043 2,64 0,0041 2,65 0,0040 2,66 0,0039 2,68 0,0037 2,70 0,0035 2,72 0,0033 2,74 0,0031 2,76 0,0029 2,78 0,0027 2,80 0,0026 2,82 0,0024 2,84 0,0023 2,86 0,0021 2,88 0,0020 2,90 0,0019 2,92 0,0018 2,94 0,0016 2,96 0,0015 2,98 0,0014 3,00 0,0013 3,02 0,0013 3,04 0,0012 3,06 0,0011 3,08 0,0010 3,10 0,0010 3,15 0,0008 3,20 0,0007 3,25 0,0006 3,30 0,0005 3,35 0,0004 3,40 0,0003 3,45 0,0003 3,50 0,0002 3,60 0,0002 3,70 0,0001 3,80 0,0001 113
Wake forest Bcaoot <mimcwi statistical power CALCULATORS ЯЩ! Avallabte Calculators: Cairtation One Sumjite Proportion One ample Mean Pamsl f'report юп P med Means Two Sample Proportion Two Sample Means Need Help Choosing Which Calculator To Um? Answei ttrese sin ph* study design question to undts stand wt rch cakwtofot you stwuld use ta Loading roles for form Calculator: Correlation Рис. 12. Подстановка в сетевой калькулятор численных значений из при- мера 56: значение а введено в графу «Significance Level», значение rQ вве- дено в графу «Null Correlation», значение г} введено в графу «Alternative Correlation», значение 1 - Р введено в графу «Power», The POWER Procedure Fishers z Test for Pearson Correlation Рис. 13. Результаты обработки сетевым калькулятором численных зна- чений из примера 56: расчетный объем выборки «N Total» находится в правом нижнем углу второй таблицы. 114
Пример 57 (вычисление объемов выборок для проверки ста- тистической гипотезы). С помощью корреляционного анализа мы изучаем зависимость длины хвои сосны обыкновенной от расстояния до промышленного предприятия. В качестве нулевой гипотезы высту- пает предположение, что длина хвои не зависит от этого расстояния [Но: г = 0]. На основании обзора литературы заключаем, что ожидае- мая связь может быть достаточно слабой, так что в качестве альтер- нативной гипотезы выбираем Н : г = 0,40. Принимаем рекомендован- ную для экологических исследований мощность анализа 80% (то есть Р = 0,20). Сколько пробных площадей (одна пробная площадь соот- ветствует одному расстоянию до источника выбросов) необходимо заложить при условиях, что допустимая вероятность ошибки первого рода составляет 5%, 1% и 0,1 %? Решение для а = 0,05: 1. Из табл. 7 по величине гх = 0,40 находим z = 0,4236. 2. Значения Za и Zp определяем из табл. 8 по a = 0,05 и Р = 0,20: Za= 1,96, Zp = 0,84. 3. По формуле (19) рассчитываем п = [(0,84 + 1,96) / 0,4236]2 + 3 - 46,69. 4. Расчет, выполненный на сетевом калькуляторе, дает п = 46. 5. Аналогичным образом для a = 0,01 и a = 0,001 находим п = 68 и п = 98 соответственно. Объем выборки, необходимой для корректного отклонения оши- бочной нулевой гипотезы о равенстве двух коэффициентов корреля- ции [Но: г = г2] при заданных уровне значимости а и мощности ана- лиза 1 - Р, рассчитывают следующим образом: n = 2[(Z₽ + Z)/(Z1-z2)]2 + 3. (21) Пример 58 (вычисление объемов выборок для проверки ста- тистической гипотезы). Какой объем выборки позволит с вероятно- стью 90% обнаружить различия между коэффициентами корреляции г = 0,84 и г2 = 0,78 при тестировании гипотезы Но: гх = г2 на 5%-ном уровне значимости? Решение: 1. Из табл. 7 по величинам гх и г2 находим z = 1,2221 и z2 = 1,0454. 2. Из табл. 8 по a = 0,05 и Р = 0,10 находим Za = 1,96 и Zp = 1,28. 3. По формуле (21) рассчитываем п = 2 х [(1,28 + 1,96) / (1,2221 - 1,0454)]2 + 3 -675. 4. Вывод: мощность анализа достигнет 90% при использовании выборок объемом 676 пар объектов для определения каждого из двух коэффициентов корреляции. 115
7.4. Объемы выборок, необходимых для проверки статистических гипотез о средних значениях нормально распределенного признака Одна из наиболее часто встречающихся задач — сравнение двух средних значений нормально распределенного параметра. Напом- ним, что для решения этой задачи с использованием критерия Стью- дента должны быть выполнены следующие условия: 1. Выборки случайным образом взяты из сравниваемых генераль- ных совокупностей. 2. Сравниваемые выборки независимы. 3. Наблюдения в пределах каждой выборки независимы. 4. Распределения признаков не отличаются от нормального. 5. Дисперсии признаков в сравниваемых генеральных совокупно- стях одинаковы. Кроме того, должны быть заданы допустимые вероятности оши- бок как первого (а), так и второго (Р) рода, а также минимальная от- носительная величина различий, которую необходимо выявить (Drd = lxmaX “ xmin I /а)- В этом случае объемы выборок могут быть рассчита- ны следующим образом: n = 2(Za + Zp)2/Drel2 (22) В расчетах используют следующие приближенные значения Z и Za = 1,96 при a = 0,05; Za = 2,58 при a = 0,01; Z^ = 2,58 при Р = 0,001; Zp = 2,33 при Р = 0,01; Zp = 1,64 при Р = 0,05; Zp = 1,28 при Р = 0,10; Zp = 0,84 при Р = 0,20; Zp = 0,25 при Р = 0,40. Пример 59 (вычисление объемов выборок для проверки ста- тистической гипотезы). Выборки какого объема необходимы для того, чтобы обнаружить различия по длине листа, превышающие 3,0 мм, между двумя популяциями березы пушистой? a = 0,05, Р = 0,20, о = 7,4 мм. Решение: 1. D . = 3,0 мм / 7,4 мм = 0,41. 116
2. Вероятности а = 0,05 соответствует Za = 1,96. 3. Вероятности Р = 0,20 соответствует Zp = 0,84. 4. Подставляя в формулу (22), получаем: п = 2 х (1,96 + 0,84)2 / (0,41)2= 93 дерева. 5. На практике лучше использовать выборки объемом по 100 де- ревьев каждая. При анализе приведенного выше примера 59 с неизбежностью возникает вопрос — а сколько листьев необходимо собрать с каж- дого из 200 деревьев? Ответ на него достаточно прост: столько же, сколько собирали в том исследовании, из которого взята используе- мая в расчетах величина среднеквадратического отклонения (о), от- ражающая изменчивость длины листа между деревьями. Очевидно, что если измеряли один случайно выбранный лист с каждого дере- ва, то эта величина будет выше, чем если замеряли 10 листьев. Для определения количества листьев, которые необходимо собрать с каж- дого дерева, необходимо задать желаемую точность оценки длины листа и провести расчет, описанный в разделе 7.1. Задачу, описанную в примере 59, можно также решить с помо- щью онлайн калькулятора (http://power.phs.wfubmc.edu/index.cfm). На панели «Available Calculators» выбираем «Two Sample Means», вводим данные (значение а, то есть 0,05. в графу «Significance Level»', значение 0 (мм) в графу «Null Difference in Means»', значение 3 (мм) в графу «Alternative Difference in Means»', значение 1 - P, то есть 0,80, в графу «Power») и нажимаем «Calculate». Калькулятор предлагает из- мерить длину листа у 97 берез из каждой популяции. В табл. 9 показаны объемы выборок, необходимые для сравне- ния двух процентных соотношений. Строки таблицы соответствуют меньшей из двух сравниваемых величин (приведенной в левой ко- лонке), столбцы — разнице между большей и меньшей величинами. Для величин превышающих 50%, следует использовать значения, полученные вычитанием х из 100% (то есть заменять 30% на 70%, 20% на 80% и т.д.). 117
Таблица 9 Объемы каждой из двух выборок, необходимых для сравнения двух процентных соотношений (х2 > хД х2-х, 5 10 ’5 20 25 зо| |35_ 40 l50l l55l Гбо1 Гб51 70 а = 0,05, Р = 0,20 5 420 130 69 44 31 24 20 16 14 12 10 9 9 7 10 680 195 96 59 41 30 23 19 16 13 11 10 9 7 15 910 250 120 71 48 34 26 21 17 14 12 10 9 8 20 1090 290 135 80 53 38 28 22 18 15 13 10 9 7 25 1250 330 150 88 57 40 30 23 19 15 13 10 9 30 1380 360 160 93 60 42 31 23 19 15 12 10 35 1470 380 170 96 61 42 31 23 18 14 11 40 1530 390 175 97 61 42 30 22 17 13 45 1560 390 175 96 60 40 28 21 16 50 1560 390 170 93 57 38 26 19 а = 0,05, Р = 0,10 5 570 175 93 59 42 32 25 21 18 15 13 11 10 9 10 910 260 130 79 54 40 31 24 21 18 15 13 11 10 15 1220 330 160 95 64 46 35 27 22 19 16 13 11 10 20 1460 390 185 105 71 51 38 29 23 20 16 14 11 10 25 1680 440 200 115 77 54 40 31 24 20 16 13 11 30 1840 480 220 125 80 56 41 31 24 20 16 13 35 1970 500 225 130 82 57 41 31 23 19 15 40 2050 520 230 130 82 56 40 29 22 18 45 2100 520 230 130 80 54 38 27 21 50 2100 520 225 125 77 51 35 24 а = 0,01, Р = 0,05 5 960 300 155 100 71 54 42 34 28 24 21 19 16 14 10 1550 440 220 135 92 68 52 41 34 28 23 21 18 15 15 2060 560 270 160 ПО 78 59 47 37 31 25 21 19 16 20 2470 660 310 180 120 86 64 50 40 32 26 21 19 15 25 2840 740 340 200 130 92 68 52 41 32 26 21 18 30 3120 810 370 210 135 95 69 53 41 32 25 21 35 3340 850 380 215 140 96 69 52 40 31 23 40 3480 880 390 220 140 95 68 50 37 28 45 3550 890 390 215 135 92 64 47 34 50 3550 880 380 210 130 86 59 41 118
Пример 60 (вычисление объемов выборок для проверки ста- тистической гипотезы). Применяемое лекарство помогает 30% па- циентов. Новое лекарство, которое сравнивается со старым, должно помогать как минимум 40% пациентов для того, чтобы имело смысл внедрять его в клиническую практику, а = 0,05, Р = 0,20. Сколько па- циентов должно участвовать в эксперименте? Решение: 1. Меньшая из сравниваемых величин х = 30%, минимальная раз- ница х2 - Xj =40% - 30% = 10%. 2. По табл. 9 находим, что каждая выборка должна включать 360 пациентов, то есть всего в эксперименте должны участвовать 720 па- циентов. Эту задачу можно также решить с помощью сетевого калькуля- тора (http://power.phs.wfubmc.edu/index.cfm). На панели «Available Calculators» выбираем «Two Sample Proportion», вводим данные (зна- чение а, то есть 0,05, в графу «Significance Level»; значение 0,30 в графу «Assumed Group 1 Proportion»; значение 0,40 в графу «Assumed Group 2 Proportion»; значение 1 - Р, то есть 0,80, в графу «Power») и нажимаем «Calculate». Расчеты показывают, что в каждой из сравни- ваемых групп должно быть 356 пациентов. Наиболее сложную задачу представляет собой определение объема выборок (ик, число повторностей в каждой из сравнивае- мых к групп), необходимых для тестирования гипотезы об отстут- ствии различий в средних значениях признака между к группами [Но: х = х2=...= хк] методом дисперсионного анализа (при к > 2). Эта задача решается с помощью номограмм (рис. 14-18) методом последовательных приближений на основании следующей информа- ции: • к, число сравниваемых групп; • Dabs, минимальное абсолютное различие между средними значе- ниями, которое мы намереваемся обнаружить; • среднеквадратическое отклонение о (изменчивость внутри сравниваемых групп); • а, уровень значимости; • 1 - Р, мощность анализа. Алгоритм решения этой задачи следующий: 1. Выбирают номограмму (по первому числу степеней свободы, которое на единицу меньше числа сравниваемых групп: dfi = к - 1); 119
2. Выбирают примерное значение nQ (то есть интуитивно ожида- емое число повторностей в каждой из сравниваемых к групп) и рас- считывают df2 = к (nQ - 1); 3. Из номограммы (по а, 1 - Р и df2) определяют коэффициент Ф; 4. Рассчитывают число повторностей в каждой из сравниваемых к групп по следующей формуле: пк = (2 кФ2 с2)/Dabs2. (23) 5. При существенном различии между nQ и пк процедуру повторя- ют, выбрав новое значение nQ примерно посередине между первым значением nQ и рассчитанным значением ик, до тех пор, пока эти зна- чения не станут практически равными. Пример 61 (вычисление объемов выборок для проверки ста- тистической гипотезы). Мы планируем выявить различия в годич- ном приросте (длине побега второго порядка) у сосны обыкновенной при различных уровнях экспериментального повреждения хвои теку- щего года. При этом мы планируем сравнить 5 уровней повреждения и контроль (то есть к = 6) и хотим выявить различия в длине побега, составляющие 10 мм или более. Известно, что а = 10 мм, а = 0,05, Р = 0,20. Определить минимально необходимое количество особей сосны в каждой группе. Решение: Первое приближение: 1. По числу степеней свободы {dfx = 6-1=5) выбираем номо- грамму (рис. 18). 2. Произвольно задаем начальный объем группы: nQ = 10. 3. Вычисляем df2 = 6 х (10- 1) = 54. 4. На вертикальной шкале номограммы находим заданную мощ- ность анализа (0,80) и определяем место пересечения горизонталь- ной линии, соответствующей этой мощности анализа, с кривой, со- ответствующей начальному объему выборки (df2 = 54) для а = 0,05. Спроецировав точку пересечения на горизонтальную шкалу, опреде- ляем значение Ф ~ 1,55. 5. По формуле (23)рассчитываем пк = (2 х 6 х 1,552 х 102) / 102 ~ 29. 6. Поскольку пк > л0, продолжаем подбор. Второе приближение: 1. Задаем новый начальный объем выборки, находящийся при- мерно посередине между первым заданным значением и значением первого приближения: nQ = 20. 120
2. Вычисляем df2 = 6 х (20 - 1) = 114. 3. По номограмме (df2 =114 заменяем на df2 = оо, то есть бесконеч- но большое значение) определяем Ф ~ 1,45. 4. По формуле (23) рассчитываем пк = (2 х 6 х 1,452 х 102) / 102 ~ 25. 5. Поскольку пк > п{} (хотя различие стало меньше, чем в первом приближении), продолжаем подбор. Третье приближение: 1. Задаем новый начальный объем выборки: п{} = 25. 2. Вычисляем df2 = 6 х (25 - 1) = 144. 3. По номограмме (df2 = 144 заменяем на df2 = оо, то есть бесконеч- но большое значение) определяем Ф ~ 1,45. 4. По формуле (23) рассчитываем пк ~ 25. 5. Поскольку пк = л0, подбор считаем завершенным: для решения поставленной задачи каждая из сравниваемых групп должна вклю- чать 25 деревьев. К сожалению, мне не удалось обнаружить достаточно простой в использовании сетевой калькулятор, пригодный для расчета объемов выборок при планировании дисперсионного анализа. Однако про- ведение подобных расчетов предусмотрено во многих пакетах при- кладных статистических программ. 121
Рис. 14. Номограмма для расчета мощности дисперсионного анализа: сравнение двух групп (dfx = 1; по Zar, 1984).
Сила анализа (1 - р) Рис. 15. Номограмма для расчета мощности дисперсионного анализа: сравнение трех групп (dfx = 2; по Zar, 1984). ю
Рис. 16. Номограмма для расчета мощности дисперсионного анализа: сравнение четырех групп (df = 3; по Zar 1984).
н- Рис. 17. Номограмма для расчета мощности дисперсионного анализа: сравнение пяти групп (df = 4; по Zar, К 1984).
ьэ Ch Рис. 18. Номограмма для расчета мощности дисперсионного анализа: сравнение шести групп (dfx - 5; по Zar, 1984).
Глава 8. Расчет мощности анализа 8.1. Факторы, влияющие на мощность анализа В предыдущей главе были рассмотрены способы расчета объемов выборок, необходимых для достижения заданной мощности анализа. Эта глава посвящена решению обратной задачи, а именно определе- нию мощности анализа при заданных (например, диктуемых внеш- ними обстоятельствами — см. ниже) характеристиках эксперимен- тального плана. В общем случае мощность анализа определяют четыре фактора: • объем выборки, • статистическая значимость (а), • используемый метод анализа данных, • величина эффекта. Увеличение объема выборки — простейший способ повышения мощности анализа. Однако на практике часто возникают ситуации, когда увеличение количества экспериментальных единиц невозмож- но или практически невозможно. Например, имеется всего четыре климатические камеры, либо отпущенного финансирования доста- точно для приобретения лишь 10 экспериментальных животных. В этих случаях план эксперимента должен быть составлен исходя из имеющихся возможностей. Хотя уровень статистической значимости формально ничем не ограничен, увеличение вероятности ошибки первого рода выше 5% не может быть рекомендовано как универсальный способ для до- стижения необходимой мощности анализа. Такое увеличение, хотя и приемлемо в определенных случаях, требует серьезного обосно- вания. И даже наличие подобного обоснования не избавляет иссле- дователя от скептического отношения рецензентов, редакторов и чи- тателей, привыкших считать 5%-ную вероятность границей между «значимыми» и «не значимыми» результатами. Способ расчета мощности статистического анализа зависит от планируемого метода анализа эмпирических данных. В общем слу- чае экспериментальные планы, основанные на контрасте (например, сравнение опыта с контролем) при прочих равных параметрах по- зволяют обеспечить более высокую мощность анализа, чем экспери- ментальные планы, включающие сравнение большего числа групп 127
(например, контроль, слабое воздействие и сильное воздействие). Использование парных статистических тестов, учитывающих струк- туру эксперимента (например, парного критерия Стьюдента в тех случаях, когда одна и та же экспериментальная единица измерена до и после воздействия), позволяет в среднем достичь более высокой мощности анализа, чем применение тестов, не учитывающих при- надлежность замеров к одной и той же экспериментальной единице (например, сравнение всех замеров, выполненных до и после воздей- ствия, с помощью обычного критерия Стьюдента). Формулировка ги- потез, определяющих направленность эффекта, позволяет использо- вать односторонние тесты, которые мощнее двусторонних. Определение 25. Величина эффекта (ES, англ, effect size) — это отношение разницы средних величин в опыте и контроле к усред- ненной внутригрупповой изменчивости: ES = (x -х )/о. (24) v опыт контроль7 v ' Более корректно в данном случае говорить о величине эффекта по Кохену, поскольку существует много других способов расчета вели- чины эффекта, широко используемых в мета-анализе (например, на основании коэффициента корреляции). Абсолютные (то есть по модулю) величины эффектов, рассчитан- ные по Кохену (формула 24), условно подразделяют на три группы: • сильные: ES = 0,56-1,20; • средние: ES = 0,33-0,55; • слабые: ES = 0-0,32. Очевидно, что чем больше ожидаемый эффект, тем легче его об- наружить, а для обнаружения малых эффектов необходимы очень большие выборки (рис. 19). Расчет мощности анализа следует выполнять на стадии планиро- вания эксперимента. Проведение расчетов после завершения экспе- римента (особенно в тех случаях, когда отклонить нулевую гипотезу не удалось) может использоваться лишь для понимания причины по- стигшей исследователя неудачи. 8.2. Мощность анализа в экологических исследованиях Как обсуждалось выше (раздел 6.5), приемлемые вероятности ошибок первого и второго рода определяются исследователем, исхо- 128
Мощность анализа Л1111^1!1М15И1ДОШ11Щ!11Ш!!11111Ие«Я1В11Н!!!11В!!!"ВИ!5ЯШ!!1111Ш1|!!!!:!111 ЯВДйВДВДЦИР iiiiiiiiiiiiLiaBaaBiBrjiiiiMiiiiKiiiiiiiiii’BiBB'jiaaia'LfliiiiainaHBHBBB^aiaiiiaiii'fVTfAiiiii |||||||||11'|1ВГ1ввв1гв1Ш11111М111111111глн1Р4В1В11Ъ11111111и»внвг4ВВ1В1а111Ш11П1111111 tiiiiiiiiiiHiiBJBBBa'JBiir.iiiiiMiiiiiiiiiNiiiHViBBiBVjBaiiiiiPdiiHHBHBJBBBiBiiiBuiiiiiiiiiiiu riiiMim 111ванвввввам1в1в141111111пл111в:4вав1»лваав1а’в111янв»4ввввввв1гл11111111в11111 ||||||||Н1^Ш1’^И|Д«!1И11111!М111Ц!:!Н11!112’Я||!1|»!!:а11!!!=я1вг5Я1Р11?яН!Ц«С,!!!=!!П! mi ни in ни ни in ин ||||||1Г111И1111111шмш11Ш11Ш1’Ш111’;1В1Ш11111Ш1111111Виа11111Ш1111Ш1111111!ш iiiriifiiiiiiiir.iiiBjiirjiiirjiiiiii:iiiiihiiiiiisfliiiii»iiiiiii’diiiaiii5iiiiiiiiiiiiiH|KMi 11Ш11Ш11111Ч111М|Г'1111Ш1111Ш111Ш11111Ш1111КШ1111|1Ш1111В1Ш11111111ШШЭД111 111111111И111Ч1111Л1Г1111Ш1111Ш111’Ж111Г1а111Ш111111Ш1111а11В5111111111111’вКэт11111 iiiiiiiiniiihiiiBF.HBjaaBFiiiaii'iiiiiiiiiiiii'HiHBBB'jiBiiBaP'iiiBiiiB^BSJBBBBBiBBaifl’jiiiiniBiiiii 111111)11411ы111в1вгвввва1111гл111411111м111вар4в1ва1в|;п111в111вв’4нввввв1в111ъ111111111111111 iiiiiHiiniiriiiiir.BBi aBBBrjiiaiB'j8iii;iiiiii;iiiiiiHPaiBiBiB^iiBiiiBiiiR«BBBHBBBiBB^flBiiiiBiiiiBiiiii llllirilf|||IHIIIIUBr'BBBF'flBIBi:4lBIP41llll’HllllliraB8BIBF4flBIIIIIBII’4HBHBBBBBBP4BIBIIBIIIIIIIIIIII IIIILIliIhlllllllMIISIIlUilHillllHilllllHSillllllilllllllllSinillllllHilllllllllllllllllll! IIIIFIhli;illli:ilRilMIIHilHIIII!;illliH;illlllHillllllll!:illllllllll!illlllllllllllllll!U IIIhlJIilllllilllfllKIIHilHillllSilllHSillllllllSilllllllKilllllllllBBiailllllllllllllll^ пн iilll IIIlL.nniSiiiiiiiiiiiilllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll 1 10 20 30 40 50 60 70 80 100 120 140160 200 250 300 350 400 500 Объем выборки для каждой из сравниваемых групп н- Рис. 19. Соотношение между величиной эффекта (ES), мощностью анализа и объемами двух выборок, сравни- ло ваемых с помощью параметрического теста при уровне значимости а = 0,05 (по Lipsey, Hurley, 2009).
дя из неких априорных соображений как о структуре исследования, так и о тяжести последствий, к которым эти ошибки могут привести. Практические рекомендации в данном случае могут основываться лишь на опыте, накопленном мировым научным сообществом. Средняя мощность анализа в исследованиях, опубликованных в 1980-е гг., существенно различалась между областями знаний. Наи- большую мощность анализа демонстрировали социологические ис- следования, а на последнем месте стояли медицинские (табл. 10). При этом, за исключением социологических исследований, при изу- чении слабых эффектов достигнутая мощность анализа была крайне мала: средняя вероятность принятия ошибочной нулевой гипотезы составляла 75% (табл. 10). Таблица 10 Обзор мощности статистического анализа по областям знаний в 1980-е гг. (по Lipsey, 1990, с сокращениями) Область исследования Средняя мощность анализа для эффектов различной величины Слабых Средних Сильных Прикладная психология 0,25 0,67 0,86 Социология 0,55 0,84 0,94 Образование 0,13 0,47 0,73 Маркетинговые исследования 0,24 0,69 0,87 Геронтология 0,37 0,88 0,96 Медицина в целом 0,14 0,39 0,61 В среднем 0,25 0,63 0,84 В конце 1990-х гг. в исследованиях по экологии поведения жи- вотных средняя мощность анализа составляла 16% для слабых, 47% для средних и 72% для сильных эффектов, в то время как для эко- логических и медицинских исследований рекомендована мощность статистического анализа не ниже 80%. К сожалению, для достиже- ния этого уровня, особенно при исследовании малых эффектов, не- обходимо использовать достаточно трудоемкие экспериментальные планы. Более того, далеко не все экологи осознают необходимость контроля мощности анализа, поскольку в явном виде эту информа- цию не принято включать в научные публикации (хотя ее легко рас- считать на основании результатов исследования). Может быть, имен- но поэтому — несмотря на публикацию критических статей — не 130
удалось отметить никаких положительных тенденций в отношении мощности статистического анализа при сравнении работ по экологии поведения, опубликованных в 1996, 2003 и 2009 г. (подробнее см.: Smith et al., 2011). 8.3. Расчет мощности корреляционного анализа Мы тестируем гипотезу об отстутствии связи между двумя при- знаками [Но: г = 0] при уровне значимости а; объем выборки равен п. Силой анализа (1 - Р) будет вероятность обоснованного отклонения Но при данном (обычно полученном в ходе эксперимента) значении коэффициента корреляции. Величину Р находят в табл. 8 по величи- не параметра Zp, рассчитываемой следующим образом: Zp = (z, -za)V«-3 (25) В этой формуле значение zx получают путем z-преобразования вы- численного значения коэффициента корреляции (г) по формуле (20) либо из табл. 7, а значение za — путем z-преобразования критическо- го значения коэффициента корреляции (ra) для заданных объема вы- борки и уровня значимости а (табл. 11). Критическим это значение называется потому, что на основании г < га мы не можем отвергнуть нулевую гипотезу (т. е. гипотезу о равенстве коэффициента корреля- ции нулю) при a = 0,05. Пример 62 (определение мощности анализа). Определить мощ- ность корреляционного анализа при проверке гипотезы об отсут- ствии связи между двумя признаками [Но: г = 0]. Коэффициент кор- реляции, рассчитанный по выборке из 12 объектов, составляет 0,866; a = 0,05. Решение: 1. Проводим z-преобразование рассчитанного значения коэффи- циента корреляции по формуле (20) или используем табл. 7: значе- нию гх = 0,866 соответствует значение zx = 1,3169. 2. В табл. 11 по значению a = 0,05 при числе степеней свободы 10 (определяемом как объем выборки минус 2) находим критическое значение коэффициента корреляции га = 0,576. 3. Проводим z-преобразование критического значения коэффици- ента корреляции или используем табл. 7: значению ra = 0,576 соот- ветствует значение za = 0,6565. 131
df а = 0,01 а = 0,05 1 1,000 0,997 2 0,990 0,950 3 0,959 0,878 4 0,917 0,811 5 0,874 0,754 6 0,834 0,707 7 0,798 0,666 8 0,765 0,632 9 0,735 0,602 10 0,708 0,576 11 0,684 0,553 12 0,661 0,532 13 0,641 0,514 14 0,623 0,497 15 0,606 0,482 16 0,590 0,468 17 0,575 0,456 18 0,561 0,444 19 0,549 0,433 20 0,537 0,423 21 0,526 0,413 22 0,515 0,404 23 0,505 0,396 Таблица 11 Критические значения коэффициентов линейной корреляции Пирсона для заданных степеней свободы (df = п-2, где п — объем выборки) и уровней значимости (а = 0,05 и а = 0,01; по Zar, 1984) df а = 0,01 а = 0,05 24 0,496 0,388 25 0,487 0,381 26 0,478 0,374 27 0,470 0,367 28 0,463 0,361 29 0,456 0,355 30 0,449 0,349 35 0,418 0,325 40 0,393 0,304 45 0,372 0,288 50 0,354 0,273 60 0,325 0,250 70 0,302 0,232 80 0,283 0,217 90 0,267 0,205 100 0,254 0,195 125 0,228 0,174 150 0,208 0,159 200 0,181 0,138 300 0,148 0,113 400 0,128 0,098 500 0,115 0,088 1000 0,081 0,062 4. Подставляя полученные значения в формулу (25), получим: Zp = (1,3169 - 0,6565) х (12 - 3)1/2 = 1,98. 5. В табл. 8 по рассчитанному значению Zp = 1,98 находим вели- чину р = 0,0239. 6. Вывод: мощность анализа составляет ~ 98%, то есть имеется лишь один шанс из 50, что мы примем ошибочную Но (то есть сде- лаем вывод об отсутствии корреляции, хотя на самом деле признаки скоррелированы). 132
Эту задачу можно также решить с помощью онлайн калькуля- тора, например http://power.phs.wfubmc.edu/index.cfm. На панели «Available Calculators» выбираем «Correlation». Подстановка в этот калькулятор численных значений объяснена в примечаниях к приме- ру 56 и на рис. 12. Пример 63 (определение мощности анализа). Сотрудники не- которого института изучают зависимость состояния сосновых лесов от расстояния до промышленного предприятия, собирая данные с 6 пробных площадей, находящихся на различном расстоянии до источ- ника выбросов. При обработке результатов используется корреляци- онный анализ. Эффекты какой величины (слабые, сильные, средние) можно обнаружить при данной схеме эксперимента при уровнях зна- чимости а = 0,05 и а = 0,01? Если эффекты не обнаружены, то на- сколько обоснованным будет вывод об отсутствии сильного эффек- та? Решение: 1. Формулируем нулевую гипотезу об отсутствии связи между со- стоянием сосновых лесов и расстоянием до промышленного пред- приятия [Но: г = 0]. 2. Формулируем альтернативную гипотезу о наличии связи между состоянием сосновых лесов и расстоянием до промышленного пред- приятия [Н : г Ф 0]. Отметим, что в данном случае необходимо ис- пользовать общую формулировку о наличии связи, поскольку чис- ленное значение эффекта (выявляемую силу связи) нам предстоит определить. 3. Из табл. 11 по значению а = 0,05 при числе степеней свобо- ды 4 (определяемом как объем выборки минус 2) находим критиче- ское значение коэффициента корреляции га = 0,811, а по значению а = 0,01 — критическое значение га = 0,917. 4. Вывод 1: при данной схеме эксперимента можно обнаружить только очень сильные эффекты. 5. Условимся в рамках данной задачи считать сильным эффект, соответствующий коэффициенту корреляции 0,75. Переформулируем альтернативную гипотезу: коэффициент линейной корреляции связи между состоянием сосновых лесов и расстоянием до промышленно- го предприятия равен 0,75 [Н,: г = 0,75]. 6. Следуя алгоритму, описанному выше (пример 62), либо приме- няя онлайн калькулятор, получим Р = 0,46. 133
7. Вывод 2: Более половины (54%) выводов об отсутствии силь- ного эффекта, сделанных на основании используемой схемы экспе- римента, будут ошибочными (ошибка второго рода, то есть корреля- ция есть, но она не обнаружена). При сравнении двух коэффициентов корреляции [Но: гх = г2] вели- чину р определяют из табл. 8 по величине параметра Zp, рассчитыва- емой следующим образом: Z₽ = /[l/(W1-3)]+Z[l/(n2-3)]’Z° <26> В этой формуле значения z и z2 получены путем z-преобразо- вания коэффициентов корреляции (либо из табл. 7), а значение Za найдено в табл. 8 по заданному уровню значимости а. Пример 64 (определение мощности анализа). Определить мощ- ность анализа при тестировании гипотезы о равенстве двух коэффи- циентов корреляции [Но: гх = г2]. Коэффициенты корреляции, рас- считанные по выборкам из 95 и 98 объектов, составляют гх = 0,84 и г2 = 0,78 соответственно; a = 0,05. Решение: 1. Проводим z-преобразование рассчитанных значений коэффици- ентов корреляции по формуле (20) или используем табл. 7: значению г, = 0,84 соответствует значение zx = 1,2221; значению г2 = 0,78 соот- ветствует значение z2 = 1,0454. 2. В табл. 8 по значению a = 0,05 находим Za = 1,96. 3. Подставляя полученные значения в формулу (26), получим: Zp = {(1,2212 - 1,0454) / [(1 / (95 - 3)) + (1 / (98 - 3))]1/2} - 1,96 = -0,76. 4. Поскольку Zp < 0, то найденное в табл. 8 значение 0,2236 пред- ставляет собой не Р, а (1 - Р). 5. Вывод: мощность анализа составляет ~ 22%, то есть при за- данных объемах выборок мы практически не имеем шансов уловить столь малое различие в величинах коэффициентов корреляции. 8.4. Расчет мощности дисперсионного анализа Приблизительную мощность дисперсионного анализа определя- ют из номограмм (рис. 14-18) по вычисленному значению коэффи- циента Ф: 134
^ = ^AYiSx'~x^/k(j2 (27) где к — число сравниваемых групп, ик — число повторностей в каж- дой из сравниваемых к групп, а — среднеквадратичное отклонение (изменчивость внутри сравниваемых групп), которое обычно оце- нивается по результатам ранее проведенных экспериментов, х (i = 1.. .к) — среднее значение признака для группы i, х — среднее значе- ние признака для всех групп. Номограмму для определения мощности анализа (рис. 14-18) вы- бирают по величине df} = к - 1. На номограмме для заданного уровня значимости а выбирают кривую, соответствующую df2 = к(пк - 1), и находят точку ее пересечения с вертикальной линией, соответствую- щей вычисленному значению Ф. Горизонтальная линия, проходящая через точку пересечения, соответствует силе анализа. Пример 65 (определение мощности анализа). Планируемый дисперсионный анализ роста главного корня у некой сельскохозяй- ственной культуры при применении четырех различных типов удо- брений (то есть к = 4) будет основываться на измерении растений с 10 индивидуальных делянок в каждой из экспериментальных групп (то есть пк = 10). Из проведенного ранее эксперимента мы знаем, что о = 2,75 см; средние значения в выборках составляют 8, 8, 9 и 12 см. Какова будет мощность дисперсионного анализа при а = 0,05? Реше- ние: 1. Рассчитаем среднее арифметическое значение длины корня для всех сравниваемых групп: х = (8 + 8 + 9+ 12)/ 4 = 9,25 см. 2. Подставляя численные значения в формулу (27), получим: Ф = {10 х [ (8 - 9,25)2 + (8 - 9,25)2 + (9 - 9,25)2 + (12 - 9,25)2] / (4 х 2,752)}1/2 = {(10 х 10,75) / 30,25}1/2 ~ 1,89. 3. df} = 4 - 1 = 3: выбираем номограмму, показанную на рис. 16. 4. #2 = 4х(Ю-1) = 36. 5. С использованием полученного значения df2 для а = 0,05 из вы- бранной номограммы (рис. 16) находим мощность анализа ~86%; то есть рассматриваемый экспериментальный план обеспечивает мощ- ность анализа, рекомендованную для экологических исследований (минимум 80%). Другая часто встречающаяся задача — определить мощность ана- лиза, исходя из минимального абсолютного различия (Dabs) между 135
средними значениями, которое мы хотим обнаружить. В этом случае параметр Ф рассчитывают следующим образом: Ф = (ОЛ,/о)Л/«/2Л (28) При этом мы найдем минимальное значение мощности анализа. Если обнаруженные в опыте различия превысят величину Dabs, то мощность анализа будет выше расчетной. Пример 66 (определение мощности анализа). Планируемый дисперсионный анализ роста корней при применении четырех раз- личных типов удобрений будет основываться на измерении растений с 10 индивидуальных делянок в каждой из четырех эксперименталь- ных групп. Из проведенного ранее эксперимента мы знаем, что о = 2,75 см. Мы планируем обнаружить различия между средними зна- чениями, составляющие 4 см или более (то есть Dabs = 4 см). Какова будет мощность дисперсионного анализа при а = 0,05? Решение: 1. Подставляя численные значения в формулу (28), получим: Ф = (4/2,75) х (10/(2 х4))1/2= 1,63. 2. df = 4 - 1 = 3: выбираем номограмму, показанную на рис. 16. 3. #2 = 4х(Ю-1) = 36. 4. С использованием полученного значения df2 для а = 0,05 из вы- бранной номограммы (рис. 16) находим мощность анализа -72%; то есть рассматриваемый экспериментальный план не обеспечивает мощность, рекомендованную для экологических исследований (ми- нимум 80%). Для повышения мощности анализа необходимо увели- чить количество экспериментальных единиц (делянок) в каждой из четырех групп. И наконец, можно оценить минимальное различие между сред- ними значениями признака, которое сможет выявить планируемый эксперимент при заданных величинах dfv dfv о, а и р по следующей формуле: Dabs =оФ>/2Л/и. (29) Пример 67 (определение минимального различия между сред- ними значениями, которое сможет выявить планируемый экспе- римент). Планируемый дисперсионный анализ роста главного корня у некой сельскохозяйственной культуры при применении четырех различных типов удобрений будет основываться на измерении расте- 136
ний с 10 индивидуальных делянок в каждой из четырех эксперимен- тальных групп. Из проведенного ранее эксперимента мы знаем, что о = 2,75 см. Найти минимальное различие между средними значени- ями, которое сможет выявить планируемый эксперимент при а = 0,05 и Р = 0,20. Решение: 1. dfx = 4 - 1 = 3: выбираем номограмму, показанную на рис. 16. 2. #2 = 4х(Ю-1) = 36. 3. С использованием значений dfv а и Р из номограммы (рис. 16) находим величину Ф ~ 1,73. 4. Подставляя в формулу (29), получим: Dabs = 2,75 х 1,73 х ((2 х 4) /10)12 = 4,26. 5. Вывод: предложенный экспериментальный план позволит выя- вить межгрупповые различия в длине главного корня, превышающие 4.25 см.
Глава 9. Подготовка к сбору данных 9.1. Выбор изучаемых характеристик Практическая рекомендация 12. Не все, что можно измерить, следует измерять. Практическая рекомендация 13. Изучать следует те и только те характеристики объекта (процесса, явления), которые необходимы для достижения цели исследования. Как ни странно, выбор измеряемых (учитываемых) характеристик исследуемого объекта или процесса у некоторых ученых вызывает значительные затруднения. Анализ публикаций показывает, что су- ществуют два распространенных типа методических ошибок — экс- периментальные планы, созданные «под купленный прибор» или «под освоенный аналитический метод», а также работы, выполнен- ные по принципу «измерю все, что смогу» (пример 68). Первый слу- чай представляет собой нарушение логической последовательности при планировании исследований (от цели — к методам ее достиже- ния), в то время как второй заслуживает специального обсуждения. С одной стороны, сбор избыточной информации ведет к нерациональ- ной трате сил и средств; с другой стороны, анализ такой информации создает массу статистических и логических проблем. В частности, очевидно, что при анализе тесно связанных между собой характе- ристик объекта (например, длины и ширины листа) нахождение зна- чимых различий по одному из признаков с высокой вероятностью позволит ожидать нахождения значимых различий и по второму при- знаку. Очевидно, что второй из этих сопряженных выводов нельзя считать независимым от первого, и он никоим образом не изменяет интерпретацию результатов — за исключением тех случаев, когда в задачи исследования входит анализ формы листа, оцениваемой как соотношение ширины и длины листовой пластинки. 138
Пример 68 (избыточный выбор признаков для экологическо- го исследования) (по Аникееву и др., 2006). № Признак Зона поражения сильного среднего слабого 1 Длина шишки, мм 29.9 ±1.04 28.8 ±0.68 30.1 ±0.62 2 Ширина шишки, мм 14.8 ±0.36 14.5 ±0.19 14.9 ±0.46 3 Вес шишки, г 2.5 ±0.19 2.3 ±0.12 2.4 ±0.12 4 Длина крылатки, мм 9.6 ±0.40 9.8 ±0.42 10.2 ±0.40 5 Ширина крылатки, мм 3.0 ±0.55 3.2 ±0.18 3.0 ±0.10 6 Длина чешуйки, мм 14.2 ±0.55 13.6 ±0.41 14.5 ±0.34 7 Ширина чешуйки, мм 6.6 ±0.16 6.4 ±0.25 6.7 ±0.14 8 Высота щитка, мм 6.6 ±0.20 6.8 ±0.14 6.8 ±0.16 9 Ширина щитка, мм 5.8 ±0.14 5.8 ±0.09 5.8 ±0.10 10 Масса 1000 шт. полных семян, г 2.6 ±0.19 3.0 ±0.10 2.8 ±0.12 11 Число семяпочек потенциально фертильных, шт. 37.5 ±1.43 33.6 ±0.89 35.7 ±1.37 12 Число полнозернистых семян, шт. 16.8 ±1.45 17.1 ±0.93 19.1 ±1.13 13 Число пустых семян, шт. 4.1 ±0.47 3.7 ±0.61 3.5 ±0.41 14 Число семяпочек, погибших во 2-й вегетационный период, шт. 1.7 ±0.52 0.8 ±0.24 1.6 ±0.57 15 Форма шишки (2-й/ 1-й признаки) 0.50 ±0.01 0.51 ±0.01 0.50 ±0.01 16 Форма крылатки (5-Й/4-Й признаки) 0.31 ±0.01 0.33 ±0.01 0.30 ±0.01 17 Форма чешуйки (7-й/б-й признаки) 0.48 ±0.02 0.47 ±0.01 0.47 ±0.01 18 Форма щитка (9-Й/8-Й признаки) 0.9 ±0.03 0.85 ±0.01 0.85 ±0.02 19 Общее число семян (12-й + 13-й признаки), шт. 21.0 ±1.57 20.7 ±0.81 22.7 ±1.13 20 Число семяпочек, доживших до начала 2-го вегета- ционного периода (14-й + 19-й признаки), шт. 22.6 ± 1.35 21.6 ±0.76 24.2 ±0.90 21 Число семяпочек, погибших в 1-й вегетационный период (11-й - 20-й признаки), шт. 14.9 ±1.13 12.1 ±0.63 11.4 ±0.97 22 Гаметофитная выживаемость семяпочек в 1-й веге- тационный период (20-Й/11-й признаки х 100), % 60.3 ± 2.72 64.1 ± 1.47 68.5 ±1.87 23 Гаметофитная выживаемость семяпочек во 2-й ве- гетационный период (19-Й/20-Й признаки х 100), % 91.3 ±2.90 96.0 ±1.27 93.1 ±2.57 24 Выживаемость семяпочек за весь гаметофитный период (19-Й/11-й признаки х 100), % 55.6 ±3.41 61.6 ±1.77 64.0 ±2.62 25 Эмбриональная выживаемость семяпочек (12-й/19-й признаки х 100), % 78.5 ± 3.23 82.2 ± 2.86 83.8 ±2.12 26 Энергия прорастания, % 28.0 ±4.55 25.6 ±4.55 24.5 ±4.45 27 Всхожесть семян, % 38.3 ±4.78 34.7 ±4.37 38.9 ±5.13 28 Форма апофиза, в баллах по С. А. Мамаеву, 1973 1.1 ±0.08 1.1 ±0.07 1.1 ±0.08 Связь выбора характеристик с целью исследования можно проил- люстрировать на примере анализа размеров листа березы. Если цель исследования не задана, то размер листа может быть охарактеризо- ван с помощью нескольких параметров, например: • длина листовой пластинки, мм; • длина листа (включая листовую пластинку и черешок), мм; • ширина листовой пластинки, мм; • площадь листовой пластинки, мм2; • масса листовой пластинки, г; • масса листа (включая листовую пластинку и черешок), г. 139
Очевидно, что все эти характеристики тесно связаны друг с дру- гом, так что их одновременное измерение будет избыточным. Если же известна цель исследования, то мы можем выбрать тот параметр, измерение которого позволит наилучшим образом охарактеризовать лист с точки зрения изучаемого процесса либо явления. Так, если мы изучаем лист как кормовой ресурс для листогрызущих насекомых, то целесообразно измерять биомассу листовой пластинки (поскольку большинство видов не ест черешки листьев). Если мы изучаем про- дуктивность фитоценоза, то целесообразно взвешивать весь лист (то есть листовую пластинку и черешок). Если мы изучаем фотосинтез, то логично измерять площадь листа (и дополнительно — удельную листовую поверхность). Если мы изучаем жизненное состояние де- рева (в предположении, что размер листа уменьшается с угнетением дерева), то целесообразно выбрать длину листовой пластинки как наиболее легко измеряемую характеристику (по сравнению, напри- мер, с биомассой и площадью). Практическая рекомендация 14. При прочих равных условиях преимущество следует отдавать признакам, непосредственно связан- ным с изучаемым процессом либо явлением. Выбор признаков, связь которых с изучаемым явлением далеко не очевидна, можно проиллюстрировать на примере работ, авторы которых измеряли флуктуирующую асимметрию (ФА) листьев рас- тений для определения уровня антропогенного воздействия на эко- системы. Значительная часть этих работ основана на предположе- нии, что ФА — удобный и надежный индекс, отражающий уровень испытываемого растениями стресса. Это предположение имеет ве- сомое теоретическое обоснование и подтверждается обнаруженным в 1990-е гг. возрастанием ФА у растений, находящихся в неблаго- приятных (с точки зрения исследователя) условиях — вблизи про- мышленных предприятий, под линиями электропередач или в зонах радиоактивного загрязнения (подробнее см.: Freedman et al., 1993). С другой стороны, многим исследователям не удалось обнаружить повышения ФА у растений в субоптимальных местообитаниях (под- робнее см.: Kozlov et al., 2009). Соответственно, нельзя утверждать, что растения демонстрируют однозначную связь между уровнем ФА и воздействием потенциально неблагоприятных факторов. Тем не менее, в последнее десятилетие опубликовано значительное количе- 140
ство работ, в которых на основании различий в величине ФА делает- ся вывод о том, что в каких-то районах растения испытывают более сильный стресс, чем в других районах. Влиянию разных видов стресса на растения посвящены многие тысячи работ. Обратившись к теоретическим основам этих исследо- ваний, легко обнаружить, что большинство специалистов ссылается на Дж. Грайма (Grime, 1979), который определял реакцию на стресс по степени угнетения роста растения в неблагоприятных условиях обитания. Таким образом, любая характеристика ростовых процес- сов непосредственно связана с уровнем стресса, в то время как зна- чение ФА если и отражает его, то опосредованно. Отмечу, что нет никаких противопоказаний к использованию ФА для индикации стресса — но только в том случае, если методиче- ски корректно доказана связь между ФА и уровнем стресса, причем уровень стресса измерен, согласно Дж. Грайму, по угнетению роста растений. К сожалению, исследователи, как правило, не проверяют гипотезу о наличии связи между ФА и ростом растений, а измерения уровня стресса часто подменяют измерением уровня некоего воздей- ствия, предположительно вызывающего стресс у растений (напри- мер, загрязнения окружающей среды). Таким образом, предположе- ние о том, что ФА — универсальный индикатор стресса у растений, в общем случае не обосновано. Практическая рекомендация 15. Если изучаемый процесс или явление можно охарактеризовать несколькими признаками, то выби- рать следует тот признак, который легче измерить (при одинаковой точности измерений), либо тот признак, который можно измерить с большей точностью (при равных трудозатратах). Основные показатели роста растения (например, длина годич- ного побега, вертикальный либо радиальный прирост для древес- ных растений, надземная биомасса для травянистых растений) измерить гораздо легче, чем уровень ФА. Это связано с тем, что методически корректное определение ФА требует проведения двух независимых замеров для каждой из половин листа (то есть четы- рех замеров каждой измеряемой единицы) с последующим ана- лизом ошибки измерения и с проверкой воспроизводимости ре- зультатов (подробнее см.: Palmer, Strobeck, 2003). Трудоемкость подобной процедуры служит дополнительным аргументом в пользу 141
отказа от практического использования ФА как индикатора уровш стресса. 9.2. Выбор шкалы и определение точности измерения Определение 26. Шкала — это знаковая система, для которой за- даны правила, устанавливающие соответствие между реальными объектами и элементами шкалы. Шкалы принято классифицировать по типам измеряемых данных, которые определяют допустимые для данной шкалы математические преобразования, а также типы отношений, отображаемых соответ- ствующей шкалой. Современная классификация, включающая четы- ре типа шкал, была предложена в 1946 г. Стэнли Смитом Стивенсом. С вопросом о типе шкалы, в которой проведены измерения исследу- емой переменной, непосредственно связана проблема адекватности методов математической обработки результатов измерения. 1. Шкала наименований (номинальная, классификационная; англ. nominal) используется для измерения значений качественных при- знаков, таких как названия организмов, цвета или марки автомоби- лей. С величинами, измеряемыми в шкале наименований, можно вы- полнять только одну операцию — проверку их совпадения (А = В) или несовпадения (А Ф В). 2. Порядковая шкала (или ранговая; англ, rank), по сравнению со шкалой наименований, учитывает также порядок объектов. Примеры порядковых шкал — балльные оценки успеваемости, шкала Бофорта для силы ветра и категории отелей (выраженные количеством звездо- чек). Однако расстояния между объектами, которые следуют друг за другом (по убыванию или по возрастанию), не могут быть оценены в этой шкале. Допустимые операции с объектами: А = В, А Ф В, А > В, А < В (то есть добавлено определение последовательности объек- тов). 3. Интервальная шкала (или шкала разностей; англ, interval), по сравнению с порядковой шкалой, учитывает также расстояния меж- ду объектами. Однако в интервальной шкале, как, например, в шка- лах температур Цельсия и Фаренгейта и при измерении времени, не существует «естественного» начала отсчета. Допустимые операции с объектами: А = В, А Ф В, А > В, А < В, А + В, А - В (то есть добавле- но определение суммы и разности величин). 142
4. Абсолютная шкала (или шкала отношений; англ, ratio) — это интервальная шкала, в которой присутствует дополнительное свой- ство: естественно и однозначно определенное начало отсчета. Это единственная из четырех шкал, имеющая абсолютный ноль. С по- мощью таких шкал измеряют массу, длину, силу, стоимость. К этому же классу отностится шкала Кельвина, то есть шкала температур, от- считанных от абсолютного нуля. Допустимые операции с объектами: А = В, А Ф В, А > В, А < В, А + В, А - В, А х В, А / В (то есть добав- лено определение произведения и частного величин). Практическая рекомендация 16. При использовании ранговых шкал буквенные обозначения классов (А, В, С, D...) предпочтитель- нее цифровых (1, 2, 3, 4...). Следование этой рекомендации позволяет уменьшить вероят- ность того, что исследователь спутает порядковую шкалу с интер- вальной или абсолютной шкалой и начнет выполнять лишенные смысла операции (аналогичные, например, сравнению спортивных команд по среднему значению номеров, написанных на футболках игроков: пример 69). Пример 69 (выбор шкалы). Какой тип шкалы использован на рис. 20? Правомерен ли проведенный автором регрессионный ана- лиз, результаты которого показаны на рисунке? Решение: 1. Горизонтальная шкала на рисунке обозначена как «Варианты опыта». Описание вариантов, обозначенных цифрами от 1 до 6, не позволяет однозначно установить их логическую последователь- ность, что указывает на использование шкалы наименований. В этом случае применение статистического анализа для поиска связи между вариантом опыта и исходом опыта неправомерно. 2. Логическая последовательность, однако, может быть установ- лена, если ранжировать варианты опыта по расстоянию между ис- точниками двух веществ, используемых в опыте. В этом случае рас- стояние будет возрастать от нуля в варианте 1 до 100 см в варианте 6, и шкала, фактически, становится порядковой. Это позволяет при- менять статистический анализ для поиска связи между вариантом опыта (то есть испытываемым расстоянием между источниками двух веществ) и его результатом, однако лишь с использованием непара- метрических критериев связи (например, коэффициента ранговой 143
Рис. 20. Усиление поисковой активности (по количеству отловленных ло- вушками имаго) самцов всеядной листовертки под действием запаха ат- трактанта для яблонной плодожорки, транс-8, транс-10-ДДА. Варианты опыта: цис-11/транс-11-ТДА 63:37, 1 мг и транс-8, транс-10-ДДА, 1 мг в капсулах как: 1) смесь в одной капсуле; 2) капсулы плотно соединены; 3) капсулы на расстоянии 3-5 см в одной ловушке; 4) аттрактанты в от- дельных, но соединенных ловушках; 5) ловушка с аттрактантом всеядной листовертки и капсулой с аттрактантом яблонной плодожорки на рассто- янии 50 см; 6) то же на расстоянии 100 см. По оси ординат — количество привлеченных в ловушки самцов всеядной листовертки в % от контроля (100%) — уловов самцов ловушками с аттрактантом для всеядной листо- вертки (по Сафонкину, 2008). корреляции). Применение параметрического регрессионного анализа в данном случае неправомерно. Порядковые и дискретные абсолютные шкалы могут быть ис- пользованы и для анализа непрерывно изменяющихся величин. Та- кая замена, неизбежно ведущая к уменьшению точности оценки из- учаемого параметра (см. ниже), целесообразна в том случае, когда необходимо в сжатые сроки обработать большой объем материала. В этом случае отнесение объекта к некоторому классу (вместо изме- рения объекта) позволяет экономить время и силы. 144
Пример 70 (выбор шкалы). Для оценки потерь листовой био- массы растений, вызванных питанием насекомых, часто использу- ют дискретные шкалы. При этом исследователь относит каждый лист к одному из заранее определенных классов (рис. 21) на основе визуальной оценки доли изъятой листовой поверхности. Этот ме- тод гораздо менее трудоемок, чем измерение площадей съеденной и оставшейся частей листа, однако в обязательном порядке требует проверки как воспроизводимости результатов (см. ниже), так и соот- ветствия между визуальной классификацией и инструментальными измерениями. Эта проверка должна регулярно выполняться в ходе иследования на небольшой части случайно взятых выборок. 0.01-1 1-5 6-25 26-50 51-75 76-100% Рис. 21. Дискретная абсолютная шкала, используемая для определения уровней повреждения листьев березы листогрызущими насекомыми. Приведены граничные значения классов, выделенных по доле съеденной насекомыми листовой поверхности; фотографии — примеры листьев, от- несенных к соответствующим классам. Для анализа данных, измеренных в интервальной или абсолют- ной шкалах, можно применять более широкий круг методов, чем для анализа данных, измеренных в номинальной и порядковой шкалах. Однако процесс измерения в интервальной и абсолютной шкалах со- пряжен с определенной погрешностью, поэтому любое полученное значение будет отличаться от истинного значения измеряемой вели- чины. Точность измерения оценивается двумя параметрами (рис. 22): близостью к истинному значению, то есть несмещенностью (англ. accuracy), и разбросом последовательных замеров одного и того же объекта, то есть эффективностью (англ, precision). С точки зрения анализа полученных результатов, отклонение от истинного значения (то есть смещенность оценки) более опасно, чем высокий разброс за- меров, поскольку вносит систематическую ошибку. Высокий разброс замеров, однако, также нежелателен, поскольку приводит к необхо- 145
димости увеличения объема выборки для получения оценки призна- ка с заданной точностью (см. раздел 7.1). Высокая Низкая Близость индивидуальных замеров (точки) к истинному значению (вертикальная линия) Рис. 22. Две характеристики точности измерения параметра. Пример 71 (точность измерения). Плохо проинструктирован- ный лаборант измерял длину листа березы как расстояние от места прикрепления черешка к ветке до вершины листа. Поскольку иссле- дователь ставил перед собой задачу оценить длину листовой пла- стинки березы, то есть расстояние от места прикрепления черешка к листовой пластинке до вершины листа, полученная в результате из- мерений оценка оказалась смещенной, причем величина смещения неизвестна. Пример 72 (точность измерения). Невнимательный лаборант из- мерял длину листовой пластинки березы, прикладывая левый край линейки к основанию листа. Однако у используемой линейки левый край находился на расстоянии 5 мм от нулевой отметки. В результате получена смещенная оценка; однако в данном случае величина сме- щения известна. Разница между примерами 71 и 72 заключается в том, что в при- мере 72 получить истинную оценку можно, прибавив 5 мм (рас- стояние от края линейки до нулевой отметки) к результату каждо- 146
го замера, то есть последствия подобной ошибки легко устранить. В примере 71, поскольку длина черешка различна у разных листьев, для устранения последствий ошибки придется повторно проводить все измерения. Если систематические и грубые ошибки измерений могут быть учтены и устранены, то случайные погрешности неизбежны — как в каждом измерении, так и в среднем значении, рассчитанном на основании индивидуальных замеров. Следует помнить о том, что значения данных в интервальной и абсолютной шкалах измеряют с определенной точностью, то есть округляют до ближайшего значе- ния шкалы. В результате полученная величина обозначает не точку, а интервал (табл. 12). Таблица 12 Связь между результатом измерения и границами, в которых лежит истинное значение измеряемого признака Результат измерения Границы, между которыми лежит истинное значение признака 67 66,6-67,4 67,2 67,15-67,25 67,23 67,226-67,234 Практическая рекомендация 17. Всегда указывайте точность из- мерения для каждого из исследованных параметров. Особое внимание следует уделять форме представления больших величин, поскольку они часто измеряются менее точно, чем мень- шие величины. Например, фраза «в заповеднике обитает 10 волков и 31 000 оленей» предполагает, что волки сосчитаны поштучно, а вот точность измерения численности оленей не ясна. Указать точность оценки можно показом границ округления, то есть заменой «31 000 оленей» на «31 тысяча оленей» (значение округлено до тысячи) либо «310 сотен оленей» (значение округлено до сотни). Другой способ — использование стандартной формы записи, то есть 3,1 х Ю4 для ве- личины, лежащей между 30550 и 31 540 (значение округлено до ты- сячи) либо 3,10 х Ю4 для величины, лежащей между 30950 и 31040 (значение округлено до сотни). Техническое оснащение современных лабораторий часто позволяет провести замеры с очень высокой точностью. Однако всегда ли высо- кая точность замеров необходима для решения поставленной задачи? 147
Практическая рекомендация 18. Работая с непрерывными вели- чинами, заранее определите необходимую точность измерений. Не имеет смысла, например, измерять с точностью до 1 мм высо- ту подроста (молодых деревьев), варьирующую в пределах от 10 до 350 см. Точно так же пустой тратой времени будет взвешивание проб подстилки, в среднем составляющих 50-150 г, с точностью до 1 мг. Кроме того, некоторые объекты невозможно замерить с высокой точ- ностью: например, измерение длины тела жабы с точностью 0,1 мм (пример 14) лишено смысла, поскольку заявленная точность измере- ния как минимум на порядок превышает возможности деформации мягких тканей тела жабы в процессе измерения. Практическая рекомендация 19. Между минимальным и макси- мальным значениями исследуемого признака должно укладываться от 30 до 100 используемых единиц измерения. Пример 73 (точность измерения). С какой точностью необходи- мо проводить измерение длины листа ивы козьей, если в нашей вы- борке она изменяется от 28 до 116 мм? Решение: 1. Точность в 1 мм вполне достаточна, поскольку между крайни- ми значениями укладывается 87 классов, отличающихся на 1 мм. 2. Более того, округление до ближайшего четного (то есть исполь- зование шкалы с шагом 2 мм) также даст удовлетворительные ре- зультаты. В этом случае между крайними значениями укладывается 44 класса, отличающихся на 2 мм, что больше минимально допусти- мого количества (30 классов). 3. А вот измерение с точностью до 5 мм по отношению к нашим данным будет слишком грубым. Между крайними значениями укла- дывается всего 18 классов, отличающихся на 5 мм, что существенно меньше минимально допустимого количества (30 классов). Определение 27. Значащими цифрами числа называют все циф- ры, начиная с первой слева, отличной от нуля, до последней, зна- чение которой обеспечивается при заданной точности измерения. Если при записи числа нужно показать, что последние цифры не являются значащими, то используют стандартную форму представ- ления числа или явным образом показывают границы округления, за- меняя цифры словами. Пример 74 (значащие цифры). Примеры чисел, включающих разное количество значащих цифр. 148
1. Одна значащая цифра: 1, 0,2, 0,03, 0,004, 0,0005, тысяча, 2 х Ю3. 2. Две значащих цифры: 12, 1,2, 0,23, 0,034, 0,0045, 0,00056, 21 тысяча, 2,1 х Ю3. 3. Три значащих цифры: 120, 12,0, 1,20, 0,234, 0,0345, 0,00456, 0,000567, 210 тысяч, 2,10 х Ю3. 4. Четыре значащих цифры: 1201, 120,1, 1,201, 0,2345, 0,03456, 0,004567,0,0005678,2101 тысяча, 2,101 х Ю3. Практическая рекомендация 20. Наличия трех значащих цифр достаточно для большинства экологических исследований, посколь- ку при этом относительная ошибка составляет 0,1-1%. Практическая рекомендация 21. Если результат измерения бу- дет использован для расчета производных величин (например, пла- нируется определить урожай томатов путем перемножения средней массы плода, числа плодов на квадратный метр и размера поля), то рекомендуется производить замеры с более высокой точностью (на- пример, регистрируя четыре значащие цифры). 9.3. Проверка воспроизводимости результатов Экологи обычно предполагают, что полученные ими результа- ты обладают высокой воспроизводимостью. Часто это действитель- но так: если первый наблюдатель обнаружил в гнезде пять птенцов, есть все основания думать, что и второй наблюдатель получит то же самое значение признака. Однако уже с измерениями длины, даже простейшими, дело обстоит не так просто, поскольку начальная и конечная точки замера выбираются с определенной долей субъек- тивности. Сложнее всего добиться высокой воспроизводимости ре- зультатов при работе с ранговыми либо дискретными шкалами, ис- пользуемыми для оценки непрерывной изменчивости. Например, в международной программе по мониторингу состояния лесов в Ев- ропе используется абсолютная шкала, по которой уровень потери хвои либо листвы кроной конкретного дерева визуально оценивает- ся с точностью до 5%. Подобная оценка, выполняемая различными исследователями, достаточно субъективна и характеризуется отно- сительно низкой точностью (в обоих смыслах: см. рис. 22). Для по- вышения точности приходится проводить регулярные тренировки, во время которых учетчики оценивают одни и те же деревья, выявляют 149
причины расхождения индивидуальных оценок и добиваются повы- шения воспроизводимости результатов. Пример 75 (точность измерения). В публикации, посвященной одному из аспектов миграций птиц (Бояринова, Бабушкина, 2010), методика исследования описана следующим образом: «При отло- ве птиц их кольцевали, взвешивали с точностью до 0,1 г, измеряли длину крыла по общепринятой методике с точностью до 1 мм. Коли- чество подкожного жира оценивали по десятибалльной шкале — от 1 (нет жира) до 10 (очень много)». Оцените методический подход к точности определения каждого из трех изученных параметров. Объ- яснения: 1. Очевидное достоинство публикации — указание точности из- мерения для каждого из трех параметров (0,1 г, 1 мм, 1 балл). 2. Недостаток публикации — отсутствие информации о воспро- изводимости измерений (то есть корреляции между двумя после- довательными замерами одной и той же птицы одним учетчиком в слепом тесте, либо между замерами, выполненными разными учет- чиками) для длины крыла и оценки количества подкожного жира. 3. При измерении массы субъективизм мал, так что оценкой вос- производимости можно пренебречь. 4. При измерении длины крыла субъективизм очевиден, в первую очередь за счет необходимости определить точку, где кончается туло- вище птицы и начинается собственно крыло; в связи с этим оценка воспроизводимости результатов весьма желательна. 5. Неизбежный субъективизм в отнесении птицы к одному из 10 классов по количеству подкожного жира делает проверку воспроиз- водимости данной оценки обязательной. Результаты этой проверки должны быть приведены в методической части статьи. В том случае, если при выбранной методике замеров воспроиз- водимость результатов окажется низкой, следует изменить методику исследования, например, понизить точность измерения (либо умень- шить количество классов) и/или измерять каждый объект дважды или трижды. Двукратное измерение всего материала (выполняемое, как пра- вило, разными лицами) используется в практике исследовательской работы в тех случаях, когда величина ожидаемого эффекта сопоста- вима с точностью замеров, например, при изучении флуктуирующей 150
асимметрии небольших объектов. Дисперсионный анализ двух заме- ров одного и того же объекта позволяет отличить объективно суще- ствующие различия от ошибки измерения. 9.4. Предварительный сбор информации, подготовка инструкций и форм для записи данных Внимательный читатель уже понял, что для любого этапа плани- рования эксперимента необходима информация о свойствах изучае- мого объекта. В связи с этим сбор предварительной информации и разработка методики сбора данных представляют собой важные эта- пы планирования НИР. Основная задача предварительного сбора информации — выяв- ление как можно большего количества источников изменчивости ис- следуемого параметра, которые могут повлиять на конечный резуль- тат исследования. Этот этап особенно важен для тех, кто начинает работу с незнакомым объектом. Кроме того, во время этого этапа составляют и проверяют в ре- альных условиях инструкции по сбору информации и формы для записи первичных данных. При этом составление и практическая проверка инструкций не только дисциплинируют исследователя, но и выявляют слабые стороны методики, а заранее подготовленные формы для записи первичных данных позволяют уменьшить коли- чество ошибок. Например, если в заготовленной форме отведено по одной сроке на исследуемый объект, то случайный пропуск объекта становится практически невозможным событием. Другой пример — запись последовательных замеров серии однотипных объектов (на- пример, высоты саженцев). Если подготовленный бланк содержит результаты предыдущего замера, то это позволяет исследователю, ведущему запись, контролировать работника, ведущего замеры. По- скольку высота саженца не может уменьшиться сама по себе, а так- же увеличиться на слишком большую величину, то сравнение с предыдущим замером позволяет как исправлять случайные ошибки (измерен не тот саженец; неправильно сняты показания), так и по- мечать саженцы, которые были повреждены (например, обгрызены животными или сломаны) между двумя замерами (и, соответственно, должны быть исключены из эксперимента). 151
Пример 76 (предварительный сбор информации и подготовка инструкций). Цель исследования — проверка гипотезы о том, что особи березы пушистой, растущие вблизи промышленного предпри- ятия, формируют листья меньшего размера, чем особи, растущие в незагрязненных районах. Задача: составить примерный перечень во- просов, на которые должен ответить исследователь при разработке плана сбора материала. Решение: 1. Для оценки ожидаемой величины эффекта измеряем по 5 ли- стьев на 5 деревьях в самом «грязном» и самом «чистом» местах и рассчитываем средние значения и среднеквадратичные отклонения (или же ищем эти данные в публикациях на сходную тему). На осно- вании полученной информации рассчитываем объемы выборок, не- обходимые для проверки нашей гипотезы при заданном уровне зна- чимости и выбранной силе анализа (см. главу 7). 2. Разрабатываем процедуру выбора деревьев. Все ли особи бере- зы пушистой (независимо от возраста, условий произрастания, ин- тенсивности плодоношения и т.п.) могут быть включены в выборку? Следует ли ли метить деревья? 3. Разрабатываем процедуру выбора листьев. Из какой части кро- ны отбирать пробу? Сколько брать листьев с одного дерева? Брать ли листья только с вегетативных побегов или не только с вегетативных, но и с генеративных? У березы два типа побегов: длинные и корот- кие; с какого типа побегов собирать листья? Листья на побеге отли- чаются по размерам; какой лист выбирать для замера? 4. Разрабатываем процедуру проведения замеров. Будем ли из- мерять листья в полевых условиях или будем собирать листья, а за- меры производить в лаборатории? Как маркировать и упаковывать пробы? Если собираем листья, то будем измерять их в свежем или высушенном состоянии? Если в высушенном, то как упаковывать листья для сушки и в каких условиях их сушить? Сохранять ли из- меренные листья? Если сохранять, то маркировать ли каждый лист индивидуально? Чем измерять длину листовой пластинки, с какой точностью? Как регистрировать первичные данные — записывать в блокнот, записывать в подготовленные бланки, вводить в электрон- ный документ? Естественно, приведенный выше список нельзя считать исчерпы- вающим. Он лишь показывает, что даже при решении столь простой (на первый взгляд) задачи для составления плана эксперимента ис- 152
следователь должен собрать довольно много информации и принять достаточное количество решений, которые обязательно должны быть зафиксированы в инструкции. Важно помнить, что этот труд не про- падет: подготовленный текст послужит основой для написания раз- дела «Материалы и методы» в публикации, основанной на результа- тах планируемого исследования. Если какая-либо процедура повторяется из года в год (например, при многолетнем мониторинге), то использование инструкции ста- новится обязательным условием получения сопоставимых данных. Кроме того, обработку данных не всегда удается провести сразу же после их сбора, так что по прошествии некоторого времени инструк- ция поможет вспомнить, как именно собирали первичную инфор- мацию. Составлением инструкции не стоит пренебрегать даже в том слу- чае, если собирать данные будет тот же человек, кто планирует ис- следование. Однако подготовка инструкции становится строго обя- зательной при привлечении к работе помощников. Ознакомление помощников с инструкцией, помимо повышения качества работы, избавит исследователя от выслушивания традиционных отговорок, сводящихся к двум базовым вариантам: «Вы этого не говорили!» и «А я подумал, что ...». При составлении инструкции особое внимание следует обратить на тщательное описание тех этапов работы, которые потенциально могут привести к необратимой потере информации. Например, если в ходе обработки одну пробу следует разделить на несколько частей, то должен быть обязательно указан порядок маркировки и упаковки каждой части пробы. Пример 77 (подготовка инструкций). Инструкция, подготовлен- ная для разборки проб водяники, собранных для анализа возрастной структуры популяций (детальное описание исследования: Zverev et al., 2008). 1. Исходный материал: 4 пакета (с надписями 1265, 1252, 1224, 1212), в каждом из которых находится 15 проб, и 4 бланка (рис. 23). До начала разборки пакеты хранить в холодильнике! Запрещается от- крывать новый пакет до окончания разборки предыдущего пакета. 2. Одна проба представляет собой часть ветки и основание корня; на липкой ленте, которыми они соединены, написана длина ветки. 153
Замеры «браацов мдякжжя, собршаых для «хим возрастаю* структуры шшуляцн* км М Длжия см дням, мм Возр» лет Длжны 10 осевых яобегов, прирост 2002 гоня 1265 1 1265 2 1265 3 1265 4 1265 5 1265 6 Рис. 23. Форма для записи данных, описанных в примере 77. 3. Открыть пакет, пронумеровать содержащиеся в нем пробы — от 1 до 15, номер написать на липкой ленте. 4. Для каждой пробы, ориентируясь на ее номер, переписать с липкой ленты в бланк длину ветки. 5. Взять одну пробу. Разъединить ветку и корень. Использовать до- полнительную липкую ленту для того, чтобы написать номер пробы и на ветке, и на корне. При этом на ветке следует написать только номер пробы (1,2 и т.д.), а на корне — указанное на пакете обозначение места сбора и, через дефис, номер пробы (например, 1265-1, 1265-2 и т.д.). 6. Измерить длину (в мм) 10 осевых побегов, выросших в про- шлом году. Побеги выбирать подряд, начиная с вершины ветки; ре- зультаты записать в бланк, ветку положить в исходный пакет. Корень положить в новый пакет, на котором написать место сбора (напри- мер, 1265 и т.д.). 7. Перейти к следующей пробе из того же пакета. После обработ- ки всех проб из пакета запечатать оба пакета с частями разобранных проб (т. е. с ветками и с корнями), убрать их в холодильник и только после этого начинать работу со следующим пакетом. 8. Конечный результат: 4 пакета с ветвями, 4 пакета с корнями, 4 заполненных бланка. Особенно внимательно следует подходить к составлению ин- струкций в тех случаях, когда исполнитель не имеет оперативной свя- зи с руководителем и не может немедленно получить консультацию при возникновении вопросов либо непредвиденных ситуаций. В этом случае (пример 78) инструкция становится достаточно длинной, по- скольку приходится предусматривать все возможные проблемы. 154
Пример 78 (подготовка инструкций). Инструкция по выращива- нию личинок лапландского листоеда (детальное описание исследова- ния: Zvereva et al., 1995). • В опыте используется 50 бюксов. В каждый бюкс помещено 7 личинок. Каждому бюксу соответствует один куст ивы, по 5 кустов с каждого из 10 экспериментальных участков. • У личинок всегда должен быть свежий корм. Корм нужно ме- нять один раз в 3 дня (или чаще — см. ниже). Ветви ивы нужно хра- нить в холодильнике. Оставленного запаса хватает на 2, иногда — на 3 замены корма. • Корм нужно менять до истечения 3-дневного срока, если он почти весь съеден, или подсох, или заплесневел. • При смене корма нужно считать живых личинок; результат (по номеру бюкса) записывать в бланк под датой смены корма. Смену корма производить следующим образом: J вытряхнуть содержимое бюкса на лист белой бумаги; J убедиться, что на стенках и на крышке не осталось личинок; J если стенки бюкса и/или крышка влажные или грязные, то протереть бюкс и/или крышку салфеткой. J положить в бюкс свежий корм; J пересадить в бюкс личинок (можно стряхивать их кисточкой со старого корма, либо отрезать кусочки листьев с личинка- ми и класть личинок в бюкс вместе с кусочками старых ли- стьев); J записать количество живых личинок в бланк под датой сме- ны корма; J выбросить старый корм. • Личинки, особенно мелкие, трудно различимы на листьях — их поиск требует повышенного внимания и хорошего освещения. Ли- чинки не пропадают бесследно — если они погибают, то на дне бюк- са можно найти их трупы. Если личинок найдено меньше, чем при предыдущем учете, то нужно повторно и очень внимательно осмо- треть старый корм. • Если в бюксе погибли все личинки, то в учете пишется ноль, и бюкс исключается из эксперимента. • После того, как личинки достигнут 8-10 мм в длину, они начи- нают окукливаться. При этом личинки прикрепляются «хвостом» к листочку (либо стенке или крышке бюкса), сморщиваются и зами- 155
рают. Таких личинок сгонять с листочка (стенки, крышки) нельзя — они при этом погибнут. Пересадку проводить только отрезанием части листочка с прикрепившейся личинкой. Прикрепившимся ли- чинкам корм больше не нужен! • При обнаружении прикрепившихся личинок их количество за- писывают в бланк с кодом «рр» (сокращение от ргерира — предку- колка); например, запись «З+Зрр» означает, что в бюксе находятся 3 питающихся личинки и три прикрепившихся личинки. • Прикрепившиеся личинки через 1-2 дня сбрасывают шкурку и превращаются в куколок. Куколки сначала почти белые, потом тем- неют. Куколки шире и короче личинок, формой тела они напоминают взрослого жука. При обнаружении куколок их количество записыва- ют в бланк с кодом «р» (сокращение от pupa — куколка); например, запись «1+Зрр+2р» означает, что в бюксе находятся 1 питающаяся личинка, три прикрепившихся личинки и 2 куколки. • Куколки в корме и в уходе не нуждаются. После окукливания всех личинок в бюксе не должно быть свежих листьев! • Бюксы с куколками необходимо просматривать ежедневно, же- лательно в первой половине дня. Вылупившихся жуков необходимо взвешивать индивидуально, а результат записывать в соответствую- щую строку бланка после даты взвешивания. Например, запись «2.7: 237, 188, 165; 3.7: 222» означает, что второго июля в бюксе вылупи- лись три жука массой 0,0237, 0,0188, и 0,0165 г, а третьего июля — один жук массой 0,0222 г. • Взвешенных жуков следует пересадить в общую банку с любы- ми листьями ивы; банку с жуками хранить в холодильнике. После составления инструкции ее необходимо проверить на прак- тике, то есть выполнить шаг за шагом всю описанную в инструкции последовательность действий. Как правило, при этом становится очевидной необходимость доработки отдельных пунктов инструк- ции. Кроме того, по результатам этой проверки можно оценить вре- мя, необходимое для выполнения запланированного объема работ. 9.5. Запись и хранение данных В ходе предварительного сбора информации исследователь дела- ет довольно много записей. Этот первичный материал служит осно- вой для научной работы, а поэтому любая запись (рис. 24) должна: 156
• быть датирована; • содержать информацию о характере данных (измеряемом при- знаке); • содержать информацию об изученной пробе (например, место сбора); • не допускать двоякого толкования, особенно в отношении чис- ленных значений. I _L 4-1—!-’ L |±&L Lj-------1—4—Ц—L. i—4. - I - ‘ О Ж 9. Л>, О 4 L 'х, <г, <ч, л, <’ ,4 -r.‘i-1 fi.Oi. zotfj,, _ otr ! As*_ ' бй Vf г/5б₽ ibfe/r&l . < rzi/c?/.. Г? Л)о/ <fcr? 2ЕПг/ J >/ 4 О s>5/ 4Cf j 6 Замеры длин побегов на мелких березах -1218, ^Л»2009 № ЧЖУЮ побегов Число листьев Длины побегов 31 2 к 32 2 <2 33 0 0 34 0 р. 35 7 У) г/ 55 5К уА 36 3 J£L 27 в Рис. 24. Примеры записи данных. Обратите внимание на наличие даты и информацию о том, что и где измеряли (а — измеряли длины годичных побегов елей на экспериментальном участке «Медное»; б — измеряли замедленную флюоресценцию хлорофилла (код «PSM») у эксперимен- тальных берез в пос. Октябрьский; в — подсчитывали число листьев и из- меряли длины годичных побегов саженцев берез на экспериментальном участке «1218»). 157
Практическая рекомендация 22. Если в записи допущена ошиб- ка, то категорически не рекомендуется исправление путем переписы- вания поверх ошибочной записи. Ошибочную запись следует зачер- кнуть и рядом внести новую (рис. 25). £ 43& -{,4 ю. Б 31 130 34 422 ( 3<9. ез 35 6.9 а б 'ЗД ^/5 в & 22> Рис. 25. Примеры исправления записей (а, б — правильно; в, г — непра- вильно). Практическая рекомендация 23. В конце каждого рабочего дня необходимо убедиться в том, что все сделанные записи датированы, читаемы и не могут впоследствии быть неправильно поняты (или не поняты вообще). Практическая рекомендация 24. Все сокращения, кроме стан- дартных, должны быть расшифрованы в том же документе (бланке, блокноте), где они используются. Все исходные данные, включая как записи, так и исследован- ные пробы (в случае неразрушающего анализа) необходимо хранить как минимум до публикации результатов исследования. После это- го пробы, как правило, выбрасывают. Это достаточно расточитель- но, поскольку на их сбор были потрачены значительные усилия, и в дальнейшем эти пробы могли бы быть использованы другими спе- циалистами. Кроме того, в условиях быстро изменяющейся окру- жающей среды и постоянно совершенствующихся методов анали- за ценность проб, собранных десятилетия тому назад, неуклонно возрастает. В связи с этим в некоторых странах созданы депозита- рии для материалов определенного типа, в которые ученые могут (на добровольной основе) передать свои пробы. В России центра- лизованные депозитарии для экологических проб пока что отсутст- вуют, однако во многих учреждениях сохраняют часть материала, получаемого в ходе флористических и фаунистических исследо- ваний. 158
В тех случаях, когда собран значительный объем первичной ин- формации, желательно публиковать эти данные в виде электронных приложений к журнальным статьям. Опция электронных приложе- ний доступна в значительном количестве международных экологи- ческих журналов, и доля этих журналов неуклонно растет. При этом сохраняется авторство данных, а за счет возможного использования информации другими исследователями возрастает количество ссы- лок на публикацию.
Заключение Вклад результатов конкретного научного исследования в общее развитие науки возрастает с увеличением их доступности для кол- лег, то есть заинтересованных читателей. Как правило, в экологии высокую доступность результатов обеспечивает их публикация в одном из международных (выходящих на английском языке) журна- лов, реферируемых Институтом научной информации. Такие журна- лы, особенно те из них, которые имеют высокий импакт-фактор (см. определение 1), предпочитают публиковать статьи, нацеленные на экспериментальную проверку гипотез, а успешная подготовка статей подобного типа возможна лишь на основе тщательно составленных экспериментальных планов. Таким образом, планирование представ- ляет собой важнейшую часть научно-исследовательской деятель- ности, поскольку оно во многом определяет как качество конечного продукта, так и его доступность для потенциальных пользователей. На практике это означает, что еще до начала сбора данных исследо- ватель должен четко представлять себе план статьи, которая будет написана на основании анализа этих данных. Ученый должен быть способен четко и логично объяснить любо- му человеку, в том числе и не знакомому с узкой областью проводи- мых исследований, какую проблему он решает и на какие вопросы пытается ответить. Помните, что логика — одна из основ планиро- вания научно-исследовательской работы. Нарушения логики могут привести к необходимости переделки всей работы. Планирование экологического эксперимента, как правило, вклю- чает решение следующих задач (однако не ограничивается этим): • формулировку цели и задач исследования; • формулировку нулевой и (часто) альтернативной гипотез либо вопросов, на которые необходимо ответить; • определение того, что считать генеральной совокупностью при- менительно к целям исследования; • определение того, что считать экспериментальной и измеряемой единицами применительно к структуре экспериментального плана; • определение приемлемых вероятностей ошибок первого и вто- рого рода; • предварительную оценку величины эффекта, который планиру- ется обнаружить (или задание точности планируемых измерений); 160
• составление схемы эксперимента (или нескольких альтернатив- ных схем); • при необходимости — формирование критерия оптимальности и выбор оптимальной схемы исследования; • расчет объема выборок (при заданной силе анализа) либо оцен- ку мощности анализа (при фиксированном количестве эксперимен- тальных единиц, которые может использовать ученый); • составление детальной инструкции для проведения экспери- мента; • подготовку форм для записи полученной информации. Следует помнить, что экспериментальный план, который привел к успеху какого-либо исследования, вовсе не обязательно окажется удовлетворительным в иных случаях, отличающихся постановкой за- дач или проверяемыми гипотезами. Большинство элементов экспери- ментального плана (такие, например, как количество повторностей) можно рассчитать исходя из заданных граничных условий. И наконец, не следует забывать, что для составления плана иссле- дования необходимо понимание логики применяемых методов. Ме- ханическое использование приведенных в книге расчетных методов не гарантирует от ошибок в планировании экологических исследо- ваний.
Список литературы Литература, использованная при подготовке основного текста книги и рекомендуемая экологам, не имеющим специальной математической подготовки Ашмарин И.П., Васильев Н.Н., Амбросов В.А. 1971. Быстрые методы ста- тистической обработки и планирование экспериментов. Л.: Ленингр. гос. ун-т. 76 с. Вознесенский В.Л. 1969. Первичная обработка экспериментальных данных: практические приемы и примеры. Л.: Наука. 84 с. Воробейчик Е.Л., Козлов М.В. 2012. Воздействие точечных источников эмиссии поллютантов на наземные экосистемы: методология исследова- ний, экспериментальные схемы, распространенные ошибки // Экология. Вып.2. С.83-91. (ipae.uran.ru/pdf/personal/e.l.vorobeichik/2012_3_rus_ Vorobeichik_Kozlov.pdf). Зорин Н.А. 2000. О неправильном употреблении термина «достоверность» в российских научных психиатрических и общемедицинских статьях // Биометрика, (www.biometrica.tomsk.ru/letl.htm). Ивантер Э.В., Коросов А.В. 2005. Элементарная биометрия: учеб, пособие. Петрозаводск: Петрозаводский гос. ун-т. 104 с. Козлов М.В. 2003. Мнимые повторности (pseudoreplication) в экологических ис- следованиях: проблема, не замеченная российскими учеными // Журн. общ. биол. Т.64. Вып.4. С.292-307, (www.biometrica.tomsk.ru/kozlov_2.htm). Козлов М.В., Воробейчик Е.Л. 2012а. Воздействие точечных источников эмиссии поллютантов на наземные экосистемы: представление резуль- татов в публикациях // Экология. Вып.4. С.243-251, (ipae.uran.ru/pdf/ personal/e.l. vorobeichik/2012_4_rus_Kozlov_Vorobeichik.pdf). Козлов М.В., Воробейчик Е.Л. 20126. Осторожно — некорректные подходы к анализу данных, или об использовании непараметрических методов в ботанических исследованиях // Бот. журн. Вып.З. С.402-410, (ipae.uran.ru/ pdf/personal/e.l. vorobeichik/2012_2_ Kozlov_Vorobeichik.pdf). Козлов М.В., Хелберт С.Х. 2006. Мнимые повторности, бесплодные дис- куссии и интернациональная сущность науки: ответ Д. В. Татарникову // Журн. общ. биол. Т.67. Вып.2. С. 145-152. (www.biometrica.tomsk.ru/ kozlov_l.htm). Леонов В.П. 1999. Долгое прощание с лысенковщиной // Биометрика, (www. biometrica.tomsk.ru/lis.htm). Любищев А.А. 1986. Дисперсионный анализ в биологии. М.: Моск. гос. ун-т. 200 с. Любищев А.А. 1969. Об ошибках в применении математики в биологии. I. Ошибки от недостатка осведомленности // Журн. общ. биол. Т.ЗО. Вып.5. С.572-584. 162
Любищев А.А. 1969. Об ошибках в применении математики в биологии. II. Ошибки, связанные с избытком энтузиазма // Журн. общ. биол. Т.ЗО. Вып.6. С.715-723. Мхеидзе М.О., Мирвис А.Б. 1975. К вопросу об определении величины вы- борки // Биометрические методы. М.: Наука. С.90-91. Советы молодому ученому: метод, пособие для студентов, аспирантов, млад- ших науч, сотрудников и, может быть, не только для них. 2011. Е.Л. Во- робейчик (ред.). Екатеринбург: ИЭРиЖ УрО РАН. 122 р. (ipae.uran.ru/pdf/ smu/Sovety_2011 .pdf). Терентьев П.В., Ростова Н.С. 1977. Практикум по биометрии. Л.: Ленингр. гос. ун-т. 152 с. Шитиков В.К., Розенберг Г.С., Крамаренко С.С., Якимов В.Н. 2008. Совре- менные подходы к статистическому анализу экспериментальных дан- ных // Г.С. Розенберг, Д.Б. Гелашвили (ред.). Проблемы экологического эксперимента: планирование и анализ наблюдений. Тольятти: Ин-т эко- логии Волжского бассейна РАН. С.212-250. (www.ievbras.ru/ecostat/Kiril/ Download/Mepe.pdf). Шмидт В.М. 1984. Математические методы в ботанике. Л.: Ленингр. гос. ун- т. 288 с. Cochran W.G., Сох G.M. 1957. Experimental designs. 2nd ed. N.Y.: Chapman & Hall, vii + 617 p. Colquhoun D. 1971. Lectures on biostatistics: an introduction to statistics with applications in biology and medicine. Oxford: Clarendon Press. 425 p. Cox D.R. 1958. Planning of experiments. N.Y.: Wiley & Sons. 308 p. Design and analysis of ecological experiments. 2001. S.M. Scheiner, J. Gurevitch (eds.). N.Y: Oxford Univ. Press. 413 p. Dixon W.J., Massey F.J., Jr. 1983. Introduction to statistical analysis. 4th ed. N.Y: McGraw-Hill, xv + 678 p. Eberhardt L.L. 1978. Appraising variability in population studies // J. Wildl. Manage. Vol.42. P.207-238. Experimental ecology: issues and perspectives. 1998. W.J. Resetarits, J. Bernardo (eds.). N.Y: Oxford Univ. Press. 470 p. Fabricius K.E., De’ath G. 2004. Identifying ecological change and its causes: a case study on coral reefs // Ecol. Appl. Vol. 14. P. 1448-1465. Fisher R. 1935. The design of experiments. Edinburgh & London: Oliver & Boyd, xi + 252 p. Fox G.A. 1991. Practical causal inference for ecoepidemiologists // J. Toxicol. Environ. Health. Vol.33. P.359-373. Green R.H. 1979. Sampling design and statistical methods for environmental biologists. N.Y: Wiley & Sons. 257 p. Grime J.P. 1979. Plant strategies and vegetation processes. Chichester: Wiley. 222 s. Hairston N.G. 1991. Ecological experiments: purpose, design, and execution. N.Y: Cambrigde Univ. Press. 370 p. 163
Handbook of meta-analysis in ecology and evolution. 2013. J. Koricheva, J. Gurevitch, K. Mengersen (eds.). Princeton: Princeton Univ. Press. 514 p. Hill A.B. 1965. Environment and disease: association or causation // Proc. Royal Soc. Med. bond. Vol.58. P.295-300. Hurlbert S.H. 1984. Pseudoreplication and the design of ecological field experiments // Ecol. Monogr. Vol.54. P. 187-211. Jennions M.D., Moller A.P. 2003. A survey of the statistical power of research in behavioral ecology and animal behaviour // Behav. Ecol. Vol. 14. P.438-455. Johnson D.H. 2002. The importance of replication in wildlife research // J. Wildl. Manage. Vol.66. P.919-932. Kotze D.J., O’Hara R.B. 2009. Preface to Methods in Ecological Research // Ann. Zool. Fenn. Vol.46. P.81. Kozlov M.V., Zvereva E.L., Zverev V.E. 2009. Impacts of point polluters on terrestrial biota: comparative analysis of 18 contaminated areas. Dordrecht: Springer, xvii + 466 p. Krebs C.J. 1989. Ecological methodology. N.Y.: Harper & Row. 654 p. Laara E. 2009. Statistics: reasoning on uncertainity, and the insignificance of testing null //Ann. Zool. Fenn. VoL46. P. 138-157. Lipsey M.W. 1990. Design sensitivity: statistical power for experimental research. N.Y.: Sage. 207 p. Lipsey M.W., Hurley S.M. 2009. Design sensitivity: statistical power for applied experimental research // L. Bickman, D.J. Rog (eds.). The Sage handbook of applied social research methods. 2nd ed. Thousand Oaks: Sage. P.44-76. Smith D.R., Hardy I.C.W., Gammell M.P. 2011. Power rangers: no improvement in the statistical power of analyses published in Animal Behaviour // Anim. Behav. Vol.81. P.347-352. Sokal R.R., Rohlf F.J. 2000. Biometry: the principles and practice of statistics in biological research. 3rd ed. N.Y: Freeman & Co. 887 p. Underwood A.J. 1997. Experiments in ecology: their logical design and interpre- tation using analysis of variance. Cambridge: Cambridge Univ. Press, xviii + 504 p. Zvereva E.L., Kozlov M.V. 2010. Responses of terrestrial arthropods to air pollution: a meta-analysis // Environ. Sci. and Pollut. Res. V.17. P.297-311. Zar J.H. 1984. Biostatistical analysis. 2nd ed. Englewood Cliffs: Prentice-Hall. 718 p. Литература, использованная при подготовке примеров Агиков И.Н. 2011. Биоиндикация воздействия аэротехногенных поллютантов цветной металлургии на сосну обыкновенную как показатель состояния лесных экосистем // ЭКиП: Экология и промышленность России. Вып.7. С.26-28. 164
Аникеев Д.Р., Юсупов И.А., Луганский Н.А., Залесов С.В., Лопатин К.И. 2006. Влияние продуктов сжигания попутного газа при добыче нефти на репродуктивное состояние сосновых древостоев в северотаежной подзо- не // Экология. Вып.2. С. 122-126. Бояринова Ю.Г., Бабушкина О.В. 2010. Реальны ли экологические отличия инвазионных видов птиц от типичных мигрантов? (на примере длинно- хвостой синицы Aegithafos с. caudatus) И Экология. Вып.5. С.383-388. Васильев А.Г., Васильева И.А., Большаков В.Н. 2010. Эволюционно-эколо- гический анализ закономерностей феногенетической изменчивости гомо- логичных морфоструктур: от популяций до экологических рядов видов // Экология. Вып.5. С.323-329. Вершинин В.Л. 2010. Топография морфологических аномалий и формирова- ние брачных пар у жаб Bufo bufo L., 1758 и В. viridis Laur., 1768 // Эколо- гия. Вып.4. С.305-309. Влияние промышленного атмосферного загрязнения на сосновые леса Коль- ского полуострова. 1990. Б.Н. Норин, В.Т. Ярмишко (ред.). Л.: Ботан. ин-т им. В. Л. Комарова АН СССР. 195 с. Ильяшук Б.П., Ильяшук Е.А. 2000. Палеоэкологический анализ сообществ хирономид горного озера как информационный источник для биомонито- ринга// Экология. Вып.5. С.384-389. Катаев Г.Д., Гилязов А.С. 2005. Роль позвоночных животных в изучении про- цессов техногенной трансформации северо-таежных экосистем (Коль- ский полуостров) // Международный контактный форум по сохранению местообитаний в Баренцевом регионе. Четвертое совещание: тез. докл. 19-25 сент. 2005 г., Сыктывкар, Республика Коми, Россия. Сыктывкар: Ин-т биологии. С.79-80. Коршиков И.И., Терлыга Н.С., Бычков С.А. 2002. Популяционно-генети- ческие проблемы дендротехногенной интродукции. Донецк: Лебедь. 326 с. Лесные экосистемы и атмосферное загрязнение. 1990. В.А. Алексеев (ред.). Л.: Наука. 197 с. Малышева Г.С., Малаховский П.Д. 2000. Пожары и их влияние на раститель- ность сухих степей // Бот. журн. Т.85. Вып.1. С.96-103. Мещеряков П.В., Прокопович Е.В., Коркина И.Н. 2003. Экологические ус- ловия реализации биогенно-аккумулятивных ЭПП в техногенных ланд- шафтах в зоне влияния СУМЗа // Биологическая рекультивация нарушен- ных земель. Материалы международной конференции, Екатеринбург, 3-7 июня 2002 г. Екатеринбург: УрО РАН. С.344-352. Моуэт Ф.М.-Г. 1993. Не кричи: «Волки!» [Рассказ об экспедиции в тундру: Пер. с англ.] М.: Тропа. 153 с. Носкова Л.М., Шуктомова И.И., Симакова Ю.С. 2010. Моделирование про- цессов биологического поглощения урана и радия в условиях техноген- ного загрязнения // Экология. Вып.5. С.365-371. 165
Онучин А.А., Козлова Л.Н. 1993. Структурно-функциональные изменения хвои сосны под влиянием поллютантов в лесостепной зоне Средней Си- бири // Лесоведение. Вып.2. С.39-45. Остроумов С.А. 2000. Роль химических сигналов в индукции нерестовой миграции кеты Oncorhynohs keta (Waldbaum) // Экология. Вып.З. С.228- 230. Пааль Т.В., Пааль Я.Л. 1989. Структура ценопопуляций брусники Vaccinium vitis-idaea L. Таллин: Валгус. 211с. Сафонкин А.Ф. 2008. Репродуктивное поведение, полиморфизм и хемоком- муникация как факторы поддержания разнообразия в семействе листо- верток (Lepidoptera: Tortricidae). Автореф. дисс. на соиск. уч. степ, д-ра биол. н. М.: Ин-т проблем экологии и эволюции им. А. Н. Северцова. 47 с. Смирнов К.А. 2001. Влияние лося на формирование подроста и подлеска в ельниках южной тайги // Лесоведение. Вып.2. С.46-52. Тихонова И.В., Семериков В.Л. 2010. Генетический полиморфизм карлико- вых сосен на юге Средней Сибири // Экология. Вып.5. С.330-335. Freeman D.C., Graham J.H., Emlen J.M. 1993. Developmental stability in plants — symmetries, stress and epigenesis // Genetica. Vol.89. P.97-119. Karban R., Baldwin LT. 1997. Induced responses to herbivory. Chicago & London: Univ, of Chicago Press. 319 p. Kozlov M.V., Zvereva E.L. 2007. Industrial barrens: extreme habitats created by non-ferrous metallurgy // Reviews Environ. Sci. Biotechnol. Vol.6. P.231-259. Lomolino M.V., Weiser M.D. 2001. Towards a more general species-area relationship: diversity on all islands, great and small // J. Biogeogr. Vol.28. P.431-445. Moor-Jankowski J., Wiener A.S., Gordon E.B. 1964. Blood groups of apes and monkeys: I. The ABO blood groups in baboons // Transfusion. Vol.4. P.92-100. Palmer A.R., Strobeck C. 2003. Fluctuating asymmetry analyses revisited // M. Polak (ed.). Developmental instability: causes and consequences. Oxford: Oxford Univ. Press. P.279-319. Wiener A.S., Moor-Jankowski J. 1969. The A-B-0 blood groups of baboons 11 Amer. J. Phys. Anthropol. VoL30. P.117-122. Yoccoz N.G. 1991. Use, overuse, and misuse of significance tests in evolutionary biology and ecology // Ecol. Soc. Amer. Bull. Vol.72. P. 106-111. Zverev V.E., Zvereva E.L., Kozlov M.V. 2008. Slow growth of Empetrum nigrum in industrial barrens: combined effect of pollution and age of extant plants 11 Environ. Poll. Vol. 156. P.454-460. Zvereva E.L., Kozlov M.V. 1996. Avoidance of willows from moderately polluted area by leaf beetle, Metasoma lapponica (Coleoptera, Chrysomelidae): effects of emission or induced resistance? // Entomol. Exp. Appl. Vol.79. P.355-362. Zvereva E.L., Kozlov M.V, Neuvonen S. 1995. Population density and performance of Metasoma lapponica (Coleoptera: Chrysomelidae) in surroundings of smelter complex // Environ. Entomol. Vol.24. P.707-715. 166
Zvereva E.L., Toivonen E., Kozlov M.V. 2008. Changes in species richness of vascular plants under pollution impact: a global perspective // Global Ecol. Biogeogr. Vol. 17. P.305-319. Zvereva E.L., Zverev V.E., Kozlov M.V. 2012. Little strokes fell great oaks: minor but chronic herbivory substantially reduces birch growth // Oikos. Vol. 121. P.2036-2043. Литература, рекомендуемая экологам, имеющим специальную математическую подготовку Гринин А.С., Орехов Н.А., Новиков В.Н. 2003. Математическое моделирова- ние в экологии: учеб, пособие для студентов вузов. М.: ЮНИТИ-ДАНА. 269 с. Ермаков С.М. 1987. Математическая теория оптимального эксперимента: учеб, пособие для вузов по спец. «Прикл. математика». М.: Наука. 318 с. Планирование эксперимента в биологии и сельском хозяйстве: учеб, пособие для слушателей ФПК. 1991. В.Н. Максимов (ред.). М.: Изд-во Моск. гос. ун-та. 219 с. Рафалес-Ламарка Э.Э., Николаев В.Г. 1971. Некоторые методы планирования и математического анализа биологических экспериментов. Киев: Наукова Думка. 119 с. Саушев А.В. 2001. Планирование эксперимента: учеб, пособие. СПб.: С.-Петерб. гос. ун-т вод. коммуникаций. 97 с. Серафинович Л.П. 2006. Планирование эксперимента: учеб, пособие. 2-е изд. Томск: В-Спектр. 127 с. Clarck J.S. 2005. Why environmental scientists are becoming Bayesians // Ecol. Lett. Vol.8. P.2-14. Ellison A.M. 2004. Bayesian inference in ecology // Ecol. Lett. Vol.7. P.509-520. McCarthy M.A. 2007. Bayesian methods for ecology. Cambridge: Cambridge Univ. Press. 306 p.
Предметный указатель1 аксиома 80 величина эффекта 6,8,16,18,25-29,36, 85, 109, 127,128, 129, 133, 152, 160 вероятность 10, 12 выборка 16, 18, 41, 46-48, 59-62, 66, 82-83, 86-92, 95-96, 100-110, 113, 115-117, 119-121, 127-128, 131- 135, 146, 152 выборка несмещенная 46-47 выборка репрезентативная 46-47 вывод вероятностный 14, 16-18,46-48, 55,66 вывод интуитивный 12, 14 генеральная совокупность 16-17, 36, 46-51, 54, 57, 60, 66, 75, 82, 86-87, 92, 101, 104-106, 116, 160 гипотеза 16-17, 20-21, 23-25, 30, 35, 41, 43-44, 59, 62, 65, 78, 80-87, 90, 93-94, 96, 98, 100, 109-110, 115-116, 119-120, 131, 141, 152, 160-161 гипотеза альтернативная 8, 15-16, 81, 85-86 гипотеза научная 80 гипотеза нулевая 8, 11, 15, 18, 59-60, 81, 83-85, 87-94, ПО, 115, 128, 130-131, 133, 160 гипотеза, тестирование 36, 81, 84-86, 119, 134 достоверность 18-19 единица измеряемая 21, 36, 54-59, 68, 74, 141, 160 единица экспериментальная 4, 21, 24, 36, 54-60, 62, 64-70, 72, 74-76, 78- 79, 92, 127-128, 136, 160-161 естествоиспытание 22 задача исследования 21, 26, 41, 43-46, 48, 55-56, 72, 84, 138, 160 импакт-фактор 4, 29-30, 84-85, 160 интервал доверительный 8, 47, 101, 103, 105 исследования подтверждающие 81 исследования поисковые 81 квадрат греко-латинский 73-74 квадрат латинский 70-74 контроль 23-24, 52, 57, 62-70, 72, 76- 78, 86, 120, 128 коэффициент вариации 104 критерии Хилла 25 критерий оптимальности 37-40,95,161 критерий Поппера 80 математическое ожидание 11 мета-анализ 26-29, 31, 49, 85, 128 мощность анализа 9, 39, 86, 92, 110, 115, 119, 127-130, 132, 134-136 наблюдение 3, 11, 14-15, 20-21, 49, 59, 80 название публикации 49-53, 58 независимость статистическая 54, 59 объем выборки 5-6, 16, 18, 37, 95-96, 100-107, 109-110, 114-115, 120- 121, 127, 131-133 оценка несмещенная 60-61, 145 оценка смещенная 29, 60-62, 145-146 ошибка абсолютная 8, 101-102, 104— 105 ошибка второго рода 6,9,36,38,85-86, 90, 92-96, 128, 134 ошибка относительная 8, 101-102, 104, 106, 149 ошибка первого рода 9, 66, 86, 93-95, 109, 115, 127 план эксперимента 3, 5, 30-31, 35-36, 39, 46, 57, 59, 64-65, 67-68, 72-74, 79, 92, 109, 127, 130, 135-138, 152, 160-161 планирование эксперимента 4-6, 21, 34-39,46, 59, 68, 70, 78-79, 92, 109, 127, 130, 135-138, 152, 160-161 пробная площадь 50, 60-61, 74-76, 115, 133 рандомизация 66, 69, 75-77 1 Полужирным шрифтом набран номер страницы, на которой приведено опреде- ление понятия. 168
связи причинно-следственные 18, 22- 26,41,53 событие невозможное 10 событие случайное 10 событие, вероятность 10 суждение вероятностное 13-14 суждение истинное 14 теория вероятностей 10-11, 13 тест двусторонний 128 тест односторонний 16, 110, 128 тест слепой 24, 62, 150 точность измерения 13, 36, 141, 145— 150, 152 точность оценки 4, 11, 36-37, 39-40, 46, 60, 101-102, 104-107, 117 уровень значимости 5, 8-9, 16, 83, 85, 86-88, 90, 102, 108-110, 115, 119, 127, 129, 131-132, 134-135 уровень значимости достигнутый 10, 14, 32 уровень ошибки, допустимый 101 цель исследования 41-45, 139-140, 152 цифра значащая 148-149 шкала 142 шкала абсолютная 143-145, 147, 149 шкала интервальная 142, 145, 147 шкала наименований 142, 145 шкала порядковая 142-143, 145, 149 эксперимент 3-4, 20, 40, 48, 54-58, 65, 73, 78-80, 97-100, 119, 131, 151, 160 эксперимент активный 20-23, 43, 64- 66, 68-69 эксперимент измерительный 20 эксперимент контролируемый 20, 29- 30, 49, 62-64,81,84, 92 эксперимент лабораторный 30, 40, 52, 69, 78 эксперимент мысленный 21-22 эксперимент пассивный 20-22, 24-25, 43, 74-78 эксперимент полевой 30-31,40, 52, 102
Оглавление Введение, или зачем и как читать эту книгу....................3 Условные обозначения..........................................8 Глава 1. Статистический образ мышления.......................10 1.1. Вероятность случайного события.......................10 1.2. Статистический подход к событиям повседневной жизни..11 1.3. Суждения вероятностные и истинные.....................13 1.4. Учимся понимать статистические выводы.................14 1.5. Что значит «достоверно»?..............................18 Глава 2. Экспериментальный метод в современной экологии......20 2.1. Базовые понятия......................................20 2.2. Установление причинно-следственных связей в активном и пассивном эксперименте...................22 2.3. Мета-анализ как эффективный способ статистического обобщения результатов независимых исследований...........26 2.4. Описание методики и результатов эксперимента.........29 Глава 3. Планирование эксперимента в экологических исследованиях.............................................34 3.1. Планирование эксперимента в практике работы зарубежных и российских ученых........................34 3.2. Планирование эксперимента как часть научного исследования.............................................35 3.3. Выбор экспериментальной схемы с помощью критерия оптимальности.............................................37 3.4. Широта выводов, их реалистичность и точность полученных оценок.........................................39 Глава 4. Цель и задачи исследования, генеральная совокупность и выборка.................................................41 4.1. Цель и задачи иследования............................41 4.2. Генеральная совокупность и выборка...................46 4.3. Отражение выбора генеральной совокупности в названии работы...................................................49 Глава 5. Основные принципы организации эксперимента..........54 5.1. Экспериментальная единица и измеряемая единица.......54 5.2. Статистическая независимость и структура экспериментального плана.................................59 5.3. Взятие репрезентативной выборки......................60 5.4. Способы борьбы с ошибками в контролируемых экспериментах ...........................................62 5.5. Выбор контроля в условиях активного эксперимента.....64 5.6. Рандомизация в условиях активного эксперимента.......66 170
5.7. Пространственное размещение экспериментальных единиц в условиях активного эксперимента........................68 5.8. Выбор экспериментальных единиц в условиях пассивного эксперимента.............................................74 5.9. Способы увеличения точности эксперимента............78 Глава 6. Формулировка гипотез и подготовка к их экспериментальной проверке................................80 6.1. Наблюдения и разработка гипотез.....................80 6.2. Принципы формулировки гипотез и их статистической проверки.............................81 6.3. Отношение экологов к тестированию гипотез...........84 6.4. Два типа ошибок при тестировании гипотез............86 6.5. Ответственность перед обществом и учет малых вероятностей.............................................93 6.6. Использование последовательного статистического анализа ... 95 Глава 7. Определение объема выборки.........................101 7.1. Объем выборки, необходимой для оценки изучаемого параметра с заданной точностью...........................101 7.2. Объем выборки, необходимой для нахождения редко встречающегося объекта...................................107 7.3. Объемы выборок, необходимых для проверки статистических гипотез о коэффициентах корреляции........109 7.4. Объемы выборок, необходимых для проверки статистических гипотез о средних значениях нормально распределенного признака................................116 Глава 8. Расчет мощности анализа...........................127 8.1. Факторы, влияющие на мощность анализа..............127 8.2. Мощность анализа в экологических исследованиях.....128 8.3. Расчет мощности корреляционного анализа............131 8.4. Расчет мощности дисперсионного анализа.............134 Глава 9. Подготовка к сбору данных.........................138 9.1. Выбор изучаемых характеристик......................138 9.2. Выбор шкалы и определение точности измерения.......142 9.3. Проверка воспроизводимости результатов.............149 9.4. Предварительный сбор информации, подготовка инструкций и форм для записи данных.....................151 9.5. Запись и хранение данных...........................156 Заключение.................................................160 Список литературы..........................................162 Предметный указатель.......................................168
Научное издание КОЗЛОВ Михаил Васильевич Планирование экологических исследований: теория и практические рекомендации. Москва: Товарищество научных изданий КМК. 2014. 172 с. при участии ИП Михайлова К.Г Оригинал-макет: Т.А. Горлина Для заявок: 123100, Москва, а/я 16, Издательство КМК электронный адрес mikhailov2000@gmail.com http ://avtor-kmk.ru Подписано в печать 30.04.2014. Заказ № Формат 60x90/16. Объём 11 п.л. Бумага офсетн. Тираж 400 экз. Отпечатано в ООО «Галлея-Принт», Москва, ул. 5-я Кабельная, 26