Текст
                    УДК 51(075.8)
ББК22.1я73
М997
Высшая математика и ее приложения к биологии
Рецензенты:
доктор физико-математических наук, профессор Ю. С. Хохлов (зав. кафедрой
математической статистики и эконометрики Тверского государственного
университета);
кандидат физико-математических наук, доцент А. Б. Плаченов (Московский
государственный институт радиотехники, электроники и автоматики
(технический университет))
Мятлев В.Д.
М997 Теория вероятностей и математическая статистика. Мате-
матические модели : учебное пособие для студ. высш. учеб,
заведений / В.Д. Мятлев, Л.А. Панченко, Г.Ю. Ризниченко,
А. Т. Терехин. — М.: Издательский центр «Академия», 2009. —
320 с. — (Университетский учебник. Высшая математика и ее
приложения к биологии).
ISBN 978-5-7695-4704-1
В учебном пособии изложены преимущественно вопросы анализа био-
логических данных и в качестве основы использованы методы теории
вероятностей и математической статистики; представлено моделирова-
ние динамики биологических процессов, основанное на применении ма-
тематического аппарата дифференциальных уравнений.
Для студентов биологических специальностей высших учебных заве-
дений.
УДК 51(075.8)
ББК 22.1я73
Оригинал-макет данного издания является собственностью Издательского
центра «Академия», и его воспроизведение любым способом без согласия
правообладателя запрещается
© Коллектив авторов, 2009
© Образовательно-издательский центр «Академия», 2009
ISBN 978-5-7695-4704-1 ©Оформление. Издательский центр «Академия», 2009

ПРЕДИСЛОВИЕ Учебное пособие по математике для биологических специ- альностей вузов основано на материале курса «Математиче- ские методы в биологии», преподаваемого с середины 80-х годов XX в. на биологическом факультете МГУ им. М. В. Ломоносова. В книге подробно рассматриваются разделы математики, нахо- дящие наибольшее применение в биологии (теория вероятностей и математическая статистика, теория дифференциальных урав- нений), с акцентом на их практическое использование в биоло- гических исследованиях. Книга состоит из двух частей (в учебной программе биоло- гического факультета МГУ эти части соответствуют третьему и четвертому семестрам общего математического обучения). За- дача первой части — обучение методам статистического анализа полевых и экспериментальных биологических данных на осно- ве методов теории вероятностей и математической статистики. Необходимо отметить, что теория вероятностей, имеющая са- мостоятельную прикладную ценность, в данном контексте рас- сматривается главным образом в качестве методологической и аппаратной основы математической статистики. Задача второй части — обучение построению и анализу математических мо- делей, описывающих динамику биологических процессов, с ис- пользованием дифференциальных и дискретных рекуррентных уравнений. Первая часть книги написана В. Д. Мятлевым, Л. А. Панчен- ко и А. Т. Терехиным, вторая — Г. Ю. Ризниченко.
ВВЕДЕНИЕ Цель учебного пособия — обучить студентов применению ма- тематических методов в биологических исследованиях, или, ина- че, построению и анализу математических моделей биологиче- ских объектов, которые часто называют биологическими си- стемами, чтобы подчеркнуть их сложность. Модель — это аналог моделируемого объекта, более до- ступный для исследования. Модели могут быть как натур- ными (например, уменьшенная модель самолета или автомо- биля, испытываемая в аэродинамической трубе, или животное, используемое в качестве модели человека при определении ток- сичности нового лекарственного средства), так и абстрактны- ми. Не замечая этого, мы постоянно пользуемся абстрактными вербальными (словесными) моделями и, следует признать, что они удовлетворяют подавляющую часть наших потребностей не только в повседневной, но также в научной и производственной деятельности. Математические модели, основанные на ис- пользовании чисел, символьных обозначений, графиков, стро- гих определений и правил вывода, также относят к абстрактно- му моделированию. По сравнению с вербальными моделями они более удобны для описания количественных, геометрических и структурных аспектов моделируемого объекта (системы) и ме- нее уязвимы в отношении скрытых логических пропусков и про- тиворечий. Математические модели можно классифицировать по раз- ным основаниям. В частности, их мо^кно разделить на вероят- ностные (вероятностно-статистические, стйатисти- ческие, стохастические) модели — в таких моделях прин- ципиально учитывается неполная предсказуемость результата при заданных известных условиях, и детерминистические модели, в которых исходные условия предопределяют получе- ние однозначного конечного результата. В первой части книги рассматриваются вероятностные, а во второй -|преимуществен- но детерминистические модели. * 4
Можно также разделить математические модели на функ- циональные и дифференциальные. Функциональные модели описывают связь одних характеристик моделируемого объекта с другими в виде функции или алгебраического уравнения (неяв- ной функции). В частности, эти модели могут описывать дина- мику поведения объекта, если аргументом функции служит вре- мя и/или возраст. Дифференциальные модели строятся на ос- нове описания локальных во времени и/или в пространстве свя- зей компонентов моделируемой системы. Они специально пред- назначены для моделирования динамики, которая, однако, в от- личие от функциональных моделей, в дифференциальных мо- делях задается неявно (локально), а ее явная функциональная зависимость от времени находится путем аналитического или численного (компьютерного) интегрирования модели. Диффе- ренциальные модели рассматриваются во второй части данной книги, функциональные — в первой. Функциональный характер вероятностно-статистических мо- делей наиболее явно проявляется в регрессионной модели, выражающей так называемую зависимую переменную у в виде функции одной или нескольких независимых переменных х с до- бавлением случайной ошибки е: У = /(®) + Е. Однако даже простая задача оценивания распределения ве- роятностей значений некоторой наблюдаемой величины у может рассматриваться как анализ вырожденной функциональной мо- дели вида У = в котором основное внимание сосредоточено на случайной ошиб- ке е. Дифференциальные модели, называемые также динамиче- скими системами и используемые для моделирования био- логических систем, чаще всего задаются с помощью систем дифференциальных уравнений. Заметим, что в последнем предложении слово «система» было использовано в трех раз- ных смыслах, обозначающих соответственно модель, моделиру- емый объект и средство моделирования (совокупность уравне- ний). Методологически более правильно было бы применить в этих трех случаях разные термины, однако следует учитывать сложившуюся практику и ориентироваться на контекст.
ЧАСТЬ I СТАТИСТИЧЕСКИЙ АНАЛИЗ БИОЛОГИЧЕСКИХ ДАННЫХ ГЛАВА 1 ОСНОВЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ Задача теории вероятностей состоит в построении и ана- лизе вероятностных математических моделей реальных явле- ний, учитывающих недетерминированные, случайные аспекты этих явлений. В биологии ввиду сложности изучаемых ею объектов и про- цессов особенно часто приходится пользоваться вероятностными моделями. Например, уже в такой простой задаче, как сравнение размеров самцов и самок некоторого вида животных, мы встре- чаемся с той трудностью, что отдельные особи, как самцы, так и самки, имеют разные размеры, причем некоторые самки круп- нее некоторых самцов, а некоторые самцы мельче некоторых са- мок. Выход состоит в рассмотрении данной ситуации с вероятност- ной точки зрения, согласно которой размеры отдельных особей представляют собой случайно выбранные значения из двух по- тенциально бесконечных множеств (генеральных совокупно- стей) самцов и самок данного вида. Вероятностное описание генеральной совокупности считает- ся заданным, если заданы доли встречаемости элементов всех возможных размеров в этой генеральной совокупности. Далее будет показано, что удобно задавать распределение долей разных размеров с помощью некоторой функции, назы- ваемой функцией распределения вероятностей. При та- ком подходе задача сравнения размеров самцов и самок сводит- ся к задаче сравнения соответствующих функций распределе- ния. Данная глава посвящена рассмотрению основных понятий теории вероятностей и математических свойств вероятностных моделей. 6
Для проверки адекватности вероятностных моделей и их под- гонки к реально наблюдаемым данным служат методы ма- тематической статистики, которые будут рассмотрены в гл. 2. 1.1. Случайные события и их вероятности Исходным понятием теории вероятностей является понятие случайного испытания (эквивалентные термины: опыт, эксперимент, наблюдение), т. е. действия, приводящего к некоторому результату, который, вообще говоря, нельзя одно- значно предсказать, зная комплекс условий проведения ис- пытания. Например, нельзя заранее наверняка угадать, гер- бом или решкой упадет подброшенная вверх монета. Нельзя од- нозначно предсказать пол будущего цыпленка по внешнему виду яйца. Предполагается, что случайное испытание можно повторять неограниченное число раз, сохраняя комплекс условий, но полу- чая, вообще говоря, разные результаты. 1.1.1. Пространство элементарных событий Множество интересующих нас возможных результатов, ко- торые могут произойти при проведении испытания с заданным комплексом условий, называют пространством (множест- вом) элементарных событий (иногда используют термин «пространство элементарных исходов»). Пространство элементарных событий Q = {со} должно быть полной систе- мой событий, а именно, в результате испытания обязательно должно произойти одно и только одно из элементарных событий (далее дано точное определение полной системы событий). При бросании монеты пространство элементарных событий состоит из двух элементарных событий: Q = {(01,6)2} — «герб» и «решка». При определении пола вылупившегося из яйца цып- ленка пространство элементарных событий также состоит из двух элементарных событий: Q = {(01,(02} — «самец» и «сам- ка». При бросании кубика с пронумерованными от 1 до 6 гранями (игральная кость) пространство элементарных событий состоит из шести элементарных событий: Q = {(01,(02,(03,(04,(05,(06}, где (Oi соответствует номеру грани, которая оказывается после бро- сания наверху. 7
При определении массы новорожденного элементарными со- бытиями будут все возможные результаты взвешивания. Коли- чество элементарных событий в данном случае зависит от воз- можного диапазона изменения массы и точности взвешивания. Часто в подобных ситуациях удобно расширить множество эле- ментарных событий, отказавшись от указания диапазона изме- нения измеряемой величины и допустив неограниченную точ- ность измерения. В этом случае множество элементарных собы- тий будет состоять из всех действительных чисел от — оо до +оо. Конечно, при этом среди элементарных событий будут такие, ко- торые заведомо не могут появиться в результате испытания, на- пример —2 г, 1О100 г и т. п., однако включение в Q лишних невоз- можных элементарных событий не противоречит определению пространства элементарных событий. Пространство элементарных событий может порождаться не одной, а двумя и более измеряемыми характеристиками. Напри- мер, если одновременно фиксируются масса и рост новорож- денного, то пространство элементарных событий состоит из пар действительных чисел, т. е. геометрически представляет собой плоскость. 1.1.2. Операции над событиями Элементарные события можно объединять в более слож- ные события. Например, объединение элементарных событий {(01, соз, (05} при бросании кубика образует событие «выпаде- ние нечетного номера». Вообще, любое подмножество простран- ства элементарных событий называется случайным (состав- ным) событием, или просто событием. Событие Q, вклю- чающее все элементарные события, называется достоверным, или полным. Считается, что событие происходит, когда проис- ходит одно из составляющих его элементарных событий. Напри- мер, событие {(01,(03,(05} происходит, когда происходит или (0i, или (03, или (05. Полное событие происходит всегда, поскольку, по определению, в результате испытания обязательно должно про- изойти одно из элементарных событий. Полезно ввести понятие невозможного, или пустого, события 0, т. е. события, не со- держащего ни одного элементарного события. Невозможное со- бытие не происходит никогда. Поскольку все события являются множествами элементар- ных событий, их можно комбинировать, используя теоретико- множественные операции. 8
Объединением, или суммой, событий А и В называется событие (обозначается A U В или А + В), состоящее из всех эле- ментарных событий, входящих хотя бы в одно из событий А или В. Событие A U В происходит, когда происходит хотя бы одно из событий А или В. Пересечением, или произведением, событий А и В назы- вается событие (обозначается А П В или АВ), состоящее из всех элементарных событий, входящих одновременно и в А, и в В. Событие А П В происходит, когда происходят одновременно А и В. Дополнением, или отрицанием, события А называется событие (обозначается А), включающее все элементарные собы- тия, не входящие в А. Событие А происходит, когда не происхо- дит А. События А и В называются непересекающимися, или не- совместными, если их пересечение есть невозможное событие, т. е. АВ = 0. Система событий Ai, ... ,Ап называется полной системой событий, если Ai + ... + Ап = Q и AiAj = 0 для всех г ± j. Примером полной системы будет система всех элементарных событий Q = {со}. Любая пара событий А и А также представ- ляет собой полную систему. 1.1.3. Вероятности событий Понятие вероятности имеет два аспекта: содержательный и формально-математический. С содержательной точки зрения вероятность некоторого со- бытия определяется относительными шансами появления этого события по сравнению с другими событиями. Экспериментально эти шансы реализуются при многократ- ном повторении событий. Частота появления события в длинном ряду испытаний является естественной оценкой веро- ятности события. Точный смысл изложенному дает формальное аксиоматиче- ское определение вероятности. Для заданного пространства элементарных событий Q веро- ятностью события А называется функция Р(А), удовлетво- ряющая следующим аксиомам Колмогорова [А. Н. Колмогоров, 1974]: 1) Р(А) 0 для любого А; 2) Р(«) = 1; 9
3) Р(А1 + Л2 + • • •) = Р(Л1) + Г(Л2) + • • •, если AiAj = 0 для любых i 7^ j. Из приведенных аксиом непосредственно вытекают следую- щие свойства вероятности: 1)0^ Р(А) 1 для любого А; 2) Р(0) = 0; 3) Р[А + В) = Р(А) + Р(В) - Р(АВ). Замечание, Ранее случайное событие было определено как лю- бое подмножество множества Q. Однако, если, например, Q являет- ся множеством действительных чисел, то среди множества всех под- множеств этого множества можно найти подмножества А настолько необычные, можно сказать «уродливые» (так называемые неизмери- мые подмножества), что с ними нельзя связать какую-либо функ- цию Р(А) — см., например, [В. Н. Тутубалин, 1992]. Следовательно, не любое подмножество из Q может быть событием с точки зрения акси- оматического определения вероятности — оно должно быть измери- мым. С другой стороны, согласно аксиоме 3 счетное объединение со- бытий также должно быть событием. Эти два требования удовлетво- ряются, если события принадлежат некоторой о-алгебре измеримых подмножеств множества Q (т. е. они измеримы и их дополнения и ко- нечные или счетные объединения или пересечения принадлежат той же о-алгебре). В случае евклидова пространства такой о-алгеброй мо- жет быть о-алгебра борелевских множеств, образованная любы- ми параллелепипедами (в одномерном случае — отрезками), а также их дополнениями и конечными или счетными объединениями и пересе- чениями. Естественность аксиоматического определения вытекает из доказываемой на его основе теоремы Бернулли, связывающей аксиоматическое определение вероятности с ее частотной интер- претацией. Теорема Бернулли. Вероятность отклонения частоты по- явления события в п независимых испытаниях (понятие незави- симости будет введено позднее) от вероятности этого события Р(А) на величину, большую, чем заданное число е, стремится к 0 при п, стремящемся к бесконечности («частота стремится к ве- роятности по вероятности»): lim Р 11 — - Р(А) I > = 0, п—^оо 11 п \ ) где т — число появлений события А в п испытаниях. Эта теорема (она будет доказана далее при рассмотрении неравенства Чебышева, см. 1.2.5) утверждает, как нам и хоте- лось бы, что при увеличении числа испытаний частота стре- 10
мится к вероятности, однако не в обычном детерминированном смысле, а в вероятностном. При этом не исключается возмож- ность того, что даже при очень большом числе испытании может получиться значение частоты m/n, сильно отличающееся от ве- роятности Р(А), однако вероятность этого события очень мала. Например, не исключено, что при 100 бросаниях правильной мо- неты мы получим 100 «гербов», т. е. частоту т/п = 100/100 = 1, которая сильно отличается от вероятности Р(А) = 0,5, однако вероятность такого большого отклонения частоты от вероятно- сти Р(А) равна ничтожно малой величине у*?100- Другим доводом в пользу выбранной системы аксиом будет наличие конкретных вероятностных моделей, в которых эта си- стема аксиом естественна. Рассмотрим две такие модели. 1.1.4. Модель равновероятных элементарных событий В модели равновероятных элементарных событий (называемой также классической моделью вероятности) число элементарных событий конечно и они считаются равнове- роятными. Примерами могут служить испытания с бросанием монеты (два равновероятных события), кубика (шесть равнове- роятных событий) или результаты скрещивания двух гетерози- готных особей Аа (четыре равновероятных события: АЛ, Аа, аА, аа). Вероятность события в классической модели определяется как отношение числа элементарных событий, составляющих это событие, к числу всех элементарных событий. Например, ве- роятность получения потомка с доминантным признаком в ре- зультате скрещивания двух гетерозиготных особей равна 3/д, по- скольку это событие включает (часто говорят — «ему благопри- ятствуют») три элементарных события (АА, Аа и аА) из четы- рех возможных (опыт Менделя). Очевидно, что свойства вероятности, постулируемые в ак- сиоматическом определении, здесь непосредственно следуют из определения вероятности как отношения числа «благоприят- ствующих» элементарных событий к общему числу возможных равновероятных событий. Решение вероятностных задач с использованием классиче- ской модели часто облегчается применением комбинаторных формул. Эти формулы определяют число элементарных собы- тий в опытах, состоящих в случайном выборе элементов из п раз- личных элементов. При этом в постановке каждого такого опыта 11
строго указано, каким способом производится выбор и что пони- мается под различными выборами. Существуют две принципиально различные схемы выбора. В первой схеме выбор осуществляется без возвращения элемен- тов, т. е. каждый отобранный элемент исключается из исходного множества элементов. Назовем эту схему выбором без возвра- щения. Во второй схеме выбор осуществляется поэлементно с обязательным возвращением отобранного элемента на каждом шаге и тщательным перемешиванием исходного множества пе- ред следующим выбором. Назовем эту схему выбором с воз- вращением. После того как выбор осуществлен, отобранные элементы могут быть либо упорядочены в порядке выбора из ис- ходного множества (в этом случае будем говорить, что «поря- док выбора элементов важен»), либо нет (в этом случае бу- дем говорить, что «порядок выбора элементов не важен»). Следовательно, для определения числа способов выбора т элементов из исходного множества п элементов надо рассмот- реть четыре различные постановки задачи. 1. Выбор без возвращения. Порядок выбора важен. В этом случае для выбора первого элемента имеется п возможностей, второго — п — 1, третьего — п — 2 и так далее до m-го, для кото- рого остается п—т+1 возможностей. Это дает п(п—1)(п—2)... х х (п — т + 1) вариантов, называемых размещениями из п эле- ментов по т элементов. Умножив и разделив полученное выра- жение на (п — т)! = (п — т)(п — т — 1) • ... • 2 • 1, получаем следующую формулу для числа размещений: А™ = п\/(п — т)\ В частности, для числа размещений из п элементов по п эле- ментов, называемых также перестановками из п элементов, получаем Рп = А™ = п\ 2. Выбор без возвращения. Порядок выбора не важен. Чис- ло таких комбинаций, называемых сочетаниями из п элемен- тов по т элементов, получается делением числа размещений из п элементов по т элементов на число перестановок из т элемен- тов, равное т\ = т(т — 1)-.. .-2-1, что дает следующую формулу для числа сочетаний: С™ = n!/[m!(n — m)!]. 3. Выбор с возвращением. Порядок выбора важен. В этом слу- чае для выбора каждого из т элементов имеется п возможно- стей, что дает А™ = пт комбинаций, называемых размещени- ями с повторениями из п элементов по т элементов (заме- тим, что т может быть как меньше, так и больше п). 4. Выбор с возвращением. Порядок выбора не важен. В этом случае число комбинаций, называемых сочетаниями с по- 12
вторениями из п элементов по т элементов (т может быть как меньше, так и больше п), определяется формулой: С™ = Ц Действительно, сочетания с повторениями можно по- лучить как перестановки из п + т — 1 объектов, состоящих из т фишек и п — 1 разделителей. В этих перестановках фишки, ока- завшиеся перед первым разделителем, считаются элементами, принадлежащими к первому из п типов элементов, оказавшиеся после первого разделителя — принадлежащими ко второму ти- пу, после второго — к третьему и т. д. Поскольку внутренний по- рядок фишек и разделителей не влияет на результат, числе всех перестановок (п + т — 1)! надо разделить на число перестановок фишек т\ и число перестановок разделителей (п — 1)!, что дает приведенную выше формулу. Задачи для самостоятельного решения 1. Сколькими способами можно разместить 12 мышей, занумеро- ванных от 1 до 12, в четырех клетках А, В, С, D по три мыши в каж- дой? 2. В распоряжении агрохимика имеется шесть различных типов ми- неральных удобрений. Ему необходимо провести эксперименты по изу- чению совместного влияния любой тройки минеральных удобрений. Сколько всего экспериментов ему придется провести, если: а) порядок внесения удобрений несущественен? б) существенен? 3. Для лечения некоторой хронической болезни применяются пять лекарств а, 6, с, d, е. Врач хочет провести сравнительное исследование трех из этих пяти лекарств. Три исследуемых лекарства врач отбира- ет из данных пяти случайным образом. Чему равна вероятность того, что: а) лекарство а будет исследовано? б) будут исследованы лекар- ства а и 6? в) будет исследовано по крайней мере одно из лекарств а и 6? 4. Классифицируются п особей по г признакам, п г. Найдите ве- роятность того, что никакие две особи не принадлежат к одному и тому же классу. Все возможные распределения особей по классам равнове- роятны. 1.1.5. Геометрическая модель Рассмотрим некоторую область Q на плоскости площадью Sq. Определим вероятность произвольного участка А площадью Sa в этой области как долю его площади в площади всей обла- сти: Р(Л) - Sa/Sq. 13
С помощью такой модели можно, например, описать экспери-. мент, состоящий в регистрации попадания космической частиць на фотопластинку. Определение вероятности в соответствии с приведенной фор мулой полностью согласуется с аксиоматическим определением), поскольку из геометрических свойств площадей непосредствен- но следует, что Р(А) О, P(Q) = 1, и Р(А + В) = Р(А) + Р(В), если АВ = 0. 1.1.6. Условная вероятность и независимость Условной вероятностью Р(А\В) события А при условии, что произошло событие В, называют отношение Р(А|В) = Р(АВ) "Р(ВГ вероятности пересечения событий А и В к вероятности события В (предполагается, что Р(В) ф 0). Из определения условной вероятности непосредственно сле- дует правило умножения-. Р(АВ) = Р(А\В)Р(В) = Р(В\А)Р(А) — вероятность произведения событий равна произведению условной вероятности на вероятность условия. Рассматривая условные вероятности при условии В, мы фак- тически переходим к новому пространству элементарных собы- тий, которое является частью первоначального и включает толь- ко элементарные события, соответствующие событию В. Доля таких элементов в исходном пространстве элементарных собы- тий равна Р(В). Событие А\В можно интерпретировать как из- влечение элементарного события, соответствующего событию Л, из совокупности элементарных событий, соответствующих собы- тию В. Доля таких элементарных событий в исходном простран- стве элементарных событий равна Р(АВ), а доля их в В равна Р(АВ)/Р(В). Пример 1.1. Найдем вероятность того, что потомок, полу- ченный в результате скрещивания гетерозиготных родителей, гомозиготен, если он имеет доминантный признак. Вероятность наличия у потомка доминантного признака рав- на, как нам уже известно, 3/4. Вероятность гомозиготности при наличии доминантного аллеля, т. е. вероятность пересечения 14
событий {АА,аа} и {АА, Аа,аА}, равна вероятности события {АА}, т. е. у4. Таким образом, искомая условная вероятность равна 1/4 : 3/4 = Уз- С понятием условной вероятности тесно связано понятие не- зависимости событий, хотя можно определить понятие незави- симости и безотносительно к условной вероятности. Два события называются независимыми, если вероятность их пересечения равна произведению их вероятностей: Р(АВ) = Р(А)Р(В). Из этого определения сразу следует, что условная вероят- ность события А при условии, что произошло независимое со- бытие В, равна безусловной вероятности события А: Р(А|В) = Р(АВ) _ Р(Л)Р(В) Р(В) Р(В) = Р(А) и также, что условная вероятность события В при условии, что произошло независимое событие А, равна безусловной вероятно- сти события В: Р(В|А) = Р(ВА) _ Р(В)Р(Л) Р(А) Р(А) = Р(В). Более того, любое из условий Р(А|В) = Р(А) или Р(В|А) = = Р(В) влечет выполнение соотношения Р(АВ) = Р(А)Р(В), определяющего независимость. Пример 1.2. Рассмотрим два события: А — попадание ча- стицы в левую половину фотопластинки, В — попадание части- цы в нижнюю половину фотопластинки. События А и В име- ют вероятности у2. Событие АВ, соответствующее попаданию частицы в пересечение А и В, т. е. в левый нижний угол фото- пластинки, имеет вероятность у4. Поскольку у4 = у2 • У?, т. е. Р(АВ) = Р(А)Р(В), события А и В независимы. Пример 1.3. Зависимы ли события «наличие доминантно- го признака» {АА, Аа, аА} и гомозиготность {АА,аа}? Вероят- ность первого события равна 3/4, вероятность второго — у2. Ве- роятность их пересечения равна у. Поскольку % У 3/4 • у2, со- бытия не являются независимыми. К этому же выводу можно прийти иначе. В примере 1.1 было показано, что вероятность гомозиготности при наличии доми- 15
нантного аллеля равна Уз. Вообще же вероятность гомозиготно- го потомка равна Таким образом, условная вероятность не равна безусловной и, следовательно, события зависимы. Пример 1.4- Рассмотрим случайное испытание, состоящее из двух последовательных бросаний монеты. Результатом этого события будут четыре равновероятных элементарных события герб —герб, герб —решка, решка —герб, решка —решка (или ГГ, ГР, РГ, РР). Зависимы ли события «выпадение герба в первом бросании» А = {ГГ,ГР} и «выпадение герба во втором броса- нии» В = {ГГ,РГ}? Имеем Р(А) = */2, Р(В) = */2, Р(АВ) = = Р(ГГ) = !/4. Поскольку Р(АВ) = Р(А)Р(В), то события неза- висимы. Задачи для самостоятельного решения 1. Два охотника стреляют в волка, причем каждый производит по одному выстрелу. Для первого охотника вероятность попадания в цель равна 0,7, для второго — 0,8. Какова вероятность хотя бы одного по- падания? Как изменится результат, если охотники произведут по два выстрела? 2. Докажите, что события А и В (А и В) независимы, если незави- симы А и В. 3. Докажите, что если два события А и В с положительными веро- ятностями несовместны, то они зависимы. 4. Задача «осторожного фальшивомонетчика». Дворцовый чекан- щик кладет в каждый ящик вместимостью в 100 монет одну фальши- вую. Король подозревает чеканщика и подвергает проверке монеты, взятые наудачу по одной в каждом из 100 ящиков. Какова вероятность того, что чеканщик не будет разоблачен? 5. Известно, что при трех бросаниях игральной кости цифра 6 вы- пала хотя бы один раз. Какова вероятность того, что она выпала два раза? 6. Предположим, что в семье с тремя детьми все возможные распре- деления детей по полу равновероятны. Событие А — «в семье имеются дети обоих полов» и событие В — «в семье имеется не более одной де- вочки». 1) События Аи В независимы? 2) А для семьи, имеющей двоих детей, события Аи В независимы? 1.1.7. Формула полной вероятности и формула Байеса Пусть имеется полная система событий Ai + ... + Ап = Q, AiAj = 0 для i j. Тогда любое событие В можно представить в виде суммы непересекающихся событий В = ВА\ + ... + ВАп и, следовательно, 16
< Р(В) = Р(ВЛ1) + ...+р(ВЛп). Вспомнив правило умножения, можно записать ' Р(В) = Р(В|А1)Р(А1) + ... + Р(В|ЛП)Р(Л„) = = £р(В|Д)Р(А) (1>1) г=1 — формула полной вероятности. Пример 1.5. Пусть имеются три трудноразличимые при ди- агнозе болезни Ai, А2, A3, встречающиеся с частотой 50, 40 и 10 %, и есть метод лечения В, приводящий к успеху соответ- ственно в 70, 75 и 90 % случаев. Какова вероятность излечения для пациента, страдающего одной (неизвестно, какой именно) из болезней Ai, А2 или A3? Имеем P(Ai) = 0,5; Р(А2) = 0,4; Р(А3) = 0,1; P(B|Ai) = 0,7; Р(В|А2) = 0,75; Р(В|А3) = 0,9. Получаем: Р(В) = 0,5 0,7+0,4х хО, 75 + 0,1-0,9 = 0,74. Из соотношений, полученных в соответствии с правилом умножения Р(ДВ) = Р(В|А)Р(А) и Р(ДВ) = Р(Д|В)Р(В), находим mis) - —. Заменив Р(В) в знаменателе по формуле полной вероятно- сти, получаем формулу Байеса, или формулу вероятно- стей гипотез: р(л,\в)= (12) ^Р(В\Л^Р(А^ j=l Вероятности P(AJ, г = 1, в данном контексте носят название априорных вероятностей гипотез А*, а вероятно- сти P(Ai|B), i = 1, называются апостериорными ве- роятностями гипотез А^. Формула Байеса, таким образом, позволяет, исходя из результатов эксперимента, корректировать имеющиеся знания о вероятностях интересующих нас событий. Пример 1.6. Рассмотрим данные примера 1.5, изменив во- прос. Предположим, что лечение по методу В оказалось успеш- ным. Какие выводы можно сделать на основании этого факта от- 17
носительно диагноза? Формула Байеса дает следующие резуль-, таты: | P(Ai |В) = 0,5 • 0,7/0,74 = 0,47; | Р(А2\В) = 0,4 • 0,75/0,74 = 0,4; | Р(А3|В) = 0,1 • 0,9/0,74 = 0,13. Итак, вероятность диагноза несколько снизилась, а веро- ятность диагноза А3 повысилась, что естественно, поскольку ле- чение В более эффективно при болезни А3. Задачи для самостоятельного решения 1. Предположим, что 5 % всех мужчин и 0,25 % всех женщин даль- тоники. Наугад выбранное лицо оказалось дальтоником. Какова веро- ятность того, что это мужчина? (Считать, что мужчин и женщин оди- наковое число.) 2. При рентгеновском обследовании вероятность обнаружить забо- левание туберкулезом у больного туберкулезом равна 0,9. Вероятность принять здорового человека за больного равна 0,01. Пусть доля боль- ных туберкулезом по отношению ко всему населению равна 0,001. Най- дите вероятность того, что человек здоров, если он был признан боль- ным при обследовании. 3. Среди 25 экзаменационных билетов 5 «хороших». Два студента по очереди берут по одному билету. Найдите вероятности следующих событий: А — первый студент взял «хороший» билет; В — второй сту- дент взял «хороший» билет; С — оба студента взяли «хорошие» би- леты. 4. Ваши друзья могут с равной вероятностью играть в одну из двух игр. В одной игре используется одна игральная кость, в другой — две игральные кости. Счет в любой игре равен количеству очков, выпав- ших на одной кости, или на обеих костях вместе. Вы слышите, что в какой-то игре у них выпало два очка. Какова вероятность того, что они играют в игру с одной костью? 5. В первой урне 8 белых и 2 черных шара, во второй урне 16 черных шаров. Из каждой урны наудачу извлекли по одному шару, а затем из этих шаров наудачу взят один шар. Найдите вероятность того, что он белый. 6. В родительской популяции генотипы АА,Аа, аа встречаются с частотами р2,2pq, q2, соответственно р + q = 1. Найдите распределение генотипов потомков (предполагается случайное скрещивание). 7. Найдите три вероятности того, что потомок имеет генотип А А, если одна из родительских особей (мужская или женская) имеет гено- тип: (1) А А, (2) Аа, (3) аа. Другая родительская особь имеет один из генотипов А А, Аа, аа. В родительской популяции генотипы А А, Аа, аа 18
^встречаются с частотами р2,2pg, q2, соответственно, и р + q — 1 (пред- полагается случайное скрещивание). 8. В родительской популяции генотипы А А, Аа, аа встречаются с Частотами р2, 2pg, д2, соответственно, и р + q = 1 (предполагается слу- чайное скрещивание). Известно, что их потомок имеет генотип А А. Найдите вероятность того, что его брат имеет генотип Аа. 1.1.8. Формула Бернулли При проведении п независимых испытаний, в каждом из которых вероятность появления события (часто называемого «успехом») равна р (0 < р < 1), вероятность наступления это- го события ровно к раз описывается формулой Бернулли Рп(к) = Ckpkqn~k, (1.3) где q = 1 - р. Доказательство формулы Бернулли следует из того, что со- бытие «п испытаний закончились к “успехами” и п — к “неуспе- хами”» состоит из стольких составляющих несовместных собы- тий, сколько существует способов выбора к предметов из п пред- метов. Следовательно, количество этих составляющих событий равно С^, а вероятность каждого из них равна pkqn~k (так как проводится п независимых испытаний). Из формулы (1.3) следует, что вероятность наступления со- бытия не менее к± раз и не более к% раз (fci fo) равна Рп (&1> ^2) = РпСО* i=ki Задачи для самостоятельного решения 1. Что вероятнее произойдет при бросании правильной монеты — герб выпадет один раз при двух бросаниях или герб выпадет три раза при шести бросаниях? 2. Вероятность хотя бы одного появления события А в четырех независимых опытах равна 0,5. Какова вероятность появления собы- тия А в одном опыте, если в каждом опыте эта вероятность одина- кова? 3. Всхожесть семян некоторого сорта растений оценивается с веро- ятностью 0,8. Какая вероятность больше: из десяти наугад выбранных семян взойдет хотя бы одно или из двенадцати семян взойдут хотя бы два? 19
4. В некоторой популяции насекомых 30 % особей инфицированы. Что вероятнее — найти хотя бы одну инфицированную особь из 10 на-1 у гад выбранных насекомых или более одной из 12? • 5. При одном цикле осмотра радиолокационной станции, следящей за космическим объектом, объект будет обнаружен с вероятностью 0,5. Сколько надо провести циклов осмотра, чтобы вероятность обнаруже- ния объекта была больше 0,99? 1.2. Случайные величины и их распределения Одномерной случайной величиной или просто слу- чайной величиной, называют любую числовую функцию, определенную на пространстве элементарных событий Q. Так как одномерная случайная величина 5 представляет со- бой числовую функцию на пространстве элементарных событий, то любая числовая функция <р(£) от случайной величины в со- ответствии с определением также является случайной величи- ной. Пример 1.7. Рассмотрим пространство элементарных собы- тий, которое получается в результате независимых бросаний двух монет. В этом примере пространство элементарных собы- тий состоит из четырех элементарных событий, которым соот- ветствует вероятность 0,25. Определим на этом пространстве случайную величину 5, равную числу гербов, появившихся при бросании двух монет. Очевидно, что значения случайной вели- чины равны 0, 1, 2 и случайная величина принимает эти значе- ния с вероятностями 0,25; 0,5; 0,25 соответственно. Пример 1.8. Пусть имеется очень большое количество кро- ликов 7V, среди которых доля альбиносов равна 0,05. Предпо- ложим, что из общего количества N кроликов наугад выбра- но 40. Рассмотрим пространство элементарных событий Q для представления результатов данного эксперимента. В этом при- мере пространство элементарных событий состоит из рав- новероятных элементарных событий. Определим теперь на этом пространстве случайную величину равную числу альбиносов среди 40 выбранных кроликов. Множество возможных значе- ний случайной величины £ есть числа от 0 до 40 включитель- но. Из формулы Бернулли следует, что вероятность того, что случайная величина £ примет значение г, где i = 0,1,2, ... ,40, равна Р(5 = г) = Р40(г) = С1о(0,05)Ч0,95)4о-\ 20
1.2.1. Функция распределения случайной величины Функцией распределения вероятностей, или просто функцией распределения (иногда применяют термин куму- лятивная функция распределения), случайной величины £ называется функция F(x), равная для любого значения х веро- ятности события £ X'. F(x) = х). (1.4) В некоторых источниках литературы нестрогое неравенство в формуле (1.4) заменяют строгим. Часто также применяют дру- гое обозначение функции распределения вероятностей случай- ной величины F^(x). Из определения (1.4) легко вывести следующие свойства функции распределения: 1) 0 F(x) 1; 2) F(x) — неубывающая функция; 3) lim F(x) = 0; х—►—ОС 4) lim F(x) = 1; х—>+оо 5) F^ <^®2) = F(;r2)-F(x1). F(x) 1 Рис. 1.1. Функция распределения F(x) случайной величины (см. при- мер 1.7) На рис. 1.1 приведен график функции распределения вероят- ностей случайной величины из примера 1.7. 1.2.2. Дискретные случайные величины Случайные величины бывают двух типов: дискретные — при- нимающие конечное или счетное число значений, и непрерыв- ные — принимающие любое значение на некотором непрерыв- ном промежутке действительной числовой оси. В этом подраз- деле рассмотрим дискретные случайные величины. 21
Дискретной случайной величиной 5 называется случай- ная величина, принимающая конечное или счетное множество значений х^х^хъ, ... Обозначим множество всех возможных значений, которые принимает дискретная случайная величина 5, через ... , а вероятности, с которыми £ принимает эти значения, — Р0)Р1)Р2) ••• Тогда ^2Pi — 1- Распределение дискретной слу- чайной величины 5 будет полностью описано, если указать для любого i вероятность pi того, что £ принимает значение х^ т. е. Pi = Р(£ = Xi). Функция распределения F(x) дискретной слу- чайной величины £ при этом оказывается равной F(x) = Р(^ х) = Pi. X'l ^Х Таким образом, F(x) — ступенчатая функция, равная посто- янной на любом интервале, не содержащем точек х^ и имеющая в каждой точке Xi скачок вверх на величину pi. Таким образом, чтобы задать дискретную случайную вели- чину 5, достаточно описать множество всех возможных значе- ний случайной величины , а также указать числа Pi, такие, что 1)Я>О, i = 0,1,2, ... 2) ^Pi = 1. i Наиболее распространенными формами представления дис- кретных случайных величин являются табличная Х1 Х2 Ро Р1 Р2 и графическая (рис. 1.2 —1.5), отображающие зависимость ве- роятности pi = Р(£ = х^ от значения случайной величины х^ Функция, выражающая эту зависимость, называется распреде- лением вероятностей дискретной случайной величи- ны. Наиболее известными примерами дискретных случайных ве- личин являются: случайная величина, распределенная по дис- кретному равномерному закону; биномиально распределенная случайная величина; случайная величина, распределенная по закону Бернулли; случайная величина, распределенная по зако- ну Пуассона. 22
Р 1 5/6 4/6 3/6 2/6 1/6 Т + 1 2 3 4 5 6 х Рис. 1.2. Распределение вероятно- стей дискретной случайной вели- чины Рис. 1.3. Распределение вероят- ностей дискретного равномерного распределения (п = 6) Случайная величина, принимающая n (n > 1) значений я?1, ^2, с вероятностями pi = 1/п, называется случайной величиной, распределенной по дискретному равномер- ному закону. На рис. 1.3 рассматриваемая случайная величи- на (для п = 6) представлена в графической форме. Случайная величина, распределенная по дискретному равномерному зако- ну, является моделью событий с равновероятными исходами (см. пример с бросанием игральной кости). Случайная величина, принимающая два значения: 0 и 1 с ве- роятностями q = 1— р ир, соответственно (0 < р < 1), называется распределенной по закону Бернулли с параметром р. Случай- ная величина, распределенная по закону Бернулли, — удачная модель для описания многих конкретных испытаний, имеющих два исхода (наиболее известный пример — бросание правильной монеты — здесь р = д = 1/2),в том числе и в биологии, на- 0 2 4 6 8 10 х Рис. 1.4. Распределение вероят- ностей биномиально распределен- ной случайной величины (п = 10; Р = 0,2) Р 0,18 0,15 0,12 0 3 6 9 12 15 18 х Рис. 1.5. Распределение вероятно- стей пуассоновской случайной ве- личины (X = 5) 23
пример, присутствие или отсутствие некоторого признака, пол родившегося детеныша и т. д. Случайная величина £ — число успехов в п испытаниях (см. формулу (1.3)), принимающая п + 1 значение 0,1,2, ...,п с ве- роятностями Pi = P(^i) = W4, где i — 0,1, 2, ..., n, q = 1 — р, 0 < р < 1, называется биноми- нально распределенной случайной величиной, апнр — па- раметрами распределения. На рис. 1.4 биномиальная случайная величина представлена в графической форме. Пример использо- вания биномиальной случайной величины дан в примере 1.8. Заметим, что случайная величина, распределенная по закону Бернулли, является частным случаем биномиальной случайной величины для п = 1. Случайная величина £, принимающая счетное множество значений 0,1,2, ... с вероятностями Pi = Р(£ — г) = —т;—, г! где i = 0,1, 2, ... , X > 0, называется случайной величиной, распределенной по закону Пуассона. Величина X называется параметром распределения Пу- ассона. Случайная величина, распределенная по закону Пуассона, может быть получена как предел биномиальной случайной ве- личины при п —> ос,р —> 0, пр = const = X. На рис. 1.5 случайная величина, распределенная по закону Пуассона, представлена в графической форме. Случайная ве- личина, распределенная по закону Пуассона, служит моделью числа появления некоторого события за единицу времени, чис- ленности бактерий в единице объема, численности животных на единице площади и т. п. Распределение Пуассона иногда называют «распределением вероятностей редких событий», поскольку оно хорошо описы- вает ситуацию случайно и независимо друг от друга появля- ющихся событий в течение заданного периода времени (реги- страция радиоактивных частиц в счетчике Гейгера, телефон- ные звонки, появление посетителей в малопосещаемом магазине и т.п.). При этом существенна именно независимость событий, а их «редкость» требуется лишь для того, чтобы можно было пренебречь вероятностью одновременного появления двух собы- тий. Если параметр X относится к единице времени, то периоду 24 1
времени длительностью t будет соответствовать пуассоновское распределение с параметром \t. Соответственно вероятность то- го, что в течение периода t не произойдет ни одного события, равна р0 = Р(£ = 0) = е~и. Например, если появление события влечет гибель организма, то ро = е~^ можно интерпретировать как вероятность того, что организм доживет до возраста t («вероятность дожи- тия»). Параметр X в этом случае называют интенсивно- стью смертности (смертностью). Из приведенной формулы видно, что чем больше X, тем мень- ше вероятность дожить до заданного возраста £, и, конечно, чем больше заданный возраст, тем меньше вероятность до него до- жить (классический пример — время жизни стакана в столовой). Из других часто используемых дискретных распределений отметим без определения отрицательное биномиальное распре- деление и гипергеометрическое распределение. Задачи для самостоятельного решения 1. Нарисуйте график функции распределения случайной величи- ны, распределенной по закону Бернулли. 2. Нарисуйте график функции распределения случайной величи- ны, распределенной по дискретному равномерному закону (п = 6). 3. Вероятность хотя бы одного появления события А при четырех независимых опытах равна 0,61. Какова вероятность появления собы- тия А при одном опыте, если при каждом опыте эта вероятность оди- накова? 4. Имеется пять независимых проб воздуха единичного объема. Число бактерий в каждой пробе распределено по закону Пуассона с параметром X, равным 2. Найдите вероятность того, что, по крайней мере, в одной пробе имеется не менее трех бактерий. 1.2.3. Непрерывные случайные величины Непрерывной случайной величиной называется случай- ная величина, для которой функция распределения F(x) непре- рывна, и существует функция /(т), называемая функцией плотности вероятностей (функцией плотности), та- кая, что X F(x) = J f(t)dt. (1.5) —ос 25
Формула (1.5) с учетом интерпретации интеграла как площа- ди проиллюстрирована графически на рис. 1.6. Справедливы следующие свойства функции плотности: 1) f(x) > 0; +оо 2) J f(x)dx = 1; —ос Х2 3) Р (xi < ж2) = J f(x)dx. XI Свойство 3 функции плотности проиллюстрировано на р!ис. 1.7. Функция плотности служит наглядной формой пред- ставления непрерывных случайных величин, являющихся мо- делью для описания многих экспериментов, связанных с изме- рением количественных признаков (например, массы животно- го, длины какой-либо части тела, температуры, влажности, уро- жайности и т. д.). С помощью функции плотности легко срав- нить вероятности того, что случайная величина примет значение из одного или другого интервала. Знание функции плотности случайной величины £ дает полную информацию о непрерывной случайной величине £, т. е. знание о ее распределении. Простейший пример непрерывной случайной величины — равномерно распределенная случайная величина. Случайная величина £ называется равномерно распреде- ленной на отрезке [а, Ь] (а и b — параметры распределения), если ее функция плотности имеет вид если а х Ь; 0 — в противном случае. Рис. 1.6. Связь между функцией распределения F(x) и функцией плотности f(x) X Рис. 1.7. Определение вероятно- сти попадания случайной величи- ны $ в интервал от х\ до хъ по функции плотности 26
Рис. 1.8. Функция плотности рав- номерно распределенной на от- резке [а, Ь] случайной величины Рис. 1.9. Функция плотности экспо- ненциального распределения: 7 — Q = 0,2; — Q = 0,1 Нетрудно проверить, что данная функция удовлетворяет свойствам 1 — 3. График функции плотности равномерно рас- пределенной на отрезке [а, Ь] случайной величины приведен на рис. 1.8. Вероятность того, что равномерно распределенная слу- чайная величина £ примет значение из отрезка определенной длины [я?1, Z2], целиком лежащего между а и Ь, не зависит от расположения этого отрезка и равна — ^i)/(b — а). Вероят- ность принять значения на отрезке [xi, Х2], расположенного вне отрезка [а, Ь], равна нулю. Непрерывная случайная величина £ называется распреде- ленной по экспоненциальному закону с параметром Q, ес- ли функция плотности f(x) случайной величины £ имеет вид если х 0; 0 — в противном случае, где Q > 0. График функции плотности экспоненциально распределен- ной случайной величины представлен на рис. 1.9. Функция рас- пределения экспоненциального распределения равна 0 при х < 0, а если х 0, то она равна Ля) F(x) = Qe~Qsds = 1 - e~Qx. о Например, вероятность дожития до определенного возраста имеет экспоненциальное распределение (см. обсуждение пуассо- новского распределения). 27
Из других часто используемых непрерывных распределений отметим треугольное распределение, распределение Эрланга, распределение Вейбулла, гамма-распределение, бета-распреде- ление. Современные пакеты прикладных программ позволяют полу- чать графики функции распределения, распределения вероятно- стей дискретной случайной величины и плотности непрерывной случайной величины. Задачи для самостоятельного решения 1. Нарисуйте график функции распределения случайной величи- ны, распределенной по равномерному закону на отрезке [0,1]. 2. Нарисуйте график функции распределения случайной величи- ны, распределенной по экспоненциальному закону с параметром Q = 2. 1.2.4. Нормальное и связанные с ним распределения Построение статистических моделей чаще всего основывает- ся на предположении о нормальности используемых распре- делений. Непрерывная случайная величина £ называется нормально распределенной случайной величиной, т. е. распределен- ной по нормальному, или гауссовому, закону с параметра- ми р и о2 (записывается £ ~ Nfc, о2)), если функция плотности /(ж) случайной величины £ имеет вид 1 —— е 2п2 ох/2л где —ос < х < +ос, —ос < р < +ос, о > 0. График функции плотности нормально распределенной слу- чайной величины представлен на рис. 1.10 в двух вариантах: р = 5, о = 1 и р = 10, о = 3. Заметим, что максимальное зна- чение f(x) достигается при х = р (/(р) = ) и график /(ж) у2ко симметричен относительно прямой, проходящей через точку р параллельно оси ординат. При практическом использовании нормального распределе- ния оказывается полезным следующее его свойство: площадь графика под функцией плотности f(x) нормального распреде- ления над интервалом (р — ко, р + ко) не зависит от р и о и равна приблизительно 0,68 (к = 1); 0,95 (к = 1,96); 0,99 (fc = 2,58), 28
Рис. 1.10. Функция плотности нормального распределения: , 1 — = 5, а = 1; 2 — ц = 10, о = 3 т. е. вероятности нормально распределенной случайной величи- ны принять значение в интервале (р, — fco, [J. + fco) равны P([i - о < < [1 4- о) 0,68; Р([1 - 1,96о < ц + 1,96о) « 0,95; Р([1 - 2,58о < ц + 2,58о) « 0,99. Если £ ~ N([i, о2), то можно доказать, что случайная вели- чина а + ~ N(a + b[i, b2o2), где а и b — константы. В частности, случайная величина ~7V(0,l). о Это распределение называется стандартным нормаль- ным распределением. Функция плотности стандартного нор- мального распределения имеет вид 1 х2 f(x) = —j=e 2 . Многие наблюдаемые в реальных экспериментах случайные величины подчиняются приблизительно нормальному закону распределения. По этой причине значительная часть классиче- ской статистической теории предполагает нормальность распре- деления рассматриваемой случайной величины. Теоретическое основание для этого предположения дает цен- тральная предельная теорема, согласно которой распре- деление суммы независимых случайных величин (точное опре- деление независимости случайных величин будет дано в 1.3), 29
ни одна из которых не доминирует, при увеличении числа сла- гаемых сходится к нормальному распределению (более точ- ную формулировку теоремы можно найти, например, в книге [В. Н. Тутубалин, 1992]). В частности, условия центральной пре- дельной теоремы выполняются, если слагаемые одинаково рас- пределены. Например, распределение биномиальной случайной величины, которую можно рассматривать как сумму п независи- мых случайных величин, распределенных по Бернулли, при уве- личении п будет приближаться к нормальному распределению с параметрами пр и пр(1 — р) (теорема Муавра — Лапласа). В приложениях статистики часто используют связанные с нормальным распределения: распределение /2 (хи-квадрат), распределение Стьюдента (часто применяют обозначение £-рас- пределение) и F-распределение. Плотности этих распределений выражаются через стандартные математические функции в ви- де некоторых (довольно громозких) формул, которые и слу- жат определением распределений. Здесь приведем «конструк- тивное» определение, раскрывающее возможности использова- ния этих распределений в математической статистике. Предположим, что каждая из п независимых случайных ве- личин £1,^2, • • • Лп (определение независимости случайных ве- личин см. в 1.3) распределена нормально с параметрами 0 и 1 (^i ~ N(0, 1)). Тогда случайная величина 7) = ^ + ^ + --- + ^ имеет распределение у2 (хи-квадрат) с п степенями свободы (записывается Т) ~ у2). График функции плотности распределения у2 изображен на рис. 1.11 в двух вариантах: п = 5 и п = 10. Предположим теперь, что каждая из п + 1 независимых слу- чайных величин • • • Лп распределена нормально с па- раметрами Ойо2 (£i ~ N (0, о2)) - Тогда случайная величина имеет распределение Стьюдента с п степенями свободы (за- писывается Т) ~ tn). График функции плотности ^-распределения приведен на рис. 1.12 в двух вариантах: п = 2 и п = 10. Заметим, что мак- 30
Рис. 1.11. Функция плотности 9 X -распределения: 1 — п = 2 — и = 10 Рис. 1.12. Функция плотности ^-распределения: 1 — п = 2\ 2 — и = 10 симальное значение плотности распределения достигается при х — 0 и график симметричен относительно оси ординат. Предположим теперь, что каждая из п + т независимых слу- чайных величин £i, ^25 • • • Лпч £п+ь • • •, %>п+т распределена нор- мально с параметрами 0 и о2, т. е. ~ 7V(0, о2). Тогда случайная Рис. 1.13. Функция плотности F-распределения: 1 — п = 5, т = 5; 2 — п = 50, т = 50 31
имеет F-распределение с пит степенями свободы (записыва- ется Т) ~ Рщт). График функции плотности F-распределения представлен на рис. 1.13 в двух вариантах: п = 5, т = 5ип = 50, т = 50. Иногда возникает ситуация, когда рассматриваемую случай- ную величину удается с помощью несложных изменений преоб- разовать в нормально распределенную случайную величину. На- пример, в биологических исследованиях часто возникает логнор- мальное распределение. Непрерывная случайная величина £ называется распреде- « 2 ленной по логнормальному закону с параметрами р и о , если случайная величина т) = 1п£ распределена нормально (1Г| ~ 7V([1, О2)). 1.2.5. Характеристики распределений Полная информация о случайной величине дается ее распре- делением вероятностей — дискретным распределением в дис- кретном случае, функцией плотности — в непрерывном, либо функцией распределения в любом из этих двух случаев. Для решения многих задач достаточно знать лишь неко- торые числовые характеристики, называемые характеристика- ми распределения случайной величины, важнейшими среди ко- торых являются: математическое ожидание, дисперсия, сред- нее квадратичное отклонение, коэффициент вариации, момен- ты, центральные моменты, коэффициент асимметрии, коэффи- циент эксцесса, медиана, мода, первая квартиль, третья квар- тиль, интерквартильный размах, квантили. Математическим ожиданием случайной величины £ (применяют также термины «среднее», «генеральное среднее») называется число М(£) (другие обозначения: Е(£), т, р), рав- ное м© = 52Xipi i — для дискретной случайной величины и 4-00 М(£) = J xf(x)dx —ос — для непрерывной случайной величины. Математическое ожидание М(£) является характеристикой положения центра распределения, или мерой центральной тен- 32
Таблица 1.1 Основные характеристики некоторых теоретических распределений Распределение Формула для вычисления математического ожидания дисперсии Дискретное равномерное (множество возможных значений: Xi, • •• ,£п) Бернулли с параметром р Биномиальное с парамет- рами пир Пуассона с параметром X Равномерное на отрезке [а, 6] Нормальное с параметра- 2 МИ [1 и О у2 сп степенями свободы ^-распределение с п степе- нями свободы F-распределение спит степенями свободы Экспоненциальное с пара- метром Q Логнормальное с парамет- 2 рами [1, сг п г=1 Р пр X а + Ь 2 Р п 0 т т — 2 1/Q 1 п / 1 п \ 2 г=1 \ г=1 / р(1 - р) пр(1 - р) X (ь-д)2 12 о2 2п п п — 2 2т2 (п 4- т — 2) п(т — 2)2(т — 4) 1/Q2 е2р+°2(е°2 - 1) денции, точнее, средним (взвешенным по вероятностям) значе- ний случайной величины. В табл. 1.1 приведены значения математических ожиданий для некоторых распределений. Читателю советуем хотя бы для двух распределений, одного дискретного и одного непрерывного вычислить математические ожидания самостоятельно. Свойства математического ожидания 1. Если ср($) — некоторая функция от случайной величины, то при довольно общих ограничениях ее математическое ожидание вычисляется по формулам: 33
М(ф(О) = 57ф(®г)Рг i — для дискретной случайной величины и +оо м(<р(5)) = J <p(z)/(x)dx —оо — для непрерывной случайной величины. 2. М(а£ + Ь) = аМ(£) + Ь, где а и b — константы. Действительно, используя свойство 1, определение случайной величины и свойства суммы, получаем для дискретной случай- ной величины к к к М(а£ + 6) = 57 (axi + &)Рг = ° 57 xiPi + & 57 Pi = аМ(£) + Ь- i=l г=1 2=1 (Для непрерывной случайной величины доказательство анало- гично.) В частности, М(а£) = аМ(£) и М(Ь) = Ь, т. е. константу можно выносить за знак математического ожидания и матема- тическое ожидание константы равно этой константе. 3. Для любых двух случайных величин ; 1Ц М(£ + т)) = М(£) + М(т)). Приведем здесь и в следующем пункте доказательство толь- ко для дискретной случайной величины. Обозначим через pij = = F(£ = Xi, Г) = yj), Pi, = F(£ = Xi), p,j = P(j] = yj), тогда I к ^^Pij = Рг.ч ^^Pij = P.j- J=1 i=l к l к I Ik m(s+л) = 5717 &+y^pii= 57 57 pi>+^y^H pii= 2=1 J = 1 2=1 J = 1 J = 1 2=1 к I = 57 xipi- + 57 yip:> = + M.(n)- 2 = 1 j = l 4. Если £ и T) — независимые случайные величины, то М(?т)) = МфМ(т)). Действительно, 34
к I к I = 52 52 Х*УзР*3 = ^2^2XiyjPi-Pj = i=l j=l z=l j = l к I = ^2xipi.^2yjp.j = M(5)M(tj) i=i j=i (для дискретных независимых случайных величин, по определе- НИЮ, Pij = Pi.p.j). Для описания многих практически важных свойств случай- ной величины необходимо знание не только ее математическо- го ожидания, но и отклонения возможных ее значений от сред- него значения. Например, у случайных величин, принимающих значения ±1 или ±10 с вероятностями1^, математические ожи- дания совпадают и равны нулю, но отклонения их значений от нуля разные. Для измерения разброса значений случайной величины око- ло среднего значения часто используют такие характеристики, как дисперсия, среднее квадратичное отклонение, коэффициент вариации. Дисперсией случайной величины называется число D(£) (другие обозначения: о2(£), о|), равное вф = £(^-мо2А, i если £ — дискретная случайная величина, и +оо D(C) = J (х - М©)2f(x)dx, —оо если £ — непрерывная случайная величина. Дисперсия характеризует средний квадрат отклонения слу- чайной величины от своего математического ожидания. В табл. 1.1 приведены формулы для вычисления дисперсий некоторых распределений. Читателю советуем, хотя бы для двух распределений — одного дискретного и одного непрерывного — вычислить дисперсии самостоятельно. Свойства дисперсии 1. D© = М[? - М©]2 = М(£2) - (М(£)]2. Действительно, пользуясь свойствами математического ожи- дания, получаем 35
М[С - М(£)]2 = М(£2) - 2[М(£)]2 + [М(£)]2 = М(£2) - [М($)]2. 2. D(£) > 0, поскольку по определению дисперсия является суммой неотрицательных слагаемых или интегралом от неотри- цательной функции. 3. D(a£ + Ь) = a2D(£), где а и b — константы. Действительно, D(a£ + b) = М[а£ + b - М(а£ + Ь)]2 = М[а? + b - аМ(£) - 6]2 = = М[а£ - аМ(£)]2 = а2М£ - М(£)]2 = a2D(£). В частности, D(a£) = a2D(£) и D(6) = 0, т. е. константу можно выносить за знак дисперсии в квадрате и дисперсия константы равна нулю. 4. Если £ и т) — независимые случайные величины, то D(£ ± 7)) = D(£) + D(7)). Действительно, D(£ ± 7)) = М(с ± Т))2 - [M(S ± Т))]2 = = М(£)2 ± 2М(£т)) + М(т))2 - [М(£)]2 т 2М(^) - [М(т))]2 = = М(£)2 - [М(£)]2 + М(т)2) - [М(т))]2 = D(£) + D(tj). Неравенство Чебышева позволяет оценивать вероятность отклонения случайной величины £ от своего математического ожидания при известной D(£): P(|^-M(?)|^e)^D©/e2. (1.6) Приведем вывод формулы (1.6) для дискретной случайной величины. Пусть случайная величина £ имеет конечную диспер- сию D(£) = “ М(£)]2р* и пусть е — любое положительное число. Если в этой сумме выбросить все слагаемые, для кото- рых \xi — М(£)| < е, а в оставшихся слагаемых, для которых \xi — М(£)| е, заменить выражения [х{ — М(£)]2 их минималь- 9 ным значением е , то получим D(£) > е2 £ Pi. |®»-М(5)|>е 36
Р(|Е-М©|^е)= £ й, откуда следует доказываемое неравенство. С помощью неравенства Чебышева, в частности, легко дока- зывается сформулированная ранее теорема Бернулли. Действи- тельно, пусть £ = m/n, тогда М(£) = M(m/n) = пр/п = р и D(£) = D(m/n) = npq/n2 = pq/n —> 0 при п ос. Заменив в неравенстве Чебышева М(£) на р и D(£) на pq/n, получим дока- зательство теоремы Бернулли. Средним квадратичным отклонением случайной ве- личины (используются также термины «среднеквадратическое отклонение» и «стандартное отклонение») называется корень квадратный из дисперсии а(5) = x/D(U- Среднее квадратичное отклонение, следовательно, является, как и дисперсия, мерой рассеяния распределения, но измеряет- ся, в отличие от дисперсии, в тех же единицах, которые исполь- зуют для измерения значений случайной величины. В дальнейшем часто будет использовано преобразование стандартизации случайной величины %: г 5-М(5) П о(Е) ' Докажите (с использованием свойств математического ожида- ния и дисперсии), что М(т)) = 0, a D(r)) = 1. Коэффициентом вариации случайной величины £ назы- вается число V(£), равное, если М(£) > О, М(5)’ Таким образом, коэффициент вариации является, как и дис- персия, и среднее квадратичное отклонение, мерой рассеяния распределения, но служит для измерения среднего квадратич- ного отклонения в долях математического ожидания. Моментом порядка v (иногда применяют термин «на- чальный момент порядка V») случайной величины называ- ется число pv, равное Hv = М(Г).
Рис. 1.14. Пример распределений с положительной (Pi > 0) и отри- цательной (Pi <0) асимметрией Центральным моментом порядка v случайной величи- ны £ называется число [iV5o, равное Rv.o = М[£ - М(£)Г Таким образом, математическое ожидание случайной вели- чины является моментом первого порядка, а дисперсия — цент- ральным моментом второго порядка. Термин «момент» заим- ствован из теоретической механики. Известно, что первый мо- мент [110, т. е. М($), — это абсцисса центра тяжести массы рас- пределения, а второй центральный момент [12,о, т. е. D(£), — мо- мент инерции массы относительно перпендикулярной оси, про- ходящей через центр тяжести х = М(£). Кроме этих моментов наиболее часто используются третий и четвертый центральные моменты. Коэффициентом асимметрии случайной величины £ на- зывается величина в = Рз,о . И1 [D(^)]3/2 ’ коэффициентом эксцесса случайной величины £ — величина о _ Р4,о _ ч ₽2 PR)]2 Если плотность распределения случайной величины симмет- рична, то коэффициент асимметрии Pi = 0. На рис. 1.14 приведе- ны графики функций плотности в двух случаях: Pi > 0, < 0. Для нормального распределения fa = 0. Если распределение со- средоточено вокруг среднего теснее, чем нормальное^ то fa < 0, в противном случае — fa > 0. I Как отмечалось, математическое ожидание яштяЬтся/харак- теристикой положения центра распределения. Другими харак- теристиками положения являются медиана и мода. Медианой случайной величины £ называется число Q2, та- кое, что Р(£ Q2) 1/2 и Р(£ Q2) 1/2. Другое распростра- ненное обозначение Me. 38
Рис. 1.15. Медиана распределения f(x)1 Если £ — непрерывная случайная величина, то определение медианы можно проиллюстрировать графиком функции плот- ности (рис. 1.15). Если распределение случайной величины симметрично, как, например, в случае нормального распределения, то медиана сов- падает с математическим ожиданием. Однако для несимметрич- ных распределений математическое ожидание и медиана, вооб- ще говоря, не совпадают. Модой (Мо) непрерывной случайной величины называется такое значение ж, в котором f(x) достигает своего локального максимума. Мода есть «центр сгущения» случайной величины в смысле наиболее часто встречающихся значений. Распределение с од- ной модой называется унимодальным, с несколькими модами — мультимодальным. Для симметричного унимодального распре- деления мода совпадает с математическим ожиданием, а следо- вательно, и с медианой. Для несимметричных распределений математическое ожида- ние, медиана и мода, вообще говоря, не совпадают. На рис. 1.16 для несимметричного унимодального распределения показаны все три характеристики положения распределения. Можно ввести еще две характеристики распределения, опре- деляемые аналогично медиане, — первую и третью квартили. Рис. 1.16. Мода (Мо), медиана (Me) и математическое ожидание (М) случайной величины £ 39
Л®)' Рис. 1.17. Первая и третья квартили распределения Первой квартилью (часто ис- пользуется термин «нижняя квар- тиль» ) распределения случайной величины $ называется число Qi, та- кое, что < Qi) = 1/4, третьей квартилью (верхней квартилью) распределе- ния случайной величины £ называется число Q3, такое, что Р(5 > Q3) = 1/4. Если £ — непрерывная случайная величина, то определение квартили удобно иллюстрировать графически (рис. 1.17). Вероятность того, что случайная величина примет значение в промежутке [ф1,фз]? равна P(Qi < £ < Q3) = 1/2. Разность Q3 — Qi называется интерквартильным разма- хом и может служить, аналогично среднеквадратическому от- клонению, мерой рассеяния значений случайной величины. Квантилью порядка р распределения F(x) называется число Ср, такое, что F(CP) = р. Для непрерывной случайной величины это определение ил- люстрирует рис. 1.18. Из определения квантили следует, что медиана — это кван- тиль порядка 0,5, первая квартиль — квантиль порядка 0,25, а третья квартиль — квантиль порядка 0,75. Для некоторых наиболее распространенных в математиче- ской статистике распределений созданы таблицы квантилей. 40
В пакетах прикладных программ по статистической обработ- ке вместо термина «квантиль» используется термин «процен- тиль», когда порядок квантили выражается в процентах. Задачи для самостоятельного решения 1. Вычислите математическое ожидание и дисперсию для распре- деления Бернулли с параметром р. 2. Вычислите математическое ожидание и дисперсию для биноми- ального распределения с параметрами пир. 3. Вычислите математическое ожидание для пуассоновского рас- пределения. 4. Станок может сломаться при изготовлении детали с вероятно- стью р. Число изготовленных деталей до остановки — случайная вели- чина. Найдите закон ее распределения и математическое ожидание. 5. Докажите, что дисперсия числа появлений успеха при одном ис- пытании не превосходит 0,25. 6. В некоторой партии зерна Уз зерен невсхожие. Наугад выбираем 4 зерна. Случайная величина — число всхожих среди них зерен. Най- дите закон ее распределения, математическое ожидание и дисперсию. 7. Каково должно быть математическое ожидание числа бактерий в единичной пробе, чтобы вероятность того, что в пробе имеется хотя бы одна бактерия, была не меньше У? 8. Имеется пять проб воздуха единичного объема. Математическое ожидание числа бактерий в каждой пробе равно 2. Найдите вероят- ность того, что, по крайней мере, в одной пробе имеется не менее двух бактерий. 1.3. Многомерные случайные величины На каждом пространстве элементарных событий Q можно определить несколько случайных величин. Пример 1.9. Рассмотрим, как и в примере 1.7, пространство элементарных событий, которое получается в результате незави- симых бросаний двух монет. Пространство элементарных собы- тий состоит из четырех элементарных событий Q = {(01,6)2,6)3, (04} — «герб» + «герб», «герб» + «решка», «решка» + «герб», «решка» + «решка». Определим на этом пространстве случай- ную величину £1, равную числу выпавших гербов, и случай- ную величину £2, равную числу выпавших решек. Очевидно, что £1 ((Oi) = 2, £1(6)2) = £1((Оз) = 1, £1((04) = 0и случайная величина £1 принимает эти значения с вероятностями 0,25; 0,5; 0,25 соот- ветственно. А £г((О1) = 0, £2(^2) = £г((оз) = ^((04) = 2 и £2 41
принимает эти значения с вероятностями 0,25; 0,5; 0,25. Вектор £ = {£i, £2} является двумерной случайной величиной. Пример 1.10. Двумерной случайной величиной является вектор Z = {£1, £2}, где £1 и £2 — широта и долгота места паде- ния метеорита на Землю. А четырехмерной случайной величи- ной является вектор £ = {£1, £2 Лз ,£4}, где £1Л2 Лз Л4 — длина и ширина чашелистика и лепестка цветка ириса. Совокупность т функций, определенных на одном и том же множестве элементарных событий, называется т-мерной слу- чайной величиной £ = {£1, ... Лш}. Многомерная случайная величина полностью определяется ее функцией распределе- ния вероятностей F(#i, • • • , %т) — -Р(^1 X} ч • • • ч хгп)ч удовлетворяющей следующим условиям: 1) 0 F(xb ...,хт) 1; 2) F(a?i, ..., хт) не убывает по каждому аргументу; 3) lim F(a?i, ... , ... ,£m) = 0 для любого г; Xi—> — оо 4) lim F(a?i, ... ,хт) = 1; >4-оо,г=1,2, ...,т 5) lim F(xi, ... ,Xi, ... ,zm) = Fi(zi), где Fi(xi) — функ- Xj^OO,j/z ция распределения одномерной случайной величины Одномерные случайные величины £i, ..., называются не- зависимыми, если их совместная функция распределения рав- на произведению одномерных функций распределения F(xi,x2, ...,хт) = F1(x1)F2(x2)... Fm(xm). 1.3.1. Дискретные многомерные случайные величины Многомерная случайная величина называется дискретной, если составляющие ее случайные величины являются дискрет- ными. Многомерная дискретная случайная величина полностью определяется набором значений вероятностей Pil,-,im = Р(£1 = xh Ч • • • ч заданных для любой комбинации значений х^,..., Xim случай- ных величин ... , Функция распределения в этом случае выражается через вероятности следующей формулой: F(Xi, ...,Хт) = । ...Xim ^Хт 42
Пример 1.11. Двумерная случайная величина (£,г)) прини- мает значения (#i, pj), г = 1, ... j = 1, Вероятности всех возможных пар значений yj) можно представить в виде таб- лицы: Е У1 Уз У1 Итог Z1 Рп Pij Pll Pl. Xi Рг1 Pij Pit Pi. Хк Рк1 Pkj Pkl Pk. Итог РЛ _Ll p.l В итоговых строке и столбце записаны суммы по столбцам и строкам к I Р-3 = ^Pij’Pi- = ^Pir г=1 j=l Итоговый столбец определяет одномерное (маргинальное) распределение случайной величины £, а итоговая строка — одномерное (маргинальное) распределение случайной величины т). Если разделить все вероятности J-ro столбца на итоговую ве- роятность p.j, то получим условные вероятности значений $ при условии Т) = yj Plj/p.j, • • •, Pij/p.j, • • •, Pkj/p.j, определяющие условное распределение случайной величи- ны £ при фиксированном значении другой случайной величины Т), равном yj. Аналогично определяется условное распределение Т) при заданном значении Если pij = p.jPi. для любых г, j{i / j), то случайные величины ; и г] являются независимыми. 1.3.2. Непрерывные многомерные случайные величины Многомерная случайная величина называется непрерыв- ной^ если непрерывна ее функция распределения F(zi, ... , zm) и существует функция плотности f(x^ ..., хт)^ такая, что 43
Xl Xm -^(^1 , • • • , f (*E1 , • • • , 37m)^371 , • • • , dxm. — OQ — (X) Рассмотрим непрерывную двумерную случайную величину (£,т)) с плотностью f(x,y) и функцией распределения F(x^y). Одномерная (маргинальная) плотность £ получается пу- тем интегрирования по у двумерной плотности +оо Л(я) = J f(x,y)dy. —(X) Аналогично определяется маргинальная плотность г) +оо А(у) = J f(x,y)dx. —оо Условная плотность случайной величины £ при задан- ном значении случайной величины г) = у задается формулой Л 'у) Y ш ’ f(x,y)dx —(X откуда получаем непрерывный аналог формулы умножения ве- роятности («совместная плотность равна произведению услов- ной плотности на плотность условия»): /Ы = /(х|у)Д(у). Аналогично условное распределение г) задается формулой _/ . ч f(x,y) f(x>y) ПуМ = " , f(x,y)dy — (X) откуда f(x, у) = /(у|х)Д(х). Непрерывные случайные величины будут независимыми, если f(x, у) = f^x)f^y). 44
Характеристикой связи случайных величин £ и г) является ко- эффициент корреляции. Коэффициентом корреляции двух случайных величин $ и г) называется отношение - ч _ соу(Е,7)) ,n) yD^)D(T))’ гдесоу(£,г|) = М[(£ —М(£))(т) —М(т|))] — ковариация £ и г). Если р(£, т|) = 0, то случайные величины £ и т) называются некоррели- рованными. Свойства коэффициента корреляции 1. Для любых случайных величин £ и г) |р(£, т))| 1. 2. Если $ и т) — независимые случайные величины, то р(£, т)) = = 0 (обратное, вообще говоря, неверно). 3. р($, т)) = +1 или —1 тогда и только тогда, когда случайные величины £ и т) связаны линейной зависимостью £ = аг] + Ь. Двумерным нормальным распределением называют распределение вероятностей двумерной непрерывной случайной величины ($, т)), если функция плотности имеет вид 1 1 х exp /(а:'9) = 2^7Т=7х ’(^~^1)2 , (у - ^2)2 _ 2 2(1 —р2) _ 0102 JJ где — некоторые параметры, oi > 0,02 > О, |р| 1. Можно доказать, что маргинальные случайные вели- чины £ и т), соответствующие этому двумерному распределе- нию, — нормально распределенные случайные величины, при- 2 2 чем pi,(12,^п<^2 ~ их математические ожидания и дисперсии, а р — коэффициент корреляции. Определение нормального распределения можно обобщить и на случай более двух измерений. Здесь не будем приводить формулу плотности вероятности многомерного нормального распределения ввиду ее громоздкости, а отметим лишь, что в число его параметров входят наряду с математическими ожида- ниями и дисперсиями одномерных случайных величин также и все их попарные корреляции. Если составляющие двумерной нормально распределенной случайной величины £ и г) некоррелированны, то р(£, 7)) = 0. То- гда функция плотности £ и 7) равна 45
-1 (g-Ml)2 1 (2/-м2)2 f(x,y) = .— -e 2°1 e 2я2 = Д(х)/Т)(у). v2tioi v2tio2 Следовательно, если составляющие двумерной нормально распределенной случайной величины некоррелированны, то они и независимы. Таким образом, для составляющих двумерного нормального распределения понятия независимости и некорре- лированности равносильны. Пусть имеется п случайных величин £1,^2, • • • Дп- Рассмот- рим новую случайную величину г) = <p(^i,$2? ••• Лп), где ср — некоторая функция. Тогда функция распределения случайной величины т) задается (в случае, когда 5г — непрерывные случай- ные величины) формулой F(x) = Р(т) < х) = J- • • J f(xi,x2, ... ,xn)dxi... dxn, Dx где f(xi,x2, ... ,xn) — функция плотности n-мерной случайной величины (51? ...,5n); Dx — область n-мерного пространства, содержащая все точки zi,Z2? такие, что cp(zi,х2, ..., Хп) X. Математическое ожидание случайной величины г) равно +оо +оо М(г|) = J ... J <p(xi, ...,x„)/(xi, ...,xn)dxi ...dxn. —00 —00 Предположим теперь, что т) = ао + ai5i + ... + an5n- Тогда можно доказать, воспользовавшись свойствами математическо- го ожидания и дисперсии, что М(т)) = а0 + aiM(5i) + ... + anM(5n) и п п п DC7)) = 52 4d(^)+52 52 aiaj cov(^’ ^)- г=1 г=1 Пусть теперь 51,^2, • • • Лп независимы и одинаково распре- 1 п делены. Обозначим М(5г) = PS D(5z) = о2; £ = ~/чг, тогда п г=1 2 М(!) = И; D(|) = ^-. [ I 46
Если дополнительно предположить, что все случайные вели- чины ^1,^2» • • • Лп нормально распределены, т. е. ~ 7V((i,o2), i = 1,2, ... , п, то можно доказать, что случайная величина г) = = ао + ai£i + • • • + атЛп также нормально распределена. Отсюда, в частности, следует, что £ ~ 7V(p, о2/п).
ГЛАВА 2 ОСНОВЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Задача математической статистики, в строгом пони- мании этого термина, состоит в разработке и применении мето- дов описания реальных явлений вероятностными моделями, ис- ходя из данных, полученных в результате наблюдений за этими явлениями. В более широком смысле математическая статистика понима- ется как совокупность методов планирования экспериментов и обработки данных, полученных в результате экспериментов или наблюдений, причем эти методы могут не основываться на ве- роятностных моделях. При таком широком понимании вместо термина «математическая статистика» часто используют тер- мин «анализ данных». Исторически вначале сформировались методы обработки данных, не связанные тесно с теорией вероятности, так назы- ваемая дескриптивная, или описательная, статистика. С начала XX в. начали интенсивно развиваться методы анали- за данных, основанные на вероятностных моделях, прежде все- го, методы статистического оценивания и статистиче- ской проверки гипотез, о которых в основном и будет идти речь в данной главе. Развитие вычислительной техники привело к появлению но- вых методов анализа. Некоторые из них разработаны на основе подходов, отличных от теоретико-вероятностного, — геометри- ческие, оптимизационные и др. Вероятностное обоснование этих методов либо отсутствует, либо недостаточно развито, что за- трудняет количественную оценку степени достоверности полу- чаемых выводов аналитическими средствами классической ма- тематической статистики. Однако в последние годы, в связи с быстрым ростом производительности ЭВМ, получили распро- странение процедуры так называемого случайного моделиро- вания (пермутационные методы, бут-стрэп), позволяю- щие оценить статистические свойства получаемых решений без использования аналитических методов. 48
Начнем рассмотрение методов математической статистики с ее исходного понятия — случайной выборки. 2.1. Случайная выборка и ее описание Понятие случайной выборки тесно связано с понятиями случайного испытания и случайной величины, которые были рассмотрены в гл. 1. Случайная выборка представляет собой со- вокупность наблюдений #2, • • •, хп случайной величины по- лученных в п независимых случайных испытаниях. Число полу- ченных наблюдений п называется объемом выборки. Образ- но можно представить процесс получения случайной выборки как извлечение наудачу значений из гипотетической бесконеч- ной генеральной совокупности, где разные значения содер- жатся в пропорциях, соответствующих распределению случай- ной величины, и тщательно перемешаны между собой. Случай- ная величина может быть не только одномерной, но и много- мерной, например, когда у случайно выбранного животного из- меряется несколько характеристик: размер, масса и т. д. В этом случае каждая из компонент выборки будет вектором. Конкретная случайная выборка — это просто набор значений случайной величины $ (во избежание чрезмерного усложнения обозначений будем считать ее одномерной). Однако при оцен- ке информации, которую несет эта выборка, ее необходимо рас- сматривать как одну из бесконечного числа потенциально воз- можных выборок объема п, т. е. как векторную n-мерную слу- чайную величину (=(^2, •••Лп), компонентами которой являются п элементов выборки. Из усло- вий получения выборки следует, что случайные величины $1, $2, ...,имеют одинаковые функции распределения F(o?i), F^), ..., F(xn), совпадающие с функцией распределения F(x) исход- ной случайной величины Кроме того, случайные величины 51,^2, •• • ,5п по определению случайной выборки независимы, поэтому их совместная функция распределения равна произве- дению одномерных функций распределения G(xi,x2, ...,Хп) = F(xi)F(2:2)...F(xTt). Как правило, информация, содержащаяся в выборке, инте- ресует нас не столько сама по себе, сколько как информация о всей генеральной совокупности. Для этого выборка должна
быть правильно организованной и представительной. Существу- ет специальный раздел математической статистики — планиро- вание выборочных обследований. Здесь рассмотрим только один способ получения выборки — простой случайный вы- бор. Суть такого выбора состоит в извлечении наудачу из тща- тельно перемешанной генеральной совокупности п значений. На практике дело обстоит сложнее. Предположим, что был прове- ден отлов п взрослых животных определенного вида и измере- на их масса. Какую генеральную совокупность представляет эта выборка — всех животных данного вида, живущих в разных ме- стах, прошлых и будущих, или популяцию, обитающую в дан- ной местности, или популяцию, обитающую в данной местности в данный год? Конечно, чем уже понимать генеральную сово- купность, описываемую данной выборкой, тем ближе истина, но, возможно, тем меньший интерес она будет представлять. Итак, имеется случайная выборка яд, я?2, • • •, хп значений слу- чайной величины £ с неизвестным распределением F(x). Как ра- зумно распорядиться этими значениями, чтобы получить пред- ставление о распределении F(x), т. е. о генеральной совокупно- сти, из которой извлечена эта выборка? Можно использовать следующий эвристический принцип: бу- дем считать, что исследуемая генеральная совокупность близка к гипотетической генеральной совокупности, состоящей только из значений яд,я?2, . ..,я;п, содержащихся в ней в равной про- порции (значения яд, #2, • • •, хп предполагаются упорядоченны- ми по возрастанию, т. е. представлены в виде вариационно- го ряда), т. е. случайная величина $ близка к случайной вели- чине принимающей п значений яд,я?2, . ..,я:п с вероятностя- ми 1/п (это, действительно, максимум информации о значени- ях случайной величины и их вероятностях, которую можно из- влечь из выборки). Распределение случайной величины £ назы- вается эмпирическим распределением случайной величины а ее функция распределения F(x) — эмпирической функцией распределения. Очевидно, что каждой выборке соответствует своя эмпирическая функция распределения, т. е. можно сказать, что F(x) — случайная функция. F(x) представляет собой сту- пенчатую функцию, возрастающую от 0 до 1 скачками высотой 1/п в точках яд,я?2, . ..,я:п (если некоторое значение повторя- ется k раз, то ему будет соответствовать один скачок величи- ной k/n). Можно определить эмпирическую функцию формулой F(x) = пх/п, где пх — число значений выборки, не превосходя- щих X. 50
Пример 2.1. Пусть случайная величина £ — длина лепест- ка случайно выбранного цветка ириса разноцветного (Iris ver- sicolor). Следующий ряд чисел содержит значения длин (в см) 50 случайно выбранных лепестков: 4,6 4,5 4,0 3,8 4,2 3,3 4,3 4,2 4,1 4,7 4,8 4,6 4,5 4,0 4,2 4,2 4,0 4,7 3,6 4,9 5,1 3,9 4,4 4,4 4,6 3,9 4,4 4,1 4,0 4,0 4,5 4,7 4,5 4,1 4,5 3,5 4,9 4,7 4,4 4,8 4,7 4,5 4,5 3,5 3,7 3,9 4,3 3,0 5,0 3,3 Представим эти значения в виде вариационного ряда: 3,0 3,3 3,9 4,0 4,2 4,2 4,5 4,5 4,7 4,7 3,3 3,5 4,0 4,0 4,2 4,3 4,5 4,5 4,7 4,7 3,5 3,6 4,0 4,0 4,3 4,4 4,5 4,5 4,8 4,8 3,7 3,8 4,1 4,1 4,4 4,4 4,6 4,6 4,9 4,9 3,9 3,9 4,1 4,2 4,4 4,5 4,6 4,7 5,0 5,1 На рис. 2.1 представлено построенное на основе этого вариа- ционного ряда эмпирическое распределение случайной величи- ны £ для этой выборки, т. е. распределение случайной величи- ны £, а на рис. 2.2 — график эмпирической функции распределе- ния F(x). Поскольку эмпирическая функция распределения F(x') явля- ется оценкой для F(x) (можно доказать, что при п —> оо вероят- ность того, что максимальное расхождение между F(x) и F(x) 51
не превзойдет заданного малого числа стремится к единице), можно взять характеристики F(x) в качестве оценок характери- стик генерального распределения. В табл. 2.1 приведены полученные таким образом формулы для некоторых выборочных характеристик. Таблица 2.1 Формулы выборочных характеристик Характеристика Формула Выборочный момент порядка к Выборочный центральный момент порядка к Выборочное среднее — первый нецентральный момент Выборочная дисперсия — второй центральный момент Выборочный коэффициент асимметрии Выборочный коэффициент эксцесса 1 п pfc = -^2xi п г=1 1 v—л pfc,0 = - У' (^г - х)к п г=1 1 П х = pi = - S2xi п г=1 1 П So = - х)2 п г=1 R - 1^0 ' 1 .3/2 1*2,0 1*2,0 52
Зная эмпирическую функцию распределения, можно так- же найти эмпирические квантили, квартили и интерквартиль- ную широту точно так же, как в случае обычной (теоретиче- ской) функции распределения. А именно, выборочная кван- тиль Ср порядка р получается как абсцисса точки пересече- ния прямой у = рс графиком эмпирической функции распре- деления F(x) (если пересечением является не точка, а отрезок, то в качестве квантили можно взять абсциссу середины это- го отрезка). Выборочные квантили Со,25, Со,50, Со,75 дают соот- ветственно выборочную нижнюю квартиль Qi, выбороч- ную медиану Q2 и выборочную верхнюю квартиль Q3, а разность (Со,75 ~ Со,25) — выборочную интерквартиль- ную широту. Еще одна характеристика разброса значений случайной величины — размах R — определяется как раз- ность между максимальным и минимальным значением в вы- борке. Если наблюдается не одномерная, а двумерная случайная ве- личина (£,т)), т.е. выборка состоит из п пар значений (#i,yi), (^2,3/2), • то можно вычислить выборочную кова- риацию ДЛЯ £ И Т) 1 п cdv(£, Т)) = - V (Xi - х)(ы - у), п 2=1 где 2=1 г=1 Выборочный коэффициент корреляции определяется формулой cdv(£,T)) Чг>~ ГТТ' где 4) = 52 (xi-x)2-, s20 = ~^(уг-у)2. fl . 1 Il . 2=1 2=1 Выборочную модухто& целесообразно оценивать для дис- кретного и непрерывного генерального распределения различ- ными способами. В дискретном случае оценкой моды будет зна- чение, встретившееся в выборке наибольшее число раз. В непре- рывном случае повторяющиеся значения редки или вообще от- 53
сутствуют, поэтому следует разбить диапазон изменения наблю- денных значений точками ао, «1, ...,«& на А: равных промежут- ков [ao,«i], (ai,a2], ..., длиной h = (аь — а$)/к и в ка- честве выборочной моды взять середину интервала, в который попало наибольшее число значений. В табл. 2.2 даны значения выборочных характеристик, вы- численные для примера данных о длинах лепестков ириса. Результаты разбиения диапазона изменения значений выбор- ки на к интервалов равной длины h и последующего подсчета числа значений пг, попавших в интервалы i = 1,2, ..., &, можно представить графически. Построив над каждым интервалом i столбик высотой пг, получим гистограмму. Если при постро- ении гистограммы оперировать не числом значений, попавших Щ в интервалы, а их относительной частотой в выборке Vi = — nh и откладывать столбики высотой у*, то полученная гистограмма будет выборочным аналогом плотности непрерывного рас- пределения (тц и Vi часто называются, соответственно, абсолют- ными и относительными частотами). В частности, сумма пло- Таблица 2.2 Значения выборочных характеристик Характеристика Значение Выборочное среднее Выборочная дисперсия (несмещенная оценка, см. 2.2.1) Выборочный ^зэффициент асимметрии Выборочный коэффициент эксцесса Минимум Максимум Размах Нижняя квартиль Верхняя квартиль Интерквартильный размах Медиана Мода х = 4,26 s2 = ———Sq = 0,2164 п — 1 pl = -0,61 р2 = 0,05 ^rnin = 3,0 •£тах = 3,1 R = 2,1 Qi = 4,00 Q3 = 4,60 Q3 - Qi = 0,60 Qi = 4,35 mod = 4,50 54
Рис. 2.3. Гистограмма щадей всех столбиков гистограммы будет равна единице, как и для плотности распределения. Очевидно, что поскольку часто- ты Vi пропорциональны численностям пг, гистограммы для чис- ленностей и частот различаются только масштабом шкалы по оси ординат. На рис. 2.3 приведен пример гистограммы для рассмотренной выше выборки, содержащей 50 значений длин ле- пестков ириса (заметим, что рис. 2.3 можно рассматривать как результат преобразования рис. 2.1 путем группировки значений на оси абсцисс). При построении гистограммы возникает трудно формализу- емая проблема выбора оптимальной длины h интервалов разби- ения. Обычно число интервалов разбиения выбирают из расче- та, чтобы в каждый интервал попало в среднем не менее деся- ти наблюдений (при очень малых объемах выборки это число уменьшают). Таким образом, при увеличении объема выборки п можно уменьшать длины интервалов разбиения и более де- тально характеризовать выборку, а следовательно, и порожда- ющее ее генеральное распределение. По сравнению с эмпири- ческой функцией распределения гистограмма более наглядна, однако при ее построении привносится элемент субъективизма. Гистограмму можно построить и на основе интервалов разбие- ния разной длины, но тогда процедура ее построения несколь- ко усложняется и поэтому такие гистограммы используются до- вольно редко. 55
2.2. Статистическое оценивание Допустим, имеется случайная выборка значе- ний некоторой случайной величины распределение которой может быть либо полностью неизвестным, либо частично извест- ным, например, может быть известна его функциональная фор- ма (вид функции распределения или плотности в непрерывном случае или формулы, определяющей вероятности отдельных значений, — в дискретном). Если вид распределения неизвестен, то нас могут интересовать различные его характеристики — ма- тематическое ожидание, мода, медиана, дисперсия, интерквар- тильная широта, моменты, асимметрия, эксцесс и т. д. Если же вид распределения известен, а неизвестны лишь значения опре- деляющих его параметров, нас могут интересовать также (или даже прежде всего) значения этих параметров, например пара- метров рис2— для нормального, параметра X — для пуассо- новского и параметра р — для биномиального распределений. Задача оценивания неизвестного параметра или характеристи- ки 0 распределения случайной величины £ состоит в вычислении на основе значений выборки #i, ^2, • • •, %п величины 0(я?1, я?2, • • •, хп\ в каком-то смысле близкой к оцениваемому параметру или характеристике и называемой точечной оценкой 0, посколь- ку за оценку неизвестного параметра 0 принимается конкрет- ное значение (точка), вычисляемое по выборке [М. Кендалл, А. Стьюарт, 1973]. Точечные оценки будут рассмотрены в 2.2.1, интервальные — в 2.2.2. 2.2.1. Точечное статистическое оценивание При рассмотрении выборочных характеристик случайной ве- личины (математического ожидания, дисперсии и т. д.) как оце- нок характеристик неизвестных генеральных совокупностей фактически решалась задача оценивания. Однако такой подход был скорее интуитивным. Попробуем его формализовать, т. е. уточнить смысл близости выборочной оценки 6 = 0(я?1, Я?2? ..., хп) к оцениваемому параметру 0. Заметим, прежде всего, что 0 является случайной величиной, значения которой меняются от одной выборки к другой. Для некоторых выборок значение 0 мо- жет оказаться очень близким к оцениваемому параметру 0, для других — далеким. Можно потребовать, чтобы хотя бы в сред- нем оценки для разных выборок группировались вокруг оцени- ваемого параметра, т. е. выполнялось условие М(0) = 0. Оценки, 56
удовлетворяющие этому условию, называются несмещенны- ми. Отметим, что в зависимости от контекста 9(^1, ^2, • • • , жп) рассматривается либо как случайная величина (и только в этом случае можно говорить о математическом ожидании 9 в опре- делении несмещенности), либо как алгебраическая формула для вычисления значения оценки по выборке, либо просто как кон- кретное значение, полученное для конкретной выборки. Можно доказать, пользуясь свойствами математического ожидания и определением выборки, что выборочное мате- матическое ожидание (чаще используется термин «выбо- рочное среднее») х является несмещенной оценкой истинного математического ожидания (генерального среднего) М(£). Дей- ствительно, имеем 1 п 1 п 1 п Мх = М - У Xi = - VMfxJ = -Ум© = М(£) Z=1 J Z=1 Z=1 (мы воспользовались тем очевидным фактом, что распределе- ние любой компоненты выборки Х{ совпадает с распределением анализируемой случайной величины £). Однако, вопреки нашей интуиции, математическое ожидание выборочного второго центрального момента 1 п ^2,0 = - У2 (Xi - х)1 2 г=1 не равно генеральной дисперсии. Для получения несмещенной оценки дисперсии s2 надо разделить сумму квадратов на п — 1, а не на п. Действительно, пользуясь свойствами математическо- го ожидания, в частности тем, что математическое ожидание произведения независимых случайных величин равно произве- дению их математических ожиданий, получаем M(s2) = М [ ——- \4xi - ж)2 ] = \ п — 1 ' / \ г=1 / = —гм - МО + (W) - *))2) = п — 1 \ I \ г= 1 / 1 / П =-----тМ - МО2 + 2(М(0 - х)х п — 1 \ \ г=1 57
п \ X У (Xi - М(0) + п(М© - х)2 = г=1 / = —!-j-M | - МО2 - 2п(М(£) - х)2 + п(М(О - ж)2 ) = \ • 1 / \г=1 / = —Ц-м | у (Xi - МО2 - п(х - М©)2 | = п — 1 \ ' / \ г=1 / 1 / п \ = —7 У M((xi - МО2) - nM((ir - МО2) = п — 1 \ 2—' / \г=1 / 1 п =------(„D(5) - -0(5)) = D(5). п — 1 п Таким образом, несмещенной оценкой для D(£) будет s2 — сумма квадратов отклонений от среднего, деленная на п — 1: г=1 Следует отметить, что несмотря на то что выборочный цен- тральный момент второго порядка не является несмещенной оценкой для дисперсии D(£), его смещение (отклонение матема- тического ожидания оценки от D(£)), равное , стремится к п нулю при п оо. Оценки, удовлетворяющие этому свойству, на- зываются асимптотически несмещенными и часто, когда не удается найти несмещенную оценку для оцениваемого пара- метра, довольствуются асимптотически несмещенными оценка- ми. Конечно, нас не очень интересует, что происходит со смеще- нием при п —> оо, когда рассматривается конкретная выборка фиксированного объема п. Скорее, мы предпочитаем асимпто- тически несмещенные оценки из-за того, что, как правило, их смещение относительно невелико при не очень малых объемах выборки. Например, смещение р2,о при = 50 равно 2 %. Конечно, поскольку s2 — несмещенная оценка для D(£), то ею и следует пользоваться. Однако нас чаще интересует не оценка дисперсии D(£) случайной величины £, а оценка ее среднеквад- ратического отклонения y/D(^). Естественно взять в качестве оценки среднеквадратического отклонения корень квадратный несмещенной оценки, т. е. $, однако необходимо учитывать, что s не будет несмещенной оценкой для y/D(^), а будет лишь асимп- тотически несмещенной. 58
Итак, на примере получения несмещенной оценки дисперсии мы убедились, что «естественный» способ получения оценок, со- стоящий в использовании характеристик выборочного распре- деления в качестве оценок характеристик генерального распре- деления, не всегда приводит к наилучшим результатам. Суще- ствует ряд регулярных приемов получения оценок: метод момен- тов, метод максимального правдоподобия (будут рассмотрены далее), но они не всегда приводят к наилучшим оценкам (напри- мер, с точки зрения несмещенности). Поэтому общий подход к задаче оценивания состоит в том, чтобы в качестве претенден- та на оценку характеристики или параметра (для краткости бу- дем иногда использовать только термин «параметр») 9 генераль- ного распределения по случайной выборке ^1,^2? • брать любые функции 9(^1,Х2, ...,хп) от компонент выборки (вме- сто словосочетания «функция от выборки» применяют термин «статистика»), среди которых должна быть выбрана наи- лучшая. У нас уже имеется один критерий для сравнения оценок — наличие или отсутствие несмещенности (хотя бы асимптотиче- ской). Однако этого недостаточно. Действительно, было пока- зано, что выборочное среднее х — несмещенная оценка для ма- тематического ожидания М(£). Но можно предложить другие несмещенные оценки. Например, полусумма первого и второго значений выборки (я?1 + #2)/2, как легко показать, будет так- же несмещенной оценкой для М(£). Конечно, интуитивно мы чувствуем, что х — более предпочтительная оценка, поскольку более полно учитывает информацию, содержащуюся в выбор- ке. Однако необходим какой-то критерий, позволяющий чисто формально показать, что х лучше оценок типа (я?1 + xz)/2. Та- ким критерием может служить состоятельность оценки. Оценка 9(я?1,Х2^ ...,хп) называется состоятельной, если при п —> оо она сходится по вероятности к оцениваемому параметру 9, т. е. если для любого положительного е выполняется условие lim F(|9 - 9| > е) = 0. п—>оо Достаточным условием состоятельности оценки 9 является ее несмещенность и стремление дисперсии оценки 9 к нулю при увеличении объема выборки, т. е. оценка будет состо- ятельной, если М(9) = 9 и lim D(9) = 0. Справедливость этого п—>оо утверждения непосредственно следует из неравенства Чебыше- ва, которое в данном случае имеет следующий вид: 59
Р(|9 — М(9)| > е) < Пользуясь этим достаточным условием, покажем, что выбо- рочное среднее х является состоятельной оценкой математиче- ского ожидания. Поскольку несмещенность х уже была доказа- на, осталось показать, что D(^) —> оо при п —> оо. Действитель- но, получаем, воспользовавшись свойствами дисперсии, /1 п \ I п 1 1 D(x) = D -\>J = — VD(xi) = -^nD(S) = -D(?)-------------> 0. \ П Т1/ n n-+oo \ 2 = 1 / 2=1 Таким образом, x — состоятельная оценка для математиче- ского ожидания М(£) случайной величины И наоборот, как легко видеть, полусумма (я?1 + xz)/2 первого и второго значений выборки, будучи несмещенной, не является состоятельной, по- скольку ее дисперсия не стремится к нулю при неограниченном увеличении п D (^4^) = |(ОЫ + D(i„)) = Id®. Аналогично можно доказать, что несмещенная оценка дис- 2 « Персии s является состоятельной оценкой для генеральной дис- персии £>(£). Еще одним желательным свойством оценки является ее эф- фективность. Несмещенная оценка 0(rri, • • •, хп) параметра 9 называется эффективной оценкой, если D(9) D(9*) для лю- бой другой несмещенной оценки 9*(^i,rr2, • • • Дело в том, что две оценки, будучи обе несмещенными и состоятельными, могут различаться своими дисперсиями. Например, следующая оценка для математического ожидания 1 п— 1 i = ------ V Xi П — 1 2=1 будет, как легко проверить, несмещенной и состоятельной. Одна- D(£) ко она не будет эффективной, так как ее дисперсия--- больше п — 1 дисперсии х, которая равна----. п Ранее было отмечено, что любая функция от выборки может рассматриваться как потенциальная оценка параметра или ха- рактеристики наблюдения. Тем не менее, по крайней мере, для 60
получения начальных выражений для оценок полезно исполь- зовать регулярные методы. Полученные таким методом оценки следует проверить на несмещенность, состоятельность и эффек- тивность и затем, если необходимо, подкорректировать (подобно тому, как это было сделано с первоначально смещенной оценкой дисперсии). Наиболее часто для получения оценок применяются методы моментов и максимального правдоподобия. Метод моментов, предложенный К. Пирсоном (1894), а еще ранее в частных случаях применявшийся К. Гауссом, состо- ит в приравнивании некоторого числа выборочных моментов со- ответствующим моментам неизвестного теоретического распре- деления. Полученная система уравнений будет содержать в ка- честве неизвестных параметры теоретического распределения (через которые выражаются теоретические моменты) и извест- ные выборочные значения, поэтому при решении этой системы относительно неизвестных параметров получаются выражения для них в виде функций от выборочных значений. Можно отме- тить, что ранее, приравнивая математическое ожидание перво- му выборочному моменту, а дисперсию — второму центральному выборочному моменту, был применен этот метод (во всяком слу- чае, для нормального распределения, у которого параметры р и 9 о совпадают соответственно с первым моментом pi и вторым центральным моментом р2,о)- Метод максимального правдоподобия был впервые предложен Р. Фишером (1912) и состоит в том, что в качестве оценок параметров распределения берутся такие значения неиз- вестных параметров ai,ot2, ... ,a^, которым соответствует мак- симальное «правдоподобие» L (от англ, likelihood) появления по- лученной выборки xi, Х2ч • • •, Хп, т. е. максимальная вероятность (в дискретном случае) Цхг,х2, ...,xn;ai,a2, •..,afc) = = Р(х!,х2, ...,Tn;ai,a2, ...,afc) = = P(xi;ai,a2, ... ,afe)P(x2;ai,a2, ..., afc)... P(xn; ai, a2, ...,afc) или максимальная плотность вероятности (в непрерывном слу- чае) £(Х1, х2, ..., Хп-, 0С1, а2, ..., afc) = = /(^i,x2, ... ,rrn;ai,a2, ...,afc) = = /(xi;ai,a2, ... ,afc)/(a:2;ai,a2, ..., ak)... f(xn; ai, a2, ...,ak)-
Поскольку функция правдоподобия L{xi, х^, ..., #п; <*1, <*2, ... ,а&) зависит как от неизвестных параметров теоретического распределения, так и от выборочных значений, то, решая задачу ее максимизации по oti, 0С2, ..., а&, можно найти выражения неиз- вестных параметров oti, «2, • • • через известные выборочные значения х\, х^, .. [Г. Крамер, 1975]. Пример использования метода максимального правдоподобия для оценивания неизвест- ных параметров будет приведен в подразд. 3.3.5, посвященном логистической регрессии. 2.2.2. Интервальное статистическое оценивание Часто помимо конкретного значения оценки необходимо знать свойства оценки, которые ассоциируются с ее точностью и надежностью. Этим требованиям отвечают так называемые ин- тервальные оценки. Интервальная оценка — это некоторый интервал (0НИжн, бверхн), называемый доверительным интервалом, концы ко- торого {доверительные пределы) зависят от выборочных зна- чений и заданной доверительной вероятности у и кото- рый с заданной вероятностью у содержит теоретическое («ис- тинное») значение 0 оцениваемого неизвестного параметра, т. е. -Р(0нижн < 0 < 0верхн) = Y (дополнение у до 1 будем обозначать е, т. е. у = 1 — е). Наиболее часто используются значения доверительной вероятности у, рав- ные 0,95 или 0,99 (95%-й и 99%-й доверительные интервалы). Ес- ли Р(0 < 0НИжн) = Р{$ > бверхн) = е/2, то доверительный интер- вал называется центральным, в противном случае — нецен- тральным. Обычно применяют центральные доверительные ин- тервалы, но иногда нецентральные интервалы оказываются бо- лее подходящими. Например, при оценке доли всхожих семян важнее более точно определить нижнюю границу доверительно- го интервала 0НИжн- В этом случае следует взять ei по возможно- сти малым и Р(0 < Онижн) = Е1, Р(0 > 0верхн) = е2, где Е1 +е2 = Е. Доверительный интервал для математического ожидания нормально распределенной случайной величины с известной дисперсией Проще всего понять логику интервального оценивания на примере построения доверительного интервала для математиче- 62
ского ожидания нормально распределенной случайной величи- ны с известной дисперсией. Пусть £ — нормально распределен- ная случайная величина с неизвестным математическим ожида- нием М(£) = р и дисперсией D(£) = о2, т. е. £ ~ 7V(p, о2), и име- ется выборка значений этой случайной величины xi, . .,хп объема п. Требуется найти доверительный интервал для р с до- верительной вероятностью у. Ранее было показано, что выборочное среднее (для любого распределения, в том числе и нормального) имеет математи- ческое ожидание, равное математическому ожиданию исходной случайной величины, т. е. р, а дисперсия — дисперсии исходной случайной величины, деленной на п, т. е. о2/п. Следовательно, статистика полученная путем стандартизации выборочного среднего х. бу- дет иметь нулевое математическое ожидание и единичную дис- персию. Поскольку, как известно, линейные комбинации нор- мально распределенных случайных величин также имеют нор- мальное распределение, а случайная величина и фактически яв- ляется линейной комбинацией нормально распределенных слу- чайных величин Xi, Xi, ... ,хп, то и будет стандартно распреде- ленной случайной величиной, т. е. и ~ Л^(0,1). Стандартное нор- мальное распределение — это конкретное, полностью заданное распределение, квантили которого можно найти в соответству- ющих таблицах (или вычислить путем численного интегриро- вания). В частности, можно найти симметричные относительно центра распределения границы, внутрь которых и попадает с за- данной вероятностью у: Р(ие/2 < и < ux_z/2) = Y или, с учетом симметрии нормального распределения, ^(-«1-е/2 < и < г/1_е/2) = Y (2.2) (через иг/2 и Uy_z/2 обозначены квантили стандартного нормаль- ного распределения порядка е/2 и 1 — е/2). В частности, справед- ливы следующие неравенства: Р(—1,96 < р < 1,96) = 0,95 и Р(—2,58 < и < 2,58) = 0,99. Подставив в (2.2) выражение для и из (2.1), получим 63
P(--Ul_e/2 < X — (1 al\fn < Ul-e/2) = Y (2.3) или, после преобразований, P(x- < p < x + U^z/2-j= = 4. \ X/П У™ J о п / - - о \ Это означает, что интервал ж — ^1—е/2 —х + 1= ) \ v п у/п J будет 100у%-м доверительным интервалом для неизвестного ма- тематического ожидания р нормального распределения с извест- ной дисперсией о2. В частности, 95%-м доверительным интер- / о о \ валом будет интервал х — 1,96—= ,х + 1,96—= , а 99%-м — \ vn л/п/ / a о \ x — 2,58—=, ж + 2,58—= . Видим, что ширина доверительного у у/П у/П J интервала уменьшается при уменьшении о, увеличении объема выборки и снижении доверительной вероятности. Доверительный интервал для математического ожидания нормально распределенной случайной величины с неизвестной дисперсией В случае неизвестной дисперсии постановка задачи и ход рас- суждений при построении доверительного интервала аналогич- ны случаю известной дисперсии. Разница состоит в том, что в выражении (2.1) неизвестное среднеквадратическое отклонение о заменяется его выборочной оценкой s: х — р s/\/n (2-4) Полученная таким образом статистика t, будучи довольно сложной функцией от нормально распределенных случайных ве- личин •• • , Уже не будет нормально распределенной. Можно доказать, что статистика t имеет ^-распределение с п — 1 степенями свободы. Отсюда следует, что справедливо равенство Р ( tn-1,1—е/2 X — р \ < in_u_6/2^ = Y, аналогичное уравнению (2.3) и отличающееся от него заменой о на s и квантилей нормального распределения на соответствую- 64
щие квантили ^-распреде ления с п — 1 степенями свободы. Со- ответственно 100у%-й доверительный интервал для неизвестно- го математического ожидания р нормального распределения с неизвестной дисперсией о2 будет иметь следующий вид s _ s \ I - s \ — ^п—1,1—е/2 /—ч х ^п—1,1—е/2 /— I? ИЛИ I X i 1,1—е/2 /— )• x/П ’ ' Jn J \ ’ 1 Jn) Известно, что этот доверительный интервал и доверитель- ный интервал, полученный ранее, являются робастными, т. е. нечувствительными к умеренным отклонениям от предположе- ния о нормальности распределения. Во всяком случае, как от- мечается в пособиях по математической статистике, при объ- еме выборки не менее 15 становится целесообразно использо- вать приведенные доверительные интервалы для математиче- ского ожидания и в случае умеренного отклонения от предпо- ложения о нормальности. Заметим, что при п —> оо ^-распределение приближается к нормальному, а его квантили — к квантилям нормального рас- пределения. Например, при п — 1 = 60 квантиль £б0;0,975 равна 2,00, что не очень сильно отличается от аналогичного значения izq,975 — 1,96 для нормального распределения (особенно на фоне выборочных флуктуаций х и s). Поэтому при числе наблюдений порядка нескольких десятков можно пользоваться нормальным прибли- жением для f-распределения. Однако при небольшом числе степеней свободы различие между квантилями ^-распределения и нормального распреде- ления довольно значительно. Например, для п — 1 = 1 имеем £1;0,975 = 12,71, ДЛЯ П — 1 = 2 — ^2;0,975 = 4,30, ДЛЯ П — 1 = 5 — ^5;0,975 = 2,57. Но уже при п — 1 = 9 (т. е. для выборки из 10 на- блюдений) получаем значение ^9;0,975 — 2,26, что не очень сильно отличается от 1,96. Возвращаясь к примеру с длинами лепестков ириса и учиты- вая, что х = 4,26, s = 0,47, ti9;0,975 = 2,01 (при числе степе- ней свободы п — 1 = 49), а также предполагая, что распределе- ние длин лепестков нормально (далее будет рассмотрена проце- дура проверки этого предположения), получаем, что 95%-м до- верительным интервалом для математического ожидания дли- ны лепестка будет интервал (4,13; 4,39), т. е. можно утверждать, что с вероятностью 0,95 неизвестное р находится между 4,13 и 4,39 (точнее, найденный доверительный интервал с вероятно- стью 0,95 накрывает неизвестное значение р). 65
Доверительный интервал для неизвестной дисперсии нормально распределенной случайной величины (при неизвестном математическом ожидании) Для нахождения доверительного интервала для неизвестной дисперсии нормально распределенной случайной величины рас- смотрим статистику 2 _ (« - 1)«2 Х “ о2 Можно показать, что эта статистика имеет ^-распределение с п — 1 степенями свободы. Следовательно, справедливо равен- ство ( 2 (п — l)s2 А Р (Хп-1,е/2 < --^2--- < Хп—1,1—е/2J = Y, которое можно переписать в виде р( (п- I)*2 2 . (п - v Г I -2------- < О < —2------- I = у. \Хп—1,1—е/2 1,е/2 / Таким образом, 100у%-й доверительный интервал для неиз- « 2 вестнои дисперсии о нормального распределения с неизвест- ным математическим ожиданием р будет иметь следующий вид: / (n — l)s2 (п — l)s2\ I 2 ’ 2 | ’ \Xn—1,1—е/2 Хп—1,е/2 / 2 2 2 -1 где Хп-1 е/2 и Хп-11—е/2 — квантили X -распределения с п — 1 сте- пенями свободы. В частности, для длины лепестков ириса, учитывая, что s2 = = 0,22, п - 1 = 49, х29;0,025 = 70,24 и Х49;о,975 = 31,55, получаем, что 95%-м доверительным интервалом для дисперсии (в пред- положении нормальности распределения) будет интервал (0,15; 0,34). Полученный доверительный интервал несимметричен от- носительно значения s2 = 0,22, так как несимметрично распре- деление /2 (однако он является центральным). Заметим, что полученный доверительный интервал для дис- персии в отличие от доверительного интервала для математиче- ского ожидания чувствителен к отклонениям от исходного пред- положения о нормальности распределения, поэтому перед его применением следует проверить гипотезу о нормальности рас- пределения. 66
Доверительный интервал для неизвестного параметра р биномиального распределения Пусть проведено п независимых испытаний, в которых неко- торое событие А произошло к раз. Требуется найти точечную и интервальную оценки неизвестной вероятности р появления это- го события. Эту задачу можно рассматривать в двух эквивалентных фор- мулировках. В первой формулировке считается, что получено п наблюдений случайной величины £i, принимающей с вероят- ностью р значение 1 в случае появления события Лис веро- ятностью 1 — р значение 0 — в случае непоявления события А (распределение Бернулли). Во второй формулировке считается, что имеется только одно наблюдение случайной величины £ — числа появлений события А в одном сложном испытании (биномиальное распределе- ние). Поскольку математическое ожидание £i, как известно, рав- но р, получение оценки для р равносильно получению оценки для математического ожидания £i. Несмещенной, состоятель- ной и эффективной оценкой для математического ожидания яв- ляется выборочное среднее, которое в данном случае совпада- ет с частотой v = к/п появления события А в выборке. Та- ким образом, выборочная частота является несмещенной, со- стоятельной и эффективной оценкой для неизвестной вероятно- сти. Во второй формулировке математическое ожидание £ равно пр, а выборочное среднее для одного наблюдения равно само- му наблюдению, т. е. к. И поскольку оценкой для пр служит к (среднее по одному наблюдению), то оценкой для р снова бу- дет к/п. Построение доверительных интервалов несколько проще об- суждать в терминах биномиального распределения. Можно по- строить как точные доверительные интервалы для р, так и при- ближенные. Математические выкладки нахождения точных до- верительных интервалов довольно громоздки и здесь приведем лишь окончательные формулы для доверительных интервалов. Напротив, выражения для приближенных доверительных ин- тервалов легко получаются на основе применения центральной предельной теоремы, однако они применимы лишь при доста- точно большом п — ориентировочно при п > 25 v(v-l)’ 67
Точный доверительный интервал для параметра би- номиального распределения имеет вид /_______________к_______________ (А; + l)F2(fc+i),2(n-fc),i-E/2 \ + (п — к + l)F2(n_A;+l),2fc,l-e/2 ’ ™ — к + (к + l)F2(fc+1))2(n_fc))1_e/2 / где п — число испытаний; к — число появлений события А; Ff,g,a- ~ квантиль порядка а распределения F с /, g степенями свободы. Рассмотрим в качестве примера данные о длине лепестков ириса с точки зрения оценки вероятности появления в случай- ной выборке «длинных» лепестков, а именно лепестков длиной 4,5 см и более. В данном случае п = 50 и к = 21. Следовательно, точечной оценкой для р будет значение v = к/п = 0,42, а 95%-м доверительным интервалом — интервал ________21________ 22F42;58;Q,975 21 + 30F60;42;0,975 ’ 29 + 22F42;58;0,975 Учитывая, ЧТО Feo;42;O,975 — 1,78 И F42;58;0,975 = 1,74, получаем окончательно интервал (0,28; 0,57). Приближенный доверительный интервал для па- раметра биномиального распределения. Поскольку чис- ло появлений события А в п испытаниях равно сумме чисел появлений этого события в отдельных испытаниях (0 или 1), в соответствии с центральной предельной теоремой при боль- ших п распределение биномиальной случайной величины будет близко к нормальному. Учитывая, что дисперсия биномиаль- ной случайной величины равна пр(1 — р), получаем для ее ма- тематического ожидания приближенные доверительные преде- лы к ± ^i—e/2 л/ггР(1 — р), а для параметра р, соответственно, — /р(1 -р) v±^l-e/2V------------• ' V п Заменив параметр р его выборочной оценкой у, получим окон- чательно для приближенного доверительного интервала пара- метра р следующее выражение: В частности, для примера с лепестками ириса, подставив у = = 0,42; izo,975 — 1,96 и п = 50, получим приближенный дове- рительный интервал (0,28; 0,56), не слишком отличающийся от точного доверительного интервала. 68
Доверительный интервал для неизвестного параметра X пуассоновского распределения Пусть число появлений некоторого события А является слу- чайной величиной, имеющей пуассоновское распределение, и пусть в результате наблюдения событие А произошло к раз. Тре- буется найти точечную и интервальную оценку неизвестного па- раметра X пуассоновского распределения. Поскольку X являет- ся математическим ожиданием пуассоновской случайной вели- чины, то несмещенной, состоятельной и эффективной оценкой для X будет выборочное среднее, которое для рассматриваемой ситуации единственного наблюдения совпадает с к. Что касает- ся доверительных пределов для параметра X, то, как и в слу- чае биномиального распределения, можно предложить точное и приближенное решения. Выражения для приближенных довери- тельных пределов также основаны на применении центральной предельной теоремы и возможны лишь при достаточно большом к — ориентировочно при к > 25. Точный доверительный интервал для параметра пуассоновского распределения имеет вид 1 2 1 2 2^2А:,е/2’ 2Х2&+2,1—е/2 где к — число появлений события А; — квантиль поряд- ка а ^-распределения с f степенями свободы [Л. Н. Болыпев, Н. В. Смирнов, 1983; К. А. Браунли, 1977]. Рассмотрим следующий пример. Пусть после фильтрования 1 мл воды на фильтровальной бумаге обнаружено 100 клеток фитопланктона. Предполагая, что число клеток в заданном объ- еме воды имеет пуассоновское распределение, найти 95%-е дове- рительные пределы для параметра X этого распределения. Под- ставив к = 100, Х200;0,025 = 162>7 и Х202;0,975 = 243,4 в приведен- ные выражения, получим 95%-й доверительный интервал: (81,3; 121,7). Приближенный доверительный интервал для пара- метра пуассоновского распределения. Поскольку число по- явлений события А при наблюдении пуассоновской случайной величины £ можно аппроксимировать биномиальным распреде- лением, а последнее — нормальным, то при не слишком малых к в соответствии с центральной предельной теоремой распределе- ние случайной величины £ будет близко к нормальному. Учиты- вая, что дисперсия пуассоновской случайной величины равна X, 69
получаем для ее математического ожидания приближенные до- верительные пределы к ± Заменив параметр X его вы- борочной оценкой к, получим окончательно для приближенного доверительного интервала параметра X следующее выражение: В частности, для предыдущего примера, подставив к = 100 и ^0,975 — 1,96, получим приближенный доверительный интервал (80,4; 119,6), не слишком отличающийся от точного доверитель- ного интервала. Приближенный доверительный интервал для неизвестного коэффициента корреляции двумерного нормального распределения Рассмотрим теперь вопрос построения доверительного интер- вала для коэффициента корреляции. Пусть (#i, yi), (#2, У2), • • •, (хп, уп) ~ случайная выборка объема п из двумерного нормаль- ного распределения. Пусть р — коэффициент корреляции слу- чайных величин £ и т), а г — выборочный коэффициент корреля- ции. Распределение коэффициента корреляции г, особенно при значениях р, близких к 0 или 1, может сильно отличаться от нормального. Однако распределение следующей функции от г, называемой преобразованием Фишера, довольно хорошо ап- проксимируется нормальным распределением 1, 1 + г 21ПГ^ z = , ,z \ 1 , 1 + р со средним М(г) = - 1п---- 2 1 — р ветственно стандартизованная случайная величина будет иметь стандартное нормальное распределение и = \/п — 3 | z — 1п ~ 7V(0,1) \ 2 1 — ру и с вероятностью у будет заключена в пределах ±?z1_e/2? т-е- и дисперсией D(z) = —-—. Соот- П О Р ( -“l-t/2 < Vn -3 (z - ) < Щ_,/2 | = у. \ \ 2 1 — ру у Решив неравенство под знаком вероятности относительно не- известного коэффициента корреляции р, получим окончательно 70
/ еХР {2 (2 - У5Ц1-е/2) } ~ 1 \ехР {2 (г - } + 1 < Р < Заметим, что полученный доверительный интервал для ко- эффициента корреляции чувствителен к отклонениям от исход- ного предположения о двумерной нормальности случайных ве- личин £ И Т). Пример 2.2. Пусть объем выборки п = 10, а вычисленное по выборке значение г = 0,6, тогда 95%-м доверительным интерва- лом для неизвестного коэффициента корреляции будет интервал (0,05; 0,88). 2.3. Статистическая проверка гипотез Пусть Xi, Х2- .. • ,хп — случайная выборка значений случай- ной величины имеющей некоторое полностью или частич- но неизвестное распределение F(x). В предыдущем подразделе рассматривались методы получения оценок параметров или ха- рактеристик этого неизвестного распределения. Однако часто нас интересуют не столько конкретные количественные оцен- ки, сколько правильность или ошибочность некоторых утвер- ждений, относящихся к распределению наблюдаемой случай- ной величины. Например, является ли это распределение нор- мальным или нет? Равно математическое ожидание заданному значению или нет? Если кроме выборки xi, Х2, ... ,хп имеется выборка У1,У2, • • • ,Уп значений другой случайной величины Т), то можно поставить вопрос о том, равны или нет математиче- ские ожидания случайных величин £ и т). Если имеется выбор- ка (j?i, yi), (х2, У2^ • • •, (^п, Уп) двумерной случайной величины (5, Т)), то может возникнуть вопрос о равенстве нулю коэффици- ента корреляции между £ и т). 2.3.1. Логика проверки статистических гипотез Решению задач проверки гипотез о генеральном распределе- нии по выборке из этого распределения посвящен специальный раздел математической статистики — проверка стпатписти- 71
ческих гипотез. Логика проверки гипотез в математической статистике (она напоминает логику доказательства от против- ного) состоит в следующем. Вначале предполагается, что прове- ряемая гипотеза (ее принято называть нулевой гипотезой и обозначать Hq) верна. В этом предположении ищется распреде- ление вероятностей некоторой функции д(х±, 2:2, ... , тп) от зна- чений выборки, называемой статистикой критерия (пра- вило проверки гипотезы принято называть критерием), и в об- ласти значений этой статистики выделяется некоторая область W, называемая критической областью, такая, что вероят- ность Р(д е Ж) попадания выборочного значения статистики д в эту область не превосходит заданного малого значения а, назы- ваемого уровнем значимости критерия (обычно полагают а равным 0,05 или 0,01). Если для данной конкретной выбор- ки д попадает в критическую область W, то гипотеза Hq от- вергается (говорят — «отвергается на уровне значимости а»), поскольку вероятность этого события, если в действительности верна Но, мала. Если д не попадает в критическую область W, то говорят, что «гипотеза Hq не отвергается на уровне значимо- сти а» или «полученные данные не дают оснований отвергнуть гипотезу Hq на уровне значимости а». Очевидно, что можно разными способами задать статистику критерия ^(ti, Т2, ..., хп), а для заданной статистики — разны- ми способами выбрать критическую область W, удовлетворяю- щую условию Р(д е W) = а. Поэтому следует выбирать д и W в некотором смысле наилучшими из возможных, а именно таки- ми, чтобы полученный критерий был наиболее мощным. Для определения понятия мощности критерия введем понятие альтернативной гипотезы т.е. гипотезы, ко- торая выполняется, если не выполняется нулевая гипотеза Hq. Тогда в терминах правильности или ошибочности принятия Hq и Ну можно указать четыре потенциально возможных результа- та применения критерия к выборке (табл. 2.3). Как видим, мощность критерия — это вероятность принятия при применении данного критерия альтернативной гипотезы Н± при условии, что она верна. Очевидно, что при фиксированной вероятности ошибки 1-го рода (ее задаем самостоятельно, и она не зависит от свойств критерия) критерий будет тем лучше, чем больше его мощность (т. е. чем меньше вероятность ошибки 2-го рода). Проиллюстрируем основные понятия рассмотренной методо- логии на простом примере проверки гипотезы о равенстве ма- 72
Таблица 2.3 Возможные результаты применения критерия к выборке Верна гипотеза Принята гипотеза Но Я1 Но 1 — а — вероятность пра- вильно принять Но, когда верна Но а — вероятность ошибочно принять Hi, когда верна Но (вероятность ошибки 1-го рода, уровень значимости) нг Р — вероятность ошибочно принять Но, когда верна Hi (вероятность ошибки 2-го рода) 1 — Р — вероятность правиль- но принять Hi, когда верна Hi (мощность критерия) тематического ожидания нормально распределенной случайной величины с известной дисперсией заданному числу (с точки зре- ния практического применения этот пример несколько искус- ственен, поскольку дисперсия наблюдаемой случайной величи- ны обычно неизвестна). 2.3.2. Проверка гипотез о математических ожиданиях Итак, пусть £ ~ 7V(p,a2), Но : р = ро и Hi: р = щ и пусть имеется выборка ^1,^2, • • • значений случайной величины £ объема п. Предположим, что Но верна и в качестве статистики критерия выбираем стандартизованное выборочное среднее _ ж-р0 / /— • a/Vn При верной Яо статистика и имеет стандартное нормальное распределение и ~ 7V(0,1), представленное на рис. 2.4. На этом рисунке также указана критическая область уровня а = 0,05, состоящая из двух бесконечных полуинтервалов (—оо, —1,96] и [1,96, оо), вероятность попадания в каждый из которых стати- стики и равна а/2 = 0,025. Имеются формализованные подходы к выбору статистик кри- териев и построению критических областей, приводящие к наи- более мощным критериям, но здесь их не рассматриваем. Не- формальное же правило состоит в том, чтобы выбирать в каче- стве статистики величину, характеризующую степень отклоне- ния от нулевой гипотезы. Очевидно, разность х — ро удовлетво- ряет этому условию, а деление на константу а/у/п, сохраняя это 73
0,4 Но 0,3 0,2 0,1 Критическая । область | (Но отвергается) I а/2 = 0,025 у/ Критическая область (Но не отвергается) I Критическая I область , (Но отвергается) Ка/2 = 0,025 0,0 U -4 -3 -2 -1 0 1 2 3 4 Рис. 2.4. Пример критической области качество, приводит к величине и с полностью заданным распре- делением, что позволяет выбрать критическую область с требуе- мым уровнем значимости. Другое неформальное правило выбо- ра критической области состоит в том, чтобы она включала зна- чения статистики, соответствующие наибольшим отклонениям от нулевой гипотезы (на рис. 2.4 эта рекомендация соблюдена). До сих пор мы рассматривали свойства критерия в предпо- ложении, что верна гипотеза Hq. А что происходит, когда вер- на альтернативная гипотеза Hi? В этом случае распределение статистики критерия и изменится. Чтобы его найти, произведем преобразование = £ - ро = £ - Ро - Р1 + Р1 = x-pi + Р1 - ро о/у/п а/у/п а/у/п а/у/п из которого следует, что при гипотезе Н\ распределение стати- стики и отличается от стандартного нормального сдвигом на ве- личину А = , т. е. и ~ Н(А, 1) при выполнении Ир (у/у/п На рис. 2.5 взаимное расположение плотностей распределе- ния статистики и при гипотезах Hq и Н\ показано для случая ро = 0, pi = 2, а2 = 1, а = 0,05 и п = 1. Вероятности ошибки 2-го рода р соответствует площадь под кривой функции плотно- сти при Н\ на промежутке от —1,96 до 1,96, где не отвергается гипотеза Но, а следовательно, ошибочно не принимается гипоте- за Hi. В данном случае вероятность ошибки 2-го рода, р = 0,48, 74
довольно велика. Это произошло главным образом потому, что мал объем выборки — имеется всего одно наблюдение, п = 1. При увеличении п распределение, соответствующее альтерна- тивной гипотезе Hi, будет сдвигаться вправо, поскольку величи- Р1 - ро на А = —• будет увеличиваться, что приведет к уменыпе- а/уп нию р (см. рис. 2.5). Очевидно также, что большей величине раз- ности pi — ро соответствует большая величина А и, следователь- но, меньшая вероятность ошибки 2-го рода. Вероятность ошиб- ки 2-го рода уменьшается также при уменьшении дисперсии а2 наблюдаемой случайной величины. Кроме того, р уменьшается при увеличении а, однако не принято принимать а больше 0,05. При уменьшении а вероятность ошибки 2-го рода р, напротив, растет, поэтому не следует принимать а слишком малым, если число наблюдений п мало, разность между pi и ро невелика, а дисперсия а2 большая. Содержательно, ошибка 1-го рода — это ошибка ложного обнаружения несуществующего отклонения от нулевой гипоте- зы (ложного обнаружения несуществующего эффекта). Ошиб- ка 2-го рода — это ошибка ложного необнаружения существу- ющего отклонения от нулевой гипотезы (ложного необнаруже- ния существующего эффекта). Мощность критерия — его спо- собность обнаружить имеющееся отклонение от нулевой гипо- тезы. Рис. 2.5. Взаимосвязь между вероятностями ошибок 1-го и 2-го рода при двусторонней альтернативе 75
В приведенном примере предполагалось, что альтернативной гипотезе Н\ соответствует вполне определенное распределение $ ~ 7V(2,1), что позволило найти конкретное значение вероят- ности ошибки 2-го рода. Такого рода альтернативные гипотезы называются простыми альтернативами. Однако на прак- тике чаще встречается ситуация, когда конкретной нулевой ги- потезе противопоставляется целый спектр альтернатив. Напри- мер, Н\: М£ ро или Н\: М£ > ро- Такого рода альтернативные гипотезы называются сложными альтернативами. В слу- чае сложной альтернативной гипотезы нельзя определить вели- чину вероятности ошибки 2-го рода. Например, в рассматрива- емой ситуации она может быть значительной даже при очень большом числе наблюдений, если различие между pi и ро мало. Поэтому в ситуации, когда статистика критерия не попадает в критическую область, не утверждают категорично, что «нуле- вая гипотеза принимается», а формулируют вывод более осто- рожно: «нулевая гипотеза не отвергается». Тем самым подчерки- вается, что хотя и не обнаружены отклонения от нулевой гипоте- зы, при верной Н\ их можно ошибочно не обнаружить с вероят- ностью р, которая нам не известна и которая, возможно, доволь- но значительна. Если же р действительно велика, то утвержде- ние «нулевая гипотеза принимается» не представляет большой ценности. Например, положив равной нулю вероятность ошибки 1-го рода, независимо от результатов наблюдений, всегда будем принимать гипотезу Hq, поскольку критическая область будет включать всю область определения статистики критерия. Одна- ко при этом вероятность ошибки 2-го рода будет равна единице, т. е. если даже отклонение от нулевой гипотезы имеется, то оно с вероятностью «единица» не будет обнаружено. Сложные альтернативы могут быть двусторонними М(£) ро) и односторонними (Hi: М(£) > ро или Н\: М(£) < < ро). Если имеется достоверная информация о направлении отклонения от нулевой гипотезы, то использование односторон- ней альтернативы предпочтительнее, поскольку повышает мощ- ность критерия. Например, если известно, что отклонение мате- матического ожидания р от гипотетического значения ро может произойти только в большую сторону, то в качестве альтернати- вы следует взять гипотезу Н\: М(£) > ро. Критическая область уровня а в этом случае будет состоять не из двух бесконечных полуинтервалов (—ос, иа/2] и [г^.а/2, ос), а из одного [ui-a, ос). На рис. 2.6 ситуация с односторонней альтернативой пред- ставлена для случая ро — 0, pi = 2, о2 = 1, а = 0,05 и п = 1. 76
0,4 Рис. 2.6. Взаимосвязь между вероятностями ошибок 1-го и 2-го рода при односторонней альтернативе Вероятности ошибки 2-го рода р при условии, что верна гипоте- за Я1, соответствует площадь под кривой плотности статистики критерия д. На промежутке от —оо до 1,64 р = 0,36, что меньше величины р = 0,48 для аналогичной двусторонней альтернати- вы, представленной на рис. 2.5. Пример 2.3. Известно, что датчик генерирует случайные числа, нормально распределенные с дисперсией 1, но есть со- мнения в том, что математическое ожидание равно 0. Требует- ся проверить гипотезу о равенстве математического ожидания нулю при двусторонней альтернативе по следующей случайной выборке объема п = 25: 0,830 0,177 -0,294 0,471 -0,044 0,635 2,209 -0,394 -0,404 1,257 1,137 -0,839 1,668 0,751 0,416 -0,922 1,473 -0,317 0,220 0,414 0,428 1,088 -1,130 -0,015 0,142 Выборочное среднее равно х = 0,358, следовательно, для ста- тистики критерия получаем Ё-ц, 0,358 - 0 a/0i 1/У25 ' Значение 1,79 не выходит за двусторонние 5%-е критические пределы ±зд,975 — ±1,96, поэтому гипотеза не отвергается. На самом деле математическое ожидание датчика было рав- ным 0,25, т. е. отклонение ошибочно не было обнаружено — при 77
проверке гипотезы была сделана ошибка 2-го рода. Очевидно, мощность критерия при данном числе наблюдений п = 25, дан- ной разности между гипотетическим и истинным математиче- скими ожиданиями pi — Цо — 0,25 и данной дисперсии о2 = 1 недостаточна. (В другом эксперименте с этим же датчиком была получена выборка значений объема п = 100. Выборочное сред- нее оказалось равным х = 0,218, а выборочное значение стати- стики — равным 2,18, что дало основание отвергнуть нулевую гипотезу.) Замечание. В современных пакетах статистических программ кроме вычисленного значения статистики критерия иНабл (в данном случае иНабл = 1,79) выдается и так называемое p-значение (от англ. p-value, или просто р), равное в случае двусторонней альтернативы ве- роятности выхода за пределы ±иНабл: Р = -Р(|М 'М’набл) (в случае односторонних альтернатив определение p-значения изменя- ется очевидным образом). Вместо сравнения иНабл = 1,79 с границами критической области ±Щ),975 — ±1,96 проще сравнить соответствую- щее р-значение, равное р = 0,073, с уровнем значимости а = 0,05. Нера- венство р > а означает, что иНабл нс попало в критическую область и, следовательно, Но не должна быть отвергнута, и, наоборот, если р а, то Hq должна быть отвергнута. В рассмотренном примере 0,073 > 0,05, следовательно, Но не должна быть отвергнута. Проверка гипотезы о равенстве заданному числу математического ожидания нормально распределенной случайной величины с неизвестной дисперсией (одновыборочный t-критерии) Аналогично случаю построения доверительного интервала для неизвестного математического ожидания нормально распре- деленной случайной величины, в случае неизвестной дисперсии в качестве статистики критерия проверки гипотезы о равенстве математического ожидания заданному числу возьмем ту же ста- тистику, что и в случае с известной дисперсией, но с заменой неизвестного среднеквадратического отклонения а его выбороч- ной оценкой s X-[lQ s/JH’ При верной Но статистика t имеет ^-распределение с п — 1 сте- пенями свободы. Соответственно критическая область для про- 78
верки гипотезы Hq : р = ро против двусторонней альтернативы Н\: [1 ф ро будет состоять из двух бесконечных полуинтервалов (—oo,tn_i)0l/2] и [tn-i,i-a/2»00) против односторонней альтерна- тивы Н\: р > ро — из одного полуинтервала [2п_1д_а, оо) и про- тив односторонней альтернативы Ну: р < ро — также из одного полуинтервала (—оо,2п_ца], где ta/2, ^i-a/2? ^i-a> обозначают квантили ^-распределения с п — 1 степенями свободы соответ- ствующего уровня значимости (в силу симметричности 2-распре- деления справедливы равенства ta/2 — —^i-a/2 и 2a = — ^1-a)- Пример 2.4> Рассмотрим пример 2.3 в предположении, что дисперсия неизвестна. В этом случае необходимо вычислить оценку среднеквадратического отклонения, которая оказывает- ся равной s = 0,830. Выборочное значение статистики критерия соответственно равно х-Н0_ 0,358-0 Cv , у у - — £1 а -L. • <з/у/п 0,830/^25 Это значение необходимо сравнить с 5%-ми двусторонними критическими пределами, равными ±^24;0,025 — ±2,06. Выбороч- ное значение статистики выходит за эти пределы, следователь- но, гипотеза о равенстве математического ожидания нулю долж- на быть отвергнута на уровне значимости 5 %. Замечание. Несмотря на то что применение 2-критерия требует нормальности исходной случайной величины, его можно использовать и при умеренных отклонениях от нормальности и не слишком малых п(п 15). Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин (двухвыборочный t-критерий) Независимые выборки. Предположим, что имеются слу- чайные выборки ^1,^2» и У1?У2, значений двух независимых нормально распределенных случайных величин £~7V(M(£),D(£)) и t)~7V(M(t)),D(t))) и требуется проверить ги- потезу Н$: М(£) = М(т)) о равенстве математических ожиданий этих случайных величин. 1. Если известно, что дисперсии случайных величин £ и Т) равны, т.е. D(£) = D(iq) = а2 (значение а2 неизвестно), то можно получить следующую объединенную несмещенную оцен- ку для о2: 79
П 771 J2 - ж)2 + (%- - у)2 s2 = i=l_______________________ п + m — 2 В этом случае s2In и s2/m будут несмещенными оценками дЛя дисперсии выборочных средних х и у, а сумма s2/п + s2/т — неСмвщенной оценкой для дисперсии разности средних х — у. Со- ответственно статистика х - у как можно показать, будет иметь ^-распределение с п + т — 2 стеПенями свободы. Критическая область уровня а для провер- ки гипотезы Hq : М(£) = М(т)) против двусторонней альтерна- тивы Я1: М(£) ф М(т)) будет состоять из двух бесконечных по- луинтервалов (-00, fn+m_2,a/2] и [<п+тп-2,1-а/2,оо) против одно- сТоронней альтернативы Hi: М(£) > М(т)) — из полуинтерва- ла [/?i+m-2,i-a? оо) и против альтернативы Hi : М(£) < М(т)) — ИЗ полуинтервала ( — ОО, £п_|_т_2?а]? где ^п+т—2,а/2? ^п+т—2,1— а/2ч £п+тп-2,1-а? tn+m-2,aL обозначают соответствующие квантили ^-распределения с п + т — 2 степенями свободы. 2. Если нет оснований считать, что дисперсии случайных ве- личин £ и т) равны, то для каждой из дисперсий D(£) и D(iq) вы- числяется своя оценка п 771 ^2 с®» - я)2 22 - у? г=1 2 J=1 =--------i— и sy =-------------;— п — 1 у т — 1 и соответственно модифицируется статистика критерия ^-У / q2 q2 . Sx । У V n m которая, как можно показать, имеет ^-распределение с чйслом степеней свободы, равным целой части от 1/fc, где к выражается следующей формулой / s2x/n \2 / sy/m ] к_ \s%/n + sl/m) \s2/n + 4/т) п — 1 т — 1 80
Связанные выборки. Пусть теперь ГГ1,ГГ2, . ..,жп и У1,У2, • • чУп~ связанные случайные выборки из нормальных распре- делений £ ~ 7V(M(£),D(£)) и т) ~ Например, Xi и У1 — результаты измерения давления до и после приема лекар- ства соответственно, или длина и ширина цветка ириса. Для про- верки гипотезы Hq: М(£) = М(т)) при двусторонней альтернати- ве Н\: М(£) ф М(т)) используется статистика (х — у\у/й 1 £=—7===, ГДе sxy =----------------7 х){Уг-у\ /с2 I .2 П — 1 V ' &у 4&Ху г=1 При условии, что верна гипотеза Hq, статистика критерия имеет ^-распределение с п — 1 степенями свободы. Критическая область уровня а состоит из двух интервалов (—оо, —tn-i,i-a/2) и (^п—1,1—а/2? °0), где ^п—1,1—а/2 — квантиль ^-распределения по- рядка 1 — а/2 с числом степеней свободы п — 1. Так построенный критерий называется парным ^-критерием или ^-критерием для связанных выборок. Замечание. Для связанных выборок f-критерий совпадает с одно- выборочным ^-критерием для выборки z\, z^, ... ,zn, где z± = Xi — yi, i = 1, ... ,n, для проверки нулевой гипотезы Hq : M(z) = 0 против дву- сторонней альтернативы Н\: М(г) 0. 2.3.3. Проверка гипотез о дисперсиях Проверка гипотезы о равенстве заданному числу дисперсии нормально распределенной случайной величины (одновыборочный у2-критерий) Для проверки гипотезы Hq : a2 = о2 о равенстве дисперсии а2 нормально распределенной случайной величины £ заданному О числу Oq рекомендуется использовать статистику X2 = (п-1)“2- ао Можно показать, что эта статистика, при условии, что вер- на гипотеза Hq, распределена по закону /2 с п — 1 степенями свободы. Критическая область уровня а при двусторонней аль- тернативе Н\: а2 / о2 состоит из двух промежутков: [0, /2_1 «/2] и [Х2-1,1-а/2>°°)’ гДе Х2-1,а/2 и Xn-i,i-a/2 “ квантили порядка а/2 и 1 — а/2 распределения х2 с п — 1 степенями свободы. Для 81
односторонней альтернативы Hi: а2 > критическая область имеет вид [/n-i 1-а> °°)> а Для альтернативы Hi: а2 < Oq — соот- ветственно [0, Хп-1 а]- Проверка гипотезы о равенстве дисперсий двух независимых нормально распределенных случайных величин (двухвыборочный F-критерии) Ранее было показано, что процедура проверки гипотезы о ра- венстве двух математических ожиданий двух нормально распре- деленных случайных величин упрощается, если их дисперсии одинаковы. Следующий критерий позволяет проверить нулевую гипотезу Hq: D(£) = D(y]) о равенстве дисперсий двух нормаль- но распределенных случайных величин. В качестве статистики критерия используется отношение несмещенных оценок диспер- сий этих случайных величин При условии, что верна гипотеза Hq, можно доказать, что статистика критерия имеет F-распределение с п — 1 и m — 1 степенями свободы (пит — объемы двух выборок). Соответ- ственно критическая область уровня а для проверки гипотезы Н$: D(£) = D(t)) против двусторонней альтернативы Hi: D(£) Ф D(t)) будет состоять из двух интервалов: (0, Fn_1?m_1?a/2] и [^п—1,тп—1,1—а/2> °о)> гДе Fn-l ,тп—1,а/2> -^71 — 1, 7П-1,1-а/2 — квантили порядка а/2 и 1 — а/2 F-распределения с п - 1 и m - 1 степеня- ми свободы. Для односторонней альтернативы Hi: D(£) > D(y]) критическая область имеет вид [Fn_i?m_i?i_a, ос), а для альтер- нативы Hi: D(£) < D(t)) — соответственно [0, Fn_ijm_i?a]. Если в качестве статистики использовать отношение большей оценки дисперсии к меньшей, то в качестве критической области (для случая s2 > Sy) при двусторонней альтернативе следует исполь- зовать одностороннюю критическая область [Fn_ijm-i,i-a/2, оо)- Это позволяет ограничиться таблицами F-распределения, со- держащими значения функции распределения только для аргу- ментов больших единицы. Замечание. В отличие от ^-критерия F-критерий чувствителен к отклонениям исходных случайных величин от нормальности. При зна- чительных отклонениях от нормальности, особенно при небольшом числе наблюдений, его применять не следует. 82
2.3.4. Сравнение параметров двух биномиальных распределений Пусть две независимые биномиально распределенные случай- ные величины £ и т) с параметрами п, pi пт, р^, соответственно, при проведении независимых испытаний приняли значения к и I. Требуется проверить гипотезу Hq : pi = р^ о равенстве пара- метров pi и ртр Для этого можно использовать статистику где > Vyj и v — выборочные частоты, вычисленные по пер- вой, второй и объединенной выборкам: = к/п, = 1/т и v = (к + Г)/(п + т). Если верна гипотеза Но, то для v^, v^, не очень близких к 0 или 1, и при достаточно больших п, т эта ста- тистика имеет приближенно стандартное нормальное распреде- ление [К. А. Браунли, 1977]. Критическая область уровня значимости а для проверки ги- потезы Hq : Pi = Рп против двусторонней альтернативы Ну. Pl ф р^ будет состоять из двух бесконечных полуинтервалов (—оо,па/2] и [^1-01/2,00) против односторонней альтернативы Hi : pi > Pri — из одного полуинтервала (ui-a,oo) и против од- носторонней альтернативы Hi: pi < р^ — также из одного полу- интервала (—oo,ua], где ?ia/2, ^i-a/2> 'Щ-а и па обозначают кван- тили соответствующего порядка стандартного нормального рас- пределения. Замечание. Имеется также точный критерий Фишера для провер- ки этой гипотезы [К. А. Браунли, 1977; Н. В. Глотов и [др.], 1982]. 2.3.5. Сравнение параметров двух пуассоновских распределений Пусть две независимые случайные величины £ и 7), имею- щие пуассоновское распределение с параметрами Х^ и Х^, соот- ветственно, при проведении испытаний приняли значения к и I. Требуется проверить гипотезу Но: Х^ = Х^ о равенстве парамет- ров Х^ и Ху) распределений этих случайных величин. Для этого можно использовать статистику 83
распределение которой при выполнении Hq и при к + I > 5 до- вольно точно приближается стандартным нормальным распре- делением. Соответственно, как и в подразд. 2.3.4, критическая область уровня значимости а для проверки гипотезы Hq: р^ = pTi против двусторонней альтернативы Н\: р^ ф рТ[ будет состоять из двух бесконечных полуинтервалов (—оо,па/2] и [^i-a/2,00) против односторонней альтернативы Н\: р^ > из одного полуинтервала [гн_а, ос) и против односторонней альтернативы Н\: р^ < рт) — также из одного полуинтервала (—ос, па]. 2.3.6. Проверка гипотезы о равенстве заданному числу коэффициента корреляции Пусть (#1, pi), (#2, У2^ • • •, (жп, Уп) ~ случайная выборка пар значений двумерной случайной величины (£,т)), имеющей дву- мерное нормальное распределение. Требуется проверить гипоте- зу Hq : р = ро о равенстве коэффициента корреляции р этого дву- мерного распределения заданному числу ро- Для проверки этой гипотезы можно использовать статистику и = \/п — 3 2 \ 1 — г 1-ро/ (2.5) распределение которой при выполнении Hq и при достаточно большом п довольно точно приближается стандартным нор- мальным распределением. Соответственно, как и в двух преды- дущих подразделах, критическая область уровня значимости а для проверки гипотезы Hq : р = ро против двусторонней альтер- нативы Н\: р ф ро будет состоять из двух бесконечных полуин- тервалов (—оо,па/2] и [^1-а/2 ч00) против односторонней альтер- нативы Н\: р > ро — из одного полуинтервала [ui«a, оо) и про- тив односторонней альтернативы Н\: р < ро — также из одного полуинтервала (—оо, ил]. Обычно проверяется гипотеза о равенстве коэффициента кор- реляции нулю, что в случае двумерного нормального распреде- ления, как ранее отмечалось, эквивалентно проверке гипотезы о независимости и т). В этом случае выражение (2.5) упрощается и = \/п — 3 2 In (2-6) 1 + г 1 — г 84
Пример 2.5. Пусть объем выборки п = 10, вычисленное по выборке значение г = 0,6, и требуется проверить гипотезу Hq : р = 0 против альтернативы Н\: р / 0. Выборочное значение статистики п, вычисленное по форму- ле (2.6), равно 1,83. Поскольку оно не выходит за двусторонние 5%-е критические пределы стандартного нормального распреде- ления ±1,96, нет оснований отвергнуть нулевую гипотезу об от- сутствии корреляции. Если бы у нас были основания предпола- гать, что корреляционная зависимость в случае ее наличия мо- жет быть только положительной, то следовало бы использовать для проверки Hq одностороннюю критическую область, кото- рая для а = 0,05 представляет собой бесконечный полуинтервал [1,64; оо). Значение 1,83 попадает в эту критическую область и, следовательно, гипотеза об отсутствии корреляции должна была быть отвергнута. Заметим, что число наблюдений в данном при- мере недостаточно велико для уверенного использования данно- го приближенного критерия. Если к этому добавить тот факт, что выборочное значение статистики критерия находится вбли- зи границы критической области, то следует заключить, что по имеющимся данным нельзя сделать надежного вывода ни о на- личии, ни об отсутствии корреляции. Отметим, что если бы значение г = 0,6 было получено для п — 50, то выборочное значение статистики и было бы равно 4,75, и гипотеза однозначно должна была быть отвергнута не только на уровне значимости 5%, но и 1% (и даже более вы- соком, так как вероятность того, что стандартно распределен- ная случайная величина примет значение, большее 4,75, равна 0,000001). 2.3.7. Критерии согласия Все рассмотренные ранее критерии принято относить к груп- пе так называемых параметрических критериев. Примене- ние этих критериев требует знания вида распределения наблю- даемых случайных величин (нормальное, биномиальное, пуассо- новское, двумерное нормальное и др.), и проверяемая гипотеза касается параметров данных распределений. Прежде чем при- менять параметрические методы, необходимо убедиться в том, что мы действительно имеем дело с распределением требуемого вида. Предположение о виде распределения случайной величины — статистическая гипотеза, которую можно проверить с помощью 85
экспериментальных данных. Критерии для проверки согласия между распределением выборочных значений и заданным тео- ретическим распределением называются критериями согла- сия. Пусть имеется выборка #2, • • • , хп значений случайной ве- личины £ с неизвестной функцией распределения F(x). Требу- ется проверить гипотезу Hq : F(x) = Fq(x) о том, что случайная величина имеет некоторое заданное распределение Fq(x) про- тив альтернативной гипотезы Н^ : F(x) ф Fq(x). Распределение Fq(x) может быть либо задано полностью (простая нулевая гипо- теза), либо с точностью до значений параметров (сложная нуле- вая гипотеза). Во втором случае фактически проверяется при- надлежность распределения к заданному виду, например про- веряется гипотеза о нормальности. Часто это делается в целях обоснования применения для обработки полученных данных ме- тодов, требующих принадлежности распределения к заданному типу. Рассмотрим два критерия согласия. Критерий согласия /2. Относительно распределения F(x) не делается никаких предположений, оно может быть как непре- рывным, так и дискретным. Для проверки простой нулевой ги- потезы статистика критерия /2 вычисляется следующим обра- зом. Область изменения значений выборки разбивается на к ин- тервалов с таким расчетом, чтобы число наблюдений попав- ших в г-й интервал, г = 1, ..., /с, в большинстве интервалов бы- ло не менее 10. Для каждого из интервалов вычисляется также вероятность pi попадания в этот интервал случайной величины при условии выполнения гипотезы Н$. Статистика /2 равна нор- мированной сумме квадратов отклонений числа наблюдений от гипотетической частоты npt\ к (тц - npj)2 ПРг Для легкости запоминания эту формулу можно рассматри- вать как сумму квадратов пуассоновских случайных величин Пг, стандартизованных путем вычитания из них гипотетических средних npi и деления разности на их среднеквадратические от- клонения {rtpi)1/2. Если верна гипотеза Но, то при достаточно большом п (не ме- нее 50) распределение данной статистики хорошо приближается /^распределением с к — 1 степенями свободы (одна степень сво- боды вычитается даже при полностью заданном Fq(j:), посколь- 86
ку значения тц связаны соотношением п\ +712 + .. .+пь = п). Сле- довательно, критическое множество уровня значимости а состо- ит из одного полуинтервала [Xfc—1 i-a’ +°°)> гДе Xfc-i i-a ~ кван- тиль ^-распределения с числом степеней свободы к — 1 порядка 1 - а. Необходимость в проверке простых гипотез возникает отно- сительно редко. Наиболее интересным для практики является случай, когда Fq(x) известна с точностью до значений г пара- метров, Fq(x) = Fo(#,9i, . ..,0Г), где 0i, ...,0r — неизвестные параметры. Тогда статистика критерия имеет вид 2 _ V" (п» ~ пРгУ * где pi = Рг(61, ..., 0Г) — оценки вероятностей г = 1, ..., fc; 01, ..., 0Г — оценки параметров 01, ..., 0Г, определяемые через наблюдаемые частоты щ, ..., п^- Если нулевая гипотеза верна, то статистика критерия /2 9 при п —> оо распределена асимптотически как х с числом сте- пеней свободы к — г — 1. Следовательно, критическое множество уровня значимости а состоит из полуинтервала [х^_г_1 i_a, +00), 2 2 ’ где Xfc-r-i 1—a “ квантиль х -распределения с числом степеней свободы к — г — 1 порядка 1 — а. Часто оценки неизвестных параметров 01, ..., 0Г определяют- ся не по наблюдаемым частотам а по всей выборке. Напри- мер, при проверке нормальности ожидаемую частоту в г-м ин- тервале npi находят, используя выборочное среднее х и выбороч- ную дисперсию s2, определенные по всей выборке. В этом случае статистика критерия х2 при справедливости Hq не распределена асимптотически как х^-г-р ее функция распределения заклю- чена между функциями распределений Xk-1 и Xfc-r-r Различи- ем между ними можно пренебречь при больших к. Но для малых к полезно убедиться, что выборочное значение статистики кри- 2^2 2 - 2 теРИЯ Хвыб > Xfc—г—1,1—а И Хвыб > Xfc—1,1—а* Одновыборочные критерии Колмогорова и Смирно- ва. Эти критерии применяют для проверки соответствия непре- рывного распределения F(x) заданному Fq(x). Статистика Кол- могорова для проверки гипотезы Hq: F(x) = Fq(x) против альтернативы : F(x) ф F(x) может служить мерой близо- сти эмпирической функции распределения F(x) и теоретиче- ской Fq(x): 87
Dn = зир|Г(ж) - F0(x)|. X Статистика Смирнова D+ для проверки гипотезы Hq против альтернативы : F(x) > Fq(x) имеет вид = sup[F(x) - Го (ж)]. X Для случая простой нулевой гипотезы распределение стати- стик Dn и D+ при справедливости Hq не зависит от типа Fq(x). Если верна нулевая гипотеза, предельным распределением ста- тистики y/nDn при п —> оо является распределение Колмогоро- ва, а Н. В. Смирнов получил точное предельное распределение статистики D+. Соответственно критическое множество уровня значимости а для проверки гипотезы Hq против альтернативы 7/1 состоит из полуинтервала [79п,1-а, +°°), а против альтерна- тивы Hf — из полуинтервала [79+1_а, +оо), где Dn,i_a, 7?^i_a — критические значения статистик Dn и 79+, соответственно, уров- ня значимости а. При а 0,2 имеем 79пд_а « 1-а/2 с большой точностью (большей, чем 0,00005). В случае сложной нулевой гипотезы, когда Fq(x) известна с точностью до параметров, Fq(x) = Fo(#,9i, ... , 9Г), где 0i, ..., f)r — неизвестные параметры, статистика критерия для проверки гипотезы Hq против двусторонней альтернативы имеет вид: Ьп = sup F(z) - F0(j:,9i, ... ,9Г) , X I I где 9i, ...,9r — оценки неизвестных параметров. При условии, что нулевая гипотеза Hq верна, распределение статистики Dn (и 79+) уже зависит от конкретного вида распре- деления Fq(x, 9i, ..., 9Г). Для некоторых типов распределений — нормального, показательного, логистического — Лиллиефорсом получены таблицы критических значений статистики Dn при условии, что гипотеза Hq верна [Н. W. Lilliefors, 1967; R. R. Sokal, F. J. Rohlf, 1995]. Соответственно критическое множество уровня значимости а для проверки гипотезы Hq против альтернативы Т/i состоит из одного полуинтервала [Рпд_а, +оо), где /)пд_а — критическое значение статистики Dn для заданных а, пи Fq(x). Статистика Dn может быть преобразована к виду, практиче- ски не зависящему от п. Например, для нормального распреде- ления получено следующее выражение для модифицированной формы статистики Колмогорова D* [Ю. Н. Тюрин, 1978] 79* = 79n(v^ - 0,01 + 0,85/х/п). 88
Это дает возможность проводить проверку гипотезы практи- чески при всех п, зная значения для небольшого набора значений а. В частности, для а = 0,05 имеем Dq 95 = 0,895. При проверке гипотезы о нормальности распределения с не- известными средним и дисперсией критерии Колмогорова и Смирнова являются более мощными, чем критерий х2- Заметим, что в англоязычной литературе критерии Колмого- рова и Смирнова называют одновыборочным критерием Колмо- горова-Смирнова, а статистики Dn и D+ — одновыборочными статистиками Колмогорова — Смирнова. Среди других критериев согласия отметим критерий Ша- пиро-Уилка для проверки нормальности [Г. Хан, С. Шапиро, 1969]. Пример 2.6. Пусть получена следующая выборка 50 значе- ний случайной величины с неизвестным распределением: 45 89 93 40 91 60 2 59 87 78 57 39 50 0 35 91 67 62 25 93 19 98 55 78 34 45 86 31 15 95 50 52 35 66 0 44 93 36 29 44 17 85 17 63 34 43 100 75 84 9 Проверим гипотезу о том, что эта случайная величина имеет нормальное распределение. После разбиения области изменения выборочных значений на пять равных интервалов получаем сле- дующие эмпирические и гипотетические частоты: Интервал Эмпирическая ,..(-оо,20] (20,40] (40,60] (60,80] (80, а частота щ 8 10 12 7 13 Г ипотетическая частота npi ... 6,1 9,7 13,4 11,6 9,2 Гипотетические частоты вычислялись для нормального рас- пределения ЛГ(р = 53,3, о2 = 840,4) с параметрами, оцененными по выборке. Соответственно число степеней свободы статистики критерия равно 5 — 1 — 2 = 2. Выборочное значение статистики X2 = 4,2, а критическая граница х2 0 95 = 6,0, т. е. критическое множество уровня значимости а = 0,05 состоит из полуинтерва- ла [6,0; +оо). Следовательно, нет оснований отвергнуть гипотезу о нормальности. В действительности выборка была получена с помощью дат- чика случайных чисел, равномерно распределенных на отрез- ке [0, 100], т. е. мы видим, что при данном числе наблюдений 89
(в общем-то, конечно, небольшом для проверки гипотезы о ти- пе распределения) критерий /2 не обнаруживает отклонения от нормальности. Выборочное значение статистики критерия Колмогорова — Смирнова равно = 0,11, что также не выходит за 5%-й предел этого критерия в предположении, что гипотетические средние равны выборочным. Однако в случае неизвестных параметров гипотетического нормального распределения лучше пользовать- ся модификацией критерия Колмогорова —Смирнова [Н. W. Li- lliefors, 1967]. Но = 0,11 < £>5 095 = 0,895, что не дает основа- ний отвергнуть гипотезу и по этому критерию. Пример 2.7. Расчеты, аналогичные предыдущим, проведен- ные для выборки объема 150 значений случайной величины, рав- номерно распределенной на отрезке [0, 100], дали значение /2 = = 7,6, что меньше /2.0 95 = 9,5. Следовательно, нет оснований о отвергнуть гипотезу о нормальности по критерию /ив этом случае. По критерию Колмогорова —Смирнова (Лиллиефорса) гипотеза отвергалась на уровне 1 %. Полученные результаты по- казывают, что критерий Колмогорова—Смирнова (Лиллиефор- са) является более мощным, чем критерий /2 при проверке ги- потезы о нормальности распределения с неизвестными средним и дисперсией. Пример 2.8. Расчеты статистик критериев согласия для данных примера 2.1, содержащих 50 выборочных значений дли- ны лепестка ириса разноцветного, приводят к значению стати- стики /2, равному 2,1, и значению статистики £>п, равному 0,117. В этом случае гипотеза о нормальности не отвергается ни кри- терием х2, ни критерием Колмогорова—Смирнова —Лиллие- форса. Пример 2.9. В некоторых классических экспериментах с се- лекцией гороха Г. Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми жел- тыми семенами и растений с морщинистыми зелеными семена- ми. Они приведены в табл. 2.4 вместе с теоретическими вероят- ностями, вычисленными в соответствии с теорией наследствен- ности Менделя [М. Дж. Кендалл, А. Стьюарт, 1973]. В этом случае теоретическое распределение дискретно и из- вестно полностью. Для проверки согласия экспериментальных „ 9 данных теоретическому распределению используем критерии / для простой гипотезы. Значение статистики, вычисленное по вы- 90
Результаты эксперимента Г. Менделя Семена Численность эмпирическая ожидаемая Круглые и желтые 315 9 556 • — = 313 16 Морщинистые и желтые 101 556 • — = 104 16 Круглые и зеленые 108 556 - ^ = 104 16 Морщинистые и зеленые 32 556 • = 35 16 Всего 556 556 4 / \ 2 борке, равно —-------— = 0,47, что меньше 5%-го критиче- ского значения Хз-0 95 = 7,81, р = 0,9. Следовательно, теория наследственности Менделя не противоречит полученным экспе- риментальным данным. Наряду с количественными статистическими критериями для определения вида распределения по выборочным данным ис- пользуются графические методы. Простейший способ — построение по имеющейся выборке ги- стограммы относительных частот и на том же графике и в том же масштабе — кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров. Значительные отклонения от нормальности (силь- ная асимметрия, бимодальность) легко обнаруживаются на гра- фике. Пример 2.10. Применим графический метод к рассмотрен- ной ранее модельной выборке объема п = 50 (см. пример 2.6), извлеченной из равномерного распределения. На рис. 2.7 при- ведены гистограмма и кривая нормальной плотности. Визуаль- но заметно отклонение от нормальности в пользу равномерно- сти (хотя, как было показано, статистически значимо при таком числе наблюдений оно не подтверждается). С точки зрения визуального обнаружения отклонений от нормальности сравнение эмпирической и гипотетической функ-
Рис. 2.7. Сравнение гистограммы и кривой нормальной плотности ций распределения гораздо менее наглядно, чем сравнение ги- стограммы с графиком плотности. Однако обычно сравнива- ют не сами функции распределения, а обратные нормальные преобразования от них, так называемые пробит-графики. Пробит-график теоретической нормальной функции распреде- ления представляет собой прямую, а пробит-график эмпириче- ской функции распределения тем ближе к прямой, чем ближе она к нормальной. Этот прием позволяет на первом этапе ана- лиза данных выявить их особенности, выдвинуть гипотезы о ха- рактере распределения, решить вопрос о целесообразности заме- ны переменной. 2.3.8. Непараметрические критерии Предположим, что для конкретной выборки мы отклоня- ем гипотезу о нормальном распределении генеральной совокуп- ности. Тогда для получения статистических выводов применя- ют разные способы. Если объем выборки достаточно велик, то можно использовать параметрические критерии (см. 2.3.2, 2.3.3) как приближенные. Другой способ состоит в подборе за- мены переменной, приводящей к нормальному распределению. Третий способ — применение непараметрических критери- ев (часто употребляют термин «критерий, свободный от рас- пределения»). Эти критерии не требуют знания вида исход- ного распределения F(a?), за исключением предположения о том, что это распределение непрерывно. В качестве статистик этих критериев используются такие функции от наблюдений, 92
распределение которых, если верна нулевая гипотеза, не зави- сит от F(x). Конечно, нельзя ожидать, что непараметрические критерии будут обладать такой же чувствительностью к раз- личению нулевой и альтернативной гипотез, как и критерии, основанные на знании вида F(x). Более подробно с метода- ми непараметрической статистики можно познакомиться в ра- ботах [Ю. Н. Благовещенский, В. П. Самсонова, Е. А. Дмитриев, 1989; М. Дж. Кендалл, А. Стьюарт, 1973; Ю. Н. Тюрин, 1978; М. Холлендер, Д. А. Вульф, 1983; J. Н. Zar, 1999]. Наибольшее развитие и применение в задачах непараметри- ческой проверки гипотез получили ранговые методы. Статисти- ки таких критериев основаны не непосредственно на численных значениях наблюдений ^1,^2, . а на их рангах, т. е. на порядковых номерах наблюдений при их упорядочении по воз- растанию (в вариационном ряду), R(x{),R(x2), ...,R(xn). Хо- тя непараметрические критерии применяются для непрерыв- ных распределений, среди выборочных значений могут быть совпадающие, например из-за неизбежных ошибок округления. В этом случае для определения рангов равных величин исполь- зуются различные методы. Метод случайного ранга состо- ит в том, что ранги совпадающих наблюдений можно взять в произвольном порядке. Например, для того чтобы решить, ка- кой из двух равных величин хг или х^ приписать больший ранг, можно бросить монету. Метод среднего ранга каждому из совпадающих наблюдений приписывает ранг, равный среднему арифметическому их порядковых номеров в вариационном ря- ду. Например, равным величинам xi = х^, которые в случае их неравенства имели бы ранги г и г + 1, приписывается сред- ний ранг г + 1/2. Третий метод заключается в том, чтобы от- бросить равные наблюдения. Ранги наблюдений, будучи функ- циями выборочных значений, являются случайными величина- ми с возможными значениями 1,2, ...,п. Оказалось, что на- бор рангов R(x2^ .. • , Я(я\г) содержит значительную до- лю информации о распределении наблюдаемой случайной вели- чины. Если статистика рангового критерия g(Ri, R%, • • •, Rn) — дис- кретная случайная величина, то для заданного уровня значимо- сти а может не существовать значения квантили распределения статистики критерия при справедливости нулевой гипотезы. По- этому для определения критического множества используются верхнее критическое значение статистики критерия gi-a, рав- ное наименьшему значению квантили распределения статисти- 93
ки критерия д, такому, что Р(д <71-а) а, и нижнее критиче- ское значение да, равное наибольшему значению квантили рас- пределения статистики критерия д, такому, что Р(д д^) а. Значения да и gi_a находят по таблицам. Для всех рассматрива- емых далее критериев существуют таблицы критических значе- ний статистики [Л. Н. Болыпев, Н. В. Смирнов, 1983]. Замечание. Ранговые критерии применяются и в тех случаях, ко- гда наблюдения не являются количественными, но допускают упорядо- чение, что часто имеет место в исследованиях по биологии, медицине, психологии и социологии. Одновыборочные непараметрические критерии Одновыборочные критерии предназначены для проверки ги- потезы о равенстве медианы заданному значению. Пусть име- ется выборка a?i,#2, значений случайной величины £ с неизвестной непрерывной функцией распределения F(a;,Me), где Me — неизвестная медиана. Требуется проверить гипотезу Но: Me = Мео, о равенстве медианы заданному числу Мео- Рас- смотрим два наиболее часто используемых критерия для про- верки этой гипотезы. Критерий знаков. В качестве статистики критерия п+ при- меняют число положительных разностей Xi — Мео, i — 1, • • • ,п. Если верна нулевая гипотеза Но, то Р(х{ > Мео) = Р(%г < Мео) — = 1/2 и, следовательно, статистика критерия п+ — дискретная случайная величина, распределенная по биномиальному закону с параметрами п и р = 1/2.Критическая область уровня зна- чимости а против двусторонней альтернативы Hi: Me Мео будет состоять из двух интервалов [0, п+/2] и [тг+_а/2,тг], при- чем п*/2 = п — так как распределение статистики кри- терия п+ симметрично относительно своего среднего п/2, где na/2’ nt-a/2 ~ нижнее и верхнее критические значения статисти- ки п+ порядка а/2 соответственно. Критическая область против односторонней альтернативы Hi: Me > Мео имеет вид [n+_a,n] и против односторонней альтернативы Hi : Me < Мео — [0, п+]. При 72 —> оо случайная величина п+ распределена асимптотиче- ски нормально, п+ ~ АГ(тг/2,7г/4), и для нахождения критиче- ских значений можно воспользоваться нормальным приближе- нием. Замечание. Критерий знаков обладает недостаточной чувстви- тельностью к различению нулевой и альтернативной гипотез. Но из-за 94
простоты и наглядности он часто используется для предварительного анализа данных. Более мощным является критерий знаковых рангов. Критерий знаковых рангов. Упорядочим по возрастанию разности Xi — Мео и обозначим через R(xi — Мео) — ранг г-й раз- ности, г = 1, ..., п. Статистика критерия знаковых рангов равна сумме рангов положительных разностей Xi — Мео: т+ = R(Xi - Мео). (xi- Мо)>О Если нулевая гипотеза Но верна, то вероятность каждого из возможных 2П исходов для набора рангов положительных раз- ностей равна (1/2)™, что и определяет распределение статисти- ки критерия для заданного п, симметричное относительно сред- него п{п + 1)/4, откуда следует, что T1Lot = п(п + 1)/2 — Т+, где T0^,T1La — нижнее и верхнее критические значения стати- стики критерия для заданных а и п соответственно. Критиче- ская область уровня а против двусторонней альтернативы бу- дет состоять из двух интервалов [О, Т^2] и [Т+_л/2, п(п + 1)/2] против правосторонней альтернативы — из одного интервала [T1La,n(n + 1)/2] и против левосторонней альтернативы — так- же из одного интервала [О, Т+]. Если верна гипотеза Hq, то при п —> оо распределение ста- тистики критерия стремится к нормальному распределению, T+~7V(n(n + 1)/4,п(п + 1)(2п + 1)/24). При п>25 этим прибли- жением можно пользоваться для определения критических зна- чений статистики. Проверка гипотезы об отсутствии сдвига Пусть имеются выборки Х1, Х2, . . . , Хп И ?/1, У2, ... ,ут значе- ний случайных величин £ и т) с неизвестными непрерывными функциями распределения F(x) и G(x) одинаковой формы, ко- торые могут различаться лишь параметром сдвига А, т. е. G(x) = = F(x — А). Требуется проверить гипотезу Hq : А = 0 об отсут- ствии сдвига между распределениями случайных величин £ и т). Случай независимых выборок. Пусть xi,X2, и У1’>У2’> • • • чУт ~ независимые выборки. Критерий Манна — Уитни. Пусть п т, в противном случае выборки поменяем местами. Упорядочим п + т наблюде- ний по возрастанию и обозначим через Ri ранг г-го наблюдения в объединенном ряду наблюдений, i = 1, ..., п + т. Если есть сов- 95
падающие значения внутри какой-либо из выборок, то их ранги можно взять в произвольном порядке. Если же совпадают зна- чения, принадлежащие разным выборкам, то для определения их рангов применяется метод среднего ранга (см. 2.3.8). В качестве статистики Манна —Уитни U используется общее число случаев (инверсий) в упорядоченной по возрастанию по- следовательности из х и т/, в которых х появляется позднее неко- торого у: п т = 5222^, г=1 j=l §ij — < 1 при^>т/7; О ПриЖг<^- Если Xi = у3, то к значению U прибавляется 1/2. Статистика U — дискретная случайная величина, принимающая значения от 0 до пт. Если нулевая гипотеза верна, то С™+т последовательностей из х и у являются равновероятными, что и определяет распре- деление статистики /7, симметричное относительно своего сред- него nm/2. Критическая область уровня а против двусторон- ней альтернативы Н\: А ф 0 будет состоять из двух ийтерва- лов [0, С/а/2] и [^i-a/2,гДе ^а/2 и ^1-а/2 — нижнее и верхнее критические значения статистики U порядка а/2 соответствен- но. Критическая область против односторонней альтернативы Н\: А > 0 — из одного интервала [C7i_a,nm] и против односто- ронней альтернативы Н\: А < 0 — из одного интервала [0, Ua]. Заметим, что нижнее и верхнее критические значения статисти- ки U связаны соотношением Ui-a = тп — Ua. При малых пит критическое значение Ua определяется непосредственным подсчетом последовательностей с наимень- шим количеством инверсий. Если гипотеза Hq верна, то при 72 —> ос, ш —> ос статистика U распределена асимптотически нор- мально: U ~ У(72772/2, 72772(72 + 772 + 1)/12). Критерий Вилкоксона. Статистику критерия U можно также вычислить по формуле U = W - п^п + 2 п где W = ^Rj, сумма рангов наблюдений Xj,j = 1, ... ,72, — 7=1 статистика критерия Вилкоксона. Следовательно, критерии, ос- нованные на статистиках U и W, эквивалентны. 96
Пример 2.11. Пусть получены выборки значений двух слу- чайных величин £ и т) объема п = 4 и т — 5: $.......... 174 175 183 174 г)......... 187 185 185 179 181 Составим из них общий вариационный ряд (т. е. расположим в порядке возрастания), сохранив информацию о принадлежно- сти к выборке: Ранг 1 2 3 4 5 6 7 8 9 к п 174 174 175 179 181 183 185 185 187 Сумма рангов выборки значений случайной величины £ рав- на ТУ = 1+2+3+6= 12. Это значение не выходит за двусто- ронние критические пределы 1^0,025 = 11 и Ио,975 — 29 уровня значимости 5 %. Выборочное значение статистики U = 2 и со- ответствующее ему р = 0,032 < а = 0,05 и, следовательно, нет оснований отвергнуть нулевую гипотезу о том, что сдвиг между распределениями F(x) и G(x) отсутствует. Заметим, что приведенные данные были получены с по- мощью датчика нормально распределенных случайных чисел £ ~ = 175, о2 = 25) и т) ~ У(р = 180, о2 = 25). Приве- денные значения могли бы быть, например, значениями роста четырех случайно выбранных французов и пяти случайно вы- бранных норвежцев (средний рост взрослых мужчин Франции и Норвегии равен 175 и 180 см соответственно), т. е. в действи- тельности сдвиг А между распределениями отличен от нуля (он равен А = 175 — 180 = —5) и гипотеза Hq : А = 0 неверна, но кри- терии Вилкоксона и Манна —Уитни не обнаружили различия между распределениями F(x) и G(x). Если применить к при- веденным данным ^-критерий Стьюдента для сравнения мате- матических ожиданий двух нормально распределенных случай- ных величин с неизвестными дисперсиями, то получим выбороч- ное значение t = — 2,72 для статистики критерия. Поскольку это значение выходит за 5%-е критические пределы £750,025 = —2,36 и £750,975 = 2,36 ^-распределения с4 + 5 — 2 = 7 степенями сво- боды, то гипотеза о равенстве математических ожиданий долж- на быть отвергнута. Это типичная ситуация — непараметриче- ские критерии обладают меньшей мощностью по сравнению с аналогичными параметрическими критериями, использующими дополнительную информацию о наблюдаемых случайных вели-
чинах. Поэтому, если имеется достоверная дополнительная ин- формация, то предпочтительнее использовать критерий, учиты- вающий эту информацию. Критерий Ван-дер-Вардена. Обозначим N = п + т. Ста- тистика критерия имеет вид \7V +1 г=1 х где R(xi) — ранг наблюдения х^, Ф(р) — р-квантиль стандартного нормального распределения. Критерий Ван-дер-Вардена является наиболее мощным непа- раметрическим критерием для проверки гипотезы об отсутствии сдвига. Если обе выборки извлечены из нормальных совокупно- стей, то при постоянном п и т —» оо критерий Ван-дер-Вардена имеет такую же мощность, как и двухвыборочный ^-критерий. Случай связанных выборок. Пусть •• и Уь ?/2, • • • ,Уп~ связанные выборки, например каждая пара наблю- дений (#г,Уг),г = 1, ...,п, принадлежит одному объекту, либо (х^уг) попарно связаны тем, что условия проведения наблюде- ний менялись от опыта к опыту, но для каждой пары (х^у^ оставались постоянными, что в практике биологического экспе- римента встречается очень часто. Обозначим через Z{ = Х{ — yt, г = 1, ..., п. Тогда проверка гипотезы об отсутствии сдвига меж- ду F(x) и G(x) сводится к проверке гипотезы о равенстве ну- лю медианы для выборки zi, 22, • ♦ •, zn. Для этого можно при- менить критерий знаков или критерий знаковых рангов, рассмотренные ранее. Критерии однородности. Критерии Манна—Уитни (Вил- коксона) и Ван-дер-Вардена позволяют обнаруживать лишь раз- личия в центральных тенденциях непрерывных распределений двух случайных величин. Если важно обнаружить любые рас- хождения в форме непрерывных распределений, то пользуются критериями однородности, например двухвыборочным критерием Смирнова. С помощью этого критерия проверя- ется гипотеза Hq: F^(x) = F^x) о том, что функции распреде- ления F^ (х) и F^x) случайных величин и Y) идентичны против альтернативной гипотезы Hi: F^(x) F^x) о том, что они раз- личны. Статистика критерия Смирнова Dm>n определяется как мак- симум модуля разности между эмпирической функцией Д(ж), построенной по выборке Xi, Х2, ... ,хп, и эмпирической функци- ей Fn(x), построенной по выборке yi,y2, • • • -Ут- 98
Dm,n = max |Д (яг) - F^(x)|. При справедливости гипотезы Но статистика А/----Dmn у т + п имеет асимптотическое (при min(m, п) —> ос так, что отно- шение т/п остается постоянным) распределение Колмогорова. Критическая область уровня значимости а против двусторон- ней альтернативы Hi будет состоять из одного полуинтервала оо), где Z)m,n,i-a — квантиль распределения статисти- ки Dm>n порядка 1 — а. Замечание. В англоязычной литературе критерий однородности двух выборок Смирнова называют двухвыборочным критерием Колмогорова — Смирнова. Проверка гипотезы о независимости. Пусть имеется двумерная выборка (#i, ?/i), (#2,3/2), из неизвестно- го двумерного распределения. Причем наблюдаемые признаки могут быть как количественными, так и порядковыми. Най- дем ранги R(xi) и R(yi) в последовательностях Ж1,Ж25 • • • и У1’>У2’> • • •, Ут упорядоченных по отдельности. Мерой зависимо- сти двух случайных величин является коэффициент ранго- вой корреляции Спирмена, определяемый формулой п Vs = 1 - 6^2^/п(п2 — 1), г=1 где di = R(xi) - R(yi). Коэффициент rs принимает значение от —1 до +1, причем rs = +1, когда R(xi) = R(yi\ и rs = —1, когда последова- тельности рангов полностью противоположны, т. е. R(xi) = (п + + 1) — R(yi), i = 1, ..., п. Для проверки гипотезы независимости признаков, Но, против альтернативы, что признаки зависимы, в качестве статистики критерия используется rs. Если Но вер- на, то распределение статистики rs симметрично относительно О с M(rs) = 0 и D(rs) = 1/(п — 1). Критическая область уров- ня значимости а имеет вид |rs| ^s,i-a/2? гДе rs,i-a/2 — верхнее критическое значение статистики критерия rs порядка а/2. Если Но верна, то при п —> ос статистика \/п — lrs распре- делена асимптотически нормально с параметрами (О, 1). При 4 п 10 критические значения статистики критерия находят по таблицам точного распределения rs, а при п > 10 пользуются нормальной аппроксимацией.
ГЛАВА 3 АНАЛИЗ МНОГОМЕРНЫХ ДАННЫХ 3.1. Классификация методов анализа многомерных данных В предыдущей главе рассматривались методы статистическо- го анализа данных, описываемых в основном одной переменной. Здесь приведем методы, позволяющие анализировать данные, описываемые любым числом переменных, т. е. так называемые многомерные данные. Несмотря на большое разнообразие методов анализа много- мерных данных, имеется четкая система представления как са- мих данных, так и результатов их анализа. Данные представ- ляются в виде прямоугольной таблицы (матрицы), строки ко- торой соответствуют различным ситуациям (наблюдениям), а столбцы — переменным, наблюдаемым в этих ситуациях; ре- зультаты — в виде функций, выражающих одни переменные (на- зываемые зависимыми переменными, или откликами) че- рез другие (называемые независимыми переменными, или факторами). Такое представление исходных данных и результатов анали- за чрезвычайно удобно, поскольку предлагает ясную схему для сбора данных, их обработки и интерпретации полученных ре- зультатов. Приведенная на рис. 3.1 классификация методов анализа дан- ных проведена по двум основаниям: отсутствию (правая часть схемы) или наличию (левая часть схемы) независимых перемен- ных, а также по типу зависимых и независимых переменных, ко- торые могут быть качественными или количественными. Деление по первому основанию определяет содержательную по- становку задачи, тогда как дальнейшее деление методов по ти- пу зависимых и независимых переменных носит скорее техниче- ский характер, детализируя математическую процедуру ее ре- шения. В случае априорного разделения переменных на зависимые и независимые (левая часть схемы) задача анализа состоит в по- лучении описания зависимости Y от X. Выбор метода решения зависит прежде всего от того, являются качественными или ко- 100
Рис. 3.1. Классификация методов анализа данных личественными зависимые переменные Y. Окончательное реше- ние о выборе метода анализа данных принимается в зависимости от типа независимых переменных X. Наиболее часто на практике для установления связи между независимыми и зависимыми переменными применяют регрес- сионный и дисперсионный анализ. В обоих случаях откликами служат количественные переменные, однако факторы в регрес- сионном анализе количественные, а в дисперсионном — каче- ственные. В регрессионном анализе наиболее явно виден функцио- нальный характер модели анализа данных. Задача регрессион- ного анализа прямо формулируется как задача поиска функцио- нальной зависимости Y от X, причем задача поиска формы свя- зи не менее важна, чем вопросы статистической значимости по- лученных результатов. Наиболее широко применяется модель множественного ли- нейного регрессионного анализа, позволяющая получать анали- тически все стандартные статистические оценки. В более сложных ситуациях (например, при использовании пошаговых процедур) для получения статистических выводов приходится применять методы, основанные на стохастическом моделировании, такие как случайная пермутация или бут-стрэп. 101
Задачей дисперсионного анализа является установление связи между независимыми качественными переменными и за- висимыми количественными. Но поскольку функциональная структура связи очень проста — отклики представляются как линейные комбинации бинарных переменных — уровней факто- ров, то основное внимание в дисперсионном анализе уделяется вопросам статистической значимости влияния отдельных фак- торов. Если отклики Y качественные, то для анализа применяют группу методов, известную под общим названием «распознава- ние образов». Наиболее используемым методом распознавания в случае количественных факторов является дцскриминантный анализ. Примерами методов распознавания, ориентированных на слу- чай качественных факторов, могут служить сегментационный анализ и метод обобщенного портрета. Целью дискриминантного анализа является получение правила, позволяющего на основе наблюденных значений коли- чественных независимых переменных X предсказывать значе- ние качественной переменной У, указывающей на принадлеж- ность наблюдения к одному из заданных классов. Сегментационный анализ состоит в последовательном разбиении совокупности наблюдений в целях получения в ко- нечном итоге групп, максимально однородных по классовому со- ставу. Случай отсутствия зависимых переменных (правая часть рис. 3.1) предполагает, что все анализируемые переменные в некотором смысле равноправны, и мы принимаем их за откли- ки (для простоты будем считать их количественными), значе- ния которых определяются какими-то неизвестными нам факто- рами. Примерами могут служить морфологические или генетиче- ские характеристики растений, животных или людей, принадле- жащих определенному таксону или обитающих на определенной территории. Задача анализа состоит в поиске неизвестных фак- торов. Выбор метода решения зависит от того, считаем ли мы искомые факторы качественными или количественными. Для поиска качественных факторов применяется группа ме- тодов, известная под названием кластерный анализ, среди которых наиболее часто используется так называемый аглсме- ративно-иерархический метод, основанный на последова- тельном объединении многомерных наблюдений сначала в мел- 102
кие, а затем во все более крупные группы. Результатом кластер- ного анализа является разбиение всей совокупности наблюде- ний на классы. Полученной классификации соответствует каче- ственная переменная (или группа переменных, если использу- ются несколько классификаций разной степени дробности или пересекающиеся классификации), категориями которой служат номера классов. Именно эта переменная (или переменные) и будет искомым качественным фактором. Найдя такой фактор (классифицирующую переменную), мы получаем возможность объяснять сходство или различие в значениях откликов для раз- ных наблюдений принадлежностью их к одному или разным классам. Если же неизвестные факторы ищутся в форме количествен- ных переменных, то применяются методы факторного анали- за. В этом случае задача состоит в представлении имеющихся откликов Y в виде линейных комбинаций неизвестных количе- ственных факторов X. С практической точки зрения примене- ние этого метода оправдано, если удается с достаточной степе- нью приближения выразить большое количество откликов через малое число факторов. Одним из наиболее часто используемых методов этого класса является метод главных компонент, основанный на ортогональном проектировании исходного мно- гомерного пространства в пространство меньшей размерности, в котором точки-наблюдения имеют наибольший разброс. Метод позволяет записать исходные данные в более компактном виде с сохранением максимума содержащейся в них информации и да- же представить их графически на плоскости для случая двух факторов. Следует еще раз подчеркнуть, что основным является разде- ление методов анализа на те, в которых переменные делятся на зависимые и независимые (анализ связи), и те, в которых тако- го деления нет (анализ факторов). Дальнейшее дробление мето- дов по типу откликов и факторов довольно относительно. Дело в том, что уровни качественных факторов можно рассматривать как бинарные переменные, которые, в свою очередь, можно счи- тать количественными переменными со значениями 0 и 1. С дру- гой стороны, непрерывную шкалу значений количественной пе- ременной можно категоризовать и рассматривать эту перемен- ную как качественную. Во всяком случае, такого рода преобра- зования приходится делать вынужденно, когда по типу разли- чаются не только факторы и отклики, но и разные переменные среди факторов или среди откликов. 103
3.2. Матричная алгебра Адекватным математическим аппаратом для описания ме- тодов статистического анализа многомерных данных является матричная алгебра. Напомним ее основные понятия. Матрицей размера п х т (или п х m-матрицей) называется любая таблица из п строк и т столбцов. Если п = т, то мат- рица называется квадратной, а число п = т — ее порядком. Например, матрицей является таблица многомерных статисти- ческих данных, содержащая значения т переменных для п на- блюдений: #11 #12 %1т X __ #21 #22 • • • % 2т \#nl #п2 %пт/ Другие примеры — выборочная корреляционная матрица порядка т, образованная выборочными коэффициентами кор- реляции, вычисленными для всех пар столбцов матрицы X: ^11 Г12 Г1т R _ Г21 Г22 Г2т \гт1 ^т2 Т'тт / и выборочная ковариационная матрица порядка т, обра- зованная выборочными ковариациями, вычисленными для всех пар столбцов матрицы X: ^СОУц COV12 COVim с = COV21 COV22 COV2m \COVml COVm2 • • • covrmm J Теоретическая ковариационная матрица состоит из ковари- аций случайных величин, соответствующих столбцам матрицы данных, 104
COV11 COV12 COV21 COV22 \covmi covm2 COVim cov2m COV Гтт / Матрица из одного столбца называется также вектор- столбцом, или просто вектором. Например, совокупность наблюдений зависимой переменной Y можно представить в виде вектор-столбца ( У А У2 \Уп/ Для матриц одного размера определена операция сложе- ния — элементы матрицы суммы равны сумме соответствую- щих элементов матриц-слагаемых: ^«11 «12 • «1т ^11 612 Ь1т А + В = «21 «22 «2т + &21 622 ^2т \«п1 «п2 • • «пт / \6п1 ЪП2 • • Ьпт «11 + Ьц «12 + ^12 «21 + ^21 «22 + ^22 \«п1 + ЬП1 0>п2 “Ь Ьп2 «1т “Ь ^1т «2т “Ь ^2т «пт “Ь Ьпт j Умножение матрицы на число определяется как умно- жение каждого элемента матрицы на это число АХ- ' ац\ «12Х «1т^ «21X «22^ «2т^ ^«п1Х «п2^ «пт^ 105
Если число столбцов одной матрицы равно числу строк дру- гой (такие матрицы называются соответственными), то для них определена операция умножения матриц по правилу «строка на столбец»: ^«11 «12 &1т (Ьп 612 61*7 АВ = «21 «22 &2т X &21 622 &2fc = \«nl «п2 ^пт/ \6ml 6m2 Ътк/ ' m ацЬц г=1 тп «2г Ьц тп 57 «1Л2 • i=l тп 57 «2г ^«2 тп «1г^г/с г=1 тп «2г^г/с i=l г=1 г=1 тп тп тп ЕМ © 1—1 «пг^г2 i=l CLnibik г=1 Видим, что умножение матрицы размера п х т на матрицу раз- мера т х к дает матрицу размера п х к. Операция транспонирования матрицы состоит в том, что строки исходной матрицы становятся столбцами транспониро- ванной / \ ап «21 «п1 Ат = «12 «22 «п2 \«1т «2т • • «пт Квадратная матрица может иметь обратную матрицу. Матрица А-1 называется обратной к квадратной матрице А размера п х п, если АА"1 = А-1А = I, где I — единичная матрица, т. е. матрица, диагональные элементы которой еди- ницы, а внедиагональные — нули. Единичная матрица облада- ет тем свойством, что умножение любой квадратной матрицы А на единичную матрицу того же порядка не меняет А, т. е. Al = IA = А. Обратная матрица для единичной матрицы яв- ляется также единичной матрицей, т. е. I-1 = I. 106
Обратная матрица может быть вычислена по формуле А-1 = adj (A)/ det (А), где adj (А) — так называемая присоединенная матрица для A; det(A) — ее определитель, часто обозначаемый так же, как | А|. Определитель матрицы — это связанное с ней числовое зна- чение, определяемое выражением |А| = (~1) alkia2k2 • • • ankn^ в котором суммирование ведется по всем п! перестановкам ин- дексов 1,2, ..., п; г — число парных инверсий, необходимых для получения перестановки &1,&2, из исходного упорядоче- ния 1,2, ..., п. Например, для определителя квадратной матри- цы 2x2 д _ Mil «12 | \«21 «22/ получаем следующий результат: |А| = «11«22 - «12«21- Определитель матрицы порядка 1 равен значению ее единствен- ного элемента. Квадратная матрица А называется ортогональной, если ААТ = АТА = I, т. е. если обратная матрица может быть полу- чена из исходной просто путем ее транспонирования А-1 = АТ. Очевидно, если определитель матрицы равен нулю (в этом случае она называется вырожденной), то для нее не существу- ет обратной матрицы (так как в формуле для вычисления обрат- ной матрицы определитель находится в знаменателе). В частно- сти, если элементы какой-либо строки или столбца матрицы про- порциональны другой строке или столбцу (т. е. получены путем умножения их элементов на одно и то же число), то определи- тель будет равен нулю, и такая матрица не будет иметь обрат- ной. Например, det I Л11 0,12 j = ацЫ12 — а^кац = 0. ка\2/ Вообще, определитель будет равен нулю в случае, если какая- либо строка или столбец матрицы является линейной комбина- цией других ее строк или столбцов. 107
С любой квадратной матрицей А порядка п связан также на- бор ее собственных значений Xi,Х2, • • •, Хп — решений урав- нения п-й степени: |А - Х/| = 0. В свою очередь каждому собственному значению Хг соответству- ет собственный вектор Vi, удовлетворяющий уравнению AVi = XiVi, которое означает, что умножение слева собственного вектора Vi на матрицу А сводится к умножению его на скаляр — соб- ственное значение X*. Отсюда следует, что если из п собственных вектор-столбцов составить квадратную матрицу V, то будет вы- полняться соотношение AV = VA, где Л — матрица, главная диагональ которой образована соб- ственными значениями Xi, Х2, ...,Хп,а внедиагональные элемен- ты — нули. Можно показать, что если все собственные значения матрицы А различны, то она не вырождена и имеет обратную матрицу А-1. В этом случае, умножая полученное соотношение слева на V-1, получаем V"1 AV - V-1VA = IA = Л, т. е. умножая А слева на V-1, а справа — на V, приводим ее к диагональному виду. 3.3. Регрессионный анализ Ранее было отмечено, что одними из самых распространен- ных методов анализа связи между количественными перемен- ными являются методы регрессионного анализа. Пусть в экспе- рименте наблюдаются значения т + 1 переменной У, Aj, Х2, • • •, Хт. Рассмотрим матрицу экспериментальных данных Ж11 ^12 • • • Я1п? У2 ^21 %22 Х2т > \Уп ^nl ^п2 • • • Хпт/ 108
где yi и Xij — значения переменных Y и Xj соответственно в г-м эксперименте. В регрессионном анализе {regression analysis) рассматри- вается связь между переменной Y, называемой зависимой пе- ременной {dependent variable), и переменными Xi,%2, • • • называемыми независимыми переменными {independent va- riables) (слово «независимые» здесь применяется не в вероят- ностном смысле). Эта связь описывается некоторой математи- ческой моделью, выражаемой функцией Y = /(Xi,X2, ...,₽fc) + e, где р0,₽1, • • • ~ неизвестные параметры; е — случайное от- клонение Y от функции регрессии /. Если функция регрессии линейна по параметрам (но не обя- зательно линейна по независимым переменным), то эта модель называется моделью линейного регрессионного анализа. Рассмотрим более подробно эту модель. Во многих реальных за- дачах экспериментальных исследований более подходящей явля- ется модель нелинейного регрессионного анализа (функция регрессии f нелинейна по параметрам). Но модель линейного ре- грессионного анализа часто бывает удовлетворительной в малой области изменения независимых переменных, а также как пер- вое приближение к модели нелинейного регрессионного анализа. В практических исследованиях описание зависимости между пе- ременными с помощью функции регрессии помогает установить наличие возможных причинных связей. Это часто привлекает исследователей к использованию методов регрессионного анали- за. Другая причина частого применения методов регрессионного анализа состоит в том, что в ситуации, когда прямые измерения зависимой переменной затруднены, уравнение регрессии позво- ляет предсказать ее значения по значениям независимых пере- менных. Матрицу экспериментальных данных можно получить одним из двух способов. При первом способе значения независимых пе- ременных Xi,X2> • • • надлежащим образом выбираются и устанавливаются без погрешностей экспериментатором в каж- дом опыте, и при этих значениях измеряется с ошибками зна- чение зависимой переменной Y. Такой эксперимент называется активным. Например, при изучении влияния температуры вод- ной среды X на скорость дыхания гидробионтов Y эксперимен- татор выбирает определенные значения температур: 5 °C, 10 °C и т. д. Затем для этих значений температуры определяется ско- 109
рость дыхания гидробионтов. При таком подходе только Y бу- дет случайной величиной. При втором способе одновременно на- блюдаются значения всех т + 1 переменных У, Xi, Х2, • • •,^т, причем все эти переменные случайны, т. е. матрица эксперимен- тальных данных в этом случае есть случайная выборка значе- ний многомерной случайной величины (У,Xi,X2, • • • ,^Gn)- Та- кой эксперимент называется пассивным. Например, в случайно выбранной пробе воды регистрируется число бактерий на 1 мл У, температура водной среды (Xi), соленость (Х2) и изучается влияние независимых переменных Х1Х2 на численность бакте- рий в водоеме У. Второй способ позволяет проводить так называемый корре- ляционный анализ, т. е. делать статистические выводы (оце- нивание, проверка гипотез) о мерах линейной зависимости меж- ду переменными (коэффициенте корреляции, множественном коэффициенте корреляции и частном коэффициенте корреля- ции). К статистическим проблемам регрессионного анализа отно- сятся: проверка выполнения предположений, лежащих в осно- ве регрессионного анализа, нахождение оценок неизвестных па- раметров регрессии, построение доверительных интервалов для неизвестных параметров регрессии, проверка гипотез относи- тельно этих параметров, проверка адекватности регрессионной модели. 3.3.1. Множественная линейная регрессия Пусть У зависимая, a Xi,X2, ... , Xm независимые перемен- ные. Рассмотрим ситуацию активного эксперимента. Модель множественной линейной регрессии записывается в виде Уг = Ро Н“ Р1^г1 Н" Р2^г2 • • • “Н (3.1) где Ро, Рь • • •, Pm — неизвестные параметры регрессии; ei, £2, • • •, — независимые случайные величины, распределенные по нормальному закону со средним 0 и одинаковой дисперсией а2: £г ~ N(fi, а2). Оценивание параметров линейной регрессии При построении оценок неизвестных параметров регрессии можно отказаться от предположения о нормальности, а предпо- ложение о независимости заменить на предположение о некор- релируемости. 110
В случае, когда т = 1, модель множественной линейной ре- грессии (3.1) записывается в виде Уг = Ро + + Ег и называется простой линейной регрессией (хг — значение в г-м эксперименте единственной независимой переменной). Оценки неизвестных параметров регрессии 0o,0i, • • • , 0Ш по- лучаются с помощью метода наименьших квадратов (МНК). Обозначим через , Ьт МНК-оценки неизвест- ных параметров (&о называется свободным членом, или кон- стантой регрессии, a bi, ... ,bm — коэффициентами ре- грессий), т. е. оценки, обеспечивающие минимум суммы квад- ратов отклонений значений зависимой переменной от регрессии п (Уг “ 00 “ 01^21 — 02^г2 ~ ~ , (3.2) г=1 которая является мерой ошибки предсказания зависимой пе- ременной Y с помощью модели множественной линейной ре- грессии по независимым переменным • • • ,Хт- Оценкой функции регрессии (или прямой наименьших квадратов в слу- чае простой линейной регрессии) будет зависимость Y — bo + &iXi + ... + ЬтХт. На рис. 3.2, иллюстрирующем МНК в случае простой ли- нейной регрессии, изображены прямая наименьших квадратов Y = bo + biXi и модули остатков di = \yi -bo- biXi I = \yi - yi\ , где yi — предсказанные по регрессионной модели значения зави- симой переменной, которые в случае простой регрессии равны Vi ~ bo + b±Xi, а в случае множественной линейной регрессии — yi — &о + + Ь]Хц + . . . + Можно доказать, что оценки Ь$, bi, ... ,bm, получаемые по ме- тоду наименьших квадратов, линейно зависят от наблюдений У1,У2, • • • ,Уп зависимой переменной Y. Кроме того, МНК-оценки являются несмещенными оценками неизвестных параметров. 111
Рис. 3.2. Прямая наименьших квадратов простой линейной регрессии (графическая иллюстрация к определению сумм квадратов таблицы дисперсионного анализа) Более подробно см. [А. Афифи, С. Эйзен, 1982; М. Дж. Кендалл, А. Стьюарт, 1973]. Приведем формулы для вычисления МНК-оценок для случая простой линейной регрессии (m = 1): п bl = ------------ И Ьо = у - Ьхх, 52 ~ г=1 где 1 71 1 71 х=~У2хг и у=~У2у^ п п г=1 г=1 Программы множественной линейной регрессии всех пакетов статистических программ вычисляют оценки Ьо, Ь1, ... .bm. Кро- ме того, составляется таблица дисперсионного анализа для мо- дели множественной линейной регрессии (табл. 3.1), на основа- нии которой можно судить о качестве «подгонки» модели. На рис. 3.2 дана графическая иллюстрация слагаемых сумм квад- ратов в случае простой линейной регрессии. Если SSr = 0, то все экспериментальные точки лежат на линии регрессии — пря- мой наименьших квадратов Y = Ьо + Ь±Х±, а если SSd = 0, то наилучшее предсказание Y осуществляется моделью Y = у. Можно показать, что s2CT = МSr — несмещенная и состоя- тельная оценка для дисперсии о2 зависимой переменной. Вели- чину Sqct = \/MSr называют стандартной ошибкой оценки зависимой переменной (standard error of estimate). 112
Таблица 3.1 Таблица дисперсионного анализа для модели множественной линейной регрессии Источник дисперсии Сумма квадратов Степени свободы Средний квадрат F-отношение р-значение Регрессия Отклонение от регрессии (остатки) Полная <£ 1^ 1 1 1 Э Н II И Q сс: Л CQ Сс Со YD = т У к = п - т - 1 ут = п — 1 SSD MSD = YD /we _ „2 _ SSr M Sr ^oct Yr MSD MSR Для F-отношения Примечание. SSd — обусловленная регрессией сумма квадратов; SSr — сумма квадратов отклонений от линии регрессии, или остаточная сумма квадратов (сумма квадратов остатков); SSt — полная сумма квадратов.
Верно замечательное свойство таблицы дисперсионного ана- лиза SST = SSD + SSR. Отношение SSd/SSt есть доля вариации У, объясняемая ре- грессией У по Xi,X2, ...,Хт. Это отношение называется ко- эффициентом детерминации. Коэффициент детерминации является мерой качества предсказаний значений зависимой пе- ременной У моделью множественной линейной регрессии. Если он равен 1 (т. е. SSr = 0), то экспериментальные точки в точно- сти лежат на линии регрессии. А если коэффициент детермина- ции равен 0 (т. е. SSd = 0, a SSt = SSr), то наилучшее предска- зание У осуществляется моделью У = у, т. е. У «не зависит» от ХъХ2,...,Хт. Можно показать в случае множественной линейной регрес- сии, что = я2, а в случае простой линейной регрессии SSD 2 ---- = г SST где R — выборочный множественный коэффициент кор- реляции между У и Xi, Х2, ..., Хт (определение множествен- ного коэффициента корреляции приведено далее); г — выбороч- ный коэффициент корреляции между У и Х±. Модель множественной линейной регрессии удобно записы- вать в матричной форме. Обозначим через р = (Ро,Р1, • • • , Рт)Т вектор-столбец неизвестных параметров регрессии, b = (&o,bi, ..., Ьт)Т — вектор-столбец МНК-оценок; у = (yi, у2, ..., уп)т — вектор-столбец наблюденных значений зависимой переменной У, е = (ei, г2, ..., гп)т — вектор-столбец ошибок, а также 1 Х11 £12 х1т 1 *^21 ^22 %2т \1 ^nl %п2 ^пт/ Тогда матричная модель множественной линейной регрессии (3.1) записывается в виде У = Хр + Е, 114
где Zi — независимые случайные величины, распределенные по нормальному закону 7V(0, о2). Можно показать, что вектор МНК-оценок является решени- ем системы так называемых нормальных уравнений (ХТХ)Ь = Хту и равен Ь = (ХгХ)-1(Хгу), а ковариационная матрица вектора МНК-оценок равна cov(b) = о2(ХгХ)-1. Доверительные интервалы Большинство программ множественной линейной регрессии вычисляют среднеквадратические отклонения МНК-оценок ко- эффициентов регрессии, обычно называемые их стандартны- ми ошибками (standard error of regression coefficients), которые будем обозначать через se(5J, где i = 0,1, ..., m. Можно пока- зать, что 100(1 — а)%-й доверительный интервал для неизвест- ного коэффициента регрессии 0* равен (bi - bi + se(bi)t п—m—1,1 — а/2), где tn—m—1,1—а/2 — квантиль распределения Стьюдента с п—т—1 степенями свободы порядка 1 — а/2. Более подробно о случае т > 1 см. [М. Дж. Кендалл, А. Стьюарт, 1973]. Для случая простой линейной регрессии (т = 1) выражения для стандартной ошибки свободного члена регрессии и углового коэффициента регрессии bi имеют вид se(bi) = MSR У (Xi - ж)2 se(60) = п MSR^xj 1=1 п П У? (Xi ~ ХУ i=l Построим теперь доверительный интервал для неизвестного значения Y. Предсказанное значение можно интерпретировать двумя способами, поэтому, соответственно способу интерпрета- ции, можно построить два доверительных интервала. При пер- вом способе у — наилучшая оценка У, соответствующего зна- чениям Xi, Х2, ..., хт независимых переменных Xi, Х2, ..., Хт. 115
При втором способе у — наилучшая оценка математического ожидания У, соответствующего значениям xi, хъ, • неза- висимых переменных Xi, Х2, • • •> Хт. Обозначим через d = (#i — Xi, х^ — #2, ..., хт — хт)Т вектор- 1 п столбец, где х^ = — у Xki-> а через А квадратную матрицу т х т п г=1 п с элементами (хн — %i)(xij — Xj).Тогда нижняя и верх- 1=1 няя границы 100(1—а)%-го доверительного интервала для У при заданных х-^ х%, ..., хт определяются выражением Г / 1 \11/2 у ± msr 1 + - + атА-Ч \ п / (3.3) ^п—т—1,1—а/2? а нижняя и верхняя границы 100(1 — а)%-го доверительного интервала для математического ожидания У при заданных х\, хъ-) • • • •> хт определяются выражением У ± MSR + атА-Ч п1/2 ^п—т—1,1— а/2? (3.4) 1 п где — квантиль распределения Стьюдента сп-т-1 степенями свободы порядка 1 — а/2. В случае простой линейной регрессии (m = 1) доверительные интервалы (3.3) и (3.4) вычисляются более просто: 1 п MSR (х — z)2 У (xi -х)2 г=1 ^п—2,1—а/2 “I 1/2 У ± MSR (х — ж)2 ^п—2,1—а/2- 1 п п 2 г=1 Замечание. Чем дальше х от среднего значения, тем больше до- верительный интервал. Многие программы простой линейной регрес- сии рисуют эти доверительные интервалы в виде кривых вокруг пря- 116
мой наименьших квадратов. Выбор типа доверительного интервала за- висит от того, как интерпретирует предсказанное значение исследова- тель. Проверка гипотез о коэффициентах линейной регрессии Рассмотрим проверку гипотезы о том, что вычисленные ко- эффициенты регрессии значимо не отличаются от нуля. Это равносильно гипотезе о том, что независимые переменные %2 ? • • •, Хт значимо не улучшают предсказания Y по сравнению с моделью yi = у. Таким образом, рассмотрим нулевую гипотезу Но: 01 = 02 = • • • = 0m = О при альтернативной гипотезе Ну не все 0$ равны нулю (альтер- нативная гипотеза состоит в том, что некоторые из независимых переменных Х±, Х2, ... ,Xs значимо улучшают предсказание Y по сравнению с моделью yi = у). Зададимся уровнем значимости критерия а. Статистика кри- терия (3-5) „MSD MSR при условии, что верна гипотеза Hq, имеет F-распределение с т и п — т—1 степенями свободы. Эта статистика вычисляется про- граммами множественной линейной регрессии в таблице диспер- сионного анализа для модели множественной линейной регрес- сии (см. табл. 3.1) вместе с соответствующим р-значением, по которому, не пользуясь таблицами квантилей (в данном случае F-распреде ления), можно судить о том, согласуется (р-значение > а) или не согласуется (р-значение а) гипотеза Но с экспери- ментальными данными. При отсутствии программы надо построить множество при- нятия нулевой гипотезы, которое в данном случае имеет вид (О, Fmjn_m_i5i_a), где Fmjn_m_i5i_a — квантиль F-распределения с тип — т — 1 степенями свободы порядка 1 — а. И если вычис- ленная по выборке статистика критерия (3.5) примет значение из множества принятия нулевой гипотезы, то считается, что ги- потеза Но согласуется с экспериментальными данными. В про- тивном случае гипотеза Но не согласуется с экспериментальны- ми данными и отвергается на уровне значимости а. Рассмотрим теперь проверку гипотезы о том, что k-й коэф- фициент регрессии значимо не отличается от нуля. Это равно-
сильно гипотезе о том, что независимая переменная значимо не улучшает предсказание Y. Таким образом, рассмотрим сле- дующие нулевую и альтернативную гипотезы Hq : Pfc = 0; Зададимся уровнем значимости критерия а. При проверке данной гипотезы обычно рассматривают одну из двух эквива- лентных статистик: bfc/MM2 и МММ- (3.6) При условии, что верна гипотеза Hq, первая из статистик (3.6) имеет F-распределение с 1 и п- т— 1 степенями свободы, а вто- рая — распределение Стьюдента с п — т — 1 степенями свободы. Эти статистики вычисляются программами множественной ли- нейной регрессии вместе с соответствующими р-значениями. При отсутствии программы надо построить множество при- нятия нулевой гипотезы, которое для первой статистики имеет ВИД (0, 1,1— а)? а ДЛЯ второй ( т—1,1— а/2? ^п—т—1,1— а/2)? где — квантиль F-распределения с 1 и п - т — 1 степенями свободы порядка 1 — a, a £n_m_ij_a/2 — квантиль рас- пределения Стьюдента с п — т — 1 степенями свободы порядка 1 -а/2. Замечание. Для проверки гипотезы Но: = С, где С — некото- рое известное число при двусторонней альтернативе Н±: С, ис- пользуется статистика @ se(bk) ’ которая, при условии что верна гипотеза Но, распределена по закону Стьюдента с п — т — 1 степенями свободы. Предположения регрессионного анализа и проверка адек- ватности регрессионной модели исследуются при рассмотрении остатков di = у — ^.Графики остатков выводятся на печать боль- шинством программ множественной и простой линейной регрес- сии. В некоторых программах для проверки коррелируемости ошибок гг вычисляется статистика Дурбина —Ватсона. 3.3.2. Множественный и частный коэффициенты корреляции Пусть Y — зависимая, а Xi,%2? • • • Дт ~ независимые пе- ременные. Рассмотрим ситуацию пассивного эксперимента, т. е. 118
предположим, что матрица экспериментальных данных являет- ся случайной выборкой значений многомерной случайной вели- чины (У, Х1, Х2, • • •, хт). Множественным коэффициентом корреляции (multi- ple correlation coefficient) между Y и Xi, Х2, ..., Хт называется число р(У; Xi, Х2, • • • ,Хт), равное максимальному значению ко- эффициента корреляции между Y и любой невырожденной ли- нейной комбинацией Xi, Х2, ..., Хт: р(У;Х!,Х2, ...,Хт) = = max р(У;а1Х1.+ а2Х2 + • • • + атХт). (3’7) di, Частным коэффициентом корреляции (partial corre- lation) между У и Xk (к < т) при фиксированных значени- ях переменных Xi, Х2, ..., Хр (список не содержит переменную Х&) называется число р(У;Х^|Х1,Х2, ...,Хр) = р(1/!,1/2), где Ui = Y — ту, U2 = Х^ — т\ и m2 — математические ожидания условных распределений У и Х& соответственно при фиксированных значениях Xi, Х2, ..., Хр. Множественный коэффициент корреляции (3.7) служит ме- рой линейности зависимости между У и набором переменных Xi,X2, . ..,Хт, а частный коэффициент корреляции — мерой линейности зависимости между У и Х&, когда Xi,X2, . ..,Хр фиксированы. Предположим теперь, что (У, Xi, Х2, . •., Хт) — многомерная нормально распределенная случайная величина. Обозначим че- рез (i^, pi, (12, • • •, Pm и Оу, о?, 025 • • • 5°т математические ожида- ния и дисперсии случайных величин У, Xi, Х2, ..., Хт, а через Uyi и Oij — коэффициенты ковариации У с Xi и Х{ с Xj соот- ветственно. Тогда можно доказать, что условное распределение У для данных значений ху Х2, ..., хт независимых переменных Xi, Х2, .. •, Хт является нормальным с параметрами Ц = ₽0 + Р1^1 + РгЖ2 + . . . + Pm^m И a2 = G2y(l-p2(Y-,X1,X2, ...,Хт)), где Pi, ... ,рт — функции дисперсий и ковариаций случайных величин У, Xi, Х2, Хт', Ро = (А/ - Рф1 - Р2^2 - ... - Pm^m- Случайная величина е = У — (1 нормально распределена с пара- метрами Ойо2, поэтому можно записать У = Ро + Р1^1 + Р2^2 + . • • + Pm^m + 119
где е ~ 7V(0,o2). Таким образом, мы пришли к модели множе- ственной линейной регрессии (3.1), поэтому изложенные ранее результаты, относящиеся к активному эксперименту, примени- мы и в случае пассивного эксперимента. Заметим также, что из (3.8) следует, что квадрат множественного коэффициента кор- реляции равен доле дисперсии У, «объясненной» линейной ре- грессионной зависимостью от Ху, Х2, ..., Хт: о2 — о2 р2(У;Х1,Х2, ...,Хт) = ^-^-. Аналогично можно показать, что квадрат частного коэф- фициента корреляции можно понимать как долю остаточной дисперсии У, «объясненной» добавлением Х^ к набору Xi, Х2, ...,Хр. 3.3.3. Пошаговая регрессия До сих пор рассматривалась множественная линейная ре- грессия зависимой переменной У от всех независимых перемен- ных Х1,Х2, Но часто перед исследователем стоит за- дача сначала выбрать из этого множества независимых пере- менных некоторое подмножество (называемое наилучшим под- множеством переменных для предсказания У), такое, что этому подмножеству соответствует наибольший коэффициент множе- ственной корреляции с зависимой переменной У среди всех под- множеств той же длины, а затем провести множественный ли- нейный регрессионный анализ (см. 3.3.1), считая независимыми переменные из наилучшего подмножества переменных. Обычно для выбора подмножества переменных применяет- ся пошаговая регрессия {step-wise regression), когда незави- симые переменные включаются в наилучшее подмножество по- следовательно одна за другой на основании некоторого крите- рия включения переменной. В некоторый момент на основании правила остановки пошаговая процедура прекращает включе- ние новых переменных, поскольку добавление новых не улуч- шает значимо предсказание переменной У. При этом на каж- дом шаге процедуры некоторая переменная, уже включенная в наилучшее подмножество переменных, на основании некоторого критерия удаления переменных может быть удалена из подмно- жества переменных. Таким образом, метод пошаговой регрессии состоит из построения на каждом шаге множественной линей- 120
ной регрессии (см. 3.3.1) и вычисления критериев включения и исключения переменных и остановки. Рассмотрим стандартную пошаговую процедуру (F-метод), которая реализуется в программах пошаговой регрессии. Критерий включения переменной основывается на статисти- ке F-включения. На очередном шаге процедуры включается та переменная, для которой значение статистики F-включения наибольшее, при условии, что оно превосходит некоторый уста- новленный минимум, задаваемый правилом остановки. Критерий исключения переменной основывается на стати- стике F-удаления. На очередном шаге процедуры исключается та переменная, для которой значение статистики F-исключения наименьшее, при условии, что оно меньше некоторого установ- ленного минимума, задаваемого правилом остановки. Рассмотрим более подробно статистики F-включения и F-ис- ключения. Предположим, что в набор переменных для предска- зания Y уже включено к переменных Ai, А'2, ..., Хк (без потери общности можно считать, что это первые к переменных исходно- го набора переменных Х±, А2, • • • ,Хт, к < т). Тогда значение статистики F-включения для переменной Xk+i равно ' ТГ х'' '2)' I3-9) 1 - TZ(Y ,Afc+i|Ai,A2, • . • , Хк) где г2(У; Afc+i|Ai, А2, • • •, Хк) — квадрат выборочного частного коэффициента корреляции между Уи Xk+i при фиксированных значениях переменных Ai, А2, ...,Хк. Статистика (3.9) служит для проверки гипотезы Hq: р(У;A^+JAj,А2, . ..,А&) = 0, т.е. для проверки гипотезы о том, что включение Xk+i в набор пе- ременных Ai, А2, • • •, Хк значимо не улучшает предсказание Y. При условии, что гипотеза Hq верна, статистика (3.9) распреде- лена по F-закону с 1 и п - к — 2 степенями свободы. Значение статистики F-исключения для переменной Хк рав- но 1 J"-*-1)' (3.10) 1 - rz(Y , Afc|Ai, А2, ..., Afc-i) где г2(У; A/jAi, А'2, ..., Хк-±) — квадрат выборочного частного коэффициента корреляции между Y и Хк при фиксированных значениях переменных Ai, А'2, • • •,Хк-1- Статистика (3.10) слу- жит для проверки нулевой гипотезы Я0:р(У;А^|А1,А2, ...,Afc_i) = 0, 121
от 0 до 1 (функция у(х) = 1/(14- ехр(—я)) называется сигмоид- ной^ или логистической). Оценки bo, bi, ... ,Ьт коэффициентов уравнения определяют методом максимального правдоподобия. Для их получения необ- ходимо максимизировать логарифм функции правдоподобия, который в данном случае имеет вид Смысл выражения в правой части уравнения легко понять, если заметить, что слагаемые первой суммы отличны от нуля только для yi = 1, а второй — только для yi = 0 и что выражение под логарифмом в первой сумме содержит оценку вероятности по- явления 1, а во второй — оценку вероятности появления 0, т. е. это действительно логарифм вероятности появления наблюдае- мого набора значений зависимой переменной при заданном на- боре значений независимых переменных и заданных значениях оцениваемых параметров уравнения, как это и требуется в мето- де максимального правдоподобия. 3.4. Дисперсионный анализ Метод дисперсионного анализа (Analysis of Variance, AN OVA), разработанный P. Фишером, используется для анали- за связи между количественной зависимой переменной Y и ка- чественными независимыми переменными Х\, ... ,Х8, или фак- торами, такими, как пол животного, вид растения или живот- ного, тип почвы или удобрений, которые не допускают количе- ственного описания и потому называются качественными пере- менными. Конкретные значения фактора называют его уровня- ми. В общем случае рассматривается влияние нескольких фак- торов, каждый из которых имеет не менее двух уровней. 124
Дисперсионный анализ основан на разложении (анализе) об- щей дисперсии зависимой переменной Y на компоненты, каждая из которых соответствует определенному источнику изменчиво- сти измеряемой переменной У. Это и объясняет название ме- тода — дисперсионный анализ. Аббревиатура ANOVA, которая используется наряду с полным названием метода, была введена Дж. Тьюки (J. W. Tukey). В основе каждой задачи дисперсионного анализа лежит план эксперимента. Планом эксперимента называют совокупность комбинаций уровней факторов (или ячеек, как их принято на- зывать) и числа наблюдений для каждой из комбинаций. Если в каждой из возможных ячеек проводится хотя бы одно наблюде- ние, то такой план называют полным факторным планом. В про- тивном случае — неполным факторным планом. План с равным числом наблюдений в ячейках называют сбалансированным, в противном случае — несбалансированным. В зависимости от математической природы факторов разли- чают три типа моделей. Если рассматривается влияние конкрет- ных уровней каждого фактора, то используется модель с по- стоянными факторами (модель I). Если же уровни фактора случайно выбираются из практически бесконечного множества уровней, то применяют модель со случайными факторами (модель II). И наконец, если уровни одних факторов являются постоянными, а уровни других факторов — случайными, то та- кая модель называется смешанной моделью (модель III). За- дачи дисперсионного анализа различают также по числу анали- зируемых факторов — дисперсионный анализ может быть одно- факторным, двухфакторным и т. д. Все конкретные модели дисперсионного анализа, которые бу- дут рассмотрены, можно записать в виде линейной модели. Для построения оценок неизвестных параметров, как и в регрес- сионном анализе, используется метод наименьших квадратов. МНК-оценки неизвестных параметров являются несмещенны- ми, линейно зависящими от наблюдений оценками с наименьшей дисперсией среди всех несмещенных линейных оценок. Дисперсионный анализ опирается на предположение нор- мальности распределения ошибок исходных данных. Отметим, что нормальность нужна только для проверки гипотез и постро- ения интервальных оценок. Само построение оценок и их опти- мальные свойства не опираются на предположения нормально- сти ошибок наблюдений. Критерии проверки гипотез в модели I будут относительно устойчивы при нарушении нормальности, но 125
это не так для модели II. Заметим также, что при планирова- нии эксперимента нужно, где это возможно, использовать рав- ное число наблюдений в ячейках для обеспечения свойств устой- чивости к нарушению предпосылок. 3.4.1. Однофакторный дисперсионный анализ Однофакторный дисперсионный анализ используется для исследования влияния одного фактора на количественную переменную. Такие задачи возникают, например, при сравнении урожайности нескольких сортов пшеницы, эффективности дей- ствия различных лекарств и т. п. Если исследователя интересу- ет урожайность определенных сортов пшеницы, то сорт являет- ся постоянным фактором, и для представления результатов экс- перимента используется модель I. И наоборот, сорт будет слу- чайным фактором, если рассматриваемые сорта были выбраны случайно из большого (практически бесконечного) числа сортов. В этом случае применяют модель II. Модель с постоянными уровнями фактора Пусть фактор А варьируется в эксперименте на заранее вы- бранных I уровнях, а , yim ~ результаты щ наблюдений, соответствующих г-му уровню фактора, которые являются од- ной из I независимых выборок из генеральной совокупности с математическими ожиданиями (генеральными средними) рг, i = 1, ...,/. Фактор А является основанием для классификации всей совокупности наблюдений, поэтому однофакторный дис- персионный анализ называют еще однофакторной классифи- кацией. Математическая модель однофакторного дисперсионного анализа имеет вид yij = V-i + ^ij, г = j = (3.11) где Zij — ошибки наблюдений, независимые нормально распре- деленные случайные величины с нулевым математическим ожи- данием и одинаковой дисперсией о2, ~ 7V(0, о2). Введем принятые в дисперсионном анализе обозначения: р = 1 7 1 = — п^рг — общее среднее; п = щ — общее число наблю- i=l i=l дений; cti = рг — р — эффект, обусловленный влиянием г-го уров- 126
ня фактора. Заметим, что для моделей с постоянными уровнями факторов эффекты уровней обозначаются греческими буквами. Используя введенные обозначения, модель (3.11) можно пе- реписать в виде Vij = р + (Хг + Zij, i = l, j = (3.12) Неизвестными параметрами в (3.11) и (3.12) являются р*, а* и р. МНК-оценки этих параметров при дополнительных ограни- I чениях riiCti = 0, которые обеспечивают их единственность, г=1 находят по формулам: Р = У„, Рг=Уг., ОСг = Рг — р, 2 = 1, (3.13) где точкой обозначены результаты усреднений по соответ- ствующим индексам I Tli yi-= 52у^/п^ - 52 52 yii- j=l г=1 j=l На следующем этапе анализа проверяется гипотеза Hq : pi = = Р2 — • • • — р/ — р (или oti = ot2 — • • • — ос/ — 0) о том, что фактор А не влияет на зависимую переменную Y при аль- тернативе, что, по крайней мере, одно из средних отличается от общего среднего: р& р (или <х& 0). Критерий для проверки гипотезы Но строится (как и в регрессионном анализе) на осно- ве следующего тождества — разложения суммы квадратов SSt отклонений результатов наблюдений от общего среднего на две компоненты (два источника дисперсии) — SSa и SSr: I Tli ssT = '^H^-yy = г=1 j=l I I Tli = 52 ni(yi- ~ y^2+52 5>* _ y^2 = SSa+SSr- i=l i=l j=l Слагаемое SSa характеризует степень разброса наблюдений между уровнями фактора и обусловлено их влиянием. Заме- тим, что обозначение SSa является традиционным для диспер- сионного анализа, в отличие от обозначения SSd в регресси- онном анализе. Слагаемое SSr, называемое остаточной суммой 127
квадратов, характеризует степень разброса наблюдений внутри уровней фактора и является следствием случайных причин и неучтенных факторов. Результаты проверки гипотезы Hq при- нято заносить в таблицу однофакторного дисперсионного анализа (табл. 3.2). Можно показать, что средние квадраты MS а и MSr (другое, часто используемое обозначение этих величин, — s2A и з^), опре- деление которых дано в табл. 3.2, при выполнении Hq являют- ся двумя различными и независимыми оценками дисперсии еди- ничного наблюдения о2 с математическими ожиданиями, рав- ными М(7И5я) = о2; М(7И5д) = о2 + - — р)2 = о2. За- г=1 метим, что МSr является несмещенной оценкой о2 для всех моделей дисперсионного анализа. Если гипотеза Hq верна, то можно показать, что справедливы следующие утверждения: • SSa и SSr независимы и распределены как: SSa ~ a2X/_i, SSR ~ о2Х2_р . М(7И5д) = М(7И£д) = о2; • статистика F = MSa/MSr имеет F-pacnpe деление с I — 1 и п — I степенями свободы. Критическая область уровня значи- мости а состоит из одного полуинтервала оо), где — квантиль F-распределения с I — 1 и n — I степе- нями свободы порядка 1 — а. Если вычисленное по наблюдениям значение статистики кри- терия (Енабл) меньше значения то нет оснований для отклонения гипотезы Hq. Обычно на этом анализ может быть завершен. Но если такой вывод противоречит, например, результатам предыдущих исследований, тогда следует выяс- нить: — не нарушаются ли предпосылки дисперсионного анализа; — нет ли других факторов, влияющих на зависимую перемен- ную, и либо перейти к двухфакторному анализу, либо спланиро- вать эксперимент так, чтобы по возможности исключить влия- ние неоднородностей условий проведения наблюдений, т. е. ис- пользовать план со случайными блоками. Если же Енабл то нулевая гипотеза отверга- ется на уровне значимости а, т. е. существует, по крайней мере, одна пара средних у^ и у/., которые различаются статистиче- ски значимо. Часто исследователю желательно также знать, ка- кое из выборочных средних можно считать максимальным. Ес- 128
Таблица 3.2 Однофакторный дисперсионный анализ Источник дисперсии Сумма квадратов Число степеней свободы Средний квадрат F-отношение Фактор А SSA = - у..)2 г=1 VA = I - 1 MSA = ^ р MS^ А MSR Остаток (ошибка) SSr = 52 52 ~ yi г=1 J=1 VR - п - I msr = 55* = й2 VR — Полная ssT=52 52 ~ г=1 j=l \)Т = п — 1 — — 129
ли нельзя выделить пары средних, представляющие интерес для сравнения, то приходится проверять гипотезы о равенстве все- возможных пар средних. Чтобы при этом сохранить а в каче- стве общего уровня значимости, следует использовать методы множественного сравнения. Кроме сравнения двух средних для исследователя могут представлять интерес сравнения вида щ — [14, щ — (р2 + ^з + I I + (Л4)/3 и т.п. Линейные комбинации с*рг, где У^Сг — 0, на- г=1 г=1 зываются контрастами. Выдвижение гипотез о контрастах I (Hq: = 0) и их проверка позволяют получить допол- г=1 нительную информацию. Если линейная комбинация задана до получения экспериментальных данных, то такие сравнения на- зывают планируемыми (planned comparisons). Например, если врач хочет выявить эффективность нескольких лечебных пре- паратов по сравнению с контролем, то такое сравнение является планируемым. На практике сравнения, представляющие интерес, определя- ются часто после получения результатов эксперимента, когда уже известны оценки средних рг, и вид наиболее важных сравне- ний подсказывают сами результаты эксперимента. Такие срав- нения называют непланируемыми (unplanned comparisons). Сравнение всевозможных пар средних является примером не- плакируемых сравнений. Число таких сравнений для модели (3.11) равно к = 1(1 — 1)/2. С рекомендациями по исполь- зованию методов множественного сравнения можно познако- миться в работах [Г. Шеффе, 1980; R. R. Sokal, F. J.Rohlf, 1995; А. Т. Teriokhin, Т. de Meeus, J.-F. Guegan, 2007]. Замечание, Аналогично проводятся исследования сравнений лю- бой модели дисперсионного анализа, а не только однофакторной. Пример 3.1. [R. R. Sokal, F. J. Rohlf, 1995]. В восьми различ- ных местах обитания (в США) были собраны 130 жуков-скаку- нов (Cicindela circumpicta). У каждого жука измерялась ширина головки (мм). Требовалось выяснить, влияет ли место обитания на этот признак. Для ответа на данный вопрос используем од- нофакторный дисперсионный анализ, предполагая, что все его предпосылки выполнены. Обозначим через угз результат изме- рения ширины головки j-ro жука из г-й местности, j = 1, ..., гщ i = 1, ... ,8. В табл. 3.3 приведены средние значения резуль- 130
Таблица 3.3 Средние значения ширины головки жука уг. в г-м месте обитания I 1 2 3 4 5 6 7 8 Vi. 3,512 3,694 3,722 3,723 3,738 3,748 3,784 3,845 Tli 20 20 20 14 10 15 11 20 Таблица 3.4 Результаты однофакторного дисперсионного анализа для примера 3.1 Источник разброса Сумма квадратов Степени свободы Средний квадрат F-отношение MSa/MSr Фактор А 1,2451 7 0,1779 F = 6,724 р = 0,000 Остаток (ошибка) 3,2270 122 0,0264 — Полная 4,4721 129 — — Таблица 3.5 Нижний и верхний концы сравнительных интервалов I 1 2 3 4 5 6 7 8 Si 0,0363 0,0132 0,0132 0,0434 0,0514 0,0420 0,0490 0,0363 li 3,430 3,612 3,640 3,655 3,621 3,653 3,673 3,763 Ui 3,594 3,775 3,804 3,820 3,853 3,842 3,894 3,927 татов наблюдений, упорядоченные по возрастанию, а также зна- чения щ. Результаты проверки гипотезы Hq о том, что место обитания не влияет на размеры головки жука, при альтернативе Я1, что хотя бы в двух районах жуки отличаются по этому признаку, занесем в таблицу дисперсионного анализа (табл. 3.4). Так как Гнабл = 6,724 > F7)i22;0,95 = 2,085 и р « а = 0,05, гипотезу Hq на уровне значимости а = 0,05 отвергаем. Чтобы выяснить, какие из средних различаются статисти- чески значимо, используем метод множественного сравнения — СТ2-метод. Для наглядного представления результатов сравне- ния построим 95%-е сравнительные интервалы для каждого вы- 131
4,05 3,95 3,85 3,75 3,65 3,55 3,45 3,35 1 2 3 4 5 6 7 8 Регион Рис. 3.3. 95%-е сравнительные интервалы для средних значений шири- ны головки жука-скакуна боронного среднего уг. по методу Габриэла (рис. 3.3). Выбороч- ные средние, для которых сравнительные интервалы не пересе- каются, различаются статистически значимо. Значения нижних и верхних концов этих интервалов для СТ2-метода вы- числяются по формулам , 1 1 k Hi. Hi. Н- а/2^г> где Si = у/Мвя/щ*, Ш8Д22;0,975 = 3,183 — квантиль порядка 0,975 стьюдентизированного максимального абсолютного отклонения [М. Дж. Кендалл, А. Стьюарт, 1973; R. R. Sokal, F. J.Rohlf, 1995] с числом степеней свободы к = 8 и п - 7 = 122 Значения s*, Ц, щ приведены в табл. 3.5. На рис. 3.3 видно, что выборочное среднее yi. значимо отличается от всех остальных средних, среди которых нет значимого различия. Модель со случайными уровнями фактора Рассмотрим ситуацию, когда исследователя интересует, ка- кой вклад в общую изменчивость зависимой переменной Y вно- сит фактор А.Такие задачи возникают, например, в популяци- онной биологии, когда изменчивость зависимой переменной свя- зана с генетическими различиями. В этом случае предполага- ем, что I уровней фактора А были выбраны случайно из гене- 132
ральной совокупности (например, с помощью таблицы случай- ных чисел). Пусть на г-м уровне фактора А производится щ наблюдений Уп, И yij ~ 7V([ii,o2), а {(!;}, i = 1, независимы и одинаково распределены со средним р и дисперсией о^. То- гда уравнение модели II (модели дисперсионного анализа со случайным фактором) имеет вид yij = + г = 1, j = 1, ... ,щ, (3.14) где tij ~ 7V(0,o2) — ошибки наблюдений, независимые случай- ные величины. Обозначим через ai эффект г-го уровня фактора А, = цг—р. Заметим, что для моделей со случайными уровнями факторов эффекты уровней принято обозначать латинскими буквами. То- гда уравнение модели (3.14) и предположения можно переписать в виде = [i + ai + £ij, г = 1, j = 1, ... (3.15) где {а*} и {tij} независимы в совокупности; ai ~ 7V(p, а^), ~ ~7V(0, а2). Дисперсия наблюдения угд будет равна о2 = + о2, по- этому о2а и о2 называют компонентами дисперсии единич- ного наблюдения. Компонента обусловлена вкладом факто- ра в общую изменчивость Y. Долю этого вклада, отношение р = а^/(о^ + о2), называют коэффициентом внутриклас- совой корреляции. Неизвестными параметрами в (3.15) являются р и две компо- ненты дисперсии о2 и (Тд. Оценка для р находится, как и для мо- дели I, по формуле (3.13). Несмещенные оценки для компонент дисперсии имеют вид о2 = MSR; д2А = (MSA - MSR)/k, i=l если 721 — где к = = п/ = К, то к = К). На следующем этапе анализа проверяется гипотеза Hq: оА = = 0 о том, что фактор не вносит никакого вклада в дисперсию наблюдений, при альтернативе Н\: оА Ф 0. Критерий для про- верки этой гипотезы строится, как и для модели I. Если верна гипотеза Но, то статистика F — MSa/MSr имеет F-pacnpeделе- ние с va = I — 1 и уд = 1(к — 1) степенями свободы. 133
Заметим, что F-критерий для проверки гипотезы Но для од- нофакторной модели II является только приближенным для не- равных щ и точным для случая равных щ. Результаты анали- за заносятся в таблицу дисперсионного анализа, аналогичную табл. 3.2. Если гипотеза Hq отвергается, то оценкой доли общей диспер- сии, обусловленной фактором А, является значение выборочно- го коэффициента внутриклассовой корреляции р = б^/(б^+62). 3.4.2. Двухфакторный дисперсионный анализ Для исследования влияния двух одновременно действующих факторов применяется двухфакторный дисперсионный анализ. Пусть факторы А и В имеют I и J уровней соответственно, а Уг;1, • • • iVijKiji Kij наблюдений зависимой переменной Y на г-м уровне фактора А и j-м уровне фактора В — это IJ незави- симых выборок с математическим ожиданием рг;, i = I, • • • , Д j = 1, ..., J. Если в каждой ячейке имеется, по крайней ме- ре, одно наблюдение, то план эксперимента называется полным двухфакторным планом. Для двухфакторной модели рассмотрим только случай по- стоянных уровней факторов. 1. Kij = К > 1 равные наблюдения в ячейках. Математи- ческая модель двухфакторного дисперсионного анализа, назы- ваемая моделью эффектов уровней, имеет вид: Vijk — р + Ot^ + Pj + Yzj У ^ijki (3.16) где Zijk ~ 7V(0,o2) и независимы, г = 1, j = 1, ..., J; fc = 1, ..., JC ; р — общее среднее; а* — эффект г-ro уровня факто- ра A; Pj — эффект j-ro уровня фактора В; — а* — Pj + р — эффект взаимодействия г-ro уровня фактора А с j-м уров- нем фактора В, т. е. эффект совместного неаддитивного вклада факторов А и В в изменчивость У, когда влияние фактора А на переменную У зависит от того, на каком уровне находится фак- тор В. МНК-оценки неизвестных параметров р, a*, Р;, при допол- нительных ограничениях I J I ctj = 0; Р; — 0; У^ yij — 0? j = i=l j=l i=l J Ууг;=0, ? = 1, j=l 134
которые обеспечивают единственность оценок, находятся по формулам £ = = yi.. - у...-, pj = y.j.-y...-, Xij = yij.-yi..-y.j. + y..., г = 1, j = В этих формулах, как и ранее, точкой обозначено усреднение по соответствующему индексу. Для определения влияния факторов и их взаимодействия на результаты эксперимента проверяются следующие гипотезы: • Hq: Yu = Y12 = • • • = Yи = 0 о том, что влияние взаимо- действия уровней факторов А и В отсутствует при альтернати- ве, что не все Yij = 0; • Hq : oci = (Х2 = ... = QQ = 0 о том, что фактор А не влияет при альтернативе, что не все а* = 0; • Hq : Pi = Р2 = • • • — Pj — 0 о том, что фактор В не влияет при альтернативе, что не все Pj = 0. Критерии для проверки этих гипотез строятся на основе сле- дующего тождества — разложения полной суммы квадратов на четыре компоненты (четыре источника дисперсии): s^ = EEE<»-!'..’2 = (3.17) г=1 j=l к=1 v 7 = SSa + SSb + SSab + SSr. Слагаемое SSa характеризует степень разброса наблюдений между уровнями фактора A, SSb — между уровнями факто- ра В. Компонента SSab обусловлена влиянием взаимодействия уровней факторов А и В. Слагаемое SSr характеризует степень разброса наблюдений внутри ячеек и является следствием влия- ния случайных причин и неучтенных факторов. Результаты ана- лиза заносятся в таблицу двухфакторного дисперсионного ана- лиза (табл. 3.6). Можно показать, что если верны нулевые гипотезы, то спра- ведливы следующие утверждения: • суммы квадратов SSa, SSb, SSab, SSr независимы и рас- пределены как n2xLi> °2Xj-i> ct2X(/-i)(j-i)> °2X2j(K-i) соответ- ственно; • каждый из средних квадратов MSa, MSb, MSab, MSr (определены в табл. 3.6) является несмещенной оценкой а2; • статистика Fab = MSab/MSr имеет F-распределение с vab = (I ~ !)(«/ — 1) и vr = ЩК — 1) степенями свободы; 135
00 Таблица 3.6 Двухфакторный дисперсионный анализ Источник разброса Сумма квадратов Число степеней свободы Средний квадрат F-отношение Фактор А Фактор В Взаимодей- ствие АВ Остаток (ошибка) Полная SSA = JK^yi..-у...У г=1 SSB = IK^(y.j.-y...)2 j=l SSab = ~ yi- ~ yi- ~ У-У2 г=1 7 = 1 ssr = 52 52 52^ - у^2 г=1 7=1 к—1 ssT = 52 52 52 ~у-}2 г=1 7=1 к=1 VA = I - 1 VB = J - 1 »АВ = (I - VB = IJ(K - 1) vT = IJK - 1 MS А = SSb MSb = VB MSab = УАВ msr = — vr F MS^ A MSR Р _MSb B MSR r MSab Fab= ms„
• статистика Fa = MSa/MSr имеет F-распре деление с va = = I — 1 и vr степенями свободы; • статистика Fr = MSb/MSr имеет F-распределение с у# = = J — 1 и vr степенями свободы. Критическая область для проверки гипотез Hq уровня зна- чимости а состоит из одного полуинтервала [Fv.?VH?i_a, ос), где FVi?VR?i_a — квантиль F-распределения с у* и vr степенями сво- боды порядка 1 — а, где г = А, В, АВ, соответственно. Замечание. Если гипотеза об отсутствии взаимодействий отверга- ется, а гипотезы об отсутствии влияния фактора А и фактора В не отвергаются, то правильный вывод состоит в том, что нельзя сделать заключение об отсутствии влияния обоих факторов. 2. Kij = К = 1 (в каждой ячейке имеется одно наблюдение). Такие планы эксперимента используются, если априори извест- но, что взаимодействие факторов мало. Тогда модель двухфак- торного дисперсионного анализа является аддитивной и имеет вид yij = (1 + a.i + Pj + Ejj, (3.18) где Zij ~ 7V(0, о2) и независимы, i = 1, ..., I, j = 1, ... ,J. Проверка гипотез об отсутствии влияния факторов А и В проводится так же, как и для модели (3.16), только роль SSr играет SSab- Вычеркнув в табл. 3.6 строку «остаток» и заменив обозначения: SSab ~ на SSr, vab ~ на vr, получим таблицу дисперсионного анализа для аддитивной модели (3.18). 3. > 1 (неравные наблюдения в ячейках). В этом случае не существует разложения, подобного (3.17). Для проверки ги- потез (см. случай 1) здесь также используется F-критерий, но построение его становится сложным и громоздким [Г. Шеффе, 1980]. Таблица 3.7 Результаты наблюдений для примера 3.2 Год Юноши Девушки N Y N Y 2003 34 180,6 79 168,1 2004 53 171,1 53 169,9
186 Рис. 3.4. Изменение средних значений переменной «рост» от факторов «пол» и «год» Пример 3.2. Проводился анализ влияния на рост студентов второго курса биологического факультета МГУ им. М. В. Ломо- носова 2003 и 2004 гг. факторов «пол» и «год». В табл. 3.7 для всех сочетаний уровней факторов приведены выборочные значе- ния среднего роста юношей и девушек (см), У, и число наблюде- Таблица 3.8 Результаты двухфакторного дисперсионного анализа Источник дисперсии Суммы квадратов SS Число степеней свободы df Средние квадраты MS F-otho- шение р-значе- ние Фактор 1 «пол» 2 342 1 2 342 45,3 0,000 Фактор 2 «год» 738 1 738 14,3 0,000 Взаимодей- ствие 1*2 1598 1 1598 30,9 0,000 Ошибка 11 109 215 52 — — 138
Таблица 3.9 Результаты множественных сравнений Пол Год Рост, см Группа Юноши 2003 180,5 1 Юноши 2004 171,1 2 Девушки 2004 169,9 2 Девушки 2003 168,1 2 ний, N, В табл. 3.8 приведены результаты двухфакторного дис- персионного анализа. Анализ табл. 3.8 и рис. 3.4 показывает, что взаимодействие факторов «пол» и «год», а также влияние каждого из факто- ров статистически значимы на уровне значимости 0,05. Что- бы выяснить, какие из средних значений различаются значимо, используем метод множественного сравнения — метод Тьюки (HSD) для неравных щ. Результаты таких сравнений, приведен- ные в табл. 3.9, показали, что в отдельную группу (1 группа) вы- деляются юноши-второкурсники 2003 г., средний рост которых значимо отличается от среднего роста юношей-второкурсников 2004 г., и девушек 2004 г. и 2003 г., среди которых нет значимого различия (2 группа). 3.4.3. Смешанные модели дисперсионного анализа Рассмотрим свойства планов эксперимента для смешанных моделей, которые наиболее часто используются при проведении биологических исследований. План со случайными блоками Пусть, например, исследователь хочет сравнить урожайности I сортов некоторой культуры. Опыты проводятся на поле, пло- дородие которого может меняться от одного участка к другому. Если сорта по участкам распределять случайно, то один сорт мо- жет «получить», например, два «хороших» участка и ни одного «плохого», а другой сорт — наоборот. В этом случае ошибками наблюдений будут в основном различия между участками, а не ошибки наблюдения. Это может привести к тому, что не будет выявлено различия между сортами, даже если оно существует. Поэтому рассмотренный ранее однофакторный план может ока-
заться неэффективным. План со случайными блоками поз- воляет уменьшить влияние на результат эксперимента тех или иных неоднородностей условий, при которых проводятся отдель- ные наблюдения. Покажем на этом примере построение плана со случайными блоками. Однотипные по плодородию участки группируются в J блоков (случайный фактор В) по I участков, каждый из кото- рых засевают одним из I сортов (постоянный фактор А), причем внутри каждого блока сорта распределяются по участкам слу- чайно. Таким образом, получаем план со случайными бло- ками без повторений, т. е. К = 1. Обозначим через yij урожайность участка (i,J), засеянного г-м сортом и принадлежащего j-му блоку, и положим yij = {i + ai + bj+£ij, i = j = (3.19) где p — общее среднее; ot2 — эффект г-го уровня фактора А; bj — эффект j-ro уровня фактора В; bj и — независи- мые в совокупности нормально распределенные случайные ве- личины с нулевым средним и дисперсиями и а соответ- ственно. Модель (3.19) называется смешанной двухфактор- ной моделью. Использование аддитивной модели объясняет- ся тем, что оценить взаимодействие «сорт-блок» невозможно, ведь каждым сортом засеян только один участок внутри каж- дого блока. Неизвестными параметрами в (3.19) являются р, а* и две ком- поненты дисперсии а2 и о|. МНК-оценки р и а*, как и для одно- I факторной модели I, при дополнительном ограничении = О, г=1 равны: р = уаг = у^ — у., i = 1, ...,/. Несмещенные оценки для компонент дисперсии имеют вид: б2 = МSr, д2в = (MSв — — MSr)/I. Вычеркнув в табл. 3.6 строку «остаток» и заменив обозначения: SSab — на SSr, уав — на v# и MSab — на MSr, получим таблицу дисперсионного анализа для модели (3.19). Для этой модели проверяются две гипотезы: • Hq: все oq = 0, при альтернативе Н\: не все а* = 0. Кри- терий для проверки этой гипотезы строится, как и для модели I однофакторного дисперсионного анализа. Если верна гипоте- за Hq, то статистика Fa — MSa/MSr имеет F-распределение с уа — I — 1 и vr — (I — 1)(J — 1) степенями свободы; • Hq : о2в — 0, о том, что фактор блока В не вносит никакого вклада в дисперсию наблюдений, при альтернативе Н^: о2в 0. 140
±аолица o.iu План со случайными блоками с повторениями Сорт 1-й блок из I однородных участков J-й блок из I однородных участков 1-й 1-я делянка К-я делянка 1 -я делянка К-я делянка 7-й 1-я делянка К-я делянка 1-я делянка К-я делянка Критерий для проверки этой гипотезы строится, как и для моде- ли II однофакторного дисперсионного анализа. Если верна гипо- теза Но, то статистика Fb — MSb/MSr имеет F-распределение с у в = J ~ 1 и vr = (I — 1)(J — 1) степенями свободы. Если каждый блок делится на KI делянок и каждый сорт случайно засевается на К делянках внутри блока (табл. 3.10), то такой план называется планом со случайными блоками с повторениями. Использование плана с повторениями позво- ляет оценить взаимодействие «сорт-блок» [Г. Шеффе, 1980]. Необходимо отметить, что уменьшить влияние неоднородно- стей условий проведения эксперимента может только разбиение на однороднее блоки. Любое свойство экспериментальных объ- ектов, которое может быть определено до начала эксперимента, должно быть использовано для определения блока. Примерами однородных блоков являются следующие: в агробиологических исследованиях соседние площадки часто можно считать близки- ми по плодородию, а следовательно, группы смежных участков можно принимать за блоки; листья на одном растении при анти- вирусной прививке, животные одного помета при опытах с пи- танием, пробы крови одного человека при сравнении нескольких методов подсчета числа лейкоцитов. Отметим, что более полное исключение влияния неоднородностей условий достигается с по- мощью планов латинских квадратов [Г. Шеффе, 1980]. Планы с группировкой Пусть необходимо выбрать план эксперимента для сравнения I методов (постоянный фактор А) определения некоторой харак- 141
План с группировкой Метод 1-е животное J-e животное 1-е животное J-e животное 1-й 1-е измере- ние К-е измере- ние 1-е измере- ние К-е измере- ние Нет Нет Нет Нет /-Й Нет Нет Нет Нет 1-е измере- ние К-е измере- ние 1-е измере- ние К-е измере- ние теристики крови (зависимая переменная У) у животного. Рас- смотрим план, для проведения которого потребуется IJ живот- ных. Для каждого метода случайно выбираются «свои» J жи- вотных (случайный фактор В с J уровнями), т. е. у каждого из J животных одной выборки проводится К независимых изме- рений характеристики крови первым методом, для другой вы- борки — вторым методом и т. д. (табл. 3.11). В этом случае каждый уровень фактора В сочетается не более чем с одним уровнем фактора А. Такой план эксперимента называется двух- факторным планом с группировкой, или иерархическим, или гнездовым (nested). Фактор А называют группирующим фактором, а фактор В — сгруппированным фактором А, что обозначается В (А). Фактор А может быть как постоянным, так и случайным, фактор В — случайным. Одна из основных областей применения иерархических планов — генетика. Эти планы используются, например, при изучении наследственного влияния родительских поколений на продуктивность или другие признаки потомства. В качестве примера рассмотрим смешанную модель для двухфакторного плана с группировкой, когда фактор А яв- ляется постоянным, а фактор В(А) — случайным: 142
Vijk — Ц + (Xi + fy(i) + ^ijki 3.20) 2 = 1,...,/; j = l,...,J; k = l, где [i — общее среднее; a* — эффект г-го уровня фактора А; — эффект у-го уровня фактора В, сгруппированного г-м уровнем фактора A; bj^ и — независимые в совокупно- сти, нормально распределенные случайные величины с нулевым средним и дисперсиями о^а) и о2 соответственно. Компонента ав(А) обусловлена вкладом случайного фактора В(А), сгруппи- рованного фактором А, в общую изменчивость У. ш Неизвестными параметрами в (3.20) являются р, аг и две ком- поненты дисперсии а2 и а2В{Ау МНК-оценки р и а* при допол- I нительном ограничении = 0 равны: р = щ = у^ — г=1 i = 1, ...,/. Несмещенные оценки для компонент дисперсии име- ют виД: б2 = MS в, °в(А) = — MSr)/K. Результаты анализа для модели (3.20) заносятся в таблицу дисперсионного анализа для плана с группировкой (табл. 3.12). Для этой модели проверяются две гипотезы: • Bq: все а* = 0, при альтернативе Ну не все а* = 0. Ес- ли верна гипотеза Во, то статистика Fa = MSa/MSb(a) (cm. табл. 3.12) имеет F-распределение cv_4 = /-1 и VB(A) — I(J ~ 1) степенями свободы; • Во: = 0? ПРИ альтернативе Ну ^^а) б- Если верна гипотеза Во, то статистика FB(a) = MSb(A)/MSr (см. табл. 3.12) имеет F-распределение с Ув(А) — — 1) и vr = U(K — 1) степенями свободы. Рассмотрим пример смешанной модели для трехфакторно- го плана с группировкой, когда постоянный фактор А является группирующим, фактор В(А) — сгруппированным фактором А, а фактор С(В) — сгруппированным фактором В. Пример 3.3. Для сравнения трех методов (фактор А) опре- деления содержания гликогена в печени крысы проводились два повторных измерения для каждой из трех случайных проб пе- чени (фактор С), взятых у каждой из двух крыс (фактор В) [R. R. Sokal, F.J.Rohlf, 1995]. В этом случае фактор А — по- стоянный группирующий фактор с тремя уровнями; случайный фактор В с двумя уровнями сгруппирован фактором А; слу- чайный трехуровневый фактор С сгруппирован фактором В (рис. 3.5). 143
Таблица 3.12 Дисперсионный анализ двухфакторного плана с группировкой Источник разброса Сумма квадратов Число степеней свободы Средний квадрат F-отношение Фактор А Фактор В (внутри А) Остаток (ошибка) Полная SSA = -У...)2 г=1 SSB{A} = К^ - Уг..)2 г=1 j=l SSr = 52 52 52 ~ Уч У2 г=1 j=l k=l ssT = 52 52 ^Учк - у-У2 г=1 j=l к=1 VA = I - 1 VB(A) = I(J — 1) VR = IJ(K - 1) vT = UK - 1 MSA = ^ VA Ma _ SSB(A} MSBW~ »а(Л> MS„= — VR fa = ^^ MSB{A) MSB(A) Fb^~ MSr
Рис. 3.5. Пример трехфакторного плана с группировкой Животные (два уровня) Пробы (три уровня) Измерения (2 повтора) Методы (три уровня) Для анализа результатов эксперимента использовалась сме- шанная модель для трехфакторного плана с группи- ровкой Vijk = Н" 04 Н- bj(i) + Cl(j) + ^ijlki I = 3, J = 2, L — 3, К = 2. Значения оценок общего среднего и среднего содержания гли- когена в печени крысы, определенного каждым из трех методов, равны: [1 = у = 142,2; pi = 132,5; р2 = 151,0; р3 = 135,2. Анализ табл. 3.13 показывает, что гипотеза Hq: все = 0 не отвергается на уровне а = 0,05, т. е. различия между методами определения содержания гликогена в печени крысы не обнару- жено; гипотеза Hq : oB^ = 0 отвергается на уровне а = 0,05, как и гипотеза Hq : = 0 — на уровне а = 0,05. Приведем значения оценок компонент дисперсии: ^в(А) ~ 36,1; ^с(в) ~ 1^,2; б2 = MSr = 21,2. Так как гипотеза Hq: все о(г = 0 не отвергается, а гипотезы Hq: аВ(,4) — 0 и Hq: = 0 отвергаются, оценка дисперсии Таблица 3.13 Результаты дисперсионного анализа для примера 3.3 (план с группировкой) Источник разброса Сумма квадратов SS Число степеней свободы V Средний квадрат MS = SS/v F-отноше- ние p-значе- ние А 1557,5 2 778,8 2,93 0,197 В(А) 797,7 3 265,9 5,37 0,014 С(В) 594,0 12 49,5 2,34 0,050 Остаток 381,0 18 21,2 — — Полная 3330,2 35 — — — 145
единичного наблюдения и доля каждой компоненты дисперсии определяются так: _2 _ г_2 । -2 । ~2 _ yi \ °у - °В(А) + °С(В) + ° - 71>4- Вклад фактора В (А) в общую дисперсию равен (36,1/71/4) х х 100 % = 50,5 %; вклад фактора С(В) равен (14,2/71,4)100 % = = 19,8 %; доля дисперсии ошибки наблюдения равна (21,2/71,4) х х 100 % = 29,6 %. На основании проведенного анализа можно сделать следу- ющие выводы: так как наибольший вклад в общую дисперсию вносит фактор В, то при планировании подобных эксперимен- тов желательно увеличить число уровней фактора В, т. е. число крыс, а также число повторных измерений. 3.4.4. Непараметрические методы анализа связи между количественной и качественными переменными Дисперсионный анализ опирается на предположение нор- мальности распределения исходных данных. Возможны два под- хода к ситуациям, когда это предположение не выполняется. Первый подход заключается в том, чтобы подобрать преобра- зование, которое сделало бы распределение зависимой перемен- ной Y более близким к нормальному. Второй подход состоит в использовании методов анализа, не зависящих от вида распре- деления наблюдаемых случайных величин, из которых наибо- лее разработаны ранговые методы. Рассмотрим некоторые из них. Более подробно с этими методами можно познакомиться в [М. Холлендер, Д. А. Вульф, 1983; J. Н. Zar, 1999]. Однофакторный анализ Пусть фактор А варьируется в эксперименте на / уровнях и на г-м уровне производится наблюдений уц, i = = 1, ...,/, N = rii + •. • + nj. Предполагается, что I выборок яв- ляются независимыми и каждая из них извлечена из непрерыв- ной совокупности с неизвестным распределением Fi(x), причем распределения Fi(x) имеют одинаковую форму и могут разли- чаться лишь параметром сдвига. Для проверки гипотезы Hq о том, что I выборок извлече- ны из одной и той же совокупности, можно воспользоваться свободным от распределения критерием Крускала — Уолли- са (Kruskal — Wallis test). Этот критерий является обобщением 146
двухвыборочного критерия Вилкоксона на случай I выборок, / 2. Упорядочим все N наблюдений по возрастанию, заменим величины yij их рангами и найдем для каждой выборки i сумму рангов R^i = 1, ...,/. Статистика Крускала —Уоллиса имеет вид: Заметим, что среди yij могут быть равные по величине на- блюдения. Если совпадения встречаются внутри одной выбор- ки, то при ранжировании применяется метод случайного ранга. Такого типа совпадения не влияют на значение статистики кри- терия. Когда же совпадения принадлежат разным выборкам, то используется метод среднего ранга (см. 2.3.8). В этом случае зна- чение статистики критерия Н следует разделить на величину (3.21) к 1 _ k=l______________ 7V3-N где К — общее число выборок с равными наблюдениями; tk — число совпадений в k-й выборке, к = 1, ..., К. Если гипотеза Hq верна, то статистика Н распределена асимптотически при п —> оо как х2 с I — 1 степенями свободы. Этим приближением можно пользоваться при щ > 5 или I > 3. Критическое множество уровня значимости а при альтернативе Я1, что не все выборки извлечены из одной совокупности, состо- ит из одного полуинтервала [x2-i i-a, +оо), где X/-i i-a — кван- тиль х2-распределения с числом степеней свободы I — 1 порядка 1 — а. Для проверки гипотезы о том, что медианы I выборок совпа- дают, можно воспользоваться медианным критерием Бра- уна— Му да (Brown —Mood test). Статистика этого критерия имеет вид р {пц - щ/2')2 i=l где тг — число наблюдений г-й выборки, значения которой не меньше значения выборочной медианы для объединенной вы- борки из N наблюдений. Если верна нулевая гипотеза, то статистика X2 распределена асимптотически как у2 с I — 1 степенями свободы. Критическое 147
множество уровня значимости а при альтернативе Hi, что хотя бы две выборки имеют различные медианы, состоит из одного полуинтервала [X/-i 1—ос’ +°°)’ гДе Х/-1 i-а — квантиль х2-рас- пределения с I — 1 степенями свободы порядка 1 — а. Если гипотеза Hq отвергается, то чтобы выделить заведомо различные выборки, применяются свободные от распределе- ния методы множественного сравнения. Для сравнения всевозможных пар выборок (непараметрический аналог непла- нируемых сравнений, которые рассматривались в 3.4.1) мож- но использовать приближенный метод Данна (Dunn test). Две выборки различаются параметром сдвига значимо на уровне значимости а, если N(N+1)_ JL_ 12 nj 2n + 1 24 \Ri. ~ Я;.| > «1-а/(/(/-1)) где = Ri/щ, Ri ~ сумма рангов г-й выборки; = Rj/nj, Rj. — сумма рангов j-n выборки, i < j = 1, ..., I; ~ квантиль стандартного нормального распределения порядка 1 — а/(/(/— 1)). В случае равных объемов выборок, щ = ... = п/ = п > 8, можно использовать приближенный метод Дуосса (Dwass method). Дня каждой пары выборок вычисляется статистика Манна—Уитни, [Д-, i < J, i,j — 1, • • • Д, критическое значение которой равно п2 UZ,n;l—a — Ь Q/,oo;l— где <Э/5(Х);1-а — квантиль порядка 1 — а стьюдентизированно- го размаха с числом степеней свободы I, оо [Л. Н. Болыпев, Н. В. Смирнов, 1983; R. R. Sokal, F. J.Rohlf, 1995]. Выборки, для которых Uij Uz,n;i-a? статистически значимо различаются па- раметром сдвига. Пример 3.4. В работе Хачатурьян и Панченко1 проводилось исследование влияния факторов внешней среды, одним из кото- рых является время суток, на устойчивость организма к гипо- ксии. Характеристикой устойчивости к острой гипоксии у крыс- самцов Вистар являлось время жизни животного, т. е. время пребывания в барокамере после «подъема» на высоту 11,5 км до обратимой остановки дыхания, после которой осуществляли 1 Хачатурьян М. Л., Панченко Л. А. Влияние сезона года на устойчивость крыс к гипоксии // Бюл. экспер. биол. — 2002. — Т. 133. — №3. — С. 348 — 352. 148
Таблица 3.14 Результаты однофакторного анализа для примера 3.4 I 1 2 3 Tli 29 43 54 Ri 2313,5 2054,5 3633,0 Ri. 79,77 47,78 62,28 H(2,N = 126) = 14,52; p = 0,0007 Таблица 3.15 Результаты сравнения пар выборок |Я<. - Ы SE |fli. -Rj.\/SE ^крит |/?i. -Й2.1 31,99 8,78 3,65 2,39 l-Ri. — #3.| 17,49 8,40 2,08 2,39 |#2. — #3.| 14,50 7,30 1,99 2,39 «спуск». Приведем пример анализа данных для низкоустойчи- вых к острой гипоксии крыс. Измерения проводились в 13, 17 и 21 ч (табл. 3.14). Проверка гипотезы о нормальности распре- деления каждой из трех выборок показала, что распределение исходных данных отлично от нормального. Поэтому для про- верки гипотезы Hq о том, что время суток не влияет на устой- чивость к гипоксии, при альтернативе Hi, что фактор влияет, использовался критерий Крускала — Уоллиса. Анализ табл. 3.14 показывает, что гипотеза Hq отвергается на уровне значимости а = 0,05. Для сравнения всех пар выборок использовался метод Данна для 1 — а = 0,95, 7 = 3, икрит = ио,9917 = 2,39 (табл. 3.15). Результаты анализа, приведенные в табл. 3.15, позволяют сделать вывод о том, что только две выборки (для 13 и 17 ч) от- личаются значимо параметром сдвига, так как |7?i. — Rz]/SE = = 3,65, что больше икрит = 2,39. Двухфакторный анализ. Критерий Фридмана Метод Фридмана предназначен для анализа результатов на- блюдений по схеме плана случайных блоков без повторений. Пусть в каждом из J блоков имеется по одному наблюдению на каждом из I уровней постоянного фактора А. Предполага- ется, что каждая из 7 выборок извлечена из непрерывной сово- купности с неизвестным распределением Fi(x). Распределения 149
Fi(x), i = 1, ..., I, имеют одинаковую форму и могут различать- ся лишь параметром сдвига. Результаты наблюдений можно представить в виде таблицы из I строк и J столбцов. Наблюдениям каждого столбца сопо- ставим соответствующие им ранги. Обозначим через Ri сумму рангов г-й строки. Для проверки гипотезы Hq о том, что фак- тор А не влияет, т. е. все / выборок извлечены из одной и той же совокупности, против альтернативы Hi, что хотя бы Fi(x) и Fj(x), i 7^ j, различаются параметром сдвига, можно восполь- зоваться свободным от распределения критерием Фридмана (Friedman test). Статистика критерия Фридмана имеет вид: 12 х? = 77(7^7) Е -ЗА/ + 1). 4 7 г=1 Если верна гипотеза Hq, то статистика х2 распределена асимптотически при п —> оо как х2 с I ~ 1 степенями свобо- ды. Критическое множество уровня значимости а при альтер- нативе Hi состоит из одного полуинтервала [X/-i 1^,+°°), гДе Х/-11—а — квантиль х2-распределения с числом степеней свобо- ды 1 — 1 порядка 1 — а. Если в столбцах таблицы встречаются совпадающие значе- ния, то при переходе к таблице рангов применяют метод сред- них рангов (см. 2.3.8), а значение статистики критерия х2 следу- ет разделить на величину (3.21), заменив N на IJ. Для сравнения всевозможных пар выборок можно использо- вать свободный от распределения метод множествен- ного сравнения Дуосса, заменив в (3.21) N на J. Двухфакторный анализ. Критерий Пейджа Часто исследователь может предположить монотонное влия- ние фактора на зависимую переменную. В этом случае для про- верки гипотезы Hq об отсутствии влияния фактора А против альтернативы Hi об упорядоченном влиянии фактора А можно воспользоваться критерием Пейджа (Page test). Этот крите- рий является более мощным, чем критерий Фридмана, для дан- ной альтернативы Hi. Статистика Пейджа имеет вид I L = IRi = Ri + 21?2 + • •. + IRi, г=1 где Ri — сумма рангов г-го столбца, как и ранее. Если верна ги- потеза Hq, то при п —> оо статистика 150
L — IJ(I + l)/4 (J(I3 — J3)/144(/— I))1/2 распределена асимптотически нормально 7V(0,1). Критическое множество уровня значимости а при альтернативе Н\ состоит из одного полуинтервала [ui-a, +оо), где ui_a — квантиль порядка 1 — а стандартного нормального распределения. Если в строках таблицы встречаются совпадающие значения, то при переходе к таблице рангов используются средние ранги. Число совпадений влияет на точность полученных выводов, с увеличением числа совпадений выводы становятся менее точными. 3.5. Кластерный анализ Кластерный анализ в некотором смысле похож на многомер- ный дисперсионный анализ — количественные отклики и каче- ственные факторы. Существенное различие состоит в том, что факторы неизвестны и надо каким-то образом их сконструиро- вать. Идея этого конструирования проста — наблюдения раз- биваются на однородные группы, которые объявляются разны- ми классами, а переменная, указывающая на принадлежность каждого наблюдения одному из этих классов, объявляется иско- мым качественным фактором. Проблема, следовательно, состо- ит только в том, как разбить совокупность наблюдений на одно- родные группы. Имеется много методов, решающих эту задачу, наиболее рас- пространен среди них агломератпивно-иерархический кла- стерный анализ, который последовательно объединяет на- блюдения, начиная с самых близких, во все более крупные груп- пы. Результаты этого последовательного объединения представ- ляются в виде дендрограммы. Можно по-разному определять как близость отдельных наблюдений, так и сформированных из них групп — кластеров (от англ, cluster — гроздь, скопление). Исходные данные в задачах кластерного анализа задаются в виде таблицы (матрицы), строки которой соответствуют различ- ным наблюдениям, а столбцы — различным переменным / \ У11 У12 У 1т У21 У22 У 1т \Уп1 Уп2 У пт /
Если рассматривать строки-наблюдения, как точки в про- странстве переменных, то естественно использовать в качестве меры различия между наблюдениями i и к евклидово рас- стояние между соответствующими им точками в m-мерном ев- клидовом пространстве В случае если переменные измерены в разных единицах, то суммирование квадратов их разностей будет неправомерным. Сначала необходимо сделать переменные соизмеримыми, напри- мер путем их стандартизации, т. е вычитания среднего и де- ления на среднеквадратическое отклонение: где Можно использовать и другие меры различия между наблю- дениями, например манхеттеновское, или сити-блок, рас- стояние, равное сумме абсолютных значений разностей между значениями переменных: п ^ik — \yij ~ ykj \ • 3=1 Для бинарных переменных манхеттеновское расстояние меж- ду двумя наблюдениями равно просто сумме несовпадающих значений в них и обычно называется хэмминговым. Вычислив каким-либо способом расстояния между всеми па- рами наблюдений, получают матрицу расстояний dn du din^ D _ ^21 d%2 d\n \dni dn2 dnnJ 152
которая и служит основой для дальнейших расчетов. Главная диагональ матрицы состоит из нулей, и матрица симметрична относительно этой диагонали. Имея матрицу расстояний, можно начать процесс последова- тельного объединения наблюдений в кластеры. Алгоритм этого объединения работает следующим образом. Сначала все наблюдения считаются отдельными кластера- ми. На первом шаге в матрице расстояний ищется минималь- ный внедиагональный элемент (поскольку матрица симметрич- на, достаточно просмотреть ее поддиагональную часть). Пусть этот элемент находится на пересечении г-й строки и j-ro столбца, что означает, что среди всех пар кластеров, каждый из которых состоит из одного наблюдения, наиболее близки между собой г-й и j-и кластеры. Эти два кластера объединяются в один, и общее число кластеров уменьшается на единицу — их становится п — 1 вместо исходных п. При этом возникает проблема определения расстояния от вновь образованного кластера i + j до остальных кластеров. Рассмотрим некоторые возможные варианты. 1. Можно определить расстояние от г + j до любого другого кластера к как минимум из расстояний от i до к и от j до к: di+j,k = niin{d^, dj к). Этот метод называется методом минимальной связи, или методом ближайшего соседа. 2. Определить расстояние от i+j до любого другого кластера к как максимум из расстояний от i до к и от j до к: di+jjc = max{dik,djk) — это метод максимальной связи, или метод дальнего соседа. 3. Определить расстояние от i+j до любого другого кластера к как среднее арифметическое из расстояний от i до к и от j до к: j ____ dik Н- djk ^i+j,k — 2 — метод средней связи. Второй и последующий шаги аналогичны первому — каждый раз объединяются два самых близких кластера и вычисляются расстояния от нового объединенного кластера до остальных. На 153
каждом шаге общее число кластеров сокращается на единицу, и процесс заканчивается, когда все кластеры объединятся в один. Метод средней связи имеет модификацию, называемую ме- тодом взвешенной средней связи. Она отличается тем, что если на некотором шаге объединяются кластеры от i и состоя- щие соответственно из Ni и Nj наблюдений, то расстояние от их объединения до любого другого кластера к вычисляется не как простое среднее, а как среднее взвешенное из расстояний от i до к и от j до к\ . Nidik + Njdjk dt+i-k= Ni + N, Метод дальнего соседа имеет тенденцию формировать кла- стеры одинакового размера и может не учитывать реальной неоднородности расположения наблюдений в пространстве при- знаков. Метод ближайшего соседа, наоборот, хорошо отслежи- вает локальные неоднородности и может выявлять кластеры до- вольно сложной формы и разного размера. Однако возможно объединение очень разных кластеров, если между ними случай- но имеется цепочка близких наблюдений. Компромиссом меж- ду этими двумя методами является метод взвешенной средней связи. Результаты кластерного анализа удобно представлять в ви- де дендрограммы, графически показывающей последователь- ность объединений с учетом расстояний между объединяющи- мися кластерами. Визуальный анализ дендрограммы позволя- ет определить число кластеров, на которые естественным обра- зом разбивается совокупность наблюдений — объединение силь- но различающихся кластеров отражается на дендрограме скач- кообразным увеличением межкластерного расстояния. На рис. 3.6 приведен пример работы агломеративно-иерархи- ческого кластерного анализа. Данные состоят из 12 наблюдений, характеризующихся двумя переменными Yi и Y2 (они представ- лены на рис. 3.6, а в виде точек на плоскости). Здесь наглядно иллюстрируется процесс объединения наблюдений в кластеры: сначала объединяются наиболее близкие друг к другу наблюде- ния 6 и 4, затем — 3 и 1, потом к 3 + 1 присоединяется 2 и т. д. (рис. 3.6, а). На рис. 3.6, б представлена дендрограмма — ре- зультат работы алгоритма, на которой ясно видно, что совокуп- ность наблюдений четко разделена на два кластера. Конечно, это еще лучше видно из представления точек на плоскости (см. рис. 3.6, а), но это возможно только потому, что рассматривает- ся случай двух переменных. Дендрограмму же можно получить 154
Расстояние между объединяющимися кластерами Номера наблюдений б 7 6 5 4 3 2 1 О Рис. 3.6. Пример работы агломеративно-иерархического кластерного анализа: а — процесс объединения наблюдений в кластеры; б — дендрограмма 155
Рис. 3.7. Пример работы метода Jf-средних: а — 1-й шаг алгоритма; б — 2-й шаг алгоритма 156
при любом числе переменных, поскольку она строится на основе анализа расстояний между наблюдениями, а их можно вычис- лять для любого числа переменных (см. формулы для евклидова или манхеттеновского расстояний). Среди других широко известных алгоритмов кластерного анализа следует отметить метод К-средних, при реализа- ции которого среди исходных наблюдений выбирают наудачу К наблюдений — начальных центров будущих кластеров. Пер- вый шаг алгоритма начинается с распределения всех наблюде- ний между этими центрами — каждое наблюдение относится к ближайшему центру. После этого центры кластеров пересчиты- ваются заново — каждая координата центра кластера вычисля- ется как среднее из координат, входящих в этот кластер наблю- дений. Второй и последующие шаги аналогичны первому. Про- цедура заканчивается, когда центры кластеров перестанут сме- щаться при новом пересчете. На рис. 3.7 показано два шага ра- боты алгоритма. Очевидно, что на третьем шаге не будет изме- нения положения центров кластеров, так как их состав не из- менится. Таким образом, в данном случае для разбиения сово- купности наблюдений на кластеры оказалось достаточно двух шагов. Несомненным преимуществом метода К-средних является возможность классифицировать наборы из многих сотен и да- же тысяч наблюдений, тогда как с помощью агломеративно- иерархического метода, хотя теоретически и возможно, но слиш- ком громоздко обрабатывать более 100 — 200 наблюдений. Недо- статки метода состоят в необходимости априорного задания чис- ла кластеров, отсутствии наглядного представления результатов и зависимости результатов от начального выбора центров — при неудачном их выборе алгоритм может дать классификацию, не соответствующую реально имеющейся. 3.6. Факторный анализ Целью факторного анализа (factor analysis) является по- иск представления, возможно, приближенного, но с наименьшей потерей информации, исходного набора т переменных У1,У2> ..., Ym в виде линейных комбинаций меньшего числа г пере- менных Vi, Vz, ... ,Vr, называемых факторами. Для упроще- ния изложения будем считать У1, Уг, • • •, Кп центрированными, т. е. полученными из непосредственно измеренных переменных вычитанием из них их средних. Тогда переменные можно выра- 157
зить в виде линейных комбинаций (без свободных членов) цен- трированных факторов Vi, р2, . •., Vr: г Yi = V), г = 1,2, ... ,т. В матричных обозначениях эти соотношения можно записать следующим образом: Y = AV (3.22) или в развернутом матричном виде кл / \ ?1 <2ц <212 &1Г V У <221 <222 &2г т г Уз — <231 <232 X V2 (3.23) \Уп/ \<2mi <2щ2 G"mr / Элементы матрицы А размера т х г называют факторны- ми нагрузками (factor loadings). Поскольку каждой переменной Yi исходных данных соответ- ствует вектор-строка ее наблюденных значений у^, k = 1,2, ..., п, то (3.23) можно записать в еще более развернутом виде \ У11 У12 У13 У41 У1п У21 У22 У23 2/42 У2п У31 У32 Узз 2/43 УЗп \Ут1 Ут2 УтЗ Утп4 Утп / / <211 <212 <221 <222 <231 <232 у ^тп2 а«1г а2г а^г X ^11 2221 О'ТПГ / \Vrl ^12 ^13 ^14 ^22 ^23 ^24 W2 ^гЗ ^г4 Vln V2n Vrn/ 158
Это соотношение в матричной форме выражает значения наблю- дений г = 1,2, ..., т; к = 1,2, ..., п, через факторные зна- чения (factor scores) Vjk, j = 1,2, ..., г; к = 1,2, ..., n, Vik = aijVjk, г = 1,2, к = 1,2,... ,n. j=i Факторный анализ используется для выявления скрытой структуры данных. Например, оценки, полученные группой ис- пытуемых по большому числу тестовых задач, можно при- ближенно попытаться представить как линейные комбинации нескольких факторов, которые можно интерпретировать как различные способности испытуемых — общие, математические, лингвистические и др. Нагрузки в представлении задачи Yi будут выражать степень важности способности Vj для решения этой задачи. Из соотношения (3.22) можно получить обратное для выра- жения факторов V через исходные переменные Y. Умножив сле- ва обе части (3.22) на Ат, а затем обе части полученного равен- ства слева на (А^А)-1 (заметим, что матрица АТА порядка г является квадратной и поэтому может иметь обратную матри- цу), получаем (ATA)-1ATY = (Ат А)-1 АТ AV, откуда V = (АТА)-1 ATY, ИЛИ V = BY, (3.24) где В = (АтА)-1 Ат — матрица размера г х т. Соотношение (3.24) можно также записать в нематричной форме тп = 7 = 1,2,Л г=1 где bji — элементы матрицы В, j = 1,2, ..., г; i = 1,2, ..., m. Непосредственно факторные значения выражаются через значения наблюдений следующим образом: 159
Vn V12 «13 г>14 Vln t>21 «22 «23 ^24 V2n \t>rl Vr2 «гЗ Vr4 Urn/ (bn У11 У12 У13 У14 У1п 612 613 • • У21 У22 У23 У24 У2п 621 &22 62З • • • • ^2m X У31 У32 Узз У34 УЗп \6rl 6r2 6r3 Ъгт/ \Ут1 Ут2 УтЗ Ут4 Утп ) или т Vjk — bjiyik, к — 1,2, . . . , П, j 1,2, . . . , Г. i=l Из соотношения (3.24) можно (при г = т) снова получить со- отношение (3.22) для выражения исходных переменных Y через факторы V. Умножив слева обе части (3.24) на Вт, а затем обе части полученного равенства слева на (ВТВ)-1 (матрица ВТВ порядка т является квадратной и поэтому может иметь обрат- ную матрицу), получаем (BTB)-1BTY = (BTB)1BTBV, откуда Y = (B^p^V, (3.25) или Y = AV, где А = (ВТВ)-1ВТ — матрица размера т х г. Таким образом, для решения задачи факторного анализа достаточно найти лю- бую из матриц А или В. Однако очевидно, что представить, тем более приближен- но, матрицу наблюденных значений в виде (3.22), т. е. в виде произведения матрицы нагрузок на матрицу факторных значе- ний, можно бесчисленным множеством способов, так как заранее неизвестны обе матрицы-сомножители в правой части. Поэтому, 160
Рис. 3.8. Геометрическая иллюстрация метода главных компонент чтобы сделать задачу факторного анализа определенной, необ- ходимо наложить какие-то ограничения на факторные нагруз- ки и факторные значения. В зависимости от вида этих ограни- чений получаются различные методы факторного анализа. Ба- зовым можно считать метод главных компонент (princi- pal component analysis), в котором факторы, называемые глав- ными компонентами (principal components), должны удовле- творять двум требованиям — быть ортогональными и содержать максимум информации об исходных данных. Метод главных компонент имеет простую геометрическую интерпретацию. На рис. 3.8 в трехмерном пространстве (У1, Y2, Уз) представлена совокупность точек-наблюдений, образующая конфигурацию, напоминающую удлиненный сплющенный эл- липсоид, который для наглядности также изображен на рисун- ке. Пусть, для простоты, начало координат О находится в центре этой совокупности. На рис. 3.8 изображены также оси главных компонент — V2 и V3. Первая главная компонента Vi имеет направление, соот- ветствующее наибольшему разбросу проекций наблюдений сре- ди всех направлений, проходящих через О. Вторая главная ком- понента V2 находится в плоскости, ортогональной к Гц и име- ет направление наибольшего разброса среди всех направлений этой плоскости. Третья главная компонента V3 в случае трех измерений однозначно определяется условием ортогональности к первым двум. Она должна находиться на той же плоскости, что и V2, и соответственно разброс проекций наблюдений на V3 161
меньше, чем на V2 (поскольку, по построению, направление наи- большего разброса уже поставлено в соответствие второй глав- ной компоненте). Как видим, число главных компонент в данном примере равно числу исходных переменных. Однако целью фак- торного анализа является сокращение числа переменных, опи- сывающих данные. В методе главных компонент этого можно добиться простым отбрасыванием последних компонент и заме- ной исходных наблюдений их проекциями на оставшиеся компо- ненты. Например, в ситуации, представленной на рис. 3.8, мож- но спроектировать наблюдения на плоскость первой и второй главных компонент и отбросить третью, что не приведет к боль- шой потере информации о взаимном расположении наблюдений. Опишем метод главных компонент в более точных терминах. Общий разброс совокупности п наблюдений в m-мерном про- странстве ортогональных наблюдаемых переменных У1, У2, • • •, Ym определяется как сумма квадратов евклидовых расстояний от центра совокупности до точек-наблюдений =yv ^общ / а0к * к=1 В свою очередь квадрат евклидова расстояния между двумя точками равен сумме квадратов разностей (расстояний) между проекциями этих точек на каждую координатную ось простран- ства, т. е., в частности, расстояние от начала координат до к-го наблюдения равно т d0k = (° ~ Укд2- i=l Отсюда следует, что общий разброс можно представить как сум- му разбросов проекций наблюдений на координатные оси т = (3.26) i=l где sYi = 52 (°_ у^2- к=1 Из равенства (3.26) путем деления обеих его частей на п (вос- пользуемся, для простоты, смещенной оценкой) получаем также соотношение 162
тп г=1 показывающее, что общая дисперсия наблюдений = = 5общ/^ равна сумме дисперсий Sy. = Sy./n проекций наблюде- ний на координатные оси. При переходе к любой новой системе координат, в частно- сти к системе координат, определяемой главными компонента- ми Vi, р2? • • •, Кп, общая дисперсия не изменится и по-прежнему будет равна сумме дисперсий проекций наблюдений на коорди- натные оси (уже новые) тп 4Щ = Е4Г (3.27) 7=1 Теперь можно точно определить условия, налагаемые на главные компоненты и позволяющие их вычислить: первая глав- ная компонента — это направление Vi, которому соответствует максимальное значение дисперсии проекций наблюдений на это направление; вторая главная компонента — направление ортогональное направлению первой главной компоненты и мак- симизирующее дисперсию Sy2 проекций наблюдений на это на- правление; третья главная компонента — направление V3, орто- гональное направлению первой и второй главных компонент и максимизирующее дисперсию проекций наблюдений на это направление, и т. д. Поскольку в соответствии с (3.27) общая дис- персия равна сумме дисперсий проекций наблюдений на главные компоненты, можно принять за 100 %, и тогда каждой глав- ной компоненте будет соответствовать своя доля (процент) объясненной дисперсии. Можно доказать, что условие максимизации дисперсий про- екций наблюдений на подпространство нескольких первых ком- понент вызывает одновременную минимизацию суммы квадра- тов расстояний от наблюдений до этого подпространства. На- пример, если исходные данные являются наблюдениями двух пе- ременных У1 и Уг, то первая главная компонента Vi будет для них не только направлением наибольшего разброса точек, но и направлением, сумма квадратов расстояний до которого от на- блюдений минимальна. В этом смысле первая главная компонен- та похожа на линию регрессии У2 по Yi, которая также находит- ся минимизацией суммы квадратов расстояний от наблюдений до линии регрессии. Разница состоит в том, что в методе глав- 163
ных компонент минимизируется сумма квадратов длин перпен- дикуляров, опущенных из точек-наблюдений на главную компо- ненту, а в регрессионном анализе расстояние измеряется вдоль оси У2 (по этой причине регрессия У2 по У1 может не совпадать с регрессией Y\ по У2). Можно также показать, что условие максимизации диспер- сий проекций наблюдений на подпространство нескольких пер- вых компонент вызывает одновременную минимизацию суммы разностей между квадратами расстояний между всеми пара- ми наблюдений в исходном пространстве и квадратами рассто- яний между проекциями этих наблюдений в подпространстве нескольких первых главных компонент. Например, если спро- ектировать все наблюдения на плоскость первых двух главных компонент, то можно быть уверенным, что это именно та плос- кость, на которой взаимные расстояния между наблюдениями в среднем наименее искажены. Таким образом, первые две глав- ные компоненты дают возможность наглядного графического представления данных на плоскости, сохраняя максимум ин- формации о них. Отметим, что если направление какой-либо оси поменять на противоположное, т. е. поменять на противоположные знаки всех проекций на эту ось, то значение дисперсии проекций на- блюдений на это направление не изменится. Это означает, что любое из двух противоположных направлений главных компо- нент можно выбирать произвольно. Иногда это бывает полезно для более удобной их интерпретации. Рассмотрим кратко некоторые вычислительные аспекты на- хождения главных компонент. Ранее отмечалось, что для решения задачи факторного ана- лиза достаточно найти любую из матриц А или В, выражаю- щих соответственно либо наблюдения через факторы, либо, на- оборот, факторы — через наблюдения. Поскольку координатные оси главных компонент получаются вращением исходной систе- мы координат с сохранением их ортогональности, матрица В в преобразовании V = BY исходных переменных в главные ком- поненты должна быть ортогональной, т. е. ВВТ = ВТВ = I. Из этого, в частности, следует, что в методе главных компонент упрощается переход от соотношения (3.24), выражающего фак- торы через исходные переменные, к соотношению (3.22), выра- жающему исходные переменные через факторы. Действительно, преобразуя (3.25), получаем Y = (BrB)-1BTV = (I^B^V = IBTV = BTV, 164
т. е. матрица факторных нагрузок А, фигурирующая в (3.22), совпадает с транспонированной матрицей В. Элементы матриц В и Вт — это косинусы углов между старыми и новыми осями, и суммы их квадратов по строкам и столбцам равны единице. Можно показать, что условие максимизации проекций на- блюдений приводит к уравнению |С - Х1| = 0, (3.28) где С — выборочная матрица ковариаций переменных Yi, Уг, ..., Ym порядка т, равная деленному на п произведению матрицы наблюдений на ее транспонированную матрицу (напомним, что переменные У1,1г, • • •, Ул центрированны): С11 С12 • с1т 021 С22 С2т \СГ1 Сг2 • • • • Стт/ / У14 У1п Уи У12 2/13 1 У21 2/22 У23 2/24 У2п 72 У31 2/32 Узз 2/34 УЗп X \Ут1 У m2 У m3 У mA • • • Утп / ^2/11 2/21 2/31 У12 2/22 2/32 X У13 2/23 2/зз 2/14 2/24 2/34 УтЛ^ У m2 У m3 У mA \У1п У2п УЗп • • • Утп/ Уравнение (3.28), левая часть которого является полиномом сте- пени 772, в данном случае имеет 772 действительных корней, соб- ственных чисел матрицы С. Эти собственные значения, распо- ложенные в порядке убывания, равны дисперсиям соответству- ющих главных компонент, а совокупность собственных векторов матрицы С образует искомую матрицу В, преобразующую ис- ходные переменные в главные компоненты. Часто наблюдаемые переменные У1,Уг, • • • ,Ym измерены в разных единицах, и тогда их непосредственный совместный ана- лиз является бессмысленным. В этом случае переменные норми- руются путем деления на свои выборочные среднеквадратиче- ские значения (их центрирование путем вычитания выборочных 165
средних мы предположили с самого начала), что делает их со- измеримыми по величине. Матрица ковариаций С при этом пре- вращается в корреляционную матрицу. Если факторный анализ используется не просто для редук- ции громоздких данных или их наглядного представления — эта задача достаточно успешно решается методом главных компо- нент, а нацелен, действительно, на поиск неких скрытых фак- торов, лежащих в основе наблюдаемых данных, то использу- ются более сложные методы. Для многих из них метод глав- ных компонент служит начальным шагом анализа. Наиболее часто применяемым является метод варимаксного враще- ния (varimax rotation method), при котором в качестве отправ- ных берутся факторы, совпадающие с первыми главными ком- понентами. Предположим, что на первую главную компонен- ту приходится 60 % дисперсии, а на вторую — 30 %. В сумме они объясняют 90 % дисперсии — это достаточно много и мож- но предположить, что за наблюдаемыми значениями большого числа переменных, возможно нескольких десятков, стоят всего два базовых фактора. Желательно понять их смысл, что можно сделать только анализируя содержательно представление этих факторов-компонент через исходные переменные. Это легче сде- лать, если нагрузки «контрастны», т. е. близки либо к нулю, либо к единице. Однако главные компоненты в этом отношении могут оказаться не лучшим выбором. Можно попробовать улучшить ситуацию, вращая первые две главные компоненты в их соб- ственной плоскости. При этом суммарная дисперсия, приходя- щаяся на эти главные компоненты, не уменьшится, так что поте- ри информации не произойдет. Может уменьшиться дисперсия первой главной компоненты, например соотношение между дис- персиями, приходящимися на новые оси (уже не главные компо- ненты), будет 50 и 40 %. Однако требование максимальной ин- формативности первого фактора может быть совсем не важным или, по крайней мере, менее важным, чем желательность хо- рошей интерпретируемости факторов. Контрастность нагрузок можно определить разными способами. В методе варимаксного вращения она определяется как усредненная по всем факторам дисперсия квадратов нагрузок в выражениях факторов через исходные переменные. Чаще используется нормализованный метод варимаксного вращения (normalized varimax rotation method), в котором факторные нагрузки предварительно норми- руются путем деления каждой из них на соответствующую ей сумму квадратов нагрузок по факторам. 166
3.7. Дискриминантный анализ Дискриминантный анализ (discriminant analysis) — один из методов распознавания образов (pattern recognition). Задачей распознавания образов является построение правила, позволя- ющего с наименьшей ошибкой предсказывать принадлежность объекта к одному из заданных классов по его описанию. Для по- строения этого правила используется предварительная инфор- мация о наборе объектов, для которых известны как описание, так и принадлежность к классу. Например, имеется группа па- циентов, для которых известны набор симптомов и точный диа- гноз. Требуется, используя эти данные, построить правило, да- ющее возможность в дальнейшем ставить диагноз по симптомам новым пациентам. Рассмотрим задачу распознавания образов, пользуясь веро- ятностными терминами. Пусть рассматриваемые потенциаль- ные объекты (наблюдения) характеризуются значениями т пе- ременных Xi,%2, • • • ч%т, являющихся непрерывными случай- ными величинами, распределенными по одному из законов F1 (*^Т ч *^2 ч • • • ч ^тп) ч F2 (^Т ? *^2 ч • • • ч *^тп) ч • • • ИЛИ Fj^(x\ , Х%, . . . , В зависимости от того, к какому из классов к = 1,2, ... отно- сится объект. Пусть, например, имеется два класса, заданных двумя одно- мерными нормальными распределениями 7V(p = 3,о2 = 1) и 2V(p = 6, о2 = 1), причем объекты из этих классов встречают- ся с равными априорными вероятностями р = q = 0,5. На рис. 3.9 изображены плотности этих двух распределений с рав- Рис. 3.9. Распознавание между двумя классами, заданными двумя од- номерными нормальными распределениями с равными априорными вероятностями 167
Рис. 3.10. Распознавание между двумя классами, заданными двумя од- номерными нормальными распределениями с неравными априорными вероятностями ными весами. Видим, что левее точки х\ = 4,5 плотность /1(^1) выше плотности f2(^1), а правее точки — наоборот. Правило, со- стоящее в том, чтобы любое новое наблюдение, оказавшееся ле- вее точки xi = 4,5, относить к первому классу, а оказавшееся правее точки — ко второму, обеспечивает минимальную ошибку классификации. На рис. 3.10 рассмотренная ситуация несколько модифициро- вана — объекты класса 1 встречаются при случайном выборе в четыре раза чаще, чем объекты класса 2. Это приводит к тому, что граница разделения между классами сдвигается правее — примерно в точку х± = 5. Иначе, мы пользуемся байесовским правилом — относим наблюдение к классу, имеющему наибольшую апостериорную вероятность. В двух рассмотренных примерах предполагалось, что извест- ны теоретические распределения, определяющие классы. Если имеются только выборки наблюдений из них, то по ним можно построить оценки распределений. В частности, если есть основа- ния считать, что неизвестные распределения нормальны, то до- статочно вычислить средние и дисперсии двух выборок. Апри- орные вероятности можно взять равными долям встречаемости наблюдений двух классов в выборке. 168
На рис. 3.11 показана ситуация, когда классы заданы дву- мя двумерными нормальными распределениями с равными дис- персиями и корреляциями и одинаковыми априорными веро- ятностями, различаясь математическими ожиданиями. Каждая плотность схематично представлена одной из своих линий уров- ня (взято одно и то же значение уровня для обеих плотностей). Легко показать, что в этом случае линия разделения между дву- мя классами, т. е. линия, вдоль которой значения обеих плотно- стей равны, является прямой (заметим, что в данном примере на одномерных проекциях на оси х\ и х^ распределения разде- лялись бы гораздо хуже, чем в двумерном пространстве). Дей- ствительно, условие равенства плотностей имеет вид pkiехр < 1 rpri-Hl1))2 . (х2-У-2^2 2(! - Р2) СТ1 °2 (а?1 — Н1Х))(а72 — H2X))11 / к — 2d2------- ------------'-i—L. nky exp oio2 / 1 Г(^1-^12))2 2(1-Р2) о? (ж2 - № )2 2 (®1 - Hl2)) (®2 - (42)) + О2 2Р / (1) (lk Z (2) (2k где (pi , р2 ) и (н > Н-2 ) ~ координаты центров первого и вто- рого распределений; oi и ^2 ~ их дисперсии по первой и второй оси; р — коэффициент корреляции, а коэффициент A?i определя- ется выражением 2koiO2\/1 - р2 Сокращая на к\ и логарифмируя, получаем соотношение < logp — 1 Г01 —и!^)2 2(1 - Р2) О? (х2 -|41})2 «2 9л(ж1 -^(11})(Ж2 -Ц21’) 2Р---------------------- <1Og9“2(l^) (Xi -142))2 ~2 + (х2 ~ 42Ь2 _ о (^1-Н12))(^2-Н22)) 1 = 0 02 Г 0102 J (3.29) 169
Рис. 3.11. Распознавание между двумя классами, заданными двумя двумерными нормальными распределениями с равными априорными вероятностями из которого видно, что после возведений в квадрат и перемноже- ний выражений в скобках члены второго порядка xf, х% и .14X2 сократятся и в левой части уравнения останется выражение пер- вого порядка относительно х± ИЖ2, т.е. это уравнение действи- тельно определяет прямую на плоскости (^1,^2)- Заметим, что этот вывод существенно использует предположение о равенстве соответствующих дисперсий и коэффициентов корреляций двух распределений, что эквивалентно равенству их ковариационных матриц Ci и С2: О? РО1О2 рО1О2 О2 На рис. 3.12 показан случай, когда надо разделить три клас- са. Здесь также предполагается, что соответствующие диспер- сии и корреляции трех распределений равны, поэтому каж- дая пара разделяется прямой, равной плотности. Совокупность этих прямых формирует, как видно из рисунка, результирую- щую кусочно-линейную границу разделения классов на плос- кости. ст = с2 = с = 170
В предположении равенства ковариационных матриц и мно- гомерной нормальности всех распределений рассмотренная си- туация обобщается и на большее число измерений. В трехмер- ном пространстве классы будут разделяться плоскостями, в че- тырехмерном — трехмерными гиперплоскостями и т. д. Имен- но предположение о нормальности и равенстве ковариацион- ных матриц распределений, соответствующих разным классам, определяет условия применимости дискриминантного анализа, точнее линейного дискриминантного анализа. Эти усло- вия довольно жестки, однако, благодаря своей статистической прозрачности и легкости численной реализации, метод линейно- го дискриминантного анализа реализован во всех пакетах про- грамм статистической обработки данных и широко применяется при анализе данных даже в ситуациях, когда его предпосылки выполняются лишь приближенно. Рассмотрим еще некоторые понятия, связанные с линейным дискриминантным анализом. Левую часть равенства (3.29), которую после преобразований можно записать в виде Рис. 3.12. Распознавание между тремя классами, заданными тремя двумерными нормальными распределениями с равными априорными вероятностями 171
Ь12(^1,^2) = «12,0 + «12,1^1 + «12,2^2, называют линейной дискриминантной функцией для классов 1 и 2. Если для некоторого нового наблюдения эта функ- ция больше нуля, то наблюдение следует отнести к классу 1, а если меньше — к классу 2. Очевидно, для случая К классов имеется К (К — 1)/2 дис- криминантных функций и все их надо сравнить с нулем. В слу- чае большого числа классов процедура становится слишком гро- моздкой, поэтому поступают иначе. С каждым классом к связы- вают функцию L/cCxi, Х2), называемую линейным дискрими- нантом этого класса, и для нового наблюдения вычисляют зна- чения дискриминантов для всех классов. Полученные К значе- ния сравниваются, и наблюдение относится к тому классу, кото- рому соответствует максимальное значение дискриминанта. Ес- ли вернуться к уравнению (3.29), то легко видеть, что его левую часть можно представить как разность двух линейных дискри- минантов, соответствующих первому и второму членам в левой части (после раскрытия скобок и взаимного уничтожения квад- ратичных членов). В пространстве наблюдаемых переменных для любого наблю- дения можно вычислить его евклидовы расстояния от центра каждого класса. Однако эти расстояния могут не отражать ис- тинные близости наблюдения к разным классам. Например, на рис. 3.11 точка на пересечении трех разделяющих прямых нахо- дится на разном расстоянии от центров трех классов, однако с точки зрения ее отнесения к одному из классов она равноудале- на от них. Адекватной мерой расстояния в ситуации дискриминантно- го анализа (при равных априорных расстояниях) является рас- стояние Махаланобиса. Расстояние Махаланобиса между двумя точками в пространстве наблюдаемых переменных опре- деляется как евклидово расстояние между этими точками' в новом пространстве, получаемом из исходного путем преобра- зования, при котором первоначальные произвольные нормаль- ные распределения становятся нормальными распределениями с единичными дисперсиями и нулевыми коэффициентами кор- реляции. Например, для случая, приведенного на рис. 3.10, этого мож- но достичь путем поворота координатных осей в направлении осей эллипсов, представляющих линии уровня, и последующего соответствующего изменения масштаба новых осей. 172
Если предпосылки линейного дискриминантного анализа не выполняются даже приближенно, то применяют нелинейные ме- тоды распознавания образов. Одним из таких методов является метод к ближайших соседей. Он состоит в том, что нахо- дятся к ближайших соседей нового наблюдения, и оно относит- ся к тому классу, представителей которого больше всего среди этих ближайших соседей. Выбор числа к не формализован — ал- горитм работает даже при к = 1, но очевидно, что при боль- шом числе наблюдений его можно брать большим, поскольку это должно повысить надежность правильного распознавания. Может оказаться полезным перед вычислением расстояний от нового наблюдения до всех остальных (для выявления ближай- ших) произвести преобразование пространства с тем, чтобы но- вые расстояния лучше соответствовали реальной близости на- блюдений к своим классам. Во всяком случае обязательно сто- ит пронормировать наблюдаемые переменные путем деления их на свои выборочные среднеквадратические отклонения, если эти переменные измерены в разных единицах.
ЧАСТЬ II МОДЕЛИРОВАНИЕ ДИНАМИКИ БИОЛОГИЧЕСКИХ ПРОЦЕССОВ ГЛАВА 4 МОДЕЛИ. ОПИСЫВАЕМЫЕ ОДНИМ УРАВНЕНИЕМ В этой главе будут рассмотрены дифференциальные матема- тические модели, описываемые только одним дифференциаль- ным уравнением. 4.1. Основные понятия Ограничимся изучением свойств дифференциального урав- нения только первого порядка поскольку дифференциальные уравнения более высокого поряд- ка могут быть путем замены переменных сведены к системам двух или более дифференциальных уравнений первого поряд- ка, которые будут рассматриваться в гл. 5. Например, уравнение второго порядка d2x путем замены dx y = Tt сводится к следующей системе двух уравнений первого порядка: ' dx Дифференциальное уравнение называется автономным, если его правая часть не зависит явно от времени, т. е. уравнение имеет вид 174
Решения уравнения (4.1) можно представить графически на плоскости (t,x) в виде интегральных кривых х = x(t). Ес- ли на плоскости (£, х) задана точка с координатами (£о, #о) и Для уравнения (4.1) выполнены условия теоремы Коши, то имеет- ся единственная интегральная кривая x(t) уравнения (4.1), про- ходящая через точку (£о,#оХ т е- интегральные кривые уравне- ния (4.1) не могут пересекаться. Они монотонны и либо уходят в бесконечность, либо асимптотически приближаются к стацио- нарному состоянию (называемому также состоянием рав- новесия, точкой покоя, особой точкой), т. е. состоянию, в котором скорость изменения фазовой переменной равна нулю: Стационарные состояния , #2, •.•,являются корнями алгеб- раического уравнения /(*) = 0. В дальнейшем мы будем пользоваться понятиями фазового пространства и фазовых переменных. Фазовым называется про- странство, на координатных осях которого отложены значения переменных системы, которые в данном случае называются фа- зовыми переменными. В соответствии с дифференциальными уравнениями, описывающими систему, задание всех координат системы для одного момента времени (точки в фазовом простан- стве) определяет состояние системы для всех других моментов времени. Таким образом, изменение состояния системы во времени можно представить как движение системы вдоль некоторой ли- нии в фазовом пространстве. Эта линия называется фазовой траекторией. Метод фазового пространства широко использу- ется в статистической физике, теории колебаний, качественной теории дифференциальных уравнений. Нам он будет полезен при качественном рассмотрении базовых моделей математиче- ской биологии. Для одного уравнения фазовое пространство представляет собой прямую. На фазовой прямой стационарное состояние Xi — это точка, к которой стремится величина ж, а на плоскости (£, х) горизон- тальная прямая х = Xi — это асимптота, к которой приближа- ются интегральные кривые (рис. 4.1). 175
Рис. 4.1. Примеры интегральных кривых автономного дифферен- циального уравнения Рис. 4.2. Иллюстрация устойчиво- го и неустойчивого равновесия: а — стационарное состояние устой- чиво; б — стационарное состояние неустойчиво Реальные биологические системы испытывают многочислен- ные флуктуации и неизбежно отклоняются от стационарного со- стояния. Если после небольшого отклонения состояние системы не удаляется от стационарного, то оно называется устойчи- вым^ в противном случае — неустойчивым. Поэтому важно знать, устойчивы ли стационарные состояния модели. Строгое математическое определение устойчивости стацио- нарного состояния дано А. М. Ляпуновым: состояние равновесия устойчиво по Ляпунову, если для любого сколь угодно ма- лого положительного числа е всегда можно найти такое 8, что если в начальный момент времени to отклонение от состояния равновесия меньше 8, т. е. |ж(^о) — < 8, то и в любой после- дующий момент времени t > to отклонение решения системы от состояния равновесия будет также мало, т. е. будет выполняться неравенство \x(t) — я| < е. Иначе, малое начальное отклонение от равновесия не может вызвать больших последующих откло- нений. Устойчивое равновесие называется асимптотически устойчивым, если можно найти достаточно малое 8, такое, что если в начальный момент времени Iq отклонение от состоя- ния равновесия меньше 8, т. е. |ж(^о)—< 8, то lim \x(t) — я I = О, t—>оо т. е. при не слишком большом начальном отклонении значение фазовой переменной возвращается к стационарному. Ситуации устойчивого и неустойчивого равновесия на при- мере шарика, находящегося внизу вогнутой и вверху выпуклой поверхности, проиллюстрированы на рис. 4.2. Легко проверить, что в первом случае условие устойчивости по Ляпунову и усло- вие асимптотической устойчивости выполняются, а во втором — нет. 176
Асимптотически устойчивое стационарное состояние пред- ставляет собой простейший тип аттрактора, т. е. множества в фазовом пространстве, к которому с течением времени стре- мится состояние динамической системы. 4.2. Исследование уравнения в окрестности стационарного состояния 4.2.1. Исследование устойчивости стационарного состояния методом линеаризации Для исследования поведения решений автономного диффе- ренциального уравнения первого порядка в окрестности стаци- онарного состояния применим метод линеаризации Ляпунова. Пусть х — стационарное решение уравнения (4.1). Пусть систе- ма, первоначально находившаяся в стационарном состоянии, от- клонилась от него и перешла в близкую точку х = х + Перей- дем в уравнении (4.1) от переменной х к переменной £, являю- щейся отклонением системы от стационарного состояния: <j(* + g)= dt dt м 4 Учитывая, что f(x) = 0 (по определению стационарного со- стояния), и разложив /(# + £) в ряд Тейлора в точке х, получаем СЬЪ £ или г г2 — — + ... dt где = f'(x), — f"(x\ • • • Отбросив члены порядка выше первого, получим линейное уравнение называемое линеаризованным уравнением, или уравнением первого приближения. Его решение имеет вид = сехр(Х^), где X = с ~ произвольная постоянная. 177
Рис. 4.3. Определение устойчивости стационарного состояния по гра- фику функции f(x): а — стационарное состояние х устойчиво; б, в — стационарное состояние х неустойчиво Если X < 0, то £ —> О при t —> оо и, следовательно, перво- начальное отклонение от состояния равновесия со временем за- тухает. Это означает, по определению, что состояние равновесия устойчиво. Если X > 0, то £ —> оо при t —> оо, т. е. исходное состо- яние равновесия неустойчиво. Если X = 0, то уравнение первого приближения не может дать ответа на вопрос об устойчивости состояния равновесия системы. Необходимо рассматривать чле- ны более высокого порядка в разложении в ряд Тейлора. Таким образом, устойчивость стационарного состояния авто- номного дифференциального уравнения (4.1) определяется зна- ком производной правой части в стационарной точке. Вопрос об устойчивости состояния равновесия одного урав- нения нетрудно решить, рассматривая график функции f(x). По определению, в стационарной точке правая часть уравнения (4.1) — функция /(ж) — обращается в нуль. При этом возможны три случая (рис. 4.3, а, б, в). 1. Вблизи состояния равновесия функция /(ж) меняет знак с плюса на минус при возрастании х (см. рис. 4.3, а). Отклоним изображающую точку системы в сторону х < х, В этой области скорость изменения х: dx/dt = f(x) положи- тельна. Следовательно, х увеличивается, т. е. возвращается к х. При х > х скорость изменения величины х отрицательна, так как функция /(ж) < 0. Следовательно, здесь х уменьшается и опять стремится к х. Таким образом, отклонения от стационар- ного состояния в обе стороны затухают. Стационарное состояние устойчиво. 2. Вблизи состояния равновесия функция /(ж) меняет знак с минуса на плюс при возрастании х (см. рис. 4.3, б). Проведем рассуждения, аналогичные случаю 1, помещая изображающую точку сначала в область х < ж, затем — в об- ласть х > х. В обоих случаях изображающая точка удаляется от состояния равновесия. Стационарное состояние неустойчиво. 178
3. Вблизи состояния равновесия функция f(x) не меняет знак (см. рис. 4.3, в) Поскольку f(x) = 0, это означает, что изображающая точка, помещенная достаточно близко к состоянию равновесия с одной стороны, будет приближаться к нему, помещенная с другой сто- роны — удаляться. В соответствии с определением устойчивости по Ляпунову состояние равновесия является неустойчивым. 4.2.2. Модель роста колонии микроорганизмов За время Д£ прирост численности Дж равен Дж = R - S, где R и S — численности родившихся и умерших за время Д£ особей, которые пропорциональны этому промежутку времени: Я(Д£,ж) = Я(ж)Д£; 5(Д*,ж) = 5(ж)Д£, т. е. Дж = [7?(ж) - 5(ж)]ДЛ Разделив на Д£ и переходя к пределу при t —* 0, получим диф- ференциальное уравнение ~ = Л(1) - «и- at В простейшем случае, когда рождаемость и смертность про- порциональны численности, уравнение принимает вид: dx — = аж - рж, а - р = г, dt г или dx — = гх. dt Проинтегрируем полученное уравнение методом разделения пе- ременных: dx — = dt, rx In ж = rt + С. 179
X = XqC^ Рис. 4.4. Экспоненциальная фор- ма динамики роста численности колонии микроорганизмов Переходя от логарифмов к значениям переменной х и опреде- ляя произвольную постоянную С из начальных условий, полу- чим экспоненциальную форму динамики роста: х = xoert, Xq = ж(0). Здесь ж(0) соответствует численности популяции в начальный момент времени. График полученной экспоненциальной функции при положи- тельных (размножение) и отрицательных (вымирание) значени- ях константы скорости роста г представлен на рис. 4.4. Роль этой модели в развитии математической биологии и экологии будет рассмотрена далее. 4.2.3. Модель перехода вещества в раствор Пусть количество вещества, переходящего в раствор, пропор- ционально интервалу времени и разности между максимально возможной концентрацией Р и концентрацией х в данный мо- мент времени: Дж = (Р — ж) ДЛ В форме дифференциального уравнения этот закон выглядит следующим образом: = k(P-x). Рис. 4.5. Концентрация переходя- щего в раствор вещества в зависи- мости от времени 180
Разделяя переменные и интегрируя, получаем k(P -х) = dty - 1п(Р - х) = kt + С, х = Р- Che~kt, где Ci — произвольная постоянная. Если ж(0) = 0, т. е. в началь- ный момент времени концентрация вещества в растворе равна нулю, то Ci = Р, х = Р(1 — e~kt). График этой функции приведен на рис. 4.5, он представляет собой кривую с насыщением. В дальнейшем мы, как правило, не будем искать аналити- ческое решение для наших моделей. Для более сложных нели- нейных уравнений это и невозможно. Важные заключения от- носительно свойств моделей можно сделать и на основании ка- чественного их исследования, в первую очередь путем иссле- дования устойчивости стационарных состояний и типов поведе- ния системы вблизи этих состояний. Следует иметь в виду, что с помощью одного автономного дифференциального уравнения могут быть описаны только монотонные изменения переменной и, следовательно, ни периодические, ни хаотические процессы не могут быть описаны. Однако, вводя в правую часть диффе- ренциального уравнения первого порядка запаздывание, можно описать колебания, а делая его дискретным, получить динами- ческий хаос. 4.3. Непрерывные модели популяций Численность популяции может меняться во времени различ- ным образом: расти, совершать колебания, падать, и причины этого могут быть различны. Здесь рассмотрим модели роста популяций и математический аппарат, позволяющий описывать динамику численности разных популяций. 4.3.1. Уравнение экспоненциального роста Широко известной математической моделью, в основу кото- рой положена задача о динамике численности популяции, явля- ется классическая модель неограниченного роста. Это — геомет- рическая прогрессия в дискретном представлении Ai+i = QAn 181
или экспонента — в непрерывном представлении: — = гх. (4.2) at Модель была предложена известным английским демогра- фом и экономистом Т. Р. Мальтусом (1798) в его классическом труде «О законе роста народонаселения», где он обратил внима- ние на тот факт, что численность популяции растет по экспонен- те (в геометрической прогрессии), в то время как производство питания увеличивается со временем линейно (в арифметической прогрессии), из чего сделал справедливый вывод, что рано или поздно экспонента обязательно «обгонит» линейную функцию, и наступит голод. Можно говорить о том, что Мальтус был пер- вым ученым-«алармистом», который на основании результатов моделирования «бил тревогу» и предупреждал человечество об опасности следования развитию по используемым ранее сцена- риям прогресса. Обсуждению важности вывода Мальтуса для популяционной динамики великий Ч. Дарвин посвятил несколько страниц свое- го дневника, указывая, что поскольку ни одна популяция не раз- множается до бесконечности, должны существовать факторы, препятствующие такому неограниченному размножению. Среди этих факторов может быть нехватка ресурса (продовольствия), вызывающая конкуренцию внутри популяции за ресурс, хищни- чество, конкуренция с другими видами. Результатом является замедление скорости роста популяции и выход ее численности на стационарный уровень. Модели ограниченного роста будут рас- смотрены далее (см. 4.3.2). Что касается отбора, то в нем боль- шое значение наряду с конкуренцией близких по своим потреб- Рис. 4.6. Экспоненциальный рост: а — зависимость численности от времени; б — зависимость скорости роста от численности 182
ностям особей играет территориальная изоляция, которая ведет к вымиранию близких форм и обеспечивает процесс диверген- ции. Модели отбора также будут рассмотрены далее (см. 5.5). Г рафик зависимости численности от времени в соответствии с законом экспоненциального роста изображен на рис. 4.6, а, а на рис. 4.6, б представлена зависимость скорости роста популяции (правая часть уравнения (4.2)) от ее численности. В соответствии с экспоненциальным законом изолированная популяция развивалась бы в условиях неограниченных ресур- сов. В природе такие условия встречаются крайне редко. При- мером может служить размножение видов, завезенных в места, где имеется много пищи и отсутствуют конкурирующие виды и хищники (кролики в Австралии). 4.3.2. Ограниченный рост Впервые системный фактор, ограничивающий рост популя- ции, описал Ферхюльст в уравнении логистического роста dx / х \ — = гх (1 - —) , (4.3) at \ К / которое можно также переписать в виде dx о — = гх — Ъх2. (4.4) где 8 — коэффициент внутривидовой конкуренции (за пищевой ресурс, убежища и др.); К — величина, называемая в биологии емкостью экологической ниши популяции. Логистическое уравнение обладает двумя важными свой- ствами. При малых значениях х численность возрастает экс- поненциально (как в уравнении (4.2)), а при больших — при- ближается к некоторому пределу К. Эта величина определяет- ся ограниченностью пищевых ресурсов, мест для гнездования и многими другими факторами, которые могут быть различными для разных видов. Таким образом, емкость экологической ни- ши представляет собой системный фактор, который определяет ограниченность роста популяции в данном ареале обитания. Уравнение (4.3) можно решить аналитически. Ход решения следующий. Произведем разделение переменных: Kdt х(К — х) = rdt. 183
Представим левую часть в виде суммы и проинтегрируем: /1 ( —Ь dx = rdt. In х — ln(K — x) = rt + In C. Переходя от логарифмов к исходным переменным, получим (4-5) где С — произвольная постоянная, которая определяется на- чальным значением численности xq: я(0) = xq, с = -^—. К — xq Подставляя полученное значение С в формулу (4.5): Xq К — X К — Xq получаем решение — зависимость численности от времени: (+\ = x0Kert К — хр + xpert' Г рафик этой функции при разных начальных значениях чис- ленности популяции представлен на рис. 4.7, а. Рис. 4.7. Логистическая модель (4.4): а — зависимость численности от времени при разных начальных значениях численности; б — зависимость скорости роста от численности 184
В случае если начальная численность меньше половины мак- симальной, кривая x(t) имеет точку перегиба с координатами 1 K-xq К\ -1п-------; v • г я?о 2 ) Ордината точки перегиба представляет собой половину макси- мальной численности, а абсцисса зависит как от емкости попу- ляции JC, так и от константы собственной скорости роста т — чем выше генетические возможности популяции, тем скорее на- ступает перегиб на кривой численности (рис. 4.7, 5). При изучении более сложных систем мы не будем искать решение для x(i) в явном виде, а ограничимся исследованием устойчивости их стационарных состояний. Проведем такое ис- следование для логистического уравнения. Уравнение стацио- нарных состояний /(#) = 0 в данном случае имеет два корня Х\ = О, Х2 = К. Проверим, будут ли эти корни устойчивыми. Для этого восполь- зуемся методом линеаризации Ляпунова. Введем новую пере- менную обозначающую отклонение переменной х от ее стаци- онарного значения: £ = х — х и запишем линеаризованное уравнение для (4.4.) dZJdt = а£, где а =/х(ж) _, i = 1,2. I Х=Х{ Напомним, что знак величины a(^i) определяет устойчивость соответствующей особой точки Xi 1‘2'Г'Т • = г-1,2. X=Xi IY Подставив в это выражение значение первого корня Xi = О, получим a(^i) = г. Если считать, что г (коэффициент естествен- ной скорости роста популяции) — величина положительная, то = 0 — неустойчивая особая точка. Если подставить в выра- жение a(xi) значение х% = К, то получим а^хъ) — —г, т. е. от- рицательную величину. Это дает возможность утверждать, что стационарное решение уравнения х% = К соответствует устойчи- вому стационарному режиму существования популяции в огра- ниченной среде. 185
Проведем теперь исследование устойчивости стационарных решений этого уравнения, исходя из графика функции правой части. На рис. 4.7, б видно, что при переходе от отрицательных к положительным значениям х в точке Xi — 0 функция f(x) ме- няет знак с минуса на плюс, т. е. особая точка неустойчива. На- оборот, в точке Х2 = К имеет место изменение знака f(x) с ро- стом х с плюса на минус, следовательно, эта особая точка устой- чива. Несмотря на схематичность положенных в ее основу пред- ставлений, логистическая кривая оказалась очень хорошим при- ближением для описания кривых роста численности многих по- пуляций. В природе внутривидовая конкуренция не удержива- ет численность естественных популяций на строго неизменном уровне, но, действуя в широком диапазоне начальных значений плотности, приводит к гораздо более узкому диапазону конеч- ных (стационарных) значений численности. Таким образом, про- Число родившихся особей _ Плотность о а Плотность Численность популяции Численность популяции Численность популяции в г д Рис. 4.8. Кривые пополнения, соответствующие в модели кривым зави- симости скорости роста от численности популяции: а, б — схема расчета кривых пополнения; в, г, д — кривые пополнения для разных видов: в — численность обыкновенного фазана на о. Протекши-Айленд после его интродукции в 1937 г. [A. S. Einarsen, 1945], г — экспериментальная популяция плодовой мушки Drosophyla melanogaster [R. Pearl, 1927], д — оценка численности арктического финвала [J. R. Allen, 1972] 186
является тенденция к поддержанию плотности каждой популя- ции в определенных пределах. На рис. 4.8, а, б показана схема расчета экспериментальных кривых пополнения. Разность между двумя кривыми (чис- ло рожденных минус число погибших) представляет собой число особей, на которое изменяется численность популяции в течение какой-либо стадии развития или за какой-нибудь промежуток времени. Пополнение популяции невелико при низких значениях плотности, возрастает по мере ее увеличения, снова снижается при достижении предельной плотности насыщения и становит- ся отрицательным (смертность превышает рождаемость), когда начальная плотность превышает К. Конкретный вид связи между скоростью пополнения популя- ции и ее плотностью меняется в зависимости от биологии вида (см., например, графики для фазанов, мух и китов на рис. 4.8, в, г, д). Поскольку скорость пополнения популяции зависит от мно- жества факторов, эмпирические точки никогда не ложатся точ- но на определенную кривую. Однако во всех случаях наблю- дается колоколообразная кривая, форма которой отражает об- щую природу зависимых от плотности изменений рождаемости и смертности всякий раз, когда возникает внутривидовая конку- ренция. 4.3.3. Модель популяции с наименьшей критической численностью В рассмотренных моделях прирост численности (биомассы) популяции представлен линейным членом гх, пропорциональ- ным численности. Строго говоря, это соответствует лишь тем популяциям, размножение которых происходит неполовым пу- тем (микроорганизмы). Если в основе размножения лежит скре- щивание, предполагающее встречи между особями разных полов одного и того же вида, то прирост будет тем выше, чем больше количество встреч между особями, а последнее пропорциональ- но второй степени х. Таким образом, для разнополой популяции в условиях неограниченных ресурсов можно записать: Это уравнение хорошо описывает тот факт, что при низких плотностях популяций скорость размножения резко падает, так как вероятность встречи двух особей разных полов уменьшается 187
при понижении плотности популяции пропорционально квадра- ту плотности. Однако при больших плотностях популяций ско- рость размножения лимитирует уже не число встреч особей про- тивоположного пола, а число самок в популяции. Формула, учи- тывающая оба эти эффекта, имеет вид: dx Qx2 — = а—-----. dt р + хх В действительности плотность популяции не должна опус- каться ниже некоторого критического значения. При падении плотности популяции ниже критической среднее время, в те- чение которого может состояться оплодотворение, становится больше времени жизни отдельной особи, точнее времени, в те- чение которого особь способна к размножению. В этом случае популяция вымирает. Этот эффект может быть учтен, если в последнее уравне- ние ввести член, пропорциональный численности и описываю- щий смертность. Зависимость скорости роста популяции от ее численности при этом примет вид dx Вж2 — — а—5------ух. dt В + хх (4-6) Уравнение (4.6) имеет два стационарных решения: х = 0 и х = dp (ар — ут) = L. (Последнее решение может быть реализова- но при соотношении параметров: ар — ут > 0, поскольку числен- ность — положительная величина.) Соответствующие графики x(t) и f(x) приведены на рис. 4.9, а, б. Из рис. 4.9, б видно, что решение х = 0 — устойчивое, а х = L — неустойчивое. При на- чальных численностях янач < L популяция вырождается, х —> О, причем тем быстрее, чем меньше ггНач- Кривые x(t) при разных £Нач даны на рис. 4.9, а. При яНач > Ь, в соответствии с уравне- нием (4.6), популяция неограниченно размножается. Величина нижней критической плотности L различна для разных видов. Наблюдения биологов показали, что это всего лишь одна пара особей на тысячу квадратных километров в слу- чае ондатр и сотни тысяч особей для американского странству- ющего голубя. Для голубых китов критическая граница общей численности оказалась равной десяткам — сотням. Хищническое истребление этих гигантских животных привело к тому, что их осталось слишком мало в Мировом океане. И хотя охота на них запрещена, надежды на восстановление популяции голубых ки- тов практически нет. 188
Рис. 4.9. Зависимость численности популяции от времени (а) и скоро- сти роста от численности (5) для уравнения (4.6). Штриховкой обозна- чена область вырождения популяции Наиболее общая формула, учитывающая как нижнюю грани- цу численности, так и внутривидовую конкуренцию, имеет вид dx Qx2 . э — = а—5-------хх — ох. dt В + хх (4-7) Зависимости численности от времени и скорости прироста от численности представлены на рис. 4.10, а, б. Корни х = 0 и х = К — устойчивые стационарные состояния; х = L — неустой- чивое, разделяющее области притяжения устойчивых состояний равновесия. Величины L и К различны для разных популяций и могут быть определены только из наблюдений и эксперимен- тов. Ясно, что их определение представляет значительные труд- ности. Кривые 1 — 4 на рис. 4.10, а соответствуют различным начальным значениям численности популяции. При любых промыслах особый интерес представляет вели- чина нижней критической границы, при переходе через кото- рую популяция уже не сможет восстановиться. Модель позволя- ет дать некий методический рецепт определения если не самой критической границы, то степени близости к ней численности вида. Обратимся к рис. 4.10, а. Пусть численность вида в началь- ный момент времени была близка к максимально возможной. При t = 0 происходит одноразовое выбивание популяции. Ес- ли численность осталась значительно больше нижней критиче- ской L, то восстановление происходит сначала быстро, а затем с монотонным замедлением (кривая 1). Если же оставшаяся по- 189
Рис. 4.10. Зависимость численности популяции от времени (а) и скоро- сти роста от численности (б) для уравнения (4.7). Штриховкой обозна- чена область вырождения популяции пуляция близка к критической точке, то восстановление проис- ходит сначала очень медленно, численность популяции надолго «застревает» вблизи критической точки, а затем уже, «набрав силы», более быстро приближается к стационарному уровню (кривая 5). Кривая 2 представляет промежуточный случай. Та- ким образом, наблюдая реакцию системы на возмущение, мож- но предсказать приближение ее к опасным границам. Кривая 4 соответствует вырождению популяции. 4.4. Дискретные модели популяций Численность реальной популяции принимает только целые значения, она не изменяется непрерывно, а является дискретной величиной. Данные переписи реальных популяций представля- ют собой наборы целых чисел. Если предположить, что числен- ность N зависит от численностей в некоторые предшествующие моменты времени, то для описания динамики численности по- пуляций можно применить аппарат разностных уравнений (отображений). Если при этом внешние и внутренние факторы, определяю- щие развитие популяции, остаются во времени неизменными, то численность популяции в момент времени t + 1 может быть опи- сана с помощью разностного уравнения в виде: М+1 = F(M,M_!,M_2, Здесь функция F зависит от численности популяции в момент времени t и к предшествующих моментов времени. 190
4.4.1. Модели популяций с неперекрывающимися поколениями Особенно просто выглядит разностное уравнение в случае, когда численность каждого следующего поколения Nt+i в по- пуляции зависит лишь от численности предыдущего поколения Nt. Это справедливо для многих видов насекомых. Их взрослые особи живут непродолжительное время, достаточное для откла- дывания яиц, и к моменту появления на свет нового поколения (на стадии взрослой особи) предшествующее поколение прекра- щает свое существование. То же имеет место для некоторых ви- дов зоопланктона, рыб, птиц. Про эти виды можно сказать, что поколения в них не перекрываются во времени, и уравнение для численности популяции в момент времени t + 1 может быть за- писано в виде М+1 = F(M). (4.8) Опыт показывает, что в таких системах при малых числен- ностях N растет от одной генерации к другой, а при высоких — падает. В таких случаях функция N имеет один максимум (од- ноэкстремальная функция) рис. 4.12, а. В зависимости от кру- тизны графика F(Nt) в системе могут возникать различные ти- пы поведения (динамические режимы): монотонное и коле- бательное приближение к равновесию, колебательные измене- ния — циклы разной длины и квазистохастическое поведение — хаос. Если поколения перекрываются — появляются дискретные возрастные группы (стадии развития). Для их описания обычно используются тоже дискретные, но более сложные матричные модели. Модели вида (4.8) являются простейшими детерминирован- ными объектами, демонстрирующими хаотическое поведение. В частности, такое поведение может возникнуть в дискретном логистическом уравнении. Вспомним логистическое уравнение, которое описывает раз- витие популяции в непрерывном времени: dN ЛГ Л N —— = rN I 1 - — dt \ К Заменив dN/dt на ДЛГ/Д£, где Д7У = Nt+i — М, Д£ = 1, полу- чим м+1 = Nt 1 + г (4-9) 191
Рис. 4.11. Вид функции f(Nt) для дискретного аналога логистического уравнения: а - f(Nt) = г(1 - Nt/К)’ б - f(Nt) = exp{r(l - Nt/К)} или Nt+1 = Ntf(Nt). (4.10) Однако это уравнение биологически некорректно. Если в какой- то момент времени значение численности Nt становится боль- ше К(1 + г)/г, то уравнение (4.9) дает отрицательное значе- ние М+1 (этот недостаток отсутствует у непрерывного логисти- ческого уравнения (4.3)). Это связано с видом функции f(Nt) (рис. 4.11, а). Чтобы исправить положение в дискретном уравнении, в ка- честве f(Nt) следует взять функцию, асимптотически стремя- щуюся к нулю при Nt —> оо. Вид такой функции изображен на рис. 4.11, б. Экспоненциальная форма такой зависимости была предложе- на Г. Мораном (1950) для численности насекомых и В. Рикером (1952) для рыбных популяций: М+1 = Мехр|г (1 - j . (4.11) Точка пересечения биссектрисы первого координатного угла М+1 = М и функции F(M) определяет равновесное состояние системы, аналогичное стационарному состоянию дифференци- ального уравнения (рис. 4.12, а). 4.4.2. Диаграмма Ламерея Ход решения можно наглядно продемонстрировать графиче- ски с помощью диаграммы, называемой лестницей Ламерея. На рис. 4.12, б показан способ нахождения значений М в по- следовательные моменты времени. Пусть в начальный момент 192
Рис. 4.12. Дискретная логистическая модель: а — определение равновесного состояния в дискретной модели популяции с неперекрывающимися поколениями; б — лестница Ламерея времени N = F(Nq) = Ni задает значение численности в по- следующий момент времени t = 4. Величина TVi в свою очередь определяет значение F(ATi) = Л 2 и т. д. На рис. 4.12, б изобра- жен случай, когда траектория сходится к равновесному состоя- нию, совершая затухающие колебания. 4.4.3. Понятия равновесия и его устойчивости для разностных уравнений Определим для разностных уравнений (отображений) неко- торые понятия, аналогичные основным понятиям теории диф- ференциальных уравнений. Решение (траектория) — любая последовательность зна- чений {Ml? (t — 0,4 ...), удовлетворяющая данному разностно- му уравнению при любом t. Разным начальным значениям соот- ветствуют разные решения. Равновесием называется решение вида: Nt = const — TV*, удовлетворяющее соотношению TV* = F(N*). Возвращаясь к формуле (4.10), видно, что для равновесного состояния f(N*) = = 1. Как и в случае дифференциальных уравнений, для исследо- вания устойчивости применим линейный анализ. Положим Nt = N*+xt. Линеаризуя уравнение (4.8), т. е. разлагая F в ряд по степе- ням xt и отбрасывая члены порядка х% и выше, получаем / dF\ 2 193
Рис. 4.13. Графики численности популяции, составленные по формуле (4.П): а — монотонный рост; б — затухающие колебания; в — двухточечный цикл; г — четырехточечный цикл; д, е — примеры хаотических решений Из условий сходимости геометрической прогрессии следует, что для линеаризованного уравнения xt 0 при £ —> оо, если —— 1 (равновесие устойчиво), dN N* и Xt оо при t оо, если dF dN > 1 (равновесие неустойчиво). Обозначим dF dN 194
В случае устойчивого равновесия: • 0 < А < 1 — отклонения от равновесия исчезают моно- тонно; • — 1 < А < 0 — затухающие колебания вокруг N*. Графики монотонного и немонотонного стремления числен- ности к равновесному состоянию в модели (4.11) представлены на рис. 4.13. В случае неустойчивого равновесия: • А > 1 — отклонение от равновесия монотонно растет; • А < — 1 — отклонение от равновесия в виде нарастающих колебаний. При \dF/dN\ = 1 геометрическая прогрессия сходится, одна- ко для выяснения характера сходимости (наличия монотонно- сти) требуется дополнительное исследование членов более высо- кого порядка. Для уравнения (4.11) равновесие находится из выражения Единственное равновесное значение N* = К > 0 существует при любом г. Равновесие устойчиво, если 0 < г < 2, решение моно- тонно при 0 < г < 1 и представляет собой затухающие колебания при 1 < г < 2. 4.4.4. Циклы и динамический хаос В уравнении (4.11) возможны и более сложные решения — циклы, являющиеся аналогом предельных циклов для систем дифференциальных уравнений. Решение называется циклом длины Г, если N* = yvt*+T,t = 0,l,2, ...; Nt*+j^ Nt*,j = 1,2, ...,Т-1. В уравнении (4.11) циклы (колебательное поведение перемен- ных) наблюдаются при следующих значениях параметра: • при 2 < г = Г2 < 2,526 — двухточечные циклы; • при Г2 < г < г с появляются циклы длины 4,8,16, ..., 2fc; • при г > гс = 3,102 решение зависит от начальных условий. Существуют трехточечные циклы и квазистохастиче- ские решения. Иногда в качестве дискретного аналога используется более простая формула, в которой численность выражена в безразмер- ном виде (при Nt > 1 численность принимается равной нулю): 195
Nt+1 = aM(l - Nt). Аналогичными свойствами обладает уравнение М+1 = к(М(1 + аМ)-₽, которое хорошо описывает динамику численности сезонно раз- множающихся насекомых с неперекрывающимися поколениями. Наблюдения показывают, что большинство популяций демон- стрирует монотонный переход к состоянию равновесия. Эти ре- зультаты подтверждают правомерность использования непре- рывного логистического уравнения в большом числе случаев для описания динамики численности. 4.5. Вероятностные модели популяций Рассмотренные модели популяций являлись детерминистиче- скими. Однако существуют два аспекта, по которым детерми- нистическая модель не может служить точным отражением ре- альных экологических систем, поскольку она не учитывает веро- ятностный характер процессов размножения и гибели, а также случайных колебаний, происходящих в среде во времени и при- водящих к случайным флуктуациям параметров моделей. Учет этих факторов приводит к существенному усложнению матема- тического аппарата, поэтому обычно исследователи стараются строить детерминистические модели, ограничиваясь упомина- нием о возможных последствиях учета стохастики. Если детер- министическая модель свидетельствует об устойчивом равнове- сии, то стохастическая модель предскажет длительное выжи- вание. Если детерминистическая модель предсказывает перио- дические снижения численности одного или нескольких видов, то стохастическая модель даст некоторую положительную веро- ятность вымирания этих видов. Наконец, если детерминистиче- ская модель не выявляет равновесия или равновесие неустойчи- вое, то стохастическая модель предскажет высокую вероятность вымирания. В качестве простейшего примера рассмотрим вероятностное описание процесса роста популяции с учетом только размноже- ния. При детерминистическом подходе считалось, что существу- ет определенная скорость размножения е, такая, что числен- ность популяции п за время dt увеличивается на dn = sndt. Это приводит к экспоненциальному закону п = aezt. 196
где а — численность популяции в начальный момент времени. Подойдем к процессу размножения с вероятностной точки зрения. Пусть вероятность появления одного потомка у данной особи в интервале времени dt равна edt. Тогда вероятность по- явления одной новой особи в целой популяции за время dt равна endt. Обозначим через pn(t) вероятность того, что в момент t в популяции имеется ровно п особей. Предположим, что в каждый момент времени может произойти только одно событие, а имен- но за время dt численность популяции может либо увеличиться на 1, либо остаться неизменной. Размер популяции в момент t можно связать с размером популяции в момент t + dt с помощью следующих рассуждений. Если число особей в момент t + dt рав- но п, это означает, что либо в момент t их было п — 1 и за время dt появилась еще одна, вероятность этого события равна е, либо в момент t было п особей и за время dt это число не изменилось, вероятность этого события равна (1 — е). Складывая вероятно- сти, получим соотношение pn(t + dt) = pn—i(t)s(n - l)dt + pn(t)(l - z)ndt, откуда путем перестановки членов и деления на dt получим pn(t + dt)-pn(t) -------—-------= pn_i(t)e(n - 1) - Pn(i)en dt или = e(n - l)pn_i - гпрп. (4.12) dt Уравнение (4.12) справедливо при n > а, где a — начальная численность популяции. Соответствующее уравнение для п = а имеет вид — = -eapa, (4.13) dt так как в случае, когда процесс начинается при значении п = а, отсутствует член, содержащий рп_\. Системы дифференциально-разностных уравнений, анало- гичные полученным, которые можно рассматривать как дина- мические уравнения для случайного процесса, обычно бывает трудно разрешить в общем виде. Однако в нашем примере это возможно. Проинтегрируем уравнение (4.13) с учетом того об- стоятельства, что (0) = 1: Ра(«) = e~Mt. Затем подставляем это решение в уравнение для п = а + 1, инте- грируем, используя начальное условие ра+1(0) = 0, и находим 197
pa+1(t) = ae-(a+1)et(eet - 1). В свою очередь этот результат подставляем в последующее урав- нение, и весь процесс повторяется. После вычисления несколь- ких последовательных членов можно записать результат в об- щем виде: Pn(t) = C^\e~™\ezt - 1)п~а,п > а. (4.14) Выражение (4.14) определяет распределение вероятностей для любого момента времени, заменяющее то единственное зна- чение, которое рассматривалось в детерминистической модели. Оно является частным случаем биномиального распределения с математическим ожиданием m(t) = aezt и дисперсией o2(t) = ae2et(l - e“et). Легко заметить, что математическое ожидание совпадает с детерминистическим средним. Таким образом, при большом числе особей детерминистическое описание будет удовлетвори- тельно заменять любую стохастическую модель, в которой ос- новное внимание уделяется нахождению средних значений. Ко- гда же число особей мало, например, когда начальный размер популяции составляет всего лишь несколько единиц, диспер- сия, т. е. среднее квадратичное отклонение численности отдель- но взятой популяции от математического ожидания, может быть довольно значительной. При этом при t —> оо коэффициент ва- риации величины п, равный о/m, стремится к 1/у/а. При изучении какой-либо определенной популяции мы на- блюдаем только одно численное значение. График роста обна- руживает значительные колебания. Смысл выражения (4.14) со- стоит в том, что если имеется некоторое большое число популя- ций и в начальный момент времени t = 0 численность каждой из них равна а, то доля этих популяций, имеющих в момент t чис- ленность п, теоретически равна pn(t). При этом математическое ожидание численности популяции (соответствует средней чис- ленности, определяемой в детерминистической модели) состав- ляет m(t), а дисперсия o2(t).
ГЛАВА 5 МОДЕЛИ, ОПИСЫВАЕМЫЕ СИСТЕМОЙ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 5.1. Основные понятия 5.1.1. Фазовая плоскость и фазовый портрет Наиболее интересные результаты по качественному модели- рованию свойств биологических систем получены на моделях из двух дифференциальных уравнений, которые допускают каче- ственное исследование с помощью метода фазовой плоскости. Напомним некоторые понятия качественной теории дифферен- циальных уравнений. Рассмотрим систему двух автономных обыкновенных диффе- ренциальных уравнений общего вида л (5Л) = Q(x,y), где Р(х,у), Q(x,y) — непрерывные функции, определенные в некоторой области G евклидовой плоскости (ж, у — декартовы координаты) и имеющие в этой области непрерывные производ- ные порядка не ниже первого. Область G может быть как неограниченной, так и ограни- ченной. Если переменные ж, у имеют конкретный биологический смысл (концентрации веществ, численности видов), то чаще все- го область G представляет собой положительный квадрант пра- вой полуплоскости: О т < оо, 0^?/<оо. Концентрации веществ или численности видов также могут быть ограничены сверху объемом сосуда или площадью ареала обитания. Тогда область значений переменных имеет вид: О < х < х0, 0 По- переменные ж, у во времени изменяются в соответствии с си- стемой уравнений (5.1) так, что каждому состоянию системы со- ответствует пара значений переменных (ж, у). Обратно, каждой 199
паре переменных (т, у) соответствует определенное состояние системы. Рассмотрим плоскость с осями координат, на которых отло- жены значения переменных т, у. Каждая точка М этой плос- кости соответствует определенному состоянию системы. Такая плоскость называется фазовой плоскостью и изображает сово- купность всех состояний системы. Точка М(Х)У) называется изображающей, или представляющей, точкой. Пусть в начальный момент времени t = to координаты изоб- ражающей точки Mo(x(to), у(1оУ)- В каждый следующий момент времени t изображающая точка будет смещаться в соответствии с изменениями значений переменных x(t), y(t). Совокупность то- чек M(x(t), y(tY) на фазовой плоскости, положение которых со- ответствует состояниям системы в процессе изменения во време- ни переменных x(t),?/(t) согласно уравнениям (5.1), называется фазовой траекторией. Совокупность фазовых траекторий при различных началь- ных значениях переменных дает легко обозримый «портрет» си- стемы. Построение фазового портрета позволяет сделать вы- воды о характере изменений переменных т, у без знания анали- тических решений исходной системы уравнений (5.1). Для изображения фазового портрета необходимо построить векторное поле направлений траекторий системы в каждой точ- ке фазовой плоскости. Задавая приращение At > 0, получим со- ответствующие приращения Ат и А?/ из выражений: Ат = Р(т, у) At; А?/ = Q(t, у) At. Задача построения векторного поля упрощается, если полу- чить выражение для фазовых траекторий в аналитическом виде. Для этого разделим второе уравнение системы (5.1) на первое: d-У = Q(x,y) dx Р(х,у) { ’ Решение этого уравнения у = у(х, с), или в неявном виде F(x,y) — с, где с — постоянная интегрирования, дает семейство интегральных кривых уравнения (5.2) — фазовых траекторий системы (5.1) на плоскости т, у. 5.1.2. Метод изоклин Для построения фазового портрета применяют метод изо- клин — на фазовую плоскость наносят линии, которые пере- 200
секают интегральные кривые под одним определенным углом. Уравнение изоклин легко получить из (5.2). Положим ^- = А dx где А — определенная постоянная величина. Значение А пред- ставляет собой тангенс угла наклона касательной к фазовой тра- ектории и может принимать значения от —оо до +оо. Подстав- ляя вместо dy/dx в (5.2) величину А, получим уравнение изо- клин: Q(x, у) Р(х,уУ Уравнение (5.3) определяет в каждой точке плоскости един- ственную касательную к соответствующей интегральной кри- вой, за исключением точки, где Р(х,у) = 0, Q(x,y) = 0, в которой направление касательной становится неопределенным, так как при этом становится неопределенным значение произ- водной: (5.3) dy_\ = Q(x,y) = О dx\x=x,y=y Р(х,у) О Эта точка является точкой пересечения всех изоклин — осо- бой точкой (точкой покоя). В ней одновременно обращают- ся в нуль производные по времени переменных х и у: ^1 =-Р(^,у) = 0; ^1 =Q(x,y) = o. CLl \х,у CLl \х,у Следовательно, особая точка дифференциальных уравнений фазовых траекторий соответствует стационарному состоянию системы, а ее координаты — суть стационарные значения пере- менных х, у. (В исключительных случаях особая точка может не быть точкой пересечения изоклин, например начало коорди- нат при Р(х, у) = Q(x, у) = х2 + у2.) Особый интерес представляют главные изоклины: • dy/dx = оо , Р(х,у) = 0 — изоклина вертикальных каса- тельных; • dy/dx = 0, Q(x,y) = 0 — изоклина горизонтальных каса- тельных. Построив на фазовой плоскости главные изоклины и найдя точку их пересечения (х, у), координаты которой удовлетворяют условиям: P(x,y) = 0; Q(x,j/) = O, 201
Рис. 5.1. Траектория системы в пространстве x,y,t находим стационарное состояние системы. Система (5.1) облада- ет столькими стационарными состояниями, сколько точек пере- сечения главных изоклин имеется на фазовой плоскости. Каждая фазовая траектория соответствует совокупности движений динамической системы, проходящих через одни и те же состояния и отличающихся друг от друга только началом от- счета времени. Таким образом, фазовые траектории системы — это проек- ции интегральных кривых в пространстве всех трех измерений х, ?/, t на плоскость х, у (рис. 5.1). Если условия теоремы Коши выполнены, то через каждую точку пространствах, ?/, t проходит единственная интегральная кривая. То же справедливо, благодаря автономности, для фазо- вых траекторий: через каждую точку фазовой плоскости прохо- дит единственная фазовая траектория. 5.1.3. Устойчивость стационарного состояния Пусть система находится в состоянии равновесия. Тогда изоб- ражающая точка находится в одной из особых точек системы, в которых по определению: dx dy — = 0; = 0. dt dt Устойчива или нет особая точка, определяется тем, уйдет или нет изображающая точка при малом отклонении от стационар- 202
ного состояния. Применительно к си- стеме двух уравнений определение устойчивости на языке е, 8 выглядит следующим образом: состояние равновесия устойчиво, если для любой заданной области от- клонений от состояния равновесия (е) можно указать область 8(e), окружа- ющую состояние равновесия и обла- дающую тем свойством, что ни од- на траектория, которая начинается внутри области 8, никогда не достиг- Рис. 5.2. Иллюстрация к определению устойчиво- сти области е и 8 на плос- кости X, у нет границы е (рис. 5.2). Для большого класса систем — грубых систем, поведения которых не меняется при малом изменении вида уравнений, ин- формацию о типе поведения в окрестности стационарного состо- яния можно получить, исследуя не исходную, а упрощенную ли- неаризованную систему. 5.2. Исследование систем двух линейных уравнений 5.2.1. Характеристическое уравнение Рассмотрим систему двух линейных уравнений: dx _ — = ах + by; < dt (5.4) = сх + dy, dt где а, Ъ, с, d — константы; х, у — декартовы координаты на фазовой плоскости. Общее решение будем искать в виде: х = Аеи; у = Веи. Подставим эти выражения в (5.4) и сократим на ext: XjA — а А -|- ЬВ; , (5'5) Такая алгебраическая система уравнений с неизвестными А, В имеет ненулевое решение лишь в том случае, если ее определи- 203
тель, составленный из коэффициентов при неизвестных, равен нулю: а — X b _ п с d — X -U- Раскрывая этот определитель, получим характеристическое уравнение системы: X2 — (а + с?)Х + (ad — be) = 0. (5.6) Решение уравнения (5.6) дает значения показателя Хц2, при ко- торых возможны ненулевые для Аи В решения уравнения (5.5). Эти значения суть а + d I (а + d)2 — 4(ad — be) = ” ± V-------------J-------- Если подкоренное выражение отрицательно, то Хц2 комплекс- но сопряженные числа. Предположим, что уравнение (5.6) не имеет кратных корней. Тогда общее решение системы (5.4) мож- но представить в виде линейной комбинации экспонент с показа- телями Xi, Х2: х = сцеХ1* + ci2eX2t; У = C2ieXlt + c22eX2t. Для анализа характера возможных траекторий системы на фазовой плоскости используем линейное однородное преоб- разование координат, которое позволит привести систему к каноническому виду: допускающее более удобное представление на фазовой плоско- сти по сравнению с исходной системой (5.4). Введем новые коор- динаты £, т) по формулам: I = ах + ру; т) = ут + Ъу. (5.8) Коэффициенты преобразований (5.7), (5.8), вообще говоря, комплексные. 204
Из курса линейной алгебры известно, что в случае Xi i исходную систему (5.4) с помощью формул (5.8) можно преоб- разовать к каноническому виду (5.7) и изучать ее поведение на фазовой плоскости т). Рассмотрим различные случаи, которые могут здесь представиться. 5.2.2. Корни Xi, ^2 действительны и одного знака Если корни Xi, К2 действительны и одного знака, то коэффи- циенты преобразования действительны, и мы переходим от дей- ствительной плоскости гс, у к действительной плоскости т). Раз- делив второе уравнение системы (5.7) на первое, получим dr\ _ Х2 т) d£~ Х?Г (5-9) Интегрируя это уравнение, находим Т) = С"|^Г, где г = Л1 Условимся понимать под Х2 корень характеристического уравнения с большим модулем, что не нарушает общности рас- суждений. Тогда, поскольку в рассматриваемом случае корни Xi, Х2 действительны и одного знака, г > 1, и мы имеем дело с ин- тегральными кривыми параболического типа. Все интегральные кривые (кроме оси т), которой соответству- ет С = оо) касаются в начале координат оси которая также является интегральной кривой уравнения (5.9). Начало коорди- нат является особой точкой. Выясним теперь направление движений изображающей точ- ки вдоль фазовых траекторий. Если Xi, Х2 отрицательны, то |£|, |т)| убывают с течением времени. Изображающая точка прибли- жается к началу координат, никогда, од- нако, не достигая его. В противном слу- чае это противоречило бы теореме Ко- ши, которая утверждает, что через каж- дую точку фазовой плоскости проходит лишь одна фазовая траектория. Такую особую точку, через которую проходят интегральные кривые, подоб- но тому, как семейство парабол у = сх' (г > 0) проходит через начало коорди- нат, называют узлом (рис. 5.3). Рис. 5.3. Особая точка типа «узел» на плоско- сти канонических коор- динат £, Г) 205
Состояние равновесия типа «узел» при Xi,Х2 < 0 устойчиво по Ляпунову, так как изображающая точка по всем интеграль- ным кривым движется по направлению к началу координат. Это устойчивый узел. Если же Xi,Х2 > 0, то |£|, |т)| возрастают с течением времени и изображающая точка удаляется от начала координат. В этом случае особая точка — неустойчивый узел. На фазовой плоскости ж, у общий качественный характер по- ведения интегральных кривых сохранится, но касательные к ин- тегральным кривым не будут совпадать с осями координат. Угол наклона этих касательных будет определяться соотношением ко- эффициентов а, р, у, 8 в преобразовании (5.8). 5.2.3. Корни Xi, Х2 действительны и разных знаков Если корни Xi и Х2 действительны и разных знаков, то пре- образование от координат ж, у к координатам Y) опять действи- тельное. Уравнения для канонических переменных снова имеют вид (5.7), а уравнение фазовых траекторий имеет вид: dr) = dl V где г - М Х2 Интегрируя, находим Ч = С|5Г’'. Это уравнение определяет семейство кривых гиперболиче- ского типа, где обе оси координат — асимптоты (при г = 1 получается семейство равнобочных гипербол). Оси координат и в этом случае являются интегральными кривыми — это будут единственные интегральные кривые, проходящие через начало координат. Каждая из них состоит из трех фазовых траекто- рий: из двух движений к состоянию равновесия (или от состо- яния равновесия) и из состояния равновесия. Все остальные ин- тегральные кривые — суть гиперболы, не проходящие через на- чало координат (рис. 5.4). Такая особая точка носит название «седло». Линии уровня вблизи горной седловины ведут себя по- добно фазовым траекториям в окрестности седла. Рассмотрим характер движения изображающей точки по фа- зовым траекториям вблизи состояния равновесия. Пусть, напри- мер, Xi > О, Х2 < 0. Тогда изображающая точка, помещенная на ось будет удаляться от начала координат, а помещенная на ось Т) — неограниченно приближаться к началу координат, не дости- гая его за конечное время. Где бы ни находилась изображающая 206
Рис. 5.4. Особая точка типа «сед- ло» на плоскости канонических координат Г) Рис. 5.5. Фазовый портрет систе- мы, один из характеристических корней которой равен нулю, а вто- рой отрицателен точка в начальный момент (за исключением особой точки и то- чек на асимптоте Y) = 0), она в конечном счете будет удаляться от состояния равновесия, даже если вначале она движется по од- ной из интегральных кривых по направлению к особой точке. Очевидно, что особая точка типа «седла» всегда неустойчи- ва. Только при специально выбранных начальных условиях на асимптоте Т] = О система будет приближаться к состоянию рав- новесия. Однако это не противоречит утверждению о неустой- чивости системы. Любая малая флуктуация приведет изобра- жающую точку к уходу с асимптоты, поэтому всякое реальное движение будет удалять систему от состояния равновесия. Пере- ходя обратно к координатам х, у, получим ту же качественную картину характера движения траекторий вокруг начала коорди- нат. Пограничным между рассмотренными случаями узла и сед- ла является случай, когда один из характеристических показа- телей, например Xi, обращается в нуль, что имеет место, когда определитель системы ad — be = 0. В этом случае коэффициенты правых частей уравнений (5.4) пропорциональны друг другу: а b ~с ~ d" и система имеет своими состояниями равновесия все точки пря- мой: ах -У by = 0. Остальные интегральные кривые представляют собой семейство параллельных прямых с угловым коэффициентом х — cjd, по которым изображающие точки либо приближаются к состоянию 207
равновесия, либо удаляются от него в зависимости от знака вто- рого корня характеристического уравнения Х2 = a+d (рис. 5.5). В этом случае координаты состояния равновесия зависят от на- чального значения переменных. 5.2.4. Корни Xi, Х2 комплексные сопряженные Если корни Xi и Х2 комплексные сопряженные, то при дей- ствительных х и у имеем комплексные сопряженные £,Г). Одна- ко, вводя еще одно промежуточное преобразование, можно и в этом случае свести рассмотрение к действительному линейному однородному преобразованию. Положим Xi — «1 + ib\\ Х2 = di — ibij % = и + iv; Г) = и — w, (5.10) где «1,61 и u, v — действительные величины. Можно показать, что преобразование от ж, у к u, v является при допущенных пред- положениях действительным, линейным, однородным, с детер- минантом, отличным от нуля. В силу уравнений (5.7), (5.10) имеем du .dv , ., ч/ . ч — + г— = («1 + гЬ1)(« + гг); dt dt = (ai - ibi)(u - w), dt dt откуда {du , — =a1u-b1v- * <5'u) dv — = a^v + byu. dt Разделив второе уравнение на первое, получим dv _ a^v + biu du aiu — biv' которое легче интегрируется, если перейти к полярной системе координат (г, ср). После подстановки и = г cos ср, v = г sin ср полу- dr «1 чим — = -—, откуда «ср 01 г г = Се%*. 208
Таким образом, на фазовой плоско- сти u, v мы имеем дело с семейством логарифмических спиралей, каждая из которых имеет асимптотическую точку в начале координат. Особая точка, ко- торая является асимптотической точ- кой всех интегральных кривых, имею- щих вид спиралей, вложенных друг в друга, называется фокусом (рис. 5.6). Рассмотрим характер движения изображающей точки по фазовым тра- екториям. Умножив первое уравнение системы (5.11) на и, а второе на v и сложив полученные уравнения, имеем Рис. 5.6. Фазовый порт- рет системы в окрест- ности особой точки ти- па «фокус» на плоскости координат u, v Ido 2Tt=a^ 2 2 где р = и + v . Пусть ai < 0 (ai = Reki52). Изображающая точка тогда непрерывно приближается к началу координат, не достигая его в конечное время. Это означает, что фазовые траектории пред- ставляют собой скручивающиеся спирали и соответствуют зату- хающим колебаниям переменных. Это — устойчивый фокус. В случае устойчивого фокуса, как и в случае устойчивого уз- ла, выполнено не только условие Ляпунова, но и более жесткое требование асимптотической устойчивости (см. 4.1). Именно при любых начальных отклонениях система по прошествии времени вернется как угодно близко к положению равновесия. Если ai > 0, то изображающая точка удаляется от начала ко- ординат, и мы имеем дело с неустойчивым фокусом. При пе- реходе от плоскости u, v к фазовой плоскости ж, у спирали также останутся спиралями, однако будут деформированы. При <21=0 фазовыми траекториями на плоскости u, v будут окружности u2 + v2 = const, которым на плоскости ж, у соответ- ствуют эллипсы: by2 + (а — d)xy — сх2 = const, т. е. при ai = 0 через особую точку х = 0, у = 0 не проходит ни одна интегральная кривая. Такая изолированная особая точка, вблизи которой интегральные кривые представляют собой за- мкнутые кривые, в частности эллипсы, вложенные друг в друга и охватывающие особую точку, называется центром. 209
Устойчивый узел (Хь Х2 действительны и отрицательны) Неустойчивый узел (Хь Х2 действительны и положительны) Устойчивый фокус (Хь Х2 комплексны, Re Х1)2 < 0) Неустойчивый фокус (Хь Х2 комплексны, Re Х1>2 > 0) Центр (Хь Х2 чисто мнимое) Седло (Хь Х2 действительны и разных знаков) Рис. 5.7. Типы фазовых портретов в окрестности стационарного состо- яния для системы линейных уравнений (5.4) Таким образом, мы рассмотрели шесть типов состояния рав- новесия в зависимости от характера корней характеристическо- го уравнения (5.6). Вид фазовых траекторий на плоскости х,у для этих шести случаев изображен на рис. 5.7. Эти типы состоя- ния равновесия относятся к случаям, когда корни характеристи- ческого уравнения (5.6) не обращаются в нуль и не совпадают между собой. 210
Пять типов состояния равновесия грубые, их характер не изменяется при достаточно малых изменениях правых частей уравнений (5.4). При этом малыми должны быть изменения не только правых частей, но и их производных первого порядка. Шестое состояние равновесия — центр — негрубое. При малых изменениях параметров правой части уравнений он переходит в устойчивый или неустойчивый фокус. 5.2.5. Бифуркационная диаграмма Введем обозначения: о = —(а + с?);А=а & . х 7 с а Тогда характеристическое уравнение (5.6) запишется в виде: Х^ + оХ + Д = 0. Рассмотрим плоскость с прямоугольными декартовыми коор- динатами о, Д и отметим на ней области, соответствующие то- му или иному типу состояния равновесия, который определяется характером корней характеристического уравнения —о ± \/о2 — 4 Д Х1,2 = ------5-------• Рис. 5.8. Бифуркационная диаграмма для системы линейных уравне- ний (5.4) 211
Условием устойчивости состояния равновесия будет наличие - отрицательной действительной части у X] и Х2. Необходимое и достаточное условие этого — выполнение неравенств о > О, Д > 0. На диаграмме (рис. 5.8) этому условию соответству- ют точки, расположенные в первой четверти плоскости пара- метров. Особая точка будет фокусом, если Xi и Х2 комплексны. Этому условию соответствуют те точки плоскости, для которых о2 — 4Д < 0, т. е. точки между двумя ветвями параболы о2 = 4Д. Точки полуоси о = 0, Д > 0 соответствуют состояниям равно- весия типа «центр». Если Xi и Х2 действительны, но разных зна- ков, то Д < 0, т. е. особая точка будет седлом. В итоге получаем диаграмму разбиения плоскости параметров о, Д на области, со- ответствующие различным типам состояния равновесия. Если коэффициенты линейной системы a, b, с, d зависят от некоторого параметра, то при изменении этого параметра будут меняться и величины о, Д. При переходе через границы харак- тер фазового портрета качественно меняется. В случае когда ме- няется характер устойчивости особой точки, такие границы на- зываются бифуркационными — по разные стороны от грани- цы система имеет два различных фазовых портрета и соответ- ственно два разных типа поведения. На диаграмме видно, как могут проходить такие изменения. Если исключить особые случаи — начало координат, то легко видеть, что седло может переходить в узел, устойчивый или неустойчивый при пересечении оси ординат. Устойчивый узел может перейти либо в седло, либо в устойчивый фокус и т. д. Отметим, что переходы устойчивый узел — устойчивый фо- кус и неустойчивый узел — неустойчивый фокус не являются бифуркационными, так как характер устойчивости при этом не меняется. При этом переходе выполняется условие о2 = 4Д, а корни характеристического уравнения равны между собой: Хц2 = — (а + d). В случае отрицательных корней особая точка устойчива, в случае положительных — неустойчива. При бифуркационных переходах меняется характер устойчи- вости особой точки. Например, устойчивый фокус через центр может переходить в неустойчивый фокус. Эта бифуркация на- зывается бифуркацией Андронова — Хопфа по именам ис- следовавших ее ученых. При этой бифуркации в нелинейных системах происходит рождение предельного цикла и система становится автоколебательной (см. 5.6). Пограничная бифурка- ционная ситуация при переходе седло —узел рассматривались в 5.2.3. 212
5.3. Системы двух нелинейных дифференциальных уравнений 5.3.1. Метод Ляпунова линеаризации системы в окрестности стационарного состояния Пусть биологическая система описывается системой двух ав- тономных дифференциальных уравнений второго порядка об- щего вида: ' dx _ $ = Q(x,y'). at Стационарные значения переменных системы определяются из алгебраических уравнений: 5.12) < Р(ж,у) = 0; Q(x,y) = 0. (5.13) Стационарные состояния соответствуют особым точкам дифференциального уравнения первого порядка, определяюще- го интегральные кривые: dy = Q(x, у) dx Р(х, у) (5-14) Математический анализ поведения траекторий этой системы на фазовой плоскости связан с именами французского матема- тика А. Пуанкаре (1854— 1912) и русского математика и механи- ка А. М. Ляпунова (1857— 1918). Ляпунов показал, что в большом числе случаев анализ устой- чивости стационарного состояния нелинейной системы можно заменить анализом устойчивости системы, линеаризованной в окрестности стационарного состояния. Рассмотрим поведение переменных при некотором неболь- шом отклонении системы от состояния равновесия. Введем вме- сто переменных х, у новые независимые переменные rj, опре- делив их как смещения относительно равновесных значений пе- ременных х = х + У = У + ?1- (5.15) 213
Подставив эти выражения в (5.12), получим dx d^ , _ — _ ч , л + л=р(1 + 5'9 + ,1)' If + f = «(^S + D dt dt (5.16) /dx dy . \ ( — = — = 0, так как x, у — координаты особой точки). \dy dt / Предположим, что функции Р и Q непрерывны и имеют не- прерывные производные не ниже первого порядка. Тогда можно разложить правые части уравнений (5.16) в ряд Тейлора по пе- ременным £,т): = Р(х, у) + al + ЬТ| + (рп?2 + 2р12?Г) + Р22Г)2 + CLl к = Q(x,y) + cl + dri + (уц£2 + 2(?12?T) + g22T)2 + •••) + •••, (5-17) где а = Рх(х^уУь = Ру(х,УУ, (5.18) с = Q'x(x,y),d = Q'y(x,y). Учтем, что по определению особой точки < Р(х,у) = 0; Q(z,y) = 0, и отбросим в уравнениях (5.17) нелинейные члены. Получим си- стему линейных уравнений с постоянными коэффициентами — систему первого приближения: dt=aK+brl’ , (5-19) f=с5+* Решение этой системы определяется корнями характеристи- ческого уравнения системы (см. 5.2): а — К Ь с d — \ = 0. (5.20) 214
Ляпунов показал, что если оба корня уравнения (5.20) (а + d) ± \/(а + d)2 — 4(ad — be) Ai,2 =--------------------------- (5.21) 2 имеют отличные от нуля действительные части, то исследование уравнений первого приближения (5.19) всегда дает правильный ответ на вопрос о типе устойчивости состояния равновесия в си- стеме (5.12), а именно: • если оба корня имеют отрицательную действительную часть и, следовательно, все решения уравнений первого прибли- жения (5.19) затухают, то состояние равновесия устойчиво; • если хотя бы один корень имеет положительную действи- тельную часть, т. е. система (5.19) имеет нарастающие решения, то состояние равновесия неустойчиво. Когда действительные части обоих корней характеристиче- ского уравнения равны нулю и корни чисто мнимые, линеаризо- ванное уравнение имеет особую точку типа «центр». Если один корень равен нулю, а другой отрицателен, то уравнения (5.18), (5.19) не дают ответа на вопрос об устойчивости состояния рав- новесия, и необходимо рассматривать члены более высокого по- рядка малости в разложении в ряд Тейлора правых частей урав- нений (5.12). В случае когда оба корня характеристического уравнения имеют отличные от нуля действительные части (грубые си- стемы), уравнение первого приближения определяет не только устойчивость стационарного состояния, но и характер фазовых траекторий в достаточно малой его окрестности. Как и в случае линейных уравнений, здесь возможны пять типов грубых состояний равновесия: устойчивый узел, неустой- чивый узел, устойчивый фокус, неустойчивый фокус и седло. Для исследования типов состояний равновесия удобно поль- зоваться диаграммой, изображенной на рис. 5.8. Для систе- мы (5.12): = [рх(я,у) + <%(£, у)]; Р^х,у) Q'x(x,y) Ру(х,у) Q'y(x,y) (5.22) Грубым состояниям равновесия соответствуют все точки плоскости параметров о, А, лежащие вне оси А = 0 и полуоси о = 0, А > 0. 215
Точкам оси А = 0 и полуоси а = О, А > 0 соответству- ют негрубые состояния равновесия (негрубые особые точки). Их свойства могут быть изменены сколь угодно малыми изменени- ями правых частей уравнений (5.12) за счет сколь угодно ма- лых изменений функций Р(ж,у), Q(x,y) и их производных. По- этому характер негрубых состояний равновесия (в частности, устойчивость) уже не определяется значениями коэффициентов в правых частях уравнений первого приближения (5.19). В отли- чие от линейных систем уже при небольших изменениях в пра- вых частях содержащихся там нелинейных членов может про- изойти качественное изменение фазового портрета — бифурка- ция. 5.3.2. Кинетические уравнения Лотки А. Лоткой [A. J. Lotka. Elements of Physical Biology, 1925] была исследована гипотетическая химическая реакция: Применим для исследования стационарного состояния этой мо- дели метод линеаризации. Пусть в некотором объеме находится в избытке вещество А. Молекулы вещества А с некоторой постоянной скоростью ко пре- вращаются в молекулы вещества X (реакция нулевого порядка). Вещество X может превращаться в вещество У, причем скорость этой реакции тем больше, чем больше концентрации как веще- ства X, так и вещества У (реакция второго порядка). В схеме это отражено обратной стрелкой над символом У. Молекулы У в свою очередь необратимо распадаются со скоростью, пропор- циональной концентрации вещества У. В результате образуется вещество В (реакция первого порядка). Запишем систему уравнений, описывающих реакцию: = ко - kixy; at = к\ху - к2у, at dB = к2У' at (5.23) где х,У)В — концентрации химических компонентов. Первые два уравнения этой системы не зависят от В, поэтому их мож- 216
но рассматривать отдельно. Рассмотрим стационарное решение системы: “7“ = 0; ^=0. dt dt Из этих условий получим систему алгебраических уравнений, связывающих стационарные концентрации х,у: ко — к\ху = 0; куху - к2у = 0. V Координаты особой точки: к2 _ ко Х=к^ У=к2 Исследуем устойчивость этого стационарного состояния ме- тодом Ляпунова. Введем новые переменные £, Т), характеризую- щие отклонения переменных от равновесных концентраций ж, у: x{t) = х + £(*); y(t) = у + т)(О- Линеаризованная система в новых переменных имеет вид: — = _fc2T) - —— dt к% dr\ _ fcifcp dt къ Отметим, что величины отклонений от стационарных значе- ний переменных $, Т) могут менять знак, в то время как исход- ные переменные ж,т/, являющиеся концентрациями, могут быть только положительными. Запишем характеристическое уравнение системы: или К2 + К + koki = 0. ^2 Корни характеристического уравнения: fcifcp ^2 . //fclfcoV ,, , ± \ —— - 4fc0fei V \ fc2 / 217
Рис. 5.9. Фазовый портрет системы первых двух уравнений системы (5.23): а — устойчивый фокус, ко = 2, ki = 10, /сг = 2; б — устойчивый узел, ко = 2, &1 = 2, /с2 = 4 Фазовый портрет системы (5.23) изображен на рис. 5.9. При 4/^2 > Ml подкоренное выражение отрицательно и осо- бая точка — фокус, при обратном соотношении — узел. И в том и в другом случае особая точка устойчива, так как действитель- ная часть обоих корней характеристического уравнения отрица- тельна. Таким образом, в описанной химической реакции (5.23) воз- можны разные режимы изменения переменных в зависимости от соотношения величин констант скоростей. Если 4/с| > &qA:i, имеют место затухающие колебания концентраций компонентов, при 4^2 < — бесколебательное приближение концентраций к стационарным. Соотношение параметров 4^ — соответ- Рис. 5.10. Плоскость пара- метров для системы (5.23): а — область устойчивого фо- куса; б — область устойчиво- го узла ствует изменению типа особой точки системы уравнений (5.23). Рассмотрим плоскость параметров (рис. 5.10), где по оси абсцисс отложе- ны значения константы к*}, а по оси ординат — произведение А?о&1- Пара- бола А?о&1 — 4А?2 делит плоскость па- раметров на две области — устойчи- вых узлов и устойчивых фокусов. За- давая те или иные значения парамет- ров, можно получить колебательный и бесколебательный режимы измене- ния концентраций веществ х и у. Фа- зовый портрет системы при этом бу- 218
дет представлять собой фокус или узел, изображенные соответ- ственно на рис. 5.10, а и б. Если в системе установятся стационарные концентрации ве- ществ х и т/, то это приведет к установлению постоянной ско- рости прироста концентрации вещества В в третьем уравнении системы (5.23): dB , И = к2у- Ясно, что в действительности такая система реализоваться не может, так как в ней при t —> оо концентрация вещества В стре- мится к бесконечности. Однако система, подобная системе реак- ций Лотки, может представлять собой фрагмент более сложной химической системы. Исследованные нами уравнения правильно описывают поведение компонентов х и т/, если приток вещества х (скорость его постоянна и равна ко) осуществляется из боль- шого «резервуара», а отток вещества у — в большой «резервуар» (значение В очень велико). При этих предположениях на малых промежутках времени (по сравнению с временем существенного изменения заполненности емкости веществом В) наше рассмот- рение вполне правомерно. 5.3.3. Модель Вольтерра В качестве второго примера рассмотрим классическую воль- терровскую модель «хищник— жертва», которая была предложена В. Вольтерра для объяснения периодических из- менений числа особей. Модель впервые опубликована в рабо- те V. Volterra «Variozionie fluttuasionie del numero d’individui in specie animali conviventi». Mem. Acad. Lincei. Vol. 2. — P. 31 — 113, 19241. Пусть в некотором замкнутом районе живут хищники и жерт- вы, например волки и зайцы. Зайцы питаются растительной пи- щей, имеющейся всегда в достаточном количестве. Волки могут питаться лишь зайцами. Обозначим число зайцев (жертв) — ж, а число волков (хищников) — у. Так как количество пищи у зайцев неограниченно, можно предположить, что они размножаются со скоростью, пропорциональной их числу: гхх. (5.24) 1 Вольтерра В. Математическая теория борьбы за существование. — М.: На- ука, 1976. 219
Если рождаемость зайцев превышает их смертность, то е > 0. Выражение (5.24) соответствует автокаталитической реакции первого порядка. Пусть убыль зайцев пропорциональна вероятности встречи зайца с волком, т. е. пропорциональна произведению ху. Можно предположить по аналогии с бимолекулярными реакциями, где вероятность появления новой молекулы пропорциональна веро- ятности встречи двух молекул, что и количество волков нарас- тает тем быстрее, чем чаще происходят их встречи с зайцами, а именно пропорционально ху. Кроме того, имеет место процесс естественной смертности волков, причем скорость смертности пропорциональна их коли- честву. Эти рассуждения приводят к системе уравнений для измене- ний численности зайцев-жертв х и волков-хищников у: = x(zx - уу); J = -у(еу - М- (5.25) Система имеет два стационарных решения. Одно из них — нулевое: xq — 0, уо — 0. Линейный анализ устойчивости показы- вает, что эта точка всегда представляет собой седло. Покажем, что система уравнений (5.25) также имеет на фазовой плоскости переменных ху ненулевую особую точку типа «центр». Коорди- наты этой точки: Еж у = —- 8 у Так как все параметры еж, е?у, у, 8 положительны, точка (х, у) расположена в положительном квадранте фазовой плоскости. Линеаризация системы вблизи этой точки дает: =й+^; J = c5 + <i,l. Коэффициенты в этих уравнениях выражаются в соответствии с (5.18) через частные производные правых частей уравнений системы (5.25) формулами: а = гх — уу; Ъ = —ух; с = 8х; d = —гу + 8х. 220
Здесь £, т) — отклонения численностей от их стационарных зна- чений х. у: £(£) = x(t) — х, п(*) = у(0 - у- Для нулевого стационарного состояния характеристический определитель имеет вид: гх-\ О О -еу - X Корни соответствующего характеристического уравнения: Xi = — Ex, Х2 = ~£у Тип нулевой особой точки — седло. Характеристический определитель матрицы коэффициентов системы для ненулевого стационарного состояния имеет вид: —X Zy^y Чх £xYx Чу Характеристическое уравнение: Н- &х£у — 0. Корни этого уравнения чисто мнимые: Хц2 — ^Ъу/^х^у • Таким образом, исследование системы показывает, что траекто- рии вблизи ненулевой особой точки являются концентрически- ми эллипсами, а сама особая точка — центром. Можно показать, что изученная модель Вольтерра и вдали от особой точки имеет замкнутые траектории, хотя форма этих траекторий уже отли- чается от эллипсоидальной, и определяется параметрами систе- мы (рис. 5.11). Изменения численности жертв и хищников во времени пред- ставляют собой колебания, причем колебания численности хищ- ников отстают по фазе от колебаний жертв. Особая точка типа «центр» устойчива по Ляпунову, но не асимптотически. Покажем на данном примере, в чем это про- является. Пусть колебания x(t) и y(t) происходят таким обра- зом, что изображающая точка движется по фазовой траекто- рии 1 (см. рис. 5.11). В момент, когда точка находится в положении Mi, в систе- му добавляется извне некоторое число особей т/, такое, что изоб- ражающая точка переходит скачком из точки Mi в точку М2. 221
Если после этого систему предоставить самой себе, то колеба- ния ж(£), y(t) уже будут происходить с большими амплитудами, чем прежде, и изображающая точка будет двигаться по траек- тории 2. Это и означает, что колебания в системе неустойчивы: они навсегда изменяют свои характеристики при внешнем воз- действии. В дальнейшем будут рассмотрены модели, описывающие устойчивые колебательные режимы, и показано, что на фазо- вой плоскости такие асимптотически устойчивые периодические движения описываются предельными циклами. На рис. 5.12 приведены кривые колебаний численности пуш- ных зверей по данным компании Гудзонова залива о числе заго- товленных шкурок. Во всех классических учебниках в течение многих лет колебательный характер этих изменений приводили как подтверждение гипотез, положенных в основу модели Воль- терра, которая только что была рассмотрена. Действительно, периоды колебаний численности зайцев (жертв) и рысей (хищ- ников) примерно одинаковы и составляют порядка 9 — 10 лет. При этом максимум численности зайцев опережает, как прави- ло, максимум численности рысей на один год. Можно полагать, что мы видим регулярные колебания, осложненные случайными факторами, связанными с погодой и пр. Однако возможна и другая интерпретация этих данных на- блюдений на основе моделей детерминированного хаоса. Дис- кретные модели такого типа рассматривались в гл. 1 (см. 1.4). Рис. 5.11. Фазовый портрет системы (5.25). Особая точка типа «центр»: а — параметры системы: zx = 4, уху = 0,3, zy = уух = 0,4; б — параметры системы: zx = 2, уху = 0,3, zy = уух = 0,4 222
S160 ----Заяц ---Рысь л н ^1201- 80 - 40 - 1845 1865 1885 1905 tr s ч о 1925 Годы Рис. 5.12. Кривые численности зайца и рыси в Канаде [К. Вилли, В. Детье, 1974] Непрерывные модели популяционной динамики, приводящие к детерминированному хаосу, будут изучены далее. Серьезным недостатком модели Вольтерра является неустой- чивость решений по отношению к малым случайным воздей- ствиям, приводящим к изменению переменных. Кроме того, в силу «негрубости» этой системы произвольно малое изменение вида правых частей уравнений (величин параметров системы) приведет к изменению типа особой точки и, следовательно, к из- менению характера фазовых траекторий. Поскольку природные системы подвергаются огромному ко- личеству случайных воздействий, реалистическая модель долж- на быть по отношению к ним устойчивой. Поэтому негрубые си- стемы не могут давать адекватное описание природных явлений. Различные модификации рассмотренной системы, изученные самим Вольтерра и другими авторами, лишены этих недостат- ков. Наиболее широко известные из них будут изучены в 5.6. Здесь остановимся на модели, которая учитывает самоограни- чение в росте обеих популяций. На ее примере видно, как может меняться характер решений при изменении параметров системы. Итак, рассмотрим систему: (/ж / > 2 \ — = х\гх - ухуу - ъххл), =у(-^у + УухХ-Ьуу2), (5.26) которая отличается от системы (5.25) наличием в правых частях членов: — Ъхх2 и —Ъуу2. 223
Эти члены отражают тот факт, что численность популяции жертв не может увеличиваться до бесконечности даже в отсут- ствие хищников в силу ограниченности пищевых ресурсов, ареа- ла существования и пр. Такие же «самоограничения» наклады- ваются на популяцию хищников. Система (5.26) имеет четыре стационарных решения, для трех из них либо численность обоих видов, либо численность од- ного из видов равна нулю. Анализ показывает, что нулевое ре- шение представляет собой неустойчивый узел. Рассмотрим си- стему алгебраических уравнений, решение которых дает коор- динаты стационарного состояния, ненулевого для численностей обоих видов. Эта система получается приравниванием нулю вы- ражений в скобках в правых частях системы (5.26): ЧхуУ = 6^5 ’Yyx^' ^уУ ~ Су- Стационарное решение: - _ &Х^у ху ф _ ______ ^х^у Уух^х $х$у + ЧхуЧух $х$у УхуУух Анализ корней характеристического уравнения показывает, что стационарное решение в зависимости от соотношения коэф- фициентов может быть либо устойчивым фокусом, либо устой- чивым узлом (рис. 5.13). а — устойчивый фокус, параметры системы: ех = 2, уху = 18, 8^ = 1, гу = 3, "Xух = 5, 8т/ = 1; б — устойчивый узел, параметры системы: гх = 2, уху = 1, 8д; --------------------- 1, £у - 3, "Yyx ~ 1, 8т/ — 1 224
И в том и в другом случае решение устойчиво к малым изме- нениям правых частей уравнений. Таким образом, самоограни- чение популяции приводит к устойчивости ее численности. Важно отметить, что рассмотренные простейшие вольтерров- ские модели не могут описывать устойчивые колебания с посто- янным периодом и амплитудой. Для описания таких колебаний необходимы нелинейные модели, имеющие на фазовой плоско- сти предельный цикл (см. 5.6). 5.4. Проблема быстрых и медленных переменных Степень подробности моделирования изучаемых явлений за- висит от цели моделирования. Однако в любом случае задача моделирования заключается в том, чтобы построить модель яв- ления, содержащую, возможно, меньшее число переменных и произвольных параметров и в то же время правильно отража- ющую свойства явления. Биологические системы включают большое число процессов с разными характерными временами, причем иерархия этих вре- мен такова, что они различаются на много порядков. 5.4.1. Иерархия времен. Метод квазистационарных концентраций Учет временной иерархии процессов позволяет сократить число дифференциальных уравнений. «Совсем медленные» пе- ременные не меняются на времени рассматриваемых процессов, и их можно считать постоянными параметрами. Для «быстрых» переменных можно вместо дифференциальных уравнений запи- сать алгебраические уравнения для их стационарных значений, поскольку «быстрые» переменные достигают своих стационар- ных значений практически мгновенно по сравнению с «медлен- ными». Пусть имеется три группы переменных с различными харак- терными временами: dx 1-»/ \ л =p(w,; п; = Q[x,y, г); at = F(x,y,z).
Переменные изменяются с разными характерными времена- ми, причем Тх<^ТуС Tz. Пусть мы наблюдаем за переменной г/, характерное время из- менения которой Ту («среднее» характерное время). Тогда за время Ту «совсем медленная» переменная z практически не бу- дет изменяться и ее можно считать постоянным параметром, обозначим его г*. Система дифференциальных уравнений с учетом этого обсто- ятельства будет содержать два уравнения и может быть записа- на в виде I = Q(x>y,z*Y \ at Отметим, что z* не является истинно стационарным значе- нием, «медленная» переменная z будет продолжать меняться и «вести» за собой более быстрые переменные х и у. В этом смыс- ле медленная переменная является ведущей, или «параметром порядка». Рассмотрим теперь уравнение для х. Эта «быстрая» перемен- ная изменяется значительно быстрее, чем ?/, и за время Ту успе- ет достичь своего стационарного значения. Значит, для перемен- ной х дифференциальное уравнение можно заменить алгебраи- ческим: Р(х,у, г*) = 0, или x = x(y,z*}. Таким образом, благодаря учету иерархии времен, исходную систему из трех дифференциальных уравнений удается свести к одному дифференциальному уравнению для переменной у: В химической кинетике метод такой редукции системы был впервые предложен Ббденштейном и носит название метода квазистационарных концентраций (КСК). Обычно он применяется для систем химических реакций, промежуточные продукты которых являются частицами с вы- сокой реакционной способностью. К ним относятся каталитиче- ские процессы, свободно радикальные и цепные реакции. 226
В процессах с участием активных промежуточных частиц разность скоростей образования vo и расхода . частиц мала по сравнению с этими скоростями. Режим называется квази- стационарным режимом, а отвечающие ему концентрации активных промежуточных веществ — квазистационарными концентрациями. Дифференциальные уравнения для промежуточных соедине- ний ^=<-<,, = 1.2,.../. можно заменить алгебраическими: < = ^,г = 1,2, ...,/. Из I алгебраических уравнений можно выразить I квазиста- ционарных концентраций промежуточных химических соедине- ний. По мере расходования исходных веществ квазистационар- ные концентрации промежуточных соединений будут меняться, но если время установления квазистационарного режима мало, он не будет нарушаться в течение всего процесса. Конечно, такое рассмотрение не правомерно для начальных стадий процесса, когда Ri меняются от нуля до своих квазиста- ционарных значений. Этот период носит название периода ин- дукции. Аналогичная ситуация имеет место в биохимических фер- ментативных процессах, где процессы образования и распада фермент-субстратного комплекса происходят значительно быст- рее, чем процессы расходования субстрата и образования про- дукта. 5.4.2. Теорема Тихонова Математически строгое обоснование применения метода КСК (редукции системы в соответствии с иерархией времен) и форму- лировка условий его применимости дана в работе крупнейшего российского математика А. Н. Тихонова [А. Н. Тихонов, 1952]. Рассмотрим простейший случай двух дифференциальных уравнений dx dt dy dt = ?(*,!/); = G(x,y). (5.27) 227
Рис. 5.14. Фазовый портрет вырожденной си- стемы (5.28) (Р — точка пересечения главных изоклин) Пусть у — медленная, а х — быстрая переменная. Это означает, что отношение приращений Ау и Ад? за короткий промежуток времени At много меньше единицы: Ау/Ад? < 1. Скорость изменения х значительно превосходит скорость изме- нения у, поэтому правую часть первого уравнения можно запи- сать в виде ср(д?, у) = AF(x, у), где Л » 1. Первое уравнение системы представим в виде dx л — = AF(x,y). at Разделив левую и правую части уравнения на А и обозначив е = 1/А, получим полную систему уравнений, тождественную ис- ходной: ' dx _ ч = С(х,у), где е < 1 - малый параметр. Если характер решения не изменится при устремлении мало- го параметра е к нулю (условия этого обстоятельства и составля- ют содержание теоремы Тихонова), можно устремить е к нулю и получить для быстрой переменной х вместо дифференциально- го уравнения — алгебраическое: (5.28) Г(ж,у) = 0; В отличие от полной системы (5.27) такая система называется выроэ/сденной (ее фазовый портрет представлен на рис. 5.14). 228
Фазовые траектории в любой точке фазовой плоскости, за ис- ключением е-окрестности кривой F(j?,?/) = 0, имеют наклон, dy G(x, у) определяемый уравнением: — = е—--------- порядка величины dx F[x^y) е<^С 1, т. е. расположены почти горизонтально. Это области быст- рых движений, при которых вдоль фазовой траектории у = = const, а х быстро меняется. Достигнув по одной из таких гори- зонталей е-окрестности кривой F(x, у) = 0, изображающая точ- ка потом будет двигаться по этой кривой. Скорость движения по горизонтальным участкам траектории dx/dt « 1/е = Л, т. е. очень велика по сравнению со скоростью движения в окрестности кривой F(j?, у) = 0. Поэтому общее вре- мя достижения некоего состояния на кривой F(j?, у) определяет- ся лишь характером движения вдоль этой кривой, т. е. зависит лишь от начальных значений медленной переменной у и не зави- сит от начальных значений быстрой переменной х. Отметим, что квазистационарные значения быстрых пере- менных являются функциями не окончательных стационарных значений медленных переменных, а лишь их мгновенных зна- чений. В этом смысле говорят о том, что быстрая переменная «подчинена» медленной. Теорема Тихонова устанавливает условия возможности ре- дукции системы дифференциальных уравнений с малым пара- метром (условия замены для быстрых переменных дифферен- циальных уравнений алгебраическими). Запишем систему N уравнений, часть из которых содержит малый параметр е перед производной: =Fp(xi,x2, ...,xr,xr+l, ...,xN), р = 1, ...г; (5.29) Clb = Fq(xi,x2, .. • ,xr,xr+i, ... ,xn) q = r + l, (5.30) Назовем систему (5.29) присоединенной, а систему (5.30) — вырожденной. Решение полной системы (5.29), (5.30) стремится к решению вырожденной системы (5.30) при е —> 0, если выполняются сле- дующие условия: а) решение полной и присоединенной системы единственно, а правые части непрерывны; б) решение xi = (pi(xi,X2, ... ,#дг), .. • ,xr = cpr(^i, представляет собой изолированный корень алгебраической си- стемы 229
(в окрестности этого корня нет других корней); в) решение xi, Х2, ...,хг — устойчивая изолированная осо- бая точка присоединенной системы (5.29) при всех значениях #r+l> Хг+2) • • • , г) начальные условия х^х®, ..., х®. попадают в область вли- яния устойчивой особой точки присоединенной системы. Это означает, что траектории, начинающиеся в этой области, со вре- менем приходят в особую точку присоединенной системы, кото- рая для них является притягивающей точкой — аттрактором. Число начальных условий вырожденной системы меньше, чем полной: начальные значения быстрых переменных не ис- пользуются в вырожденной системе. Согласно теореме Тихо- нова, если выполняется условие «в», то результат не зави- сит от начальных условий для переменных присоединенной си- стемы. Таким образом, необходимым условием редукции является наличие малого параметра в уравнениях (5.29). Теорема Тихонова явно или неявно применяется при иссле- довании практически любых моделей биологических систем, в этом мы убедимся в дальнейшем. 5.4.3. Фермент-субстратная реакция Михаэлиса — Ментен Классическим примером базовой ферментативной реакции является модель, предложенная М. Михаэлисом и М. Ментен (1913) Схема реакции может быть представлена в виде: E + Sy^ES-^P + E, (5.31) что означает следующее: субстрат S соединяется с ферментом Е в комплекс ES, в котором происходит химическое превраще- ние и который затем распадается на фермент Е и продукт Р. По закону действующих масс скорость реакции пропорци- ональна произведению концентраций. Обозначив концентрации реагентов малыми буквами: s = [S],e = [Е],с = [ES],p = [Р], получим систему уравнений: 230
ds — = —k^es + k-ic] dt de — = -kies + (k-i + fc2)c; (ll de , — = kies - (fc-i + k2)c- (ll dp I. dt = (5.32) В системе (5.32) учтены следующие процессы: • субстрат S расходуется, образуя фермент-субстратный ком- плекс ES (бимолекулярная реакция с константой скорости &i), и его концентрация увеличивается при распаде комплекса в обрат- ной реакции (константа k-i ); • фермент Е расходуется на образование комплекса ES (&1), его концентрация увеличивается при распаде комплекса в об- ратной реакции (константа к-i) и при образовании продук- та (fc2); • комплекс ES образуется из фермента Е и субстрата S (бимо- лекулярная реакция с константой скорости к\), а также распада- ется на субстрат S и фермент Е (к-i) или продукт Р и фермент Е (fc2); • продукт Р образуется при распаде комплекса (констан- та /ь2). Для полной математической формулировки задачи Коши не- обходимо задать начальные условия: $о(0) = $о, е(0) = е0, с(0) = 0, р(0) = 0. Уравнения (5.32) не являются независимыми. Кроме того, по- следнее уравнение отделяется от первых трех. Если система пер- вых трех уравнений решена, то концентрация продукта может быть рассчитана по формуле р(<) = к2 t J c(tf)dtr. о В соответствии со схемой реакций (5.31) общее количество фер- мента, свободного и связанного в комплекс, сохраняется: e(f) + c(t) = е0. 231
(5.33) Это условие позволяет одно из дифференциальных уравнений системы (5.32) заменить алгебраическим, и модель сводится к двум дифференциальным уравнениям: ds z_ — = -fcjeos + (fcis + fc_i)c; < at de _ z _ . * — = fcieos - (k±s + fc-i + k2)c dt с начальными условиями: So(0) = So, c(0) = 0. Введем безразмерные переменные и параметры: 1 / ч s(^) / х С(£) т = fcieot, ж(т) = —3/(т) =----, so е0 > fc i + к2 е0 mSq so Запишем уравнения (5.33) в безразмерном виде: = -х + (х + К - Х)у, = X - (х + К)у, dx dx я(0) = 1,у(0) = 0. (5.34) (5.35) Из (5.34) следует, что (К — X) > 0. Поскольку реакция превращения фермент-субстратного ком- плекса необратима, уже из схемы реакций (5.31) ясно, что с тече- нием времени весь субстрат будет превращен в продукт и в ста- ционарном состоянии концентрации субстрата и комплекса ста- нут равны нулю: х = 0, у = 0. Систему (5.35) нельзя решить аналитически. Проанализиру- ем качественно, как ведут себя x(t) и y(t). Вблизи т = 0 dx/dx < 0. Это означает, что х уменьшается от х = 1, расчеты показывают, что величина х (безразмерная кон- центрация субстрата) уменьшается монотонно, при £ —> оо весь субстрат будет исчерпан. В то же время dy/dt>Q,y растет от у = 0 до величины у = х/(х + К), при которой правая часть уравнения для dy/dt обращается в нуль. После этого у будет уменьшаться до нуля. Таким образом, концентрация фермент- субстратного комплекса у проходит через максимум. Относи- тельная концентрация свободного фермента е/е$ сначала убы- вает, а затем снова возрастает до величины е/е$ = 1, поскольку с течением времени субстрат исчерпывается и все меньшая доля фермента оказывается связанной. Кинетические кривые изобра- жены на рис. 5.15. 232
б Рис. 5.15. Кинетика изменения безразмерных переменных в уравнении Михаэлиса — Ментен: а — с учетом области переходных процессов на малых временах (полная систе- ма (5.35)). Вертикальной штриховой линией отделен «начальный период ин- дукции» ; б — без учета области переходных процессов (редуцированная систе- ма (5.36)) Предположим, что концентрация субстрата значительно пре- вышает концентрацию фермента: so ео- Тогда из соотноше- ний (5.34) следует, что е 1. Если условия теоремы Тихоно- ва выполняются (для уравнений Михаэлиса —Ментен это мож- но показать), мы имеем право заменить второе из уравнений (5.35) алгебраическим и найти «квазистационарную концентра- цию» фермент-субстратного комплекса: !/* = х* х* + К По терминологии Тихонова мы получим вырожденную систе- му: = -X + (х + К - X)?/; Л X (5-36) 233
Рис. 5.16. Иллюстрация закона Михаэли- са—Ментен. Зависимость скорости реак- ции р от начальной концентрации субстра- та s: ро — максимальная скорость; Кт — константа Михаэлиса О Кт Подставив выражение для у в дифференциальное уравнение для ж, получим dx Хх dx х + К1 х(0) = 1. В размерном виде — это классическая формула Михаэлиса— Ментен для кинетики изменения субстрата в ферментативной реакции: Таким образом, уравнение (5.37) верно описывает изменение концентрации субстрата, но не характеризует изменение концен- траций свободного фермента и фермент-субстратного комплек- са, которые на малых временах ведут себя немонотонно (см. рис. 5.15, а). Величина Кт называется константой Михаэлиса и имеет раз- мерность концентрации. Она соответствует концентрации суб- страта, при которой скорость ц(*5) равна половине максималь- ной. При s Кт скорость пропорциональна концентрации: Максимальная скорость ферментативной реакции ро равна т. е. линейно зависит от константы скорости стадии распада ферментативного комплекса /с2, которую называют ли- митирующей стадией. В эксперименте для оценки параметров ферментативной ре- акции используют кривую зависимости скорости реакции от концентрации субстрата (рис. 5.16). В ферментативных реакци- ях возможны гораздо более сложные типы динамического пове- дения: два или несколько устойчивых стационарных состояния, автоколебания, квазистохастические режимы. Эти типы поведе- ния будут рассмотрены далее. 234
5.5. Мультистационарность Важная особенность биологических систем — переключение из одного режима функционирования в другой. Системы, об- ладающие двумя или несколькими устойчивыми стационарны- ми состояниями, называются мулътистационарными^ или триггерными, системами. 5.5.1. Фазовый портрет мультистационарной системы На фазовой плоскости триггерной системе в простейшем слу- чае соответствуют два устойчивых стационарных решения, раз- деленных сепаратрисой. Напомним, что особые точки (устойчи- вые и седло) лежат на пересечении главных изоклин — изоклин вертикальных и горизонтальных касательных. На рис. 5.17 представлен фазовый портрет относительно про- стой триггерной системы, описывающей явление конкуренции двух равноправных видов. Соответствующая система уравнений имеет вид: dx j Q — х 1 xix2 ах ।, dx2 о = Х2 — Х1Х2 — аХ^. (5.38) Рис. 5.17. Фазовый портрет триггерной системы (5.38), описывающей явление конкуренции между двумя равноправными видами; х,у — чис- ленности конкурирующих видов 235
Рис. 5.18. Фазовый портрет системы (5.39) (шарик в ложбине с двумя лунками). Штриховкой обозначена область притяжения стационарно- го состояния (+1) Такая система имеет четыре стационарных решения: 1) х 1 = Х2 = 0 — неустойчивый узел; 2) Xi = Х2 = ----седло; 1 + а 3) xi = -, Х2 = 0 — устойчивый узел; а 1 4) Xi = О, Х2 =--устойчивый узел. а Бистабильная система может иметь более сложную структу- ру фазового портрета. Пример такой системы — движение шари- ка в ложбине с двумя лунками в присутствии трения [Д. С. Чер- навский, 2004]. На рис. 5.18 дана система, описываемая уравнениями: dx ~57=У^ 1 (5.39) = -ау + Ь(х - а:3). В такой системе три стационарных состояния: 1) х = у = 0 — седло; 2, 3) — устойчивые фокусы. Вблизи этих стационарных состояний траектории представ- ляют собой закручивающиеся спирали. Вдали от стационарных состояний области притяжения имеют слоистую структуру. Тол- щина слоев уменьшается при уменьшении параметра а. Как видно из приведенных примеров, в триггерных систе- мах и поведение во времени, и стационарное решение зависят не только от параметров, но и от начальных условий. 236
5.5.2. Типы переключения триггера Слово «триггер» означает переключатель. Возникает во- прос: «Как можно переключить триггер из одного стационарно- го состояния в другое?» Рассмотрим фазовый портрет системы, обладающей двумя устойчивыми стационарными состояниями (рис. 5.19). Здесь а, с — устойчивые стационарные состояния; b — седло. Если начальное положение изображающей точки размещено левее сепаратрисы седла (штриховая линия), то система нахо- дится в области притяжения особой точки а и со временем стре- мится к этому устойчивому стационарному состоянию. Из точек, лежащих правее сепаратрисы, система будет двигаться к особой точке с. Рассмотрим возможные способы переключения системы из режима а в режим с. Силовое переключение. Можно изменить значения кон- центраций, например добавить определенное количество веще- ства ж, так что система «перепрыгнет» через сепаратрису в неко- торую точку ci, которая находится по правую сторону сепа- ратрисы в области влияния устойчивого стационарного состоя- ния с, к которому система перейдет сама с течением времени. На фазовом портрете (см. рис. 5.19) силовое (специфическое) пере- ключение показано стрелкой. Кинетика переменных при таком переключении представлена на рис. 5.20. Параметрическое переключение. Другой (неспецифиче- ский) способ переключения показан на рис. 5.21. При таком спо- собе непосредственному воздействию подвергаются не перемен- ные, а параметры системы. Это может быть достигнуто разны- ми способами, например изменением скорости поступления суб- страта, температуры, pH. Сущность такого способа переключения состоит в использо- вании зависимости фазового портрета системы от некоторого управляющего параметра. Пусть с изменением этого параметра Рис. 5.19. Триггерная система (сплошны- ми линиями показаны главные изокли- ны; штриховой линией обозначена сепа- ратриса, отделяющая области влияния двух устойчивых стационарных состоя- ний а и с; линией со стрелкой указан про- цесс силового переключения триггера) 237
ных во времени при силовом пе- реключении триггера после до- бавления в систему вещества х в количестве, достаточном для переключения системы из ре- жима а в режим с (см. рис. 5.19) фазовый портрет претерпевает последовательность превраще- ний, показанных на рис. 5.21 (а— г). На стадии (см. рис. 5.21, в) устойчивый узел (см. рис. 5.21, а) и седло (см. рис. 5.21, б) сли- ваются в одну полуустойчивую точку седло —узел. На стадии (см. рис. 5.21, г) в системе остается лишь одно устойчивое стаци- онарное состояние, к которому и сходятся все фазовые траекто- Рис. 5.21. Параметрическое переключение триггера. Последователь- ные стадии (а — г) трансформации фазового портрета (стрелками обо- значено направление фазовых траекторий) 238
Тогда система, находившаяся в начале процесса переключе- ния в стационарном режиме (см. рис. 5.21, а), в результате па- раметрического переключения окажется в области притяжения единственного устойчивого стационарного режима с, куда с те- чением времени и перейдет. Параметрический способ переключения реализуется при из- менении любой генетической программы, он может также иметь место при изменении внешних условий, приводящих к измене- нию управляющего параметра системы. Как было показано, в триггерной системе изображающая точка «выбирает» (в зависимости от параметров и начальных условий) стационарный режим функционирования. Триггерные модели могут быть использованы при описании процесса отбора и потому применимы к процессам эволюции. 5.5.3. Отбор одного из равноправных видов Общая модель отбора одного из нескольких равноправных видов можно записать в следующей форме: N г = 1,2, ...,7V, где а — эффективный коэффициент репродукции; у — вероят- ность гибели в результате встречи. Пусть N = 2, Xi = х, %2 — У- Система уравнений имеет вид: dx — = ах- уху; dy - = ау- уху. at (5.40) Стационарные решения находят из алгебраических уравне- ний, полученных приравниванием правых частей нулю: ах — уху = 0; ау — уху = 0. Система имеет два стационарных решения: 1) х = 0, у = 0; ч а а 2)х = ~, у = - 239
Характеристическое уравнение линеаризованной системы имеет вид а — уу — X —ух Q —уу а — ух — X Выражения для характеристических чисел определяют из уравнения X2 — Х(2а — ух — уу) + (а — уу)(а — ух) — у2ху = 0. (5.41) Для исследования устойчивости симметричного стационар- ного состояния 2 подставим в это уравнение значения х = а/у, у = а/у и получим Корни действительны и разных знаков. Это означает, что симметричное стационарное состояние представляет собой седло. При подстановке в (5.41) нулевых значений для ж, у (стацио- нарное состояние 1) получим X2 — 2аХ + а2 — 0j Хц2 = а. Это означает, что нулевая особая точка представляет собой неустойчивый узел (два положительных действительных кор- ня). Фазовый портрет системы изображен на рис. 5.22. Изокли- ны горизонтальных касательных: у = 0 — ось абсцисс и верти- кальная прямая х = а/у; изоклины вертикальных касательных: х — 0 — ось ординат и горизонтальная прямая у = а/у. Все траектории уходят на бесконечность, так как самоогра- ничение роста популяции в данной модели не учитывается. Модель (5.40) демонстрирует принципиальную возможность отбора в системе равноправных видов, где симметричное состо- яние сосуществования является неустойчивым. Вот один из при- меров такой системы. Известно, что сахара и аминокислоты являются оптически активными соединениями, причем сахара — левовращающие плоскость поляризации света, аминокислоты — правовращаю- щие. Противоположные изомеры не только не встречаются в 240
Рис. 5.22. Фазовый портрет систе- мы (5.40), описывающий отбор од- ного из двух равноправных видов в отсутствие ограничений роста: а (начало координат) — неустойчи- вей узел; b — седло живых организмах и не усваиваются ими, но являются ядами. В этом заключается одна из сложностей искусственного син- теза. Ясно, что «зеркальные» организмы не лучше и не хуже. В не- живой природе распространены рацемические смеси, содержа- щие равное количество зеркальных изомеров. Такая же раце- мическая смесь получается при небиологическом синтезе. По- видимому, и первичный бульон был рацемической смесью. Рассмотренная модель описывает выживание одних видов и уничтожение других. Условие, которое обеспечивает при этом отбор одного вида, заключается в том, что при встрече они вза- имно отравляются и гибнут. Причина отбора здесь — не преиму- щество одного из видов, а их взаимный антагонизм. Однако модель (5.40) не может характеризовать реальную си- стему, так как описывает неограниченный рост биомассы с тече- нием времени. Этот недостаток может быть исправлен несколь- кими способами. Один их них — введение самоограничения чис- ленности вида в форме ферхюльстовских членов. Тогда прихо- дим к модели (5.38). Другой способ — ввести в модель перемен- ную, описывающую поступающий в систему с определенной ско- ростью питательный ресурс, общий для обоих видов. Учтем ограниченность питательных ресурсов. Пусть s — ли- митирующий субстрат (световая энергия, минеральное питание и т.п.). Сам субстрат не является оптически активным, но пре- образуется в оптически активные продукты. Выразим скорость роста каждой популяции а через s в соот- ветствии с формулой Моно: _ aos а~ Ks +s' График этой функции приведен на рис. 5.16. 241
Пусть v — интенсивность притока субстрата. Расход субстра- та пропорционален поглощению его организмами, т. е. сумме их концентраций. Уравнение для скорости изменения концентра- ции субстрата во времени имеет вид: ds s , — = —aa0 (X + У) + V. dt ix s + s Здесь a — экономический коэффициент, указывающий, сколь- ко субстрата идет на образование единицы биомассы. Обычно a > 10, и поэтому скорость поглощения субстрата можно счи- тать значительно большей, чем скорость прироста биомассы. Уравнения для концентраций объектов типаж и у принимают вид: (it IX е -f" S ^=а0—^У-рУ-уХУ. dt Ks + s Введем безразмерные переменные: t' = pi; x — У = -7- z = ^ v = R2’ pz х aoz z Опустив штрихи у t', vz, запишем систему в безразмерном виде: — = f (z) х - х - ху; dy t, . < -£ = f(z)y-у-ху; dz a , . . . ч bi=-»/«(*+»)+'' Допустим, что процессы поглощения субстрата (третье урав- нение) существенно более быстрые, чем процессы репродукции (первое и второе уравнения). В этом случае может быть исполь- зован метод квазистационарных концентраций (см. 5.4.1) и диф- ференциальное уравнение для быстрой переменной z — концен- трации субстрата — заменено алгебраическим. Тогда субстрат 242
на интересующих нас временах достигнет квазистационарнои концентрации: dz/dt = 0. Отсюда /(-) = ЧЧ = —• а(х + у) х + у Здесь vo = v/a. В итоге получается система двух безразмерных уравнений: (5.42) Построим фазовый портрет системы (рис. 5.23). Изоклины вертикальных касательных: х = 0 (ось ординат) и гипербола vo п х = -------у] изоклины горизонтальных касательных: у = U 1 + У (ось абсцисс) и гипербола у = ---х. 1 + х Переменные х и у симметричны, поэтому изоклина верти- кальных касательных симметрична изоклине горизонтальных касательных относительно биссектрисы первого координатного угла. Система имеет четыре особые точки: 1) х = 0, у = 0 — неустойчивый узел; 2) х = 0, у = vq — устойчивый узел; 3) х = vo, у = 0 — устойчивый узел; \/1 + 2vq — 1 4) х = у =------------симметричную точку — седло. £ В такой системе выживет один из видов: х или у. Его стацио- нарная концентрация определяется скоростью притока субстра- Рис. 5.23. Фазовый портрет систе- мы (5.42), описывающий отбор од- ного из двух равноправных видов, когда субстрат поступает в систе- му с постоянной скоростью: а (нача- ло координат) — неустойчивый узел; Ъ — седло; с, d — устойчивые узлы (штриховой линией обозначена сепа- ратриса седла) 243
та и экономическим коэффициентом а. Как и в системе (5.40), здесь причина отбора — неустойчивость симметричного состоя- ния. 5.6. Колебания в биологических системах Биологические системы отличаются периодическим измене- нием различных характеристик. Период этих колебаний может быть связан с изменениями условий жизни на Земле (смена вре- мен года, дня и ночи), геофизических ритмов (солнечные, лун- ные, связанные с периодами атмосферных явлений). Но многие периодические процессы имеют частоту изменения, не связан- ную очевидным образом с внешними геокосмическими циклами. Это так называемые «биологические часы» различной природы, начиная от колебаний биомакромолекул, биохимических колеба- ний вплоть до популяционных волн. Внутриклеточные колебания задают эндогенные биологиче- ские ритмы, которые свойственны всем живым системам. Имен- но они определяют периодичность деления клеток, отмеряют время рождения и смерти живых организмов. Модели колеба- тельных систем используются в ферментативном катализе, тео- рии иммунитета, в теории трансмембранного ионного переноса, микробиологии и биотехнологии. 5.6.1. Автоколебания и предельные циклы Некоторые типы периодических движений рассматривались при изучении особых точек типа «центр» и затухающих или на- растающих колебаний в случае устойчивого и неустойчивого фо- куса. Однако «биологические часы» имеют свойство, отличаю- щее их от рассмотренных типов колебаний — неизменность во времени периода и амплитуды таких колебаний, означающую стационарность и устойчивость колебательного режима. В данном случае периодическое изменение величин представ- ляет собой один из типов стационарного поведения системы. Ес- ли колебания в системе имеют постоянные период и амплитуду, устанавливаются независимо от начальных условий и поддержи- ваются благодаря свойствам самой системы, а не вследствие воз- действия периодической силы, то система называется аетоко- лебательной. К классу автоколебательных систем относятся колебания в гликолизе и других метаболических системах, периодические 244
процессы фотосинтеза, колебания концентрации кальция в клет- ке, колебания численности животных в популяциях. В фазовом пространстве такому типу поведения соответ- ствует притягивающее множество (аттрактор), называемое пре- дельным циклом. Предельный цикл есть изолированная замкнутая кривая на фазовой плоскости. Если предельный цикл устойчив, то при £ —> оо к нему стремятся все фазовые траектории, начинаю- щиеся в некоторой е-окрестности этого предельного цикла. Пре- дельный цикл представляет стационарный режим с определен- ной амплитудой, не зависящий от начальных условий, а опре- деляющийся только организацией системы. Существование пре- дельного цикла на фазовой плоскости — основной признак авто- колебательной системы. Очевидно, что при автоколебательном процессе фаза колебаний может быть любой. Остановимся на общих характеристиках автоколебательных систем. Рассмотрим систему уравнений общего вида: r dx <di = p(x^’ = <Ж У)- Если Т(Т > 0) — наименьшее число, для которого при всяком t x(t + Т) = x(t)\ y(t + T) = y(t), то изменение переменных х = x(t), у = y(t) называется периоди- ческим изменением с периодом Т. Периодическому изменению соответствует замкнутая траек- тория на фазовой плоскости, и обратно: всякой замкнутой траек- тории соответствует бесконечное множество периодических из- менений, отличающихся друг от друга выбором начала отсчета времени. Если периодическому изменению на фазовой плоскости соот- ветствует изолированная замкнутая кривая, к которой с внеш- ней и внутренней стороны приближаются (при возрастании £) соседние траектории по спиралям, то эта изолированная замкну- тая траектория есть предельный цикл. Простые примеры позволяют убедиться, что система общего вида (5.1) допускает в качестве траекторий предельные циклы. Например, для системы 245
^ = у + х[1- (ж2 + у2)]; at ^ = -х + у[1- (ж2 + у2)] dt (5.43) траектория х2 + у2 = 1 является предельным циклом. Его пара- метрические уравнения будут: х = cos(t — £i); у = sin(£ — £i), а уравнения всех других фазовых траекторий запишутся в виде _ cos(£ — to) sin(£ — to) X \/l + Се-2(<-<о) ’ У \/l + Се~2(^о) ’ Значениям постоянной интегрирования С > 0 соответствуют фазовые траектории, накручивающиеся на предельный цикл из- нутри (при t +оо), а значениям — 1 < С < 0 — траектории, накручивающиеся снаружи. 5.6.2. Устойчивость предельных циклов Предельный цикл называется устойчивым, если существу- ет область на фазовой плоскости, содержащая этот предельный цикл, — е-окрестность, такая, что все фазовые траектории, на- чинающиеся в е-окрестности, асимптотически при t оо при- ближаются к предельному циклу. Если же, наоборот, в любой сколь угодно малой е-окрестности предельного цикла существует по крайней мере одна фазо- вая траектория, не приближающаяся к предельному циклу при t —> H-оо, то такой предельный цикл называется неустойчи- вым. Такие циклы разделяют области влияния (бассейны) раз- ных притягивающих множеств. Рис. 5.24. Устойчивый (а) и неустойчивые (б и в) предельные циклы на фазовой плоскости 246
На рис. 5.24 изображены устойчивый (а) и неустойчивые (б") и (в) предельные циклы. Неустойчивые предельные циклы, по- добные изображенному на рис. 5.24, б, такие, что все траектории с одной стороны (например, изнутри) приближаются к ним, а с другой (например, извне) — удаляются от них при t —+ оо, назы- вают «полуустойчивыми», или двойными. Последнее название связано с тем, что обычно такие циклы при подходящем измене- нии параметра системы расщепляются на два, один из которых устойчив, а другой — неустойчив. 5.6.3. Брюсселятор Простейшим классическим примером существования автоко- лебаний в системе химических реакций является тримолекуляр- ная модель «брюсселятор», предложенная в Брюсселе И. Р. При- гожиным и Р. Лефевром (1965). Основной целью при изучении этой модели было установление качественных типов поведения, совместимых с фундаментальными законами химической и био- логической кинетики. В этом смысле брюсселятор играет роль базовой модели, такую же как гармонический осциллятор в фи- зике, или модели Вольтерра в динамике популяций. Рассмотрим свойства брюсселятора как автоколебательной системы. Брюсселятор представляет собой следующую схему гипоте- тических химических реакций: А==^Х /с_1 2Х + Y^=±3X К-2 В + X^=±Y + С к-з X^=^R, К —4 ' где А, В — исходные вещества; С, R — продукты; X, Y — проме- жуточные вещества. Пусть конечные продукты С и R немедленно удаляются из ре- акционного пространства. Это означает, что обратные констан- ты А?-з = к-4 = 0. Если субстрат А находится в избытке, k-i = 0. Предположим также, что к-2 = 0. Значения остальных констант положим равными единице. Тогда схема рассмотренных реак- ций (в случае точечной системы) описывается системой уравне- ний: 247
= А + х2у - (В + 1)я; < dt (5.44) = Вх - х2у. at Модель (5.44) имеет одну особую точку с координатами В х = А, у = —. (5.45) yi Исследуем стационарное решение (5.45) системы (5.44) на устойчивость по методу Ляпунова. Введем переменные, харак- теризующие отклонения от особой точки: 1 = х-х,х\ = у-у. Линеаризованная система имеет вид '^ = (В-1)Е + АЧ = -В1-А\ Характеристическое уравнение В-1-Х А2 _ _ -В -А2-Х -U’ ИЛИ X2 + (А2 + 1 - В)Х + А2 = О, имеет корни Х1)2 = -1 (А2 + 1 - В) ± J \/(А2 + 1 - В)2 - 4А2. (5.46) Напомним, что особая точка является устойчивой, если действи- тельные части корней характеристического уравнения отрица- тельны. Из выражения (5.46) видно, что при В < 1 + А2 особая точка (5.45) устойчива. Если В > 1 + А2, то особая точка стано- вится неустойчивой, и у системы (5.44) появляется устойчивый предельный цикл. Значение В = 1 + А2 является бифуркацион- ным. Если оно лишь немного превосходит бифуркационный по- рог, то автоколебания в системе носят квазигармонический ха- рактер. Таким образом, брюсселятор при выполнении условия В > 1 + А2 248
б Рис. 5.25. Фазовый портрет брюсселятора: а - В > 1 + А2; б - В < 1 + А2 является автоколебательной системой. Фазовый портрет брюс- селятора при разных значениях параметров изображен на рис. 5.25. Далее будет рассмотрен «точечный» брюсселятор в качестве локального элемента системы «реакция —диффузия» (см. 6.3). Исследования брюсселятора как распределенной системы легли в основу науки о пространственно-временной самоорганизации химических и биологических систем. 5.6.4. Колебания в гликолизе Классическим примером колебательной биохимической реак- ции является гликолиз. В процессе гликолиза осуществляется распад глюкозы и других сахаров, при этом соединения, содер- жащие шесть молекул углерода, превращаются в трикарбоновые кислоты, включающие три молекулы углерода. За счет избыт- Рис. 5.26. Упрощенная схема ре- акций гликолиза: [Гл] — глюкоза; Ф6Ф — фруктозо-6- фосфат — субстрат ключевой реак- ции; ФДФ — фру ктозо-ди-фосфат — продукт этой реакции, который явля- ется субстратом в следующей стадии Активация 1 [Гл] Ф6Ф -> ФДФ (х) (у) 249
ка свободной энергии в процессе гликолиза на одну молекулу шестиуглеродного сахара образуются две молекулы АТФ. Ос- новную роль в генерации наблюдаемых колебаний концентра- ций компонентов реакции: фруктозо-6-фосфата, фруктозо-1,6- фосфата и восстановленного НАД {никотинаминадениндинук- леотид) играет ключевой фермент гликолитического пути — фосфофруктокиназа (ФФК). Упрощенная схема реакций пред- ставлена на рис. 5.26. Обе реакции катализируются ферментами. В безразмерных переменных система описывающих реакции уравнений может быть записана в виде: Рис. 5.27. Модель гликолиза (5.48). Кинетика изменений концентраций фруктозо-6-фосфата (х) и фруктозо-ди-фосфата (у) (справа) и фазо- вый портрет системы (слева) при разных значениях параметров си- стемы: а — бесколебательный процесс (узел на фазовой плоскости), а = 0,25; г = 1; б — колебания с постоянной амплитудой и фазой (предельный цикл на фазовой плоскости), а = 8; г = 0,5 250
'dX _k у X______________У < dt (Kmx “I" x) (Ктпу “I" ?/) dy = x______________у _ у .dt \Kmx + x)(Kmy + y) q(K'my + y)' (5-47) Здесь зависимости скоростей реакций от переменных записаны в форме Михаэлиса —Ментен (Моно). Если выполняются усло- вия: Ктх ж, Кту у, можно произвести замену переменных: ,/ tykKmy / / q — к j — ----------—--- — ____________—____ 2j — 2J_____ KmXKmy(q ~ к) KmxKmy(q — к) kKfmy Опустив штрихи у новых переменных, перепишем систему (5.47) в безразмерном виде : dx л=1-ху' dy ( -dt=*y\X~ 1 + г 1 + гу (5.48) где __ (q к)2КтхКту ____ к {Kfmy)2k^ 'Г q — k Кинетика изменений переменных и фазовые портреты систе- мы (5.48) при разных значениях параметров представлены на рис. 5.27. Интересно, что колебательные реакции в системе гликолиза были сначала предсказаны на математической модели [J. A. Hi- ggins, 1954] и лишь после этого зарегистрированы эксперимен- тально с помощью метода дифференциальной спектрофотомет- рии в лаборатории Б. Чанса (1966). 5.7. Динамический хаос Ранее рассматривались модели сйстем, которые описывают- ся с помощью двух дифференциальных уравнений, их поведение можно наглядно изобразить на фазовой плоскости. Для таких двумерных систем в рамках качественной теории дифференци- альных уравнений разработана исчерпывающая теория возмож- ных типов динамического поведения. Когда встает вопрос описания сложных многокомпонентных систем, например биологических сообществ, необходимо исполь- зовать системы большей размерности. 251
При исследовании систем размерности больше двух исполь- зуется понятие фазового пространства, которое является расширением понятия фазовой плоскости. В фазовом простран- стве по осям координат отложены значения переменных систе- мы. Размерность фазового пространства соответствует числу пе- ременных. Для трехмерного пространства говорят о фазовом объеме. Полной классификации типов динамического поведения не существует. Известно, что увеличение размерности позволяет описать качественно новые типы поведения. Так, одно автоном- ное уравнение может описать лишь монотонные изменения пе- ременной. Система двух автономных уравнений может иметь бо- лее сложные типы поведения — предельные циклы, множествен- ные стационарные состояния. Во второй половине XX в. стало понятно, что в автономной системе третьего и более высокого порядка возможны квазистохастические режимы. 5.7.1. Система Лоренца. Детерминированный хаос Впервые проблема динамического хаоса была рассмотрена в работах великого французского математика Ж. Пуанкаре в начале XX в. Позднее (во второй половине XX в.) метеоролог Е. Лоренц [Lorenz, 1963] обнаружил, что даже простая система из трех нелинейных дифференциальных уравнений х = оу — ох; < у = гх — у — xz; (5.49) z — ху — bz может привести к хаотическим траекториям (рис. 5.28). Хаотическое поведение затем было обнаружено при рас- ширении размерности в большинстве классических моделей био- логических систем, имеющих колебательные решения, в том чис- ле в моделях взаимодействия видов, моделях гликолиза и кле- точного цикла, моделях ферментативного катализа и др. Не- которые из этих моделей будут рассмотрены далее. Причина нерегулярности определяется свойством нелиней- ных систем экспоненциально быстро разводить первоначально близкие траектории в ограниченной области фазового простран- ства. Механической системой такого типа является бильярд Си- ная, у которого стенки выпуклы внутрь, отчего угол отраже- ния шара от стенки приводит к большому (экспоненциальному) разбеганию траекторий при малых отклонениях угла падения. 252
Рис. 5.28. Проекции фазовых траекторий системы Лоренца при разных значениях параметра г (г = 1 — единственное стационарное состояние; г = 10 — два стационарных состояния — устойчивых фокуса в разных плоскостях; г = 28 — область странного аттрактора. Справа — траек- тории в окрестности аттракторов в увеличенном масштабе) 253
То же происходит при рассеивании частиц на круглых шарах. В таких системах траектория частицы становится непредсказу- емой на больших временах. К процессам такого типа относят- ся течение жидкости вблизи порога возникновения турбулентно- сти, некоторые химические реакции, метеорологические процес- сы, движения горных масс при землетрясениях. К ним относят- ся и многие биологические процессы в достаточно узкой области значений параметров. Изучение роли динамического хаоса в организации биологических процессов — одна из актуальных за- дач математической биологии. Понятие «хаотическое поведение» означает неустойчивость фазовых траекторий, рост малого начального возмущения во времени, перемешивание элементов фазового объема и, как следствие, непредсказуемость поведения системы на больших временах. Важно, что режимы такого типа обнаруживаются в детер- минированных системах, где однозначно задан закон изме- нения системы с течением времени. Частный случай рождения динамического хаоса мы наблюдали при изучении дискретно- го аналога логистического уравнения (см. 4.4). При некоторых значениях параметра эта система демонстрировала квазистоха- стическое поведение, траектории системы при этом приобрета- ли сложный непериодический характер. Как и в случае истин- но хаотического броуновского движения, в каждой новой реа- лизации при тех же начальных условиях (в пределах возмож- ной точности) мы получали другие сложные траектории, силь- но отличающиеся друг от друга. На самом деле, если бы на- чальные значения воспроизводились с абсолютной точностью, сложная траектория также бы повторилась. Но в области де- терминированного хаоса траектории являются неустойчивыми по отношению к малым отклонениям. Поэтому даже малей- шие отклонения, допускаемые компьютером, приводят к разбе- ганию. Этим и объясняется название «детерминированный ха- ос», объединяющее два несовместимых представления — детер- минированность (однозначную определенность) и непредсказу- емость поведения. В системах с размерностью фазового про- странства N 3 возможны установившиеся изменения перемен- ных, не являющиеся ни периодическими, ни квазипериодически- ми. Таким хаотическим изменениям переменных соответствуют хаотические аттракторы, представляющие собой геомет- рически сложные множества дробной размерности. 254
5.7.2. Линейный анализ устойчивости траекторий Линейный анализ устойчивости траекторий проводится ана- логично линейному анализу устойчивости стационарных состоя- ний. Поскольку анализируется малое возмущение, можно лине- аризовать оператор эволюции в окрестности исследуемой траек- тории и провести линейный анализ ее устойчивости. Рассмотрим автономную динамическую систему х = F(x, а), где х — вектор переменных; а — вектор параметров; F — вектор- функция с компонентами fj. Изучим устойчивость решения xQ(t). Введем малое возмущение у = x(t) — xQ(t). Для него можно за- писать у = F(x° + у) - F(x°). Раскладывая F(x° + y) в ряд в окрестности х° и учитывая ма- лость возмущения, получим линеаризованное уравнение относи- тельно у: У = A(t)y, где А — матрица линеаризации системы с элементами dfi I aj,k = > Зч к = I» 2, ..., N. ОХк 1жо Матрица А характеризуется собственными векторами ег и собственными значениями р^: Ав{ = pi6i, i = 1,2, ..., N. Собственные числа являются корнями характеристического уравнения det [Л — рЕ] = О, где Е — единичная матрица. Начальное возмущение, заданное в момент времени t* вдоль г-го собственного вектора, с течением времени будет меняться в соответствии с эволюцией этого вектора: Уг(0 = Уг(^*) ехР р» (« — **) - (5.50) Будет отклонение уменьшаться или нарастать, определяется значением действительной части рг. 255
Элементы матрицы А со временем могут меняться. Соответ- ственно меняются ее собственные векторы и собственные значе- ния, а также знак действительной части р*. Поэтому, вообще го- воря, (5.50) выполняется только в пределе при t — t* —> 0. Для общей характеристики устойчивости траектории по отношению к возмущению вдоль г-го собственного вектора используют ве- личину, называемую характеристическим показателем Ляпу- нова'. Xi = lim —ln||yl(f)||, t—>оо t — to где yl(t) — возмущение вдоль г-го собственного вектора в момент времени t, соответствующее бесконечно малому начальному воз- мущению уг(£*). Для TV-мерной задачи устойчивость траектории характеризу- ется набором N ляпуновских характеристических показателей. Они связаны с собственными значениями матрицы линеариза- ции соотношением t \г = lim ---- t ► оо t Tq to Таким образом, ляпуновский показатель — это усредненное вдоль исследуемой траектории значение действительной части собственного значения матрицы линеаризации. Устойчивость траектории по Ляпунову означает, что произвольное начальное возмущение y(t*) в среднем вдоль траектории не возрастает. Для этого необходимо и достаточно, чтобы спектр ляпуновских пока- зателей Х$ не содержал положительных значений. 5.7.3. Диссипативные системы В физике системы принято подразделять на консервативные и диссипативные. В консервативных системах энергия сохраня- ется (маятник без затухания). В диссипативных системах энер- гия со временем уменьшается (маятник в вязкой среде). Для того чтобы диссипативная система поддерживала непрерывное движение (например, автоколебания), необходимы источники энергии. Существование аттрактора в диссипативной системе связа- но со свойством сжатия элемента фазового объема под действи- ем оператора эволюции. Рассмотрим множество точек, заполня- 256
Странный аттрактор Двумерный тор Предельный цикл Точка покоя Рис. 5.29. Сжатие элемента фазового объема в разные типы аттрак- торов ющих элемент объема А У, и множество фазовых траекторий, стартующих из этих точек в момент времени to- С течением времени объем А У меняется по закону: АУ(^) = Ay(t0)exp[(t - t0)divF(z(t))], где F(a;(t)) — поле фазовых скоростей (поток) динамической си- стемы. Черта сверху означает усреднение вдоль фазовой траек- тории. Если в среднем дивергенция потока отрицательна, а это всегда выполняется для систем с потерями, то элемент фазового объема АУ в пределе при t —> оо стремится к нулю. Это озна- чает, что рассматриваемое множество фазовых траекторий, ко- торые берут свое начало в АУ, стремится попасть на некоторое предельное множество, размерность которого меньше размерно- сти N фазового пространства системы. На рис. 5.29 изображены различные типы аттракторов, в ко- торые может перейти элемент фазового пространства размерно- сти 3: точка покоя, предельный цикл, двумерная поверхность — поверхность тора и странный аттрактор. 257
3 Рис. 5.30. Сжатие элемента фазового пространства радиуса е при «на- матывании» траектории на устойчивый предельный цикл — траекто- рия Г Средняя вдоль траектории дивергенция потока и, следова- тельно, эволюция элемента фазового объема определяются сум- мой ляпуновских показателей: N 1 f Xi = Jim -—— I div F(t')dt'. i=1 ° to Для фазовых траекторий на аттракторе должно иметь место сжатие элемента фазового объема. Соответственно дивергенция потока вдоль траектории отрицательна, а значит, ляпуновские показатели удовлетворяют неравенству 2><0. i=l Хаотические аттракторы имеют по крайней мере один по- ложительный ляпуновский показатель. Если траектории на ат- тракторе имеют более чем одно направление неустойчивости, ха- ос называется гиперхаосом. Непредсказуемость поведения системы в области динамиче- ского хаоса связана с неустойчивостью системы по отношению к малым отклонениям начального состояния. Это означает, что необходимо анализировать эволюцию во времени не начальной 258
точки, а начального объема вокруг этой точки. Рассмотрим ма- лую сферу радиуса е > О, окружающую начальное состояние xq. Любая точка внутри сферы характеризует малое отклоне- ние от начального состояния. Применим оператор эволюции и посмотрим за трансформацией этого малого объема во времени. Если система устойчива, любое малое отклонение со временем будет затухать, шарик радиуса е будет уменьшаться со време- нем и в пределе при £ —> оо его радиус уменьшится до нуля. На рис. 5.30 представлено последовательное сжатие (7—5) перво- начальной области неопределенности фазового объема радиуса в случае, когда устойчивое предельное множество представляет собой предельный цикл. Для неустойчивых режимов процесс происходит сложнее. Не- устойчивость режима ведет к росту возмущений. Но если систе- ма диссипативна, то независимо от того, устойчива или неустой- чива система, происходит уменьшение элемента фазового объе- ма во времени, что связано с потерями энергии. Это значит, что элемент фазового пространства по одним направлениям растя- гивается (что соответствует положительным показателям Ляпу- нова), а по другим — сжимается. Причем степень сжатия пре- валирует над степенью расширения. Пример такой трансфор- мации для системы, описывающей радиотехническое устройство (модифицированный генератор с инерционной нелинейностью), представили В.С. Анищенко с соавторами в книге «Нелинейная динамика хаотических и стохастических систем» (рис. 5.31). Мо- дель генератора описывается систе- мой уравнений: ' х = тх + у — xz. < У = Л — — yz + gl(x)x2^ 1, х > 0, 0, х 0. При определенных значениях пара- метров система демонстрирует квази- стохастическое поведение. Рассмотрим, как будет себя ве- сти малый фазовый объем радиуса е, окружающий начальную точку, для такой квазистохастической системы. (5.51) Рис. 5.31. Детерминиро- ванный хаос в трехмер- ной системе (5.51). Фазо- вая траектория для значе- ний параметров т = 1,5; д = 0,5 [В. С. Анищенко и [ДР-], 1999] 259
Рис. 5.32. Перемешивание в квазистохастической системе. Эволюция малого первоначального фазового объема во времени в динамической системе (5.51). Наблюдения траектории в различные моменты времени (1 — 9) [В. С. Анищенко и [др.], 1999] Результаты компьютерного моделирования представлены на рис. 5.32. Видно, что со временем имеет место растяжение в одних на- правлениях и сжатие — в других. Так, точки траекторий, начи- нающихся в элементе 7, можно обнаружить в любой части фазо- вого пространства, занятого аттрактором. Процесс перемешивания имеет простую аналогию. Поместим в жидкость, находящуюся в сосуде, капельку чернил и будем жидкость перемешивать. В силу «неустойчивости» капли моле- кулы чернил под влиянием потоков жидкости скоро «разбегут- ся» по всему объему. Их траектории будут представлять собой хаотические траектории. Если же в сосуд поместить твердую ча- 260
стицу, то молекулы вещества будут перемещаться под влиянием потока жидкости тоже по сложной траектории, но не удаляясь друг от друга (траектория устойчива). Явление детерминированного хаоса было обнаружено прак- тически во всех областях науки. Рассмотрим далее модель ква- зистохастического поведения биологического сообщества из трех видов. 5.7.4. Динамический хаос в сообществе из трех видов Для системы из трех видов в случае разветвленной трофи- ческой цепи даже исследование автономной локальной системы становится чрезвычайно сложным. Здесь отступление от воль- терровской схемы и учет биологических факторов, влияющих на динамику численности сосуществующих популяций, приводят к большому разнообразию модельных систем. В системах, состоящих из хищника и двух жертв при наличии внутривидовой конкуренции между жертвами при изменении параметров системы, возможны бифуркационные явления, при- водящие к появлению квазистохастических режимов [Е. А. Апо- нина и [др.], 1982]: = «1(«1 -Ui- аги2 - Ьиз); at < = и2(а2 -и2- а2щ - Ь2изУ, (5.52) at = u3(-1 + diut + d2u2 - u3), < at где щ, U2 — безразмерные численности жертв; из — безразмер- ная численность хищников; ai, 0С2 — параметры, соответствую- щие скоростям роста численностей жертв. В такой системе наряду с устойчивым состоянием равнове- сия возможны колебательные изменения численностей всех трех видов. В некоторой области параметров в системе имеется пре- дельный цикл сложной формы. При уменьшении 0С2 наблюдается серия последовательных удвоений цикла (рис. 5.33, а—в). В некотором диапазоне зна- чений «2 из результатов численного эксперимента видно, что траектория системы полностью заполняет некоторый фазо- вый объем. При этих значениях параметров поведение системы неотличимо от случайного, т. е. является квазистохастическим 261
Рис. 5.33. Фазовые портреты системы (5.52), описывающей взаимодей- ствие трех видов: хищник — две жертвы [Е. А. Апонина и [др.], 1982; А.Д. Базыкин, 2003]. Параметры модели: ai = 6; «2 = 1; &i = 4; 62 = 10; di = 0,25; cfo — 4. При уменьшении параметра скорости роста численности второй жертвы происходит усложнение траектории (по- следовательное удвоение предельного цикла), колебательная динами- ка переходит в квазистохастическую: а — oti = 2,4; аг = 1,7537; б — ai = 5,4; аг = 1,7533; в — ai = 5,4; аг = 1,7532; г — ai — 5,4; аг ~ 1,7532 (рис. 5.33, г). Притягивающая область в фазовом пространстве является странным аттрактором. Модельному режиму, изображенному на рис. 5.33, г, соответ- ствуют наблюдаемые в природе нерегулярные квазистохастиче- ские изменения численностей животных.
ГЛАВА 6 РАСПРЕДЕЛЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ МОДЕЛИ 6.1. Уравнение реакция —диффузия 6.1.1. Активные кинетические среды в живых системах Все биологические системы, в частности биологически актив- ные мембраны и ткани, сообщества живых организмов, относят- ся к классу активных распределенных систем, основные свой- ства которых следующие: • существует распределенный источник энергии или веществ, богатых энергией; • каждый элементарный объем среды находится в состоя- нии, далеком от термодинамического равновесия, т. е. является открытой термодинамической системой, в которой диссипирует часть энергии, поступающей из распределенного источника; • связь между соседними элементарными объемами осу- ществляется за счет процессов переноса. Благодаря этим свойствам биологические системы облада- ют рядом нетривиальных типов поведения, составляющих сущ- ность живых систем. Исследование простейших моделей актив- ных сред показало, что сложное пространственно-временное по- ведение систем может быть описано системами нелинейных диф- ференциальных уравнений в частных производных вида: ....(61) i = 1,2, ..., n, где Du и Dij (г j) — коэффициенты диффузии и взаимной диффузии; Fi — нелинейные функции, описывающие взаимодей- ствие компонентов. В зависимости от вида функций Fi и коэффициентов диффу- зии в уравнении (6.1) в системах реакция — диффузия мо- гут возникать следующие нетривиальные типы поведения пере- менных [Ю. М. Романовский, Н. В. Степанова, Д. С. Чернавский, 1984; 2004]: 1) распространяющиеся возмущения в виде бегущего им- пульса; 263
2) генерация волн автономными источниками импульсной ак- тивности. В качестве источников волн могут выступать либо неоднородности среды, вызванные отклонением значений пара- метров системы из-за механических или других повреждений, либо локальные кратковременные флуктуации переменных (ис- точники типа «ведущий центр»); 3) стоячие волны; 4) синхронные автоколебания во всем пространстве. Синхро- низация происходит с частотой того элемента пространства, ко- торый обладает наименьшим периодом колебаний; 5) квазистохастические волны, которые могут быть связаны с динамическим хаосом в локальной системе, но могут и возни- кать в распределенной системе с устойчивыми локальными эле- ментами; 6) стационарные неоднородные распределения переменных в пространстве — диссипативные структуры. 6.1.2. Уравнение диффузии Существование процессов переноса вещества и энергии явля- ется необходимым условием того, что система функционирует в пространстве как единое целое. Перемещение молекул веще- ства под действием случайных сил — диффузия — имеет место в любом веществе — газе, жидкости, твердом теле. Неоднород- ная смесь веществ в замкнутом объеме будет со временем бла- годаря диффузии однородной — вещества перемещаются, и кон- центрация каждого из них во всем объеме станет одинаковой. В такой системе установится так называемое однородное (гомо- генное) стационарное состояние. Время установления стацио- нарного состояния, естественно, определяется свойствами веще- ства, в основном подвижностью его молекул. В активных кинетических средах, которыми являются био- логические системы, кроме процессов диффузии, происходят также взаимодействия между компонентами, описываемые, как правило, нелинейными функциями. Эти нелинейные процессы могут приводить к установлению различных концентраций вза- имодействующих компонентов в разных точках пространства, препятствуя таким образом вызванному диффузией выравнива- нию концентраций. Противоборство этих двух процессов — вза- имодействия компонентов в каждой отдельной точке простран- ства и диффузии — определяет поведение распределенной си- стемы. 264 I
(6-2) Рассмотрение процессов, происходящих в распределенной си- стеме, начнем с простейшего случая — с изучения процесса диф- фузии в одномерном реакторе — трубке, заполненной раствором некоторого вещества, предполагая, что во всякий момент време- ни концентрация раствора по сечению трубки одинакова. Тогда процесс диффузии может быть описан функцией C(r, t), пред- ставляющей концентрацию вещества в сечении с координатой г в момент времени t. Опыт показывает, что диффузионный поток какого-либо ком- понента, т. е. масса диффундирующего компонента, проходящая в единицу времени через единицу площади, перпендикулярной направлению диффузии, пропорционален градиенту концентра- ции этого компонента, взятому с обратным знаком (закон Фика): где I — диффузионный поток интересующего нас компонента в направлении оси г. Знак «минус» в правой части (6.2) пока- зывает, что диффузионный поток направлен в сторону убыва- ния концентрации. Коэффициент D в уравнении (6.2) называет- ся коэффициентом диффузии, он численно равен диффузионно- му потоку при градиенте концентраций, равном 1, и зависит от свойств диффундирующего вещества и свойств остальных ком- понентов, составляющих смесь. При не слишком больших кон- центрациях веществ D мало зависит от концентрации самого ве- щества и определяется степенью подвижности молекул. Пусть поперечное сечение трубки S. Выделим в ней элемен- тарный объем А К с координатами границ г и г + Аг, тогда ДТ4 = S&r. Не нарушая общности, предположим, что диф- фузия протекает в направлении оси г. Масса АМГ вещества, втекающего за время от t до t + At в рассматриваемый объем через границу г, согласно закону Фика, равна: Д7ИГ = -DdC^ SAt. дг Через другую границу с координатой г + Аг из выделенного объема вытекает вещество массой АМг+дг: м = _rac(r + Ar,t)SAt дг Общее изменение массы AM в объеме AV составляет AM = АМГ — АМг+дг, или 265
дм + _ „афОКД( dr or Запишем уравнение для изменения концентрации: AC(r,t) = п дС(г + Ar, t) дС (г, t) Ам = = D dr ~ dr ДУ SAr Дг Перейдем к пределу при Дг -> 0 и получим ДС(М)4(Р^)Д(. dr \ dr J Разделив левую и правую части этого выражения на Д4 и пе- рейдя к пределу при At —> 0, получим уравнение диффузии в дифференциальной форме: dC(r,t) _ д_ dt дг D9C(r,t) дг В случае когда коэффициент диффузии D постоянен, имеем дС(г, f) dt _ „&C(r,t) dr2 (6.3) или в другой форме записи Ct = DCrr. В случае когда диффузия происходит в трехмерном про- странстве, причем имеет место изотропная диффузия, т. е. перемещение частиц вещества равновероятно по всем направле- ниям, уравнение (6.3) примет вид ^ = РДС(М). Здесь А — оператор Лапласа. Если в среде диффундируют п веществ с концентрациями Ci (г = 1, ..., п), процесс описывается системой п уравнений: =Di&Ci(r,t), г = 1,2, (6.4) где Di — коэффициент диффузии г-го вещества. Вообще говоря, коэффициент диффузии определяется не только свойствами самого диффундирующего вещества, но и свойствами остальных компонентов системы. Тогда вместо ко- 266
эффициента самодиффузии Di следует пользоваться коэффици- ентом взаимной диффузии (кросс-диффузии). Уравнения (6.3), (6.4) описывают изменение во времени и в пространстве концентраций веществ, когда в системе происхо- дит единственный процесс — диффузия. Однако специфика хи- мических и биологических систем определяется тем, что кроме диффузии в них протекают и другие процессы. Это приводит к возникновению новых членов в правых частях уравнений типа (6.3), (6.4), описывающих изменения концентраций Ci во време- ни. Например, в случае одного вещества в одномерном реакторе кроме диффузии возможно наличие в некоторых местах трубки источников или стоков этого вещества, с учетом которых урав- нение (6.3) примет вид дС д2С ч “Я? = D ~Я~2 + dt dr2 где F — функция источника. Если, кроме того, имеется диффузия вещества через стенки трубки, то в правой части уравнения появятся также члены, про- порциональные концентрации: дС dt = D—^ + F^t) + aC. drz В многокомпонентных системах возможны разнообразные взаимопревращения компонентов, например химические пре- вращения веществ в ходе реакций. Пусть скорость изменения концентрации Ci за счет химической реакции описывается функ- цией fi = fi(Ci)Cz, .. • ,Сп), вид которой определяется механиз- мом реакции. В общем случае функция fi зависит как от концен- траций реагирующих веществ, так и явно от пространственной координаты г и времени t. В дальнейшем, как и в случае точеч- ных систем, будем считать, что вид функции fi не зависит явно от времени и координаты пространства. С учетом химических превращений, происходящих в каждой точке системы, уравнения (6.4) следует переписать в виде: 8С -^ = fi(C1,C2,...Cn) + DiACi(r,t). С/С В случае одномерного реактора: ^ = fi(C1,C2,...,Cn) + Di^. (6.5) 267
Дифференциальные уравнения с частными производными имеют, вообще говоря, бесчисленное множество решений. По- этому для однозначной характеристики процесса необходимо к уравнениям добавить некоторые дополнительные условия. Для обыкновенных дифференциальных уравнений необходимо за- дать начальные значения переменных в момент времени t = tn. В случае распределенных систем этого недостаточно. 6.1.3. Начальные и граничные (краевые) условия Кроме начальных условий — значений функций СД£, г) в не- который начальный момент времени t = to — следует задать так- же так называемые граничные (краевые) условия, т. е. условия на границе области, в которой развертывается изучаемый процесс. Начальные условия задаются в виде функции зависимости концентрации от пространственной координаты в начальный момент времени Ci(t0,r) =(fi(r). (6.6) Граничные условия могут быть заданы в различном виде в зависимости от закона изменения концентрации веществ на гра- нице изучаемой области. Рассмотрим основные типы краевых условий на примере одномерного реактора — трубки длиной I. 1. На краю трубки задана концентрация, которая может опре- деляться, например, концентрацией вещества в резервуаре, с ко- торым трубка находится в контакте: C(O,t)=n(t), (6.7) где [i(t) — концентрация вещества в резервуаре в момент време- ни t. В частности, если на границе трубки происходит поглощение вещества, то С(0Д) = 0. 2. На границе задано значение производной: 8С1 — (O,t) = v(t). (6.8) or К этому условию мы приходим, если задана величина диффузи- онного потока /, протекающего через торцевое сечение трубки: 7(0,i) = ^(0,t), or 268
тогда величина v в формуле (6.8) — известная функция, которая выражается через заданный поток I по формуле В частности, в случае непроницаемости торца трубки, когда дС диффузионный поток на границе равен нулю: — (0, t) = 0. or 3. На краю трубки задано линейное соотношение между про- изводной и функцией: ^7(o,t) = -x[C(o,t)-e(t)|. (6.9) Граничное условие (6.9) соответствует случаю, когда на гра- нице имеется диффузионный поток между трубкой и резервуа- ром, концентрация вещества в котором известна. Пользуясь дву- мя выражениями для диффузионного потока, протекающего че- дС рез сечение г = 0,1 = h(C—8) и I = — D-—, получаем математи- ог ческую формулировку краевого условия в виде (6.9), где X = О — заданная функция. А. В случае если функции СД^Д) непрерывны в изучаемой области вместе со своими вторыми производными, то система уравнений типа (6.5) вместе с начальными (6.6) и граничными условиями одного из типов (6.7) —(6.9) имеет единственное ре- шение. Возможны типы задач, в которых краевые или начальные условия не следует учитывать. Рассмотрим процесс диффузии в очень большом объеме. В течение небольшого промежутка вре- мени влияние потока веществ, заданного на границе, в централь- ной части рассматриваемого объема оказывается весьма слабо, и концентрация веществ определяется, помимо химических реак- ций, в основном начальным распределением вещества. При ана- лизе поведения переменных на малых временах в таких зада- чах считают, что реакция происходит в неограниченном объеме, и ищут решение системы уравнений при заданных начальных условиях без учета граничных условий. Влияние начальных условий с течением времени ослабевает. При этом если концентрация веществ поддерживается постоян- ной на границе, то в момент времени, достаточно удаленный от начального, концентрация веществ определяется лишь гранич- 269
ными условиями. В этом случае можно считать, что опыт про- должается бесконечно долго, и начальные условия тем самым отпадают. 6.2. Решение уравнения диффузии 6.2.1. Общий ход решения Решение краевых задач для системы нелинейных уравнений типа (6.5) при произвольных функциях может быть выполне- но лишь с помощью компьютера. Методы аналитического реше- ния разработаны только для линейных уравнений вида Ct = DCrr + (6.10) с соответствующими начальными и граничными условиями, не содержащими нелинейные функции относительно концентраций С. Методы решения таких задач подробно изложены в учебни- ках и монографиях, посвященных уравнениям математической физики [А. Н. Тихонов, А. А. Самарский, 1999]. Здесь достаточно подробно рассмотрим решение линейной краевой задачи и уви- дим, что такое решение в пространстве — времени может быть представлено в виде ряда Фурье (бесконечной суммы гармони- ческих функций пространственной координаты с убывающими со временем амплитудами). Отсюда становится понятным, по- чему в нелинейных системах с диффузией при наличии малых флуктуаций могут возникнуть автоволновые процессы и пери- одические по пространству, постоянные во времени структуры (диссипативные структуры). Нелинейная система оказывается своеобразным «фильтром», выделяющим некоторые из членов гармонического ряда и поддерживающим их существование, в то время как более высокие гармоники затухают во времени. Рассмотрим общий путь решения одномерной краевой задачи для уравнения (6.10) с начальным условием С(г,0) = ср(г) (6.11) и граничными условиями первого рода на обеих границах узкой трубки длины I: C(0,i)=pi(t);C(Z,t) = p2(t). (6.12) Задачу решают в три этапа. Сначала ищут решение однород- ного уравнения Ct = DCrr (6.13) 270
с начальным условием (6.11) и нулевыми краевыми условиями С(0Д) = O;C(Z,t) =0. (6.14) Затем находят решение неоднородного уравнения (6.10) с ну- левыми краевыми условиями (6.14). Наконец, последний этап — решение общей краевой задачи — уравнения (6.10) с начальным условием (6.11) и граничными условиями (6.12). 6.2.2. Решение однородного уравнения Пусть в системе имеет место только один процесс — диффу- зия. Решим основную вспомогательную задачу: найдем решение уравнения (6.13), не равное тождественно нулю и удовлетворяю- щее нулевым краевым условиям (6.14). При этом воспользуемся методом разделения переменных, представляя решение в виде C(r,t) = fl(r)T(t), (6.15) где Я(г) — функция только пространственной переменной г; T(t) — функция только переменной времени t. Подставим решение в форме (6.15) в уравнение (6.13): TfR = DTR" и разделим обе части равенства на DRT. Получаем _ Д" _ LTT ~~R ~~ ’ где X = const, так как левая часть равенства зависит только от £, а правая — только от г. Отсюда получим два самостоятельных уравнения для переменных г и t: Я"(г) + ХЯ(г) = 0, (6.16) T'(t) + DXT(t) = 0. (6.17) Для определения функции Я(г) получено обыкновенное диф- ференциальное уравнение (6.16), причем вследствие граничных условий (6.14) функция Я(г) должна удовлетворять дополни- тельным условиям: Я(0) = Я(/) = О, (6.18) так как в противном случае было бы: T(t)=O и С(гД) = 0, 271
в то время как задача состоит в нахождении нетривиального ре- шения. Для функции T(t) никаких дополнительных условий нет. Таким образом, чтобы найти функцию Я(г), необходимо определить значения X, называемые собственными значения- ми, при которых существует нетривиальное решение задачи (6.16), (6.18), а также сами эти решения. Такая задача называ- ется задачей о собственных значениях, или задачей Штурма — Лиувилля. Собственные значения задачи Штурма —Лиувилля обладают следующими свойствами: • множество собственных значений не пусто и не имеет ко- нечных предельных точек; • собственные значения вещественны и конечной кратности; • собственные значения неотрицательны; • множество собственных значений счетно; • каждое собственное значение — простое. Согласно теореме В. А. Стеклова, всякая функция /, непре- рывная и имеющая непрерывные производные не ниже второй, разлагается в регулярно сходящийся ряд Фурье по собственным функциям {Xfc} задачи Штурма —Лиувилля: оо f(x) = ^(f,Xk)Xk(x). п=1 Доказательство этих утверждений можно найти в учебнике [В. С. Владимиров, 1981]. Общее решение уравнения (6.16) имеет вид: Я(г) = + С2е~^. При X О задача не имеет нетривиальных решений. При X > 0 общее решение содержит мнимые показатели и поэтому может быть записано в виде Я(г) = Di cos y/\r + D2 sin д/Хг. Краевые условия (6.18) дают: Я(0) = Di=0, 7?(Z) = D2 sin V\l = 0. Если R(r) не равно тождественно нулю, то 0, поэтому д- гг ТШ sin УХ/ = 0, или vX = —, 272
Рис. 6.1. Собственные функции Rn(r) для краевой линейной задачи о диффузии в одномерном реакто- ре длины I с нулевыми краевыми условиями АА/ где п — любое целое число. Величину л/Х = — в литературе, посвященной волновым процессам, обычно называют волновым числом и обозначают буквой к. Таким образом, нетривиальные решения задачи возможны лишь при собственных значениях Х„=(у)2. (6-19) Этим собственным значениям соответствуют собственные функ- ции: Rn(r) = Dn sin ™r. (6.20) В дальнейшем произвольный множитель Dn будем считать равным единице. Вид собственных функций (6.20) для краевой задачи о диффузии в одномерном реакторе длины I с нулевыми концентрациями на границе при различных значениях п изобра- жен на рис. 6.1. Собственным значениям Хп (6.19) соответствуют решения уравнения (6.17): T'(t) + DXnT(t) = 0. Это линейное обыкновенное дифференциальное уравнение, его решения для каждого п представляют собой затухающие со вре- менем экспоненты: Tn(t) = Ane~D^nt, (6.21) 273
где Ап — не определенные пока коэффициенты. Возвращаясь к задаче (6.13), (6.14), видим, что функции концентраций Сп(г, £), представляющие собой произведения временного и простран- ственного сомножителей: Cn(r, t) = Rn(r)Tn(t) = A-ne~Dlnt sin ™r, (6.22) являются частными решениями уравнения (6.13), удовлетворя- ющими нулевым краевым условиям. Таким образом, частные решения (6.22) представляют собой затухающие со временем синусоидальные распределения кон- центрации С. Легко видеть, что выражение, стоящее под знаком sin, представляет собой произведение волнового числа кп = — m /" 1 ТСП и координаты г. Таким образом, кп = — является «частотой колебания» переменной С в пространстве или, что то же са- А 2К - мое, величина Ап = -— является «периодом» колебании кон- fen А 21 центрации С по пространству г. Иначе, Ап = — есть длина п волны синусоиды, представляющей собой собственное решение Сп (см. рис. 6.1). Чем больше номер гармоники п, тем мень- ше период синусоиды в пространстве и тем больше коэффици- ент затухания этой синусоиды во времени (за счет множителя е-(?)2^). Условие нулевых потоков на границах При граничных условиях непроницаемости концов одномер- ного реактора на решения уравнения (6.16) накладываются кра- евые условия ВС* ^(0,£) = ^(М) = 0, (6.23) or or dR,^ ndRm „ которые дают следующее: -^—(0) = 0; (I) = 0. or or Продифференцировав выражение для функции Я(г), полу- чим Ж = — Di\/Xsin V\r + D2^Xcos^Xr. or Из краевых условий (6.23) следует =D2V\ = 0, ^1 =Г>2^ = 0. or lr=0 or lz=o 274
Отсюда, как и в случае, когда краевые условия соответствуют нулевым концентрациям на границах, получаются те же величи- ны собственных значений но собственными функция- ми для одномерного реактора с непроницаемыми концами явля- ются функции _ _ ип Rn = Dn cos —г. Частные решения задачи о диффузии в замкнутом одномер- ном реакторе — концентрации Cn(r, t), как и в задаче с нулевыми концентрациями на границе — произведения временного и про- странственного сомножителей: Cn(r, i) = Rn(r)Tn(t) = Ane~DXnt cos —г. (6.24) Общее решение представляет собой суперпозицию частных решений. Именно благодаря такой структуре решения опреде- ленные типы взаимодействия переменных в системах с диффу- зией могут привести к образованию в системе стационарных пе- риодических структур, а также возникновению режимов типа стоящих и бегущих волн. 6.2.3. Зависимость решений от начальных условий Вернемся к задаче с начальными условиями (6.11). Предста- вим решение в виде ряда: оо C(r, £) = У Апе~^) Dt sin -у-г. (6.25) п=1 Функция C(r, £) удовлетворяет граничным условиям, так как им удовлетворяют все члены ряда. Требуя выполнения началь- ных условий (6.11), получим выражение: оо <р(г) = С(г, 0) = У Ап sin ^г. (6.26) п=1 Таким образом, Ап представляют собой коэффициенты раз- ложения Фурье, известного из курса математического анализа, функции ср (г) по синусам в интервале (0,2): I Ап = | [ <р(£) sin (6.27) v J L о где £ — переменная интегрирования. 275
Учитывая выражения (6.27) для множителей Ап, формулу (6.25) можно записать в виде 2П/ . цп ,цп sin —г sin —с, 6 L (6.28) Изменение порядков суммирования и интегрирования закон- но, если ряды сходятся равномерно по £ при t > 0. Обозначив О оо G(r,5,t) = ?£«-<”) “ П=1 . ЦП , ЦП sin —г sin —q представим C(r, t) через (7(r, £, t) в виде I C(r,t) = о где G(r, £,£) называется функцией мгновенного источника и ха- рактеризует распределение вещества в трубке 0 г I в мо- мент времени t, если в начальный момент концентрация веще- ства равна нулю, и в этот момент в точке г = £ мгновенно вы- деляется некоторое количество вещества, а концентрация веще- ства на концах трубки все время поддерживается нулевой. Как будет показано далее, выражение для функции источника удоб- но использовать при решении неоднородного уравнения диффу- зии. Итак, получено решение однородного уравнения с заданными начальными условиями и нулевыми краевыми условиями. Решение краевой задачи с нулевыми потоками на границе бу- дет иметь вид C(r,f) i ЦП ЦП cos —г COS — Q а функция источника соответственно может быть выражена формулой о оо z-f/ г -( — }2Dt 1171 ЦТЬТ = - У е \ 1 cos —г cos — £. v L L п=1 276
Таким образом, для краевых задач как первого рода (на гра- ницах заданы концентрации), так и второго рода (на границах заданы потоки) собственными функциями являются периодиче- ские гармонические функции пространственной координаты . тт ип sin —г, cos —г, п = 1,2, ..., оо. v L Если реакция происходит в безграничной трубке, то решение однородного уравнения дС _ д2С dt dr2 с начальным условием С(0, г) = g(r) имеет вид оо 1 Г (*-£)2 C(r,i) = —= —оо Из этой формулы, в частности, следует, что если начальная концентрация была положительна только на конечном отрезке О г Z, то при любом t > 0 концентрация в момент t бу- дет положительна всюду на числовой прямой: —оо < г < оо. С помощью диффузии большие концентрации распространяют- ся сравнительно медленно, в то время как малые — за малое вре- мя на большие расстояния. Следует иметь в виду, что уравнение (6.10) на очень малых интервалах времени плохо описывает про- цесс диффузии. Если рассматривается диффузия на конечном отрезке [0,1] с условием непроницаемости на концах, то любая начальная концентрация с ростом t стремится к равномерному распределению по отрезку. 6.2.4. Решение неоднородного уравнения диффузии с нулевым начальным условием и нулевыми краевыми условиями Присутствие в правой части уравнения (6.10) члена /(гД) означает наличие источника (или стока) вещества в данном ме- сте через стенки трубки. Например, при описании процессов диффузии ионов вдоль мембраны возможен трансмембранный перенос ионов. Для неоднородного уравнения диффузии Ct = DCrr +
с нулевым начальным условием С(г,0) = 0 и нулевыми краевыми условиями С(0Д) = 0,С(/Д) =0 решение С (г, t) также ищут в виде разложения в ряд Фурье по . ип sin —г: С (г, i) = ^2 Cn(i) sin 71=1 Здесь функции Cn(t) могут быть получены при подстановке предполагаемой формы решения в исходное уравнение (6.10), где функция /(г, t) также представляется в виде ряда Фурье: оо ЕЛ . . , ЦП fn(t) sin —г. п=1 Общее решение поставленной задачи имеет вид C(r,i) . ЦП sin —г (6.29) Как и в случае однородного уравнения, оно может быть пред- ставлено через функцию источника: t i 0 0 C(r,i) o °o G(r, t — т) = - У e~(~) sin ~j~r sin 71=1 (6.30) Легко видеть, что функция (6.30) совпадает с функцией (6.27). Различие состоит в том, что в случае формулы (6.27) изу- чалось однородное уравнение диффузии и поэтому рассматри- вался источник вещества, действующий лишь в момент време- ни t = 0, согласно начальному условию (6.11). Дальнейшее рас- пределение вещества определялось в этом случае «пассивной» 278
диффузией по градиенту концентраций. В случае неоднородно- го уравнения (6.10) функция /(г, t) задает распределение источ- ников вещества, действующих постоянно. Поэтому в выражении для C(r, t) через функцию источника необходимо суммировать действие мгновенных точечных источников во все моменты вре- мени от t = 0 до рассматриваемого момента t (интеграл по т) и во всех точках одномерного реактора (интеграл по £). Таким обра- зом, исходя из физического смысла функции источника G(r, £, t) можно было бы сразу написать выражение (6.30) для функции, дающей решение неоднородного уравнения. 6.2.5. Общая краевая задача Решение общей краевой задачи — уравнения (6.10) с началь- ными (6.11) и краевыми (6.12) условиями — сводится к реше- нию задачи с нулевыми краевыми условиями. Для этого реше- ние C(r, t) представляют в виде суммы двух функций: C(r, t) = V (г, f) + v(r, £). Здесь V(г, t) — известная функция: V(r,i) =щ(£) + у [Иг(О — Н1(0], a v — неизвестная функция, которая определяется как решение уравнения vt = Dvrr + f (г, t), где J(г, t) = f(r, t) - [Ц - DVrr]. Начальные условия для функции v: г>(г, 0) = ф(г); ср(г) = ср(г) — V(r, 0), а граничные условия — нулевые: Pi(i) = 0, р2(*) = °- Метод нахождения функции v был разобран ранее. Итак, мы рассмотрели аналитические методы решения одно- родных (типа (6.13)) и неоднородных (типа (6.10)) уравнений, описывающих диффузию одного вещества в одномерном реак- торе. Решение представляется в виде интегралов, причем удоб- ный для аналитического исследования вид решения может быть получен лишь в небольшом числе частных случаев. Еще более
сложной становится ситуация при изучении системы нескольких веществ, способных вступать в химические реакции и диффун- дировать в трехмерном пространстве, а именно с такими систе- мами мы имеем дело в биологии. Однако некоторые выводы о свойствах решений могут быть сделаны на основании качествен- ного исследования моделей. Одна из проблем, при решении ко- торой оказываются эффективными методы качественного иссле- дования, — изучение устойчивости стационарных состояний рас- пределенных систем. В любом случае условием возникновения в распределенных системах сложных пространственно-временных режимов явля- ется неустойчивость гомогенного стационарного состояния. Гра- ницы области параметров, в которой возникает такая неустой- чивость, могут быть установлены на основе анализа линеаризо- ванной системы аналогично локальным системам (см. гл. 4, 5). 6.2.6. Устойчивость гомогенных стационарных состояний нелинейных систем Если некоторое стационарное состояние системы неустойчи- во, то это означает, что с течением времени в системе устанавли- вается какой-либо иной режим. Для точечной системы это мо- гут быть другие устойчивые стационарные состояния в мульти- стационарных системах, автоколебания или динамический хаос (см. гл. 2). В распределенных системах неустойчивость однород- ных в пространстве (гомогенных) стационарных решений может приводить к возникновению диссипативных структур, автовол- новых процессов и квазистохастических режимов. Стационарные, т. е. неизменные во времени, решения можно найти из условия обращения в нуль производных по времени: ^=0. dt Поясним, как ставится задача об устойчивости стационарных решений распределенных систем на примере одного уравнения с одной пространственной переменной. Пусть реакция происходит в тонкой трубке длины I. Уравнение, описывающее изменение переменной С в пространстве и во времени, имеет вид = flO + D^. at }t-c’ + Ddr2’ Пусть краевые условия соответствуют непроницаемости трубки на торцах: (6.31) 280
^(i,0) = = 0. (6.32) Поскольку речь идет о стационарном решении (поведении пе- ременной С при t —> оо), начальные условия не играют роли. Пусть Со(г) — стационарное решение уравнения (6.31), т. е. ре- шение задачи: f(C) + D-^ = Q с краевым условием непроницаемости границ. Зададим системе некоторое возмущение 8 (г), т. е. выберем в качестве начальной функции в этой задаче функцию, близкую к Со: C(0,r) = C0(r) + 8(r); |8(r)|< 1. Пусть С§(£,г) — решение задачи (6.31), (6.32) с такой начальной функцией. Стационарное решение Со (г) называется устойчивым, если для достаточно малых отклонений от стационарного состояния |8(г)| функция С§(£, г) при всех t 0 мало отличается от Со(г). Вблизи Со(г) нелинейную функцию f(C) можно приблизить линейной функцией, использовав первый член разложения по С в ряду Тейлора: /(С) = /(Со) + /'(Со)(С-Со). Здесь С — Со = 8(t,r). При малых 8(г) функция С§(£,г) может быть представлена в виде C5(V)«C0(r) + 8(£,r), где 8(£, г) — решение линейной задачи: = ^3^ + acaw, г); (6.33) ^ = ^ = 0. (6.34) Здесь и в дальнейшем считаем для краткости, что коэффициент диффузии D = 1. Итак, для исследования устойчивости стационарных состоя- ний распределенных систем нужно изучить поведение решения линейной задачи при t оо. Как правило, свойства линейной задачи определяют устойчивость или неустойчивость решения соответствующей нелинейной системы. Исключение составляют 281
это имело место и при исследовании точечных систем. Пусть задача (6.33), (6.34) имеет однородные по пространству стационарные решения. Рассмотрим вопрос об устойчивости та- ких решений. Для однородных стационарных решений fc(Co) = = А — const. Задача (6.33), (6.34) представляет собой линейное уравнение диффузии, которое отличается от рассмотренного ра- нее наличием в правой части слагаемого, которое является от- клонением от стационарной концентрации 8(Z,r), умноженным на число А, с соответствующими краевыми и начальными усло- виями. Ранее было показано, что собственными функциями линей- ного уравнения диффузии с условиями непроницаемости на кон- цах отрезка являются функции ккг U П 1 cos —-, к = 0,1, ... Решение 8(Z,r) задачи (6.33), (6.34) с начальной функцией 8(г) также можно представить в виде Е°° . ч киг ak(t) cos—. fc=o Подставив это выражение в (6.33), получим следующее уравне- ние для нахождения dak(t) ( к2п2 Д . х ot \ / откуда (6.35) / J ( к2п2 ak(t) = exp < I— Величины задают временной характер нарастания или за- тухания соответствующей гармоники возмущения S(£,r), в то кпг время как множители cos —у- определяют распределение на- чального отклонения вдоль пространственной координаты. Если в формулах (6.35) А < 0, то при любом к = 1,2, ... функция 8(Z,r) —> 0 при £ —> О, какова бы ни была начальная функция 8(г). Таким образом, в этом случае любое малое возму- щение однородного по пространству стационарного решения со временем затухает. 282
бых &, кроме к = 0. В такой системе будут затухать все гар- моники cos——, к = 1,2, ... (относительно нулевой гармоники линейное приближение не дает ответа). Если А > 0, то существует конечное число гармоник вида кпг cos ——, которое приводит к развитию возмущений стационар- ного однородного решения. А именно, это только те гармоники, k2it2 для которых - < А = Если начальное возмущение не содержит этих гармоник, то оно со временем будет исчезать. Вспомним, что в начале анализа было принято D = 1. Если учесть коэффициент диффузии в системе, где ff(Co) > 0, воз- можны незатухающие начальные возмущения, номера незатуха- ющих гармоник к* в соответствии с (6.35) можно определить по формуле У Dn2 ' Таким образом, номер наивысшей незатухающей гармоники тем больше, чем длиннее реактор, и тем меньше, чем выше зна- чение коэффициента диффузии. Незатухающие гармоники, раз- виваясь, могут приводить систему к установлению простран- ственно неоднородных диссипативных структур или автоволно- вых режимов. 6.2.7. Распределенная модель популяции с наименьшей критической численностью В качестве примера исследуем устойчивость однородных ста- ционарных решений одного уравнения с одной пространствен- ной переменной дс д2с ^ = Dh+c{a-cw-bY (6-36) Соответствующее точечное уравнение de — = с(а - с)(с - b) at имеет три стационарных решения: с\ = 0, С2 = а; сз = Ь, Для 0 < а < b вид функции /(с) в этом уравнении соответ- ствует графику, изображенному на рис. 6.2. 283
Рис. 6.2. Функция /(с) для уравнения (6.36) Предположим, что процесс, описы- ваемый уравнением (6.36), происходит в трубке длины /(О г I) с непро- ницаемыми концами. Это накладыва- ет граничные условия: ^(i,O) = ^(t,Z) = O. dr dr Исследуем теперь стационарные ре- шения уравнения (6.36). Для их определения имеем обыкновен- ное дифференциальное уравнение, независимой переменной ко- торого является пространственная координата г: D-? + с(с - а)(Ь - с) = 0, 0 г Z, (6.37) drz de, ч dc/ix причем — (0) = 0; — (Z) = 0. dr dr Исследуем устойчивость однородных стационарных состоя- ний системы, характеризуемой уравнением (6.37). В соответ- ствии с процедурой, описанной ранее, вблизи стационарного ре- шения с(г) аппроксимируем нелинейную функцию /(с) = с(а - С^с-Ь) линейной функцией /(с) — f(c) + /'(с)(с — с). Прежде всего име- ем три стационарных решения, которые являются положениями равновесия соответствующей точечной системы: ci = 0, С2 = а, с3 = Ь. Рассмотрим знак производной функции ff(c) в стацио- нарных точках. Как видно из рис. 6.2, при 0 < а < b значения /'(0) и ff(b) отрицательны и, следовательно, стационарные ре- шения с = 0, с = b устойчивы. Решение с = а неустойчиво, так как ff(a) > 0. Заметим, что существует только конечное число кип гармоник вида cos ——, которые приводят к развитию возмуще- ний стационарного решения с = а. Это те гармоники, для кото- /с2к2 .. рых ~j2~ < J \а)- Если начальное возмущение не содержит этих гармоник, то оно со временем будет затухать. При не очень малых длинах реактора I имеются еще и неод- нородные по пространству решения. Чтобы найти их, обозначим через F(c) функцию, для которой F'(c) = с(с — а)(Ь — с). Умно- dc жив уравнение (6.37) на — и интегрируя по г, получим dr 284
2 W + = 2 = “nst' Здесь A — произвольная постоянная. Решив полученное урав- с Г de нение, имеем соотношение: ± —=------------= г, которое ха- с° y-^(A-2F(C)) рактеризует все решения уравнения (6.37). Постоянные со и А de , \ deч определяются из двух граничных условий: — (0,t) = 0; — (l,t) = dr dr = 0. Можно доказать, что при Z, больших некоторого Iq > 0, эти граничные условия можно удовлетворить и, следовательно, су- ществует пространственно неоднородное решение задачи. С уве- личением длины реактора число различных стационарных ре- шений возрастает. 6.3. Система двух уравнений реакция —диффузия Поведение распределенных систем из двух уравнений может быть чрезвычайно разнообразным: возмущения в виде бегущего импульса, генерация волн автономными источниками импульс- ной активности, стоячие волны, синхронные автоколебания во всем пространстве, квазистохастические волны и диссипативные структуры — стационарные неоднородные распределения пере- менных в пространстве. Как и в случае точечных систем, важное место в изучении распределенных систем занимает исследование устойчивости стационарного состояния. 6.3.1. Устойчивость однородных стационарных решений Рассмотрим распределенную систему, в которой имеется два вещества, т. е. две кинетические переменные х и ?/, которые пре- терпевают химические превращения и, кроме того, могут диф- фундировать в реакционном объеме. В случае одномерного ре- актора такая система может быть описана системой уравнений: где г — пространственная переменная. (6.38) 285
Пусть краевыми условиями являются условия непроницаемо- сти торцов одномерного реактора: дх I _ дх I _ ду I _ ду | _ (Эг1г=о дг\г=1 <Эг1г=о дт\г=1 Характер поведения такой системы со временем может быть различным. В простейшем случае при t —> оо во всех точках ре- актора установятся одинаковые концёнтрации х и у, т. е. систе- ма придет к своему устойчивому однородному в пространстве (гомогенному) стационарному состоянию. Если же однородное стационарное состояние неустойчиво, при t —* оо могут реализо- ваться другие режимы — либо иные однородные стационарные состояния, либо неоднородные стационарные (диссипативные) структуры. Возможно также, что в каждой точке пространства переменные с течением времени не стремятся к определенным значениям, а в системе устанавливается автоколебательный или квазистохастический режим. Таким образом, как и в случае то- чечных моделей, первым необходимым этапом изучения модели распределенной системы является исследование устойчивости ее однородного стационарного состояния. Рассмотрим пространственно однородное решение системы (6.38): х = Xk = const; у = ук = const, где х и у являются корнями алгебраической системы уравнений < Р(х,у) = 0; <?(м) = 0 к и, следовательно, особыми точками точечной системы. В подразд. 6.2 была рассмотрена устойчивость гомогенного стационарного состояния в случае одного уравнения. Такое со- стояние устойчиво, если малые возмущения сил (в том числе и распределенных в пространстве), действующих на систему, вы- зывают малые возмущения ее решений. Предполагается, что эти возмущения остаются малыми при любом t —* оо. Как и в случае одного уравнения, исследование устойчиво- сти будем проводить на основе анализа линеаризованной систе- мы уравнений. Пусть £&(£,г) и r\k(t^r) — малые отклонения от пространственно однородных решений Хк и у к- Тогда для и Т]к можно записать распределенную линеаризованную систему (нижние индексы к для краткости опускаем): 286
dt dt drl dt d2t = a£ + 67] + ; (Э2т) = ^ + </7) + ^^. (6.39) Коэффициенты a, b,c,d в линеаризованных уравнениях (6.39) определяются, как и в случае обыкновенных дифференциаль- ных уравнений (см. 4.3): ЭР(х,у) dP(x,y) а = —дГ~'' dQ(x,y) dP(x,y) c = ~th~’ d = —^— Коэффициенты диффузии: Dx = Dy = DTr Решение будем искать в виде £(f, г) = Aepteikr- 7)(/, г) = Bepteikr. (6.40) Здесь множитель егкг характеризует отклонение величин пе- ременных от однородного стационарного состояния в точке с ко- ординатой г для собственных функций, соответствующих вол- новому числу к. Для трубки длиной I (см. подразд. 6.2) волно- вое число принимает дискретные значения к = кп = —. Для бесконечного одномерного реактора волновые числа к меняют- ся непрерывно от 0 до оо. Множитель ept характеризует поведе- ние отклонения от стационарного состояния во времени. После подстановки выражений (6.40) в (6.39) и сокращения на eptelkr получим Ар = аА + ЬВ — D^k^A-, Bp = сА + dB — D^B, или А(р - а + DKk2) - ЬВ = 0; сА — В(р — d + D^k2) = 0. Величины Л, В тождественно не равны нулю только в том слу- чае, если определитель системы равен нулю: (р — а + k2D{)(p — d + к2 — be = 0. Полученное уравнение называется дисперсионным уравнением. Его решение 287
a+d—(D^ - D^k2±y/[a -d-k\D^- D^+Abc Pl,2 =------------------------------------------ (6.41) определяет поведение системы во времени через параметры си- стемы и волновое число к. Как и в случае точечных систем, знак действительной части pi,2 показывает, устойчивым или неустой- чивым будет исследуемое однородное стационарное решение. В области параметров, где оба Repi^ < 0, решение устойчиво. К устойчивому стационарному состоянию переменные могут приближаться колебательным или бесколебательным образом, в зависимости от знака подкоренного выражения в формуле (6.41). Если подкоренное выражение отрицательно, то корни комплексно-сопряженные и в каждой точке пространства име- ют место затухающие колебания переменных вокруг стационар- ных значений. Если же подкоренное выражение положительно, то корни рц2 действительные отрицательные и имеет место бес- колебательное стремление переменных к стационарным значе- ниям. В случае когда действительные части положитель- ны или имеют разные знаки, однородное стационарное состо- яние является неустойчивым. Здесь также возможны различ- ные типы неустойчивостей: если рц2 действительны и положи- тельны — неустойчивость типа «узел», если pi,2 — комплекс- ные и Repi^ > 0 — неустойчивость типа «фокус», и наконец, если pi и р2 имеют разные знаки — неустойчивость типа «сед- ло». На рис 6.3, а— е изображены возможные виды зависимости действительной части от волнового числа к. На графиках выделены три области: I — оба корня имеют положительную действительную часть (Repi^ > 0); II — один корень имеет по- ложительную, а другой — отрицательную действительную часть (Repi > 0, Rep2 < 0); III — оба корня имеют отрицательную действительную часть: (Repi^ < 0). На рис. 6.3 а, б, е оба характеристических числа рц2 действи- тельны для любых волновых чисел fc, а потому Repi и Rep2 раз- личны во всей области изменения параметров. На рис. 6.3, в— д существуют две области — область, в которой характеристиче- ские числа Р1,2 комплексно-сопряженные и потому их действи- тельные части равны, и область, где оба числа рц2 действитель- ны и различны. На рисунках указаны значения волнового числа, которые со- ответствуют изменению типа устойчивости системы. Рассмот- рим, какие изменения могут происходить при увеличении чис- ла к. 288
Рис. 6.3. Различные типы зависимости действительной части корней дисперсионного уравнения для системы (6.39) от волнового числа к [Ю. М. Романовский и [др.], 2004] Волновое число к± соответствует значению, при котором один из вещественных корней (больший) переходит из положитель- ной в отрицательную область, это соответствует переходу из об- ласти седловой неустойчивости (два положительных действи- тельных корня разных знаков) II в область устойчивого узла III (см. рис. 6.3, а, б, г, д). Волновое число наоборот, соот- ветствует переходу из области устойчивого узла III в область седловой неустойчивости II (см. рис. 6.3, г, д). Волновое число к% характеризует переход из области колебательной неустойчи- 289
Рис. 6.4. Зависимость действительной части корней дисперсионного уравне- ния Re р от волнового числа к в случае неустойчивости Тьюринга вости I (Repi = Rep2 > 0) в область устойчивых колебаний: Repi = Rep2 < 0 (см. рис. 6.3, в, г). Волновое число кд опре- деляет превращение колебательной системы в бесколебатель- ную — рождение двух разных значений Repi^ из одного, соот- ветствующего двум комплексно-сопряженным числам (см. рис. 6.3, в, г, д). Волновое число к$ характеризует переход из об- ласти неустойчивого узла в область седловой неустойчивости II (см. рис. 6.3, а). Возмущения с длиной волны из области I (см. рис. 6.3, а, в, г) в нелинейной распределенной системе могут приводить к воз- никновению бегущих волн конечной амплитуды, стоячих волн, ведущих центров. В системе с двумя переменными появление та- ких режимов возможно лишь в случае, когда точечная система (Г>^ = 0, DTl = 0) является автоколебательной. На рис. 6.3, г, д имеется область II изменения параметра к: к<2 < к < fci, в которой одно из характеристических чисел по- ложительно, а другое — отрицательно. Для значений волновых чисел к < ki и к > к^ такая система имеет устойчивое гомоген- ное стационарное состояние, а в интервале к^ < к < к\ демон- стрирует неустойчивость. Область неустойчивости такого рода называется областью неустойчивости Тьюринга. Зависимость Repi ^ от волнового числа в случае неустойчиво- сти Тьюринга изображена на рис. 6.4. Границы области неустой- чивости на оси абсцисс определяются значениями &1,&25 для которых одна из действительных частей Repi^ обращается в нуль: &1,2 — (aDri + dD%)± aD^ + dD^2 — ^D^D^ad — be) 1 (6-42) Флуктуации от однородного стационарного состояния в обла- сти неустойчивости Тьюринга могут привести к нарушению го- 290
могенности системы и возникновению стационарной неоднород- ной структуры. При анализе устойчивости гомогенных стационарных состоя- ний систем более высокого порядка ^ = Fi(x1,x2,...,xn) + D<^ (6.43) dt dr2 поступают таким же образом, как и при исследовании систем второго порядка. Пусть координаты особой точки системы: {^1т, ^2тпч • • • •)Хптп} ч Ш = 1, 2, . . . , Л/, где тп — номер особой точки. Возмущение представляется в виде суперпозиции волн вида * _ f , Tzk X z . v xim = xi~ xim = V-im exp pmkt + l — Г (6.44) \ -l/ / (i — мнимая единица), 2L где к — волновое число, определяющее длину волны Хтк = к Подставив (6.44) в линеаризованную систему уравнений, за- писанную в системе координат с началом в т-й особой точке, с учетом условия существования нетривиальных решений такой системы получим дисперсионное уравнение, связывающее ком- плексные частоты ртк = ± iwmk, длины волн Хтк (волновые числа к) и коэффициенты системы (6.43): Ртк + Qn-i^p^1 + ...+ qQ(k2) = 0. Если исследуемое стационарное состояние неустойчиво, то име- ется хотя бы одно значение комплексной частоты ртк, для кото- рой Repmk > 0. Количество корней дисперсионного уравнения с положитель- ной действительной частью определяет тип неустойчивости си- стемы. Если имеется четное число корней ртк с 8 > 0, неустойчи- вость называют колебательной. Нечетному числу таких корней соответствует неустойчивость Тьюринга, приводящая к образо- ванию стационарных неоднородных структур, названных дисси- пативными структурами (ДС). Этот термин подчеркивает тер- модинамический аспект проблемы — ДС рождаются и существу- ют в термодинамически открытых системах за счет диссипа- тивных процессов утилизации энергии и энтропии [Г. Николис, И. Р. Пригожин, 1979]. 291
6.3.2. Распределенный брюсселятор В гл. 5 (см. 5.6.3) была изучена простейшая модельная ав- токолебательная система «брюсселятор», описывающая химиче- ское взаимодействие двух веществ по схеме, включающей реали- зацию кубической нелинейности: 2Х + Y ЗХ. Рассмотрим, каким может быть пространственно-временное поведение системы, если в каждой точке локальное взаимодей- ствие описывается уравнениями типа «брюсселятор». Пусть ре- акции протекают в узкой длинной трубке (одномерном реакто- ре), вдоль которой вещества могут диффундировать. Коэффи- циенты диффузии Dy будем считать постоянными парамет- рами системы. Концы трубки, так же как и ее стенки, непрони- цаемы для веществ, участвующих в реакции. Уравнения, описы- вающие распределенный брюсселятор, имеют вид дХ dt д^Х = А + Х2У - (В + 1)Х + Dx—T- дгг дУ dt = ВХ — Х2У + Dy—T, у дг2 (6.45) где г — пространственная координата. Напомним, что для точечной системы имеется одно стацио- нарное состояние, которое характеризуется значениями концен- траций: X = А; У=^~. А Такими будут концентрации во всех точках реактора, если гомо- генное стационарное состояние системы устойчиво. Для исследования условий потери устойчивости однородного по пространству решения введем переменные, характеризующие малые отклонения системы от однородного решения: Е = Х-А; = Линеаризуем систему (6.45), и решение полученной системы бу- дем искать в виде = Ciept+ikr, T)(t,r) = C2ept+ikr. 292
Величины р и к связаны дисперсионным уравнением, которое позволяет определить характер устойчивости исследуемого го- могенного решения. Дисперсионное уравнение для брюсселято- ра имеет вид (р - В - 1 + fc2Z>5)(p + А2 + k2D^ + В А2 = 0. (6.46) Если уравнение (6.46) имеет два действительных корня, причем один из них pi < 0, а второй > 0, то система в области гомо- генного стационарного решения имеет неустойчивость седлового типа (неустойчивость Тьюринга). Условия существования такой неустойчивости выполняются при В > 1,DX Д (1 - л/В)2 Я2 Границы области волновых чисел /с, в которой реализуется неустойчивость Тьюринга, задаются выражением ±У[(В - 1)Д - DXA2]2 - 4A2DxDvj. Именно в этой области система (6.45) образует диссипативные структуры. Аналитическое исследование устойчивости неоднородных стационарных решений представляет значительные трудности, и в основном для этой цели используют асимптотические мето- ды. Так, устойчивость диссипативных структур в брюсселято- ре исследовали методом малых возмущений. Предполагая, что в системе существует диссипативная структура, которая носит квазигармонический характер [В. А. Васильев, Ю.М. Романов- ский, 1976], стационарные решения представляли в виде х(г) = а\ 4- «2 cos кг; у(г) = 61+62 cos кг + sin кг. а малые возмущения описывали формулами п п = cos ikr; т)(£, г) = ty’W cos ikr. j=0 j=0 В результате этих и ряда других исследований было показа- но, что при fcmin < к < fcmax наблюдаются устойчивые структу- ры, для брюсселятора 293
X 5 4 3 2 1 Рис. 6.5. Стационарные диссипативные структуры, полученные при одинаковых значениях параметров путем наложения на однород- ное стационарное состояние локализованного возмущения [Г. Николис, И. Р. Пригожин, 1979] , - в~х 1, - А2 Dx ’ max Д(В-1)‘ Компьютерные эксперименты показали, что в отсутствие по- токов на границах в системе может возникать несколько дисси- пативных структур в зависимости от локализации возмущений однородного состояния. Стационарные профили переменной X для различных возмущений представлены на рис. 6.5. Отрезок {0,1} разбивали на 101 одинаковых интервала, после чего возмущение одного знака и одинаковой амплитуды налага- лись в точках: 9, 21, 48, 72 (рис. 6.5, а); 9, 17, 34, 43 (рис. 6.5, б) и 9, 55, 70 (рис. 6.5, в) 6.3.3. Локализованные диссипативные структуры Описанные диссипативные структуры распространяются на всю систему. Этот факт является следствием предположения о том, что концентрации исходных веществ реакций Аи В под- держиваются постоянными во всех точках пространства. Та- кая ситуация является идеализированной. В реальном экспери- 294
менте реагенты вводятся в реакционный объем через границы. Это означает, что вещества А и В будут диффундировать в среде, что вызовет установление их концентрационных профи- лей. Неоднородное пространственное распределение исходных веществ приводит к локализации диссипативных структур внут- ри определенных границ. В случае когда вещество В равномерно распределено по объ- ему, а концентрация вещества А поддерживается постоянной на границе, систему уравнений (6.45) следует дополнить уравнени- ем, описывающим потребление и диффузию вещества А. Полу- чим систему из трех уравнений: Рис. 6.6. Локализованная диссипативная структура, полученная при численном решении системы (6.47) для последовательно увеличива- ющихся значений параметра В. Параметры системы: Da = 0,026; Dx = 1,052 • 10“3; Dy = 5,26 • 10“3; I = 1 [Г. Николис, И. Р. Пригожин, 1979] 295
= А + X2Y - (В + 1)Х + Вх^; dt drz dY _BX-x2y + d dt-BX X Y + Dy dr2 , dA t a2 a ,n ,4 -^- = -A + D—^ (0 < r /) dt dr2 (6.47) с граничными условиями A(0) = A(Z) = A. Концентрационные профили вещества X, полученные в соот- ветствии с системой (6.47) для разных значений параметра В, представлены на рис. 6.6. На границах поддерживались значе- ния переменных, соответствующие гомогенному стационарному состоянию. 6.4. Распространение фронтов, импульсов и волн 6.4.1. Распространение волны в системах с диффузией В популяционной генетике к задаче распространения волны приводит рассмотрение области, занятой особями — носителя- ми доминантного гена. Подобные задачи встречаются в эколо- гии при изучении распространения вида. Эффекты, возникаю- щие при распространении волн в активной кинетической среде, играют особую роль в процессах передачи информации и управ- ления в биологических системах. Рассмотрим дифференциальное уравнение ! f(C} dt dr'- +-'( ' (6.48) с начальным условием C(0,r) = (?(r) = < 1, 0, r < 0; r > 0. Начальное условие такого вида означает, например, что обшир- ная территория (в одномерном случае — полупрямая г < 0) за- нята доминантным геном, концентрация которого близка к еди- нице. В начальный момент времени область, где С = 1, имеет резкую границу, и при всех г > 0 концентрация С = 0. При 296
Рис. 6.7. Профиль плотности С в зависимости от координаты г в по- следовательные моменты времени: > ^2 > ti > Л) — О t = 0 начинается распространение «волны» ненулевых концен- траций доминантного гена в область г > 0, которое является следствием взаимодействия двух процессов: случайного переме- щения особей (диффузии частиц) и размножения, описываемо- го функцией f(C). Эти процессы ведут к перемещению обла- сти плотностей, близких к единице, с возрастанием t слева на- право. Примерная картина профиля плотности С в зависимо- сти от координаты г в разные моменты времени изображена на рис. 6.7. В начальный момент времени to = 0 кривая имеет вид сту- пеньки. С течением времени фронт волн перемещается впра- во, причем его форма приближается к определенной предельной кривой. А. Н. Колмогоров, И. Г. Петровский и Н. С. Пискунов [А. Н. Колмогоров и [др.], 1975] решили задачу (1937) о предель- ной скорости перемещения фронта волны и определили предель- ную форму фронта. В качестве функции f(C) в этой работе рас- сматривали функцию, равную нулю при С = 0иС=1и поло- жительную в промежуточных точках. Вид такой функции пока- зан на рис. 6.8, а. Сделанные относительно f(C) предположения означают, что при малых С концентрация резко нарастает за счет функции размножения f(C). При дальнейшем возрастании С функция f(C) — скорость роста концентрации С — начинает убывать, и при С, близких к единице, наступает насыщение. Изменение ви- да функции C(t) в зависимости от времени в фиксированных точках пространства г* изображено на рис. 6.9. /(0 Рис. 6.8. Возможные типы функции f(C) для уравнения (6.48)
t Рис. 6.9. Вид функции C(t) в фиксированных точках пространства Гг Продолжительность лаг-периода (времени запаздывания роста) функ- ции С(г, £) зависит от координаты г. Как только благодаря диффузии ма- лые, но конечные концентрации до- стигли точки г*, начинается бурный рост С до значений, близких к едини- це, в соответствии с функцией f(C). Таким образом, малые концентрации, которые распространя- ются за счет диффузии, увеличиваются за счет нелинейных свойств локальной системы. Взаимодействие этих двух про- цессов приводит к тому, что волна концентрации, близкой к единице, движется слева направо (см. рис. 6.9). В работе [А. Н. Колмогоров и [др.], 1975] установлено, что предельная ско- рость распространения фронта волны для функции, изображен- ной на рис. 6.8, а, равна: Хо = 2/Dp(0). (6.49) Чтобы найти предельную форму фронта распространения кон- центраций, вводят так называемую автоволновую переменную: z — г — Xt и ищут решение уравнения (6.48) в виде C(£,r)~ V(r-X£). (6.50) Предельная форма кривой плотности задается решением урав- нения £>S’+x°^+/(y)=o’ (б-51) которое обращается в нуль при z = 4-оо и в единицу при z — — оо. Такое решение V(z) всегда существует и единственно с точно- стью до преобразования z' = z + А (А — произвольная постоян- ная), не меняющего форму кривой. Автоволновое решение (6.50) обладает тем свойством, что при изменении t форма кривой, изображающей зависимость V(t), не меняется, а сама эта кривая перемещается слева напра- во со скоростью X. Можно показать, что уравнение (6.50) имеет решение, удовлетворяющее граничным условиям при z —> ±оо, лишь при X = Хо (формула (6.49)). За счет множителя д//'(0) скорость распространения волны (6.49) может быть существенно больше, чем скорость, с которой распространяются не очень ма- лые концентрации за счет диффузии. Это увеличение скорости распространения происходит вследствие действия «размножи- 298
теля», функционирование которого описывается точечной (ло- кальной) системой = /(с)- В ряде моделей возникают функции иного вида, чем изобра- женные на рис. 6.8, а. Например функция на рис. 6.8, б описы- вает случай, когда размножение частиц начинается не при лю- бой сколь угодно малой концентрации, а только при достижении некоторой достаточно большой концентрации Cq. Такая функ- ция встречается в некоторых моделях химической кинетики и моделях передачи сигналов в биологических системах, когда ре- акция начинается только в том случае, когда концентрация до- стигает порогового значения. Эта функция также применяется в теории горения, пороговое значение переменной величины здесь имеет смысл температуры возгорания. В случае когда начальное условие задано «ступенькой» (см. рис. 6.8, 5), в распределенной системе также распространяется концентрационная волна. Случай, изображенный на рис. 6.8, в, встречается в ряде задач популяционной генетики и экологии. Отрицательность функции f(C) при малых С описывает, например, эффект, свя- занный с тем, что при малой концентрации скорость размно- жения мала, так как мала частота встреч особей разного пола. Поэтому за счет смертности при малых С скорость изменения численности отрицательна. Именно такой вид функции скоро- сти роста был рассмотрен в гл. 4 (см. рис. 4.10, 5) при изучении популяций с наименьшей критической численностью. В случае, представленном на рис. 6.8, в, для распространения концентра- ционной волны постоянной амплитуды нужно еще потребовать, 1 чтобы величина J f(C)dC была положительна, в противном слу- о чае будет распространяться область малых значений концентра- ций. В важном частном случае f(C) = С (С — 1)(а — С) скорость волны, которая устанавливается при больших t, можно вычис- лить явно. Именно этот тип функции используется в уравнении странения волны оказывается равной Фитцхью — Нагумо для описания распространения нервного им- пульса. Модель этого чрезвычайно важного для биологии явле- ния будет рассмотрена в 6.4.2. В этом случае скорость распро- — 2а).
6.4.2. Задача распространения нервного импульса Основным свойством нервных клеток является способность к проведению нервного импульса — распространяющейся по нерв- ному волокну электрической волны. Свойство проведения обу- словлено тем, что элементарный объем мембраны представля- ет собой «локальный активный элемент», обладающий способ- ностью усиливать приходящий электрический сигнал. Основополагающая работа по изучению механизмов при- надлежит А. Ходчкину и А. Хаксли [A. L. Hodgkin, A. F. Huxley, 1952], которые провели эксперименты и разработали модель, описывающую распространение нервного импульса. Их исследо- вание, удостоенное Нобелевской премии (1963), было выполне- но на гигантском аксоне кальмара. Аксон представляет собой цилиндрическую трубку диаметром 50 — 70 А, вдоль внешней поверхности которой распространяется электрический импульс. В настоящее время известно, что приложение внешнего напря- жения вызывает конформационные изменения в белковых ком- плексах — каналах, осуществляющих трансмембранный перенос ионов: Na, К, Са, С1 и др. Каналы начинают «работать» — пере- носить ионы через мембрану, при этом происходит локальное из- менение потенциала, которое носит обратимый характер. В свою очередь это приводит к распространению фронта нарастания и следующего за ним фронта спада потенциала на мембране. Та- ким образом, вдоль нервного волокна «бежит» импульс потен- циала. В терминах кинетических моделей трансмембранные ионные каналы работают как «нелинейные функции» (типа функции — размножителя f(C) в уравнении Петровского —Колмогорова— Пискунова (6.48)), обеспечивающие распространение вдоль мем- браны импульса потенциала. В ответ на ступенчатое измене- ние напряжения (начальные условия) вдоль мембраны проходит одиночный нервный импульс (рис. 6.10) — потенциал действия, который длится примерно 1 мс и распространяется со скоростью от 1 до 100 м/с. Опыты с использованием фармакологических агентов позво- лили разделить протекающий поперек мембраны ток на состав- ляющие, соответствующие Na+- и К+-токам (Д[а и 7к)? которые играют основную роль в распространении импульса. Роль дру- гих ионов, в частности ионов Са2+, в модели Ходчкина — Хаксли охарактеризована током «утечки» (1ь)« Общий ток I(t) пред- ставляет собой сумму токов отдельных ионов через мембрану и 300
Рис. 6.10. Форма нервного импульса во времени. Потенциал отсчитывается от уровня потенциала покоя емкостного тока, вызванного вариациями трансмембранного по- тенциала. Таким образом, т/ х ^dV = С~й+ + at где С — емкость мембраны; Ц = /\а + /к + ^L- На основе экспериментальных данных о зависимости прово- димости мембраны для различных ионов от потенциала на мем- бране А. Ходчкин и А. Хаксли описали величины ионных токов с помощью функций, зависящих от «концентраций» некоторых гипотетических частиц, перемещающихся в мембране под дей- ствием электрического поля. Моделью Ходчкина —Хаксли на- зывается следующая система нелинейных дифференциальных уравнений: = C^+(V-EK)gKn4 + (V - £Na)4Nam3/z + +(V - Ео)до\ < IF = ~П>>~ ^пП’ (6.52) dm <1 \ a — = am(l - m) - pmm; at = a/i(l - h) - $hh, dt где n, m и h — функции потенциала и времени, определяю- щие поведение натриевого и калиевого токов; а — радиус во- локна; R — удельное сопротивление протоплазмы; С — удель- ная емкость мембраны; Е'к, Еыа> Ео, <7к, 5Na, 5о — постоянные; otn, am, OQi, Pn, Pm, Ph — заданные функции потенциала [A. Hodgkin, A. Huxley, 1952]. Модель позволяет описать основные свойства проводящего нервного волокна.
Система (6.52) слишком сложна для аналитического исследо- вания. Были предложены упрощенные модели, способные опи- сать те же свойства. Наиболее популярная из них — предло- женная независимо Р. Фитцхью [R. Fitzhugh, 1961] и Дж. Нагумо [J.S.Nagumo, S.Arimoto [et al.], 1962]. Система для локальных процессов здесь сводится к системе из двух уравнений, которую можно представить в безразмерном виде: (du „, ч — = /(«) - V + 1а-, (1Ъ dv — = bu — dt 1 ’ ^/(и) = и(а — и)(и — 1). (6.53) Здесь переменная и выполняет роль мембранного потенциа- ла У, a v — роль всех трех переменных: m,n,h в уравнениях (6.52); 1а — составляющая тока, обусловленная наличием соб- ственного постоянного потенциала (потенциала покоя) на мем- бране. В случае когда 1а = 0, расположение главных изоклин на плоскости u,v представлено на рис. 6.11, а, б. Графики на рис. 6.11, а и б отличаются значением отношения Ь/у. На рис. 6.11, а система имеет одно устойчивое решение, соответству- ющее нулевому значению потенциала, на рис. 6.11, б — три ста- ционарных решения, два из которых устойчивы (0 и S2), а третье Si — неустойчивое. С функцией вида /(и) мы неоднократно встречались, ее гра- фик изображен на рис. 6.8, в. В задаче о распространении кон- Рис. 6.11. Расположение главных изоклин системы (6.53) в случае 1а = 0 на фазовой плоскости и, v для разных значений отношения д/у: а — одно устойчивое стационарное состояние (0, 0); б — два устойчивых стаци- • онарных состояния (0 и S2) и одно неустойчивое — седло Si 302
Рис. 6.12. Фазовый портрет системы (6.53) при 1а — 0, а = 0,25; b = у = 0,002 для малых подпороговых (точка Р) и больших надпороговых (точка А) пер- воначальных отклонений потенциала и от стационарного нулевого значения. Штриховыми линиями обозначены изо- клины горизонтальных (прямая) и вер- тикальных (имеет TV-образный харак- тер) касательных [J. Rinzel, 1981] центрационной волны такой вид локальной функции источника означал, что «размножение» и «разгорание» процесса в данной точке пространства начинаются, если величина локальной кон- центрации превысит некоторое пороговое значение. Уравнения (6.53) также отражают тот факт, что бурный рост потенциала начинается лишь в случае, когда значение потенциала превысит некоторый порог (величину а). В противном случае потенциал затухает. Поясним, как в такой системе возникает «импульс». На рис. 6.12 штриховыми линиями изображены главные изо- клины системы. Зададим некоторое начальное отклонение по- тенциала и . Если это отклонение переменной и мало, а именно, меньше величины а в третьем уравнении системы (6.53) — точ- ка Р, то по короткой фазовой траектории система возвратится в состояние покоя (подпороговое возбуждение). Если же отклоне- ние переменной и велико (больше а) — точка А, то фазовая тра- ектория имеет иной характер. Изображающая точка движется по траектории ABCDO, достигает изоклины вертикальных ка- сательных (АВ), потом движется вдоль нее (ВС), затем доволь- но быстро переходит в область отрицательных значений (СВ), пересекая изоклину горизонтальных касательных, и после этого Рис. 6.13. Поведение переменных и (сплошная линия) и v (штриховая ли- ния) во времени в случае, когда фазо- вая траектория начинается в точке А [J. Rinzel, 1981] • 303
Рис. 6.14. Главные изоклины в модели Фитцхью — Нагумо (6.53) для разных значений приложенного напряжения: а, в — стационарное состояние локально устойчиво, но «возбудимо» в том смысле, что при достаточно больших отклонениях изображающая точка опи- сывает траекторию, соответствующую одиночному «импульсу» (см. рис. 6.12); б — стационарное состояние неустойчиво, возможно существование предельно- го цикла и автоколебаний состояния; г — состояние S2 неустойчиво; состояния Si и S3 — устойчивы, между ними возможны переключения вдоль изоклины вертикальных касательных (DO) возвращается в точку покоя. На рис. 6.13 изображено поведение переменных и и v во времени. Локальный элемент системы, обладающий таким типом поведения, называется возбудимым элементом. В случае когда равновесное значение потенциала на мембране не равно нулю, изоклина вертикальных касательных будет пе- ресекать ось v не в нуле (см. рис. 6.12), а в точке v = 1а. На рис. 6.14, а—г представлены возможные варианты расположе- ния главных изоклин в системе (6.53) при 1а ф 0. В распределенных системах, где имеет место диффузия, или в случае проводящего нервного волокна, когда ток распростра- няется вдоль пространственной координаты, такое локальное поведение приводит к автоволновым явлениям. Возможно рас- пространение импульса (см. рис. 6.14, аи в (возбудимаясреда)), стоячие и бегущие волны и возникновение устойчивых негомо- генных распределений концентраций (см. рис. 6.14, б (колеба- тельная неустойчивость) и г (седловая неустойчивость)). Рассмотрим пространственно распределенную систему Фитц- хью— Нагумо, которая отличается от системы (6.53) тем, что в 304
Рис. 6.15. Распространение импульса в случае надпорогового (а) и под- порогового (б) воздействия: а — при начальном отклонении потенциала больше пороговой величины и = а в системе возникает бегущий импульс, который распространяется вдоль нер- ва без изменения формы (уединенная волна). Точки А, В, С, D соответствуют точкам на фазовом портрете (см. рис. 6.12); б — при начальном отклонении по- тенциала в точке возбуждения, меньшем пороговой величины и = а (точка Р на рис. 6.12), бегущий импульс быстро затухает со временем (ti < t? < £з) ней учтено распространение потенциала вдоль кабеля (нервного волокна): ди — = /(и) - v + Ia + D—x; dt дх2 f(u) = и(а — и)(и — 1). Процесс распространения бегущего импульса в такой системе в случае надпорогового и подпорогового возбуждения изобра- жен на рис. 6.15, а, б. Изучим распространение переднего фрон- та импульса. Для упрощения качественного рассмотрения будем считать Ь и у малыми: b = zL, у = еТИ, 0 < е < 1. Это предположение соответствует распространению весьма длительных (с характерным временем е-1) импульсов, однако более подробный анализ и вычислительные эксперименты пока- зывают, что вывод относительно скорости распространения пе- реднего фронта импульса справедлив и для относительно корот- ких импульсов. При 1а = 0 система (6.54) принимает вид: ' ди dt dv .di д2и = D^ + fM-v, = e(Lit — Mv). (6.55) 305
Рассмотрим передний фронт импульса, изображенного на рис. 6.15. При е 0 из (6.55) следует, что v = const. Пред- положим, что локальная система имеет фазовый портрет, пред- ставленный на рис. 6.12, и единственное стационарное состояние (0,0). Приходим к одному уравнению для потенциала и: ди dt представляющему собой уравнение Петровского — Колмогоро- ва—Пискунова (6.48) с функцией f(u) = и(а — и)(и — 1). Распространение фронта в модели Петровского —Колмого- рова — Пискунова было рассмотрено ранее, где отмечалось так- же, что в такой системе скорость распространения переднего фронта импульса постоянна и равна |ф' — 2а). Учет мед- ленных изменений величины v на участке траектории ВС (см. рис. 6.12 и 6.15, а) приводит к следующему выражению для скорости распространения одиночного импульса [J. D. Murray, 1993]: где истир^иг) — значения переменной и в точках C,P,D (см. рис. 6.15). Добавление к модели (6.54) уравнения, описывающего транс- мембранный перенос ионов Са++, позволяет описать периоди- ческое возникновение пачек импульсов, бегущих вдоль нервного волокна [R. Е. Plant, 1981]. Модель Фитцхью — Нагумо представляет собой в некотором смысле упрощенную «модель» системы Ходчкина —Хаксли, по- зволяющую увидеть на фазовых портретах те свойства системы, которые определяют ее качественное поведение, в частности су- ществование порога возбуждения. В настоящее время получены рентгеноструктурные данные о молекулярном строении каналов, обеспечивающих «воротные» токи и осуществляющих перенос ионов Na+, К+ и Са2+ через возбудимую мембрану нервной клетки. С точки зрения этих дан- ных модель Ходчкина—Хаксли, зарекомендовавшая себя как очень хорошая эмпирическая модель, требует новой биологиче- ской интерпретации. с =
СПИСОК ЛИТЕРАТУРЫ Часть I Айвазян С. А. Исследование зависимостей / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин. — М. : Финансы и статистика, 1985. — 487 с. Айвазян С. А. Классификация и снижение размерностей / С. А. Ай- вазян, И. С. Енюков, Л. Д. Мешалкин. — М. : Финансы и статистика, 1989. - 607 с. Афифи А. Статистический анализ. Подход с использованием ЭВМ / А. Афифи, С. Эйзен. — М. : Мир, 1982. — 488 с. Благовещенский Ю. Н. Непараметрические методы в почвенных ис- следованиях / Ю. Н. Благовещенский, В. П. Самсонова, Е. А. Дмитри- ев. — М. : Наука, 1987. — 98 с. Бокс Дж. Анализ временных рядов. Прогноз и управление / Дж. Бокс, Г. Дженкинс. — М.: Мир, Вып. 1, 1974. — 405 с. Большее Л. Н. Таблицы математической статистики / Л. Н. Боль- шее, Н. В. Смирнов. — М. : Наука, 1983. — 416 с. Браунли К. А. Статистическая теория и методология в науке и тех- нике. — М. : Наука, 1977. — 407 с. Боровков А. А. Математическая статистика. — Новосибирск : Нау- ка, 1997. - 772 с. Глотов Н. В. Биометрия / Н. В. Глотов и [др.]. — Л. : Изд-во ЛГУ, 1982. - 264 с. Гмурман В. Е. Теория вероятностей и математическая статисти- ка. — М. : Юрайт, 2005. — 479 с. Гнеденко Б. В. Элементарное введение в теорию вероятностей / Б. В. Гнеденко, А. Я. Хинчин. — М. : Наука, 1982. Дрейпер Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. — М. : Диалектика, 2007. — 912 с. Ивашов-Мусатов О. С. Теория вероятностей и математическая ста- тистика. — М. : Фима, 2003. — 224 с. Кендалл М. Дж. Теория распределений / М. Дж. Кендалл, А. Стью- арт. — М. : Наука, 1966. — 586 с. Кендалл М.Дж. Статистические выводы и связи / М. Дж. Кен- далл, А. Стьюарт. — М. : Наука, 1973. — 892 с. Кендалл М. Дж. Многомерный статистический анализ и временные ряды / М. Дж. Кендалл, А. Стьюарт. — М. : Наука, 1976. — 734 с. Колмогоров А.Н. Основные понятия теории вероятностей. — М. : Наука, 1974. - 119 с. 307
Компьютерная биометрика / под ред. В. Н. Носова. — М. : Изд-во Моск, ун-та, 1990. — 232 с. Коршунов Д. А. Сборник задач и упражнений по математической статистике / Д. А. Коршунов, Н. И. Чернова. — Новосибирск : Изд-во Ин-та математики, 2004. — 128 с. Крамер Г. Математические методы статистики. — М. : Мир, 1975. — 648 с. Макаров А. А. Анализ данных на компьютере / А. А. Макаров, Ю. Н. Тюрин. - М. : ИНФРА-М, 2003. - 544 с. Манита А.Д. Теория вероятностей и математическая статисти- ка. — М. : Изд-во Моск, ун-та, 2001. — 120 с. Мешалкин Л. Д. Сборник задач по теории вероятностей. — М.: Изд- во Моск, ун-та, 1963. — 154 с. Мостеллер Ф. Пятьдесят занимательных вероятностных задач с ре- шениями. — М. : Наука, 1971. — 103 с. Налимов В. В. Логические основания планирования эксперимента / В. В. Налимов, Т. И. Голикова. — М. : Металлургия, 1981. — 151с. Тутубалин В. Н. Теория вероятностей и случайных процессов. — М. : Изд-во Моск, ун-та, 1992. — 400 с. Тюрин Ю. Н. Непараметрические методы статистики. — М. : Зна- ние, 1978. — 64 с. Феллер В. Введение в теорию вероятностей и ее приложения: в 2 т. Т. 1. - М. : Мир, 1984. - 528 с. Фишер Р. А. Статистические методы для исследователей. — М. : Госстатиздат, 1958. — 267 с. Хан Г. Статистические модели в инженерных задачах / Г. Хан, С. Шапиро. — М. : Мир, 1969. — 396 с. Харман Г. Современный факторный анализ. — М. : Статистика, 1972. - 486 с. Холлендер М. Непараметрические методы статистики / М. Холлен- дер, Д. А. Вульф. — М. : Финансы и статистика, 1983. — 518 с. Ченсун К. Л. Элементарный курс теории вероятностей / К. Л. Чжун, Ф. Аитсахлиа. — М. : Бином, 2007. — 455 с. Шеффе Г. Дисперсионный анализ. — М. : Наука, 1980. — 512 с. Lilliefors Н. W. The Kolmogorov — Smirnov Test for Normality with Mean and Variance Unknown // Journal of the American Statical Associ- ation, 1967. - V. 62. - P. 399-402. Sokal R. R. 1995. Biometry / R. R. Sokal, F. J. Rohlf. — N.Y. : W. H. Freeman Co. — 887 p. Teriokhin A. T. On the power of some binomial modifications of the Bonferroni multiple test / A. T. Teriokhin, T.de Meeus, J.-F. Guegan // Journal of General Biology, 2007. — V. 68. P. 332 — 340. Zar J. H. Biostatistical Analysis. Upper Saddle River, N.J. : Prentice- Hall, Inc., 1999. - 998 p. 308
Часть II Учебные пособия и монографии Анищенко В. С. Нелинейная динамика хаотических и стохастиче- ских систем / В. С. Анищенко, Т. Е. Вадивасова, В. В. Астахов. — Сара- тов : Изд-во Саратовского гос. ун-та, 1999. — 368 с. Базыкин А.Д. Нелинейная динамика взаимодействующих популя- ций. — М.-Ижевск : Изд-во ин-та компьютерных исследований, 2003. — 368 с. Бигон М. Экология. Особи, популяции и сообщества / М. Бигон, Дж. Харпер, К.Таусенд. — М. : Мир, 1989. — Т. 1. — 668 с., Т. 2. — 478 с. Братусь А. С. Математические модели экологии и динамические системы с непрерывным временем / А. С. Братусь, А. С. Новожилов. — М. : Изд-во Моск, ун-та, 2004. — 242 с. Васильев В. А. Автоволновые процессы / В. А. Васильев, Ю. М. Ро- мановский, В. А. Яхно. — М. : Наука, 1987. — 238 с. Владимиров В. С. Уравнения математической физики. — М. : Нау- ка, 1981. Иваницкий Г. Р. Математическая биофизика клетки / Г. Р. Иваниц- кий, В. И. Кринский, Е. Е. Сельков. — М. : Наука, 1978. — 310 с. Лоскутов А.Ю. Введение в синергетику / А. Ю. Лоскутов, А. С. Михайлов. — М. : Наука, 1990. — 272 с. Николис Г. Самоорганизация в неравновесных системах. От дисси- пативных структур к упорядоченности через флуктуации / Г. Николис, И. Р. Пригожин. — М. : Мир, 1979. — 512 с. Ризниченко Г. Ю. Биофизическая динамика продукционных про- цессов / Г. Ю. Ризниченко, А. Б. Рубин. — М.-Ижевск : Изд-во инсти- тута компьютерных исследований, 2004. — 464 с. Ризниченко Г. Ю. Лекции по математическим моделям в биоло- гии. — М.-Ижевск : Изд-во РХД, 2002. — 232 с. Ризниченко Г. Ю. Математические модели биологических продук- ционных процессов / Г. Ю. Ризниченко, А. Б. Рубин. — М. : Изд-во Моск, ун-та, 1993. — 302 с. Романовский Ю. М. Математическая биофизика / Ю. М. Романов- ский, Н. В. Степанова, Д. С. Чернавский. — М. : Наука, 1984. — 344 с. Романовский Ю. М. Математическое моделирование в биофизике. Введение в теоретическую биофизику / Ю. М. Романовский, Н. В. Сте- панова, Д. С. Чернавский. — М.-Ижевск : Изд-во института компью- терных исследований, 2004. — 472 с. Рубин А. Б. Биофизика. — М. : Изд-во «Книжный Дом Универси- тет», 1999. — 448 с. Рубин А. Б. Кинетика биологических процессов / А. Б. Рубин, Н. Ф. Пытьева, Г. Ю, Ризниченко. — М. : Изд-во Моск, ун-та, 1988. — 304 с. 309
Свирежев Ю. М. Устойчивость биологических сообществ / Ю. М. Свирежев, Д. О. Логофет. — М. : Наука, 1978. — 352 с. Тихонов А. Н. Уравнения математической физики / А. Н. Тихонов, А. А. Самарский. — М. : Наука, 1999. —768 с. Чернавский Д. С. Синергетика и информация. Динамическая тео- рия информации. — М. : УРСС, 2004. — 288 с. Шнолъ С. Э. Физико-химические факторы биологической эволю- ции. — М. : Наука, 1979. — 262 с. Lotka A. J. Elements of Physical biology. — Baltimore: Williams and Wilkins, 1925. Malthus T. R. An essay on the principal of Population, 1798; Penguin Books, 1970. Murray J. D. Mathematical biology. — I: An intriduction. — Berlin: Springer, 2002. — 568 p. Volterra V. Lecons sur la Theorie Mathematique de la Lutte pour la Vie. — Paris, 1931. Оригинальные статьи Апонина E. А. Анализ сложного динамического поведения в моде- ли хищник —две жертвы / Е. А. Апонина, Ю. М.Апонин, А.Д. Бавы- кин / / Проблемы экологического мониторинга и моделирования эко- систем. — Ленинград : Гидрометеоиздат, 1982. — Т. 5. — С. 163—180. Колмогоров А. Н. Качественное изучение математических моделей динамики популяций // Вопросы кибернетики. — М., 1972. — № 55. Колмогоров А. Н. Исследование уравнения диффузии, соединенной с возрастанием вещества, и его применение к одной биологической про- блеме / А. Н. Колмогоров, И. Г. Петровский, Н. С. Пискунов // Бюлл. МГУ — Сер. А. Математика и механика, 1937 (Вопросы кибернети- ки). - М., 1975. - Вып. 12. - С. 3-30. Тихонов А.Н. Системы дифференциальных уравнений, содержа- щие малые параметры при производных // Математический сбор- ник. - М., 1952. - № 3. - Т. 32. Fitzhugh R. Impulses and physiological states in theoretical model of nerve membrane // Biophys J., 1961. — V. 1. — P. 445 — 466. Higgins J. A. A chemical mechanism for oscillations in glicolitic inter- mediates in yeast cells // Proc. Nat. Acad. Sci. USA, 1954. — V. 51. Higgins J. A. The theory of oscillating reactions // Ing. Chem., 1967. — № 5. - V. 9. Hodgkin A. L. A quantitative description of membrane current and its application to conduction and excitation in nurve / A. L. Hodgkin, A. F. Huxley //J. Physiol. — London, 1952. — V. 117. — P. 500 — 544. Lorenz E. N. Deterministic non-periodic flow //J. Atmos. Sci., 1963. — V. 20. -P. 131-141. May R. M. When two and two make four: nonlinear phenomena in ecology // Proc. R. Soc. - London, 1986. - № 1252. - V. B228. - P. 241 - 268. 310
Michaelis L. Die Kinetik der Investinwirkung / L. Michaelis, M. I. Men- ten // Biochem. Z., 1913. - V. 49. - P. 333-369. Moran H. F. H. Some remarks on animal population dynamics // Bio- metrics, 1950. - V. 6. - P. 250-258. Nagumo J. S. An active pulse transmission line simulating nerve axon / J.S.Nagumo, S.Arimoto, S.Yoshizava // Proc. IRE, 1962. — V. 50. — P. 2061-2071. Plant R. E. Bifurcation and resonance in a model for bursting nerve cells // J. Math. Biol., 1981. - V. 11. - P. 15-32. Prigogene I. R. Simmetry breaking instabilities in dissipative systems / I. R. Prigogene, R. Lefever //J. Chem. Phys., 1968. — N. 48. — P. 1665 — 1700. Ricker W. E. Stock and recruitment //J. Fish. Res. Rd. Can., 1954. — V. 11.-P. 559-623. 'Rinzel J. Models in neurobiology // In: Nonlinear Phenomena in Phy- sics and Biology. N.Y. Plenum Press, 1981. — P. 345 — 367. Turing A. M. The chemical basis of the morphogenesis // Proc.Roy.Soc. B, 1952. - V. 237. - P. 37-71. Verhulst P. F. Notice sur la loi que la population suit dans son accro- issement // Corr. Math, et Phys., 1838. — V. 10. — P. 113—121. Volterra V. Variozionie fluttuasionie del numero d’individui in specie animali conviventi // Mem. Acad. Lincei., 1926. — V. 2. — P. 31 —113.
ОГЛАВЛЕНИЕ Предисловие.............................................. 3 Введение................................................. 4 Часть I Статистический анализ биологических данных Глава 1. Основы теории вероятностей...................... 6 1.1. Случайные события и их вероятности.................. 7 1.1.1. Пространство элементарных событий............. 7 1.1.2. Операции над событиями........................ 8 1.1.3. Вероятности событий........................... 9 1.1.4. Модель равновероятных элементарных событий....11 1.1.5. Геометрическая модель.........................13 1.1.6. Условная вероятность и независимость........ 14 1.1.7. Формула полной вероятности и формула Байеса...16 1.1.8. Формула Бернулли..............................19 1.2. Случайные величины и их распределения...............20 1.2.1. Функция распределения случайной величины......21 1.2.2. Дискретные случайные величины.................21 1.2.3. Непрерывные случайные величины................25 1.2.4. Нормальное и связанные с ним распределения....28 1.2.5. Характеристики распределений..................32 1.3. Многомерные случайные величины......................41 1.3.1. Дискретные многомерные случайные величины.....42 1.3.2. Непрерывные многомерные случайные величины....43 Глава 2. Основы математической статистики................48 2.1. Случайная выборка и ее описание ....................49 2.2. Статистическое оценивание...........................56 2.2.1. Точечное статистическое оценивание............56 2.2.2. Интервальное статистическое оценивание........62 2.3. Статистическая проверка гипотез.....................71 2.3.1. Логика проверки статистических гипотез........71 2.3.2. Проверка гипотез о математических ожиданиях...73 2.3.3. Проверка гипотез о дисперсиях.................81
2.3.4. Сравнение параметров двух биномиальных распределений......................................83 2.3.5. Сравнение параметров двух пуассоновских распределений......................................83 2.3.6. Проверка гипотезы о равенстве заданному числу коэффициента корреляции............................84 2.3.7. Критерии согласия............................85 2.3.8. Непараметрические критерии...................92 Глава 3. Анализ многомерных данных.....................100 3.1. Классификация методов анализа многомерных данных . . . 100 3.2. Матричная алгебра.................................104 3.3. Регрессионный анализ..............................108 3.3.1. Множественная линейная регрессия..............ПО 3.3.2. Множественный и частный коэффициенты корреляции........................................118 3.3.3. Пошаговая регрессия........................120 3.3.4. Нелинейная регрессия........................122 3.3.5. Логистическая регрессия.....................123 3.4. Дисперсионный анализ.............................124 3.4.1. Однофакторный дисперсионный анализ..........126 3.4.2. Двухфакторный дисперсионный анализ..........134 3.4.3. Смешанные модели дисперсионного анализа.....139 3.4.4. Непараметрические методы анализа связи между количественной и качественными переменными .... 146 3.5. Кластерный анализ................................151 3.6. Факторный анализ.................................157 3.7. Дискриминантный анализ...........................167 Часть II Моделирование динамики биологических процессов Глава 4. Модели, описываемые одним уравнением ... 174 4.1. Основные понятия...................................174 4.2. Исследование уравнения в окрестности стационарного состояния .............................................177 4.2.1. Исследование устойчивости стационарного состояния методом линеаризации................................177 4.2.2. Модель роста колонии микроорганизмов.........179 4.2.3. Модель перехода вещества в раствор...........180 4.3. Непрерывные модели популяций.......................181 4.3.1. Уравнение экспоненциального роста............181 4.3.2. Ограниченный рост............................183 4.3.3. Модель популяции с наименьшей критической численностью........................................187
4.4. Дискретные модели популяций........................190 4.4.1. Модели популяций с неперекрывающимися поколениями.........................................191 4.4.2. Диаграмма Ламерея............................192 4.4.3. Понятия равновесия и его устойчивости для разностных уравнений...........................................193 4.4.4. Циклы и динамический хаос....................195 4.5. Вероятностные модели популяций ....................196 Глава 5. Модели, описываемые системой дифференциальных уравнений............................ 199 5.1. Основные понятия...................................199 5.1.1. Фазовая плоскость и фазовый портрет..........199 5.1.2. Метод изоклин................................200 5.1.3. Устойчивость стационарного состояния.........202 5.2. Исследование систем двух линейных уравнений........203 5.2.1. Характеристическое уравнение.................203 5.2.2. Корни Xi, ^2 действительны и одного знака....205 5.2.3. Корни К1, ^2 действительны и разных знаков...206 5.2.4. Корни Xi, ^2 комплексные сопряженные.........208 5.2.5. Бифуркационная диаграмма.....................211 5.3. Системы двух нелинейных дифференциальных уравнений..............................................213 5.3.1. Метод Ляпунова линеаризации системы в окрестности стационарного состояния.............................213 5.3.2. Кинетические уравнения Лотки.................216 5.3.3. Модель Вольтерра.............................219 5.4. Проблема быстрых и медленных переменных............225 5.4.1. Иерархия времен. Метод квазистационарных концентраций........................................225 5.4.2. Теорема Тихонова.............................227 5.4.3. Фермент-субстратная реакция Михаэлиса—Ментен . . 230 5.5. Мультистационарность...............................235 5.5.1. Фазовый портрет мультистационарной системы .... 235 5.5.2. Типы переключения триггера...................237 5.5.3. Отбор одного из равноправных видов...........239 5.6. Колебания в биологических системах ................244 5.6.1. Автоколебания и предельные циклы.............244 5.6.2. Устойчивость предельных циклов...............246 5.6.3. Брюсселятор..................................247 5.6.4. Колебания в гликолизе........................249 5.7. Динамический хаос..................................251 5.7.1. Система Лоренца. Детерминированный хаос......252 5.7.2. Линейный анализ устойчивости траекторий......255 5.7.3. Диссипативные системы........................256 5.7.4. Динамический хаос в сообществе из трех видов.261
Глава 6. Распределенные дифференциальные модели . 263 6.1. Уравнение реакция —диффузия .......................263 6.1.1. Активные кинетические среды в живых системах . . . 263 6.1.2. Уравнение диффузии...........................264 6.1.3. Начальные и граничные (краевые) условия......268 6.2. Решение уравнения диффузии ........................270 6.2.1. Общий ход решения............................270 6.2.2. Решение однородного уравнения................271 6.2.3. Зависимость решений от начальных условий.....275 6.2.4. Решение неоднородного уравнения диффузии с нулевым начальным условием и нулевыми краевыми условиями......................................277 6.2.5. Общая краевая задача.........................279 6.2.6. Устойчивость гомогенных стационарных состояний нелинейных систем...................................280 6.2.7. Распределенная модель популяции с наименьшей критической численностью............................283 6.3. Система двух уравнений реакция —диффузия ..........285 6.3.1. Устойчивость однородных стационарных решений . . . 285 6.3.2. Распределенный брюсселятор...................292 6.3.3. Локализованные диссипативные структуры.......294 6.4. Распространение фронтов, импульсов и волн..........296 6.4.1. Распространение волны в системах с диффузией .... 296 6.4.2. Задача распространения нервного импульса.....300 Список литературы.......................................307