/
Текст
ЛЕНИНГРАДСКИЙ ОРДЕНА ЛЕНИНА
И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени А. А. ЖДАНОВА
И. П. АШМАРИН, Н. Н. ВАСИЛЬЕВ, В. А. АМБРОСОВ
БЫСТРЫЕ МЕТОДЫ
СТАТИСТИЧЕСКОЙ
ОБРАБОТКИ
И ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТОВ
Издание второе, 'исправленное
ИЗДАТЕЛЬСТВО ЛЕНИНГРАДСКОГО УНИВЕРСИТЕТА
Ленинград • 1975
Печатается по постановлению
Редакционно-издательского совета
Ленинградского университета
УДК 311+65.012.21
Ашмарин И. П„ Васильев Н. Н., Амбро-
с о в В. А. Быстрые методы статистической обра-
ботки и планирование экспериментов. Л., Изд-во
Ленингр. ун-та, 1974, 1—76.
Многие быстрые и в то же время достаточно
строгие способы обработки опытных данных пока
еще мало известны широкому кругу эксперимента-
торов, хотя при их использовании конечная цель
статистического анализа достигается с минимальной
затратой сил. Настоящее руководство заключает
в себе описание ряда таких способов и условий их
применения. Излагаются также методы планирова-
ния эксперимента, в том числе относительно быст-
рые, и рассматриваются общие вопросы «стратегии»
планирования сложных экспериментов.
Издание рассчитано на биологов, биохимиков,
химиков и других специалистов естественных наук,
имеющих дело с экспериментом и сталкивающихся
с необходимостью быстрой обработки опытных дан-
ных.
Ил. — 2, табл. — 14, библиогр. — 22 назв.
21004—041
076(02)—75 178—74
© Издательство Ле
университета, 19
Ашмарин Игорь Петрович, Васильев Николай Николаевич,
Амбрасов Валерий Антонович,
Быстрые методы статистической обработки
и планирование экспериментов
Шктор М. Николаева Техн, редактор Г. С. Орлова
Корректоры Т. Г, Павлова, Н. М. Каплинская
ВО £ МЯЙбрр 18/1 1974 г. Подписано к печати 24/Ш 1975 г. Формат бумаги
УМ, т»п. 3. Печ. л. 5. Уч.-изд. л. 4,8. Бум. л. 2,5. Тираж 14 400 экз.
Заказ 182. Цена 48 коп.
Издательство ЛГУ им. А. А. Жданова
199164. Ленинград, Университетская наб., 7/9.
пография № 2 Ленуприздата. 192104, Ленинград, Литейный пр., 55.
ВВЕДЕНИЕ
Когда говорят об экспрессных, быстрых методах, нередко
Думают о методах заведомо нестрогих, связанных с более или
^енее произвольными допущениями. Полагают, что без этого,
$ак правило, нельзя обеспечить быстроту метода. Однако сле-
дует подчеркнуть, что существует большое число весьма не-
сложных по технике расчета и в то же время достаточно стро-
гих методов статистической обработки. Единственное, чем
иногда (но отнюдь не всегда) приходится поступаться, — это
'размахом так называемых доверительных интервалов, т. е. ве-
рЬятных границ, в которых заключено истинное значение изме-
ряемой величины. Они определяются с некоторым запасом по
сравнению с классическими методами, Опыт показывает, что
в большинстве случаев такая «перестраховка» не мешает дости-
жению цели. И лишь в относительно немногих, особенно труд-
ных или дискутабельных, ситуациях приходится пользоваться
технически сложными методами.
В настоящем руководстве мы стремились представить, во-
первых, экспрессные методы, применяя которые читатель может
не опасаться недостаточно строгого их обоснования (во многих
ситуациях они могут полностью заменить традиционные), и,
во-вторых, некоторые экспрессные приемы для предваритель-
ного анализа, которые можно использовать для решения во-
проса о целесообразности применения в данном случае гро-
моздкого традиционного метода.
На первый взгляд, в век широкого внедрения электронно-
вычислительной техники забота о популяризации экспрессных
методов статистической обработки представляется неактуаль-
ной. Это глубокое заблуждение. Многие из высокоэффективных
экспрессных методов требуют для выполнения расчета гораздо
меньше времени, чем нужно даже для акта передачи данных
на машину, не говоря уже о случаях, для которых надо гото-
вить специальную программу. Особенно очевидно это тогда,
когда количество первичных данных невелико, — ситуация,
очень часто встречающаяся в биологических экспериментах.
3
Не надо также переоценивать возможность исследователя
(даже в очень благоприятных условиях) воспользоваться
в любой момент услугами ЭВМ. Наконец, некритическое при-
менение ЭВМ внушает иногда своеобразные иллюзии объек-
тивности и точности, хотя нередко метод, заложенный в про-
грамму машинного расчета, менее корректен, чем экспрессный
метод, избираемый и реализуемый самим исследователем.
Важно также, что, выбирая метод, сам исследователь лишний
раз задумывается над правильностью выбора.
В основу большинства экспрессных методов, излагаемых
ниже, положены либо оценки размаха варьирования, либо
непараметрические критерии. К сожалению, именно биологи
мало знакомы с этой группой методов, хотя они особенно по-
лезны в биологических исследованиях. Заметим, что мы не
вносили в излагаемые методы сколь-нибудь существенных
нововведений, обратив главное внимание на отбор наиболее
практичных из них, а также на удобную конструкцию расчет-
ных таблиц и на рациональную последовательность их приме-
нения.
Нужно особо подчеркнуть важность правильной последова-
тельности применения методов, основанных на оценках раз-
маха варьирования. В доступных читателю-биологу пособиях,
где излагаются эти методы, обычно не уделяется должного
внимания последовательности их применения, от которой в зна-
чительной мере зависит их эффективность и строгость. Поэтому
в настоящем руководстве мы подчеркиваем первоочередность
таких операций, как исключение так называемых выскакиваю-
щих значений и сопоставление размахов вариант в совокупно-
стях, средние показатели которых экспериментатор намере-
вается сравнить. Нарушение рекомендуемой последовательности
может напрасно дискредитировать излагаемые методы.
Быстрота обработки экспериментальных данных и быстрота
выполнения исследования в целом тесно связаны с проблемой
рационального планирования эксперимента. Трудность трак-
товки и статистической обработки данных может быть значи-
тельно уменьшена при соответствующем планировании опытов,
не говоря уже об экономии сил и средств, затрачиваемых на
эксперимент как таковой.
Математические методы планирования — область, широко
разрабатываемая в последние годы. Однако и здесь нередко
упускают из виду эффективные простейшие принципы плани-
рования опытов, а относительно сложные приемы применяют
иногда в биологических исследованиях там, где использование
их дает, в сущности, иллюзорную выгоду. Поэтому в соответ-
ствующем разделе предлагаемого руководства мы стремились
изложить ряд общих принципов планирования биологических
экспериментов и описать простейшие способы наряду с отдель-
ными более сложными методами.
4
торой раздел имеет еще одну особенность, существенно
дающую его от предыдущего. В первом разделе не изла-
ся традиционные методы статистической обработки дан-
поск:ольку они уже многократно описывались в весьма
©образных по сложности руководствах. Что же касается
дов планирования эксперимента, то и традиционные, и быст-
способы в отечественной литературе представлены пока
ь немногочисленными публикациями, как правило, недо-
гочно популярными. Поэтому во втором разделе излагаются
[только быстрые, но и традиционные приемы математического
Ьнирования эксперимента.
«Ограниченный объем руководства побудил авторов в отдель-
случаях, когда можно дать рекомендации в отношении
(едоступной литературы и таблиц, не приводить разверну-
) изложения некоторых методов.
Настоящее руководство, хотя и рассчитано на широкий круг
химиков, микробиологов и биологов других специальностей,
дполаг'ает все же, что читатель имеет первичное представ-
ав о методах статистической обработки экспериментальных
дых, по крайней мере в пределах общих разделов одного
яаибол ее доступных пособий (Фишер, 1958; Каминский, 1959;
марин» Воробьев, 1962; Бейли, 1962; Урбах, 1963, 1964; Ро-
бкий, 1S67; Плохинский, .1970, и др.).
Первы й раздел руководства написан И. П. Ашмариным,
рой — Н. Н. Васильевым и В. А. Амбросовым. Подраздел
1енка «редней и варьирования при измерениях с помощью
блонов » первого раздела написан Н. П. Ховановым.
Основные условные обозначения
F — отношение оценок дисперсии
f — число степеней свободы
И — средняя гармоническая
1Р — абсолютное значение разности между средней и погра-
ничным значением доверительного интервала
Me — медиана
Мо — мода
п — объем выборки, число единичных определений, опытов
Р — доля вариант при альтернативном распределении
р — вероятность
г — коэффициент корреляции
6’ — оценка стандартного отклонения (квадратичного откло-
нения, средней квадратичной ошибки)
tp — критерий Стьюдента (для уровня надежности р)
U — наименьшее число инверсий, критерий Мэнн-Уитнея
Wn — размах варьирования в выборке, содержащей п вариант
Xi — значения гй варианты
х — средняя арифметическая
Хгеом — средняя геометрическая
I. БЫСТРЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ
ОПЫТНЫХ ДАННЫХ
1. Вычисление средних величин, исключение так называемых
выскакивающих вариант
Независимо от того, какой вид средней избран для харак-
теристики экспериментальных данных, необходима определен-
ная предварительная техническая обработка последних для
ускорения дальнейших расчетов и предупреждения ошибок.
Сколь ни элементарна эта обработка, она заслуживает упо-<
минания.
Так, если исходные данные — результаты отдельных опытов,
Измерений (мы будем называть их вариантами)—представ-
лены дробными числами, то желательно умножить их на ка-
кую-то постоянную величину, чтобы оперировать далее только
с целыми. Если многозначные варианты различаются лишь
в одном или нескольких последних знаках, то целесообразно
отбросить постоянную часть вариант. Разумеется, после завер-
шения расчета средней нельзя забывать о необходимости про-
извести с полученным значением обратные операции. Для
излагаемых далее методов важно отметить и указать номера
наибольшей и наименьшей вариант, а также одной-двух бли-
жайших к ним вариант. Если обрабатываемая совокупность
вариант невелика, то желательно расположить их в порядке
возрастающих значений и пронумеровать все варианты. По-
следняя операция становится обязательной, если предпола-
гается расчет медианы. Пример такой подготовки данных пред-
ставлен ниже (пример 1).
Пример 1. Предварительная обработка данных
Коэффициенты специфичности препаратов ДНК из Е. coli
Варианта № 1 .. .. 1,08 Варианта № 5 .. . 1,31
» № 2 .. . 1,04 » № 6 .. . 1,09
» № 3 .. . 1,04 » № 7 .. . 1,01
№ 4 .. . 1,12 » № 8 .. . 1,06
Та же совокупность после предварительной обработки данных перед усред-
нением (все варианты умножены на 100, затем уменьшены на 100 и ран-
жированы) выглядит так:
11» 4з, 64, 85, 9б, 12?, 31в>
где индекс — номер в порядке возрастающих значений.
7
Выбор вида вычисляемой средней величины является важ-
ной самостоятельной задачей, рассмотрение которой выходит
за рамки настоящего руководства. Напомним лишь, что, по-
мимо чаще всего применяемой средней арифметической, в прак-
тике биохимических, микробиологических и физиологических
исследований нередко используются средняя геометрическая,
средняя гармоническая и медиана. Средняя геометрическая
наиболее объективно характеризует совокупности данных, яв-
ляющихся результатами определений на животных активности
различных микроорганизмов, токсинов и вакцин. Средняя гар-
моническая часто используется при осреднении сроков реакции
животных на воздействие тех же агентов. Что касается медианы,
то, хотя она используется в общем реже средней арифметиче-
ской, ее следует рассматривать как наиболее универсальный
вид средней. Когда применение средней арифметической не
оправдано и в то же время нельзя a priori предписать исполь-
зование другого вида средней, медиана оказывается, как пра-.
вило, более объективным показателем. Это очень важно в био-
логическом эксперименте, в котором закономерность варьиро-
вания данных во многих случаях неизвестна заранее. Кроме
того, медиана пригодна и для характеристики такой совокуп-
ности, в которой крайние варианты представлены теми или
иными полуколичественными данными (например, если в опыте
не найдено точное значение, а лишь установлено, что крайняя
варианта больше предшествующей). Однако медиана менее
выгодна, чем многие другие средние, в качестве основы для
ряда более сложных статистических операций.
Переходя к технике расчета средних, заметим, что самым
простым и быстрым является расчет именно медианы (Me).
Собственно, после описанной выше подготовки данных никаких
дополнительных вычислений не требуется. Если число вариант
нечетное, медианой является варианта, делящая ряд пополам.
При четном числе вариант медиана — средняя арифметическая
двух вариант, ближайших к середине ряда. _
Вычисление средней арифметической (х) — операция не-
сложная, хотя иногда и громоздкая. Она существенно облег-
чается простейшей вычислительной техникой — суммирующей и
логарифмической линейками, арифмометрами и т. п.
Следует, однако, подчеркнуть, что прежде чем установить
значение средней, необходимо обязательно проверить совокуп-
ность на присутствие так называемых выскакивающих вариант.
Они являются, как правило, следствием какой-либо грубой
ошибки в проведении данного измерения, оставшейся не заме-
ченной экспериментатором. Методы, обычно применяемые для
выявления выскакивающих значений, довольно громоздки. Од-
нако существует очень быстрый способ, позволяющий решать
эту задачу с достаточной строгостью. Он основан на оценке
различий крайних вариант данной совокупности.
8
Проиллюстрируем его применение на примере 1. Просмотр
упорядоченного ряда позволяет предположить, что выскаки-
вающей является варианта № 8, или, обозначая далее варианты
^ерез Xi и указывая их номера в виде индекса, х8. Рассчитаем
Теперь отношение
т. е> =обзз
хп — Ху ’ хь— Ху 31—1 ’
<де в числителе — разность между «подозреваемой» выскаки-
вающей крайней вариантой и вариантой, которая ей предше-
Шгвуёт, *а в знаменателе — разность между наибольшей и наи-
Дуньшей вариантами ряда. Полученную величину оценим с по-
Жицью табл. 1 приложения. Там для числа вариант п = 8 и
Шррвня достоверности оценки 99% указано пограничное значе-
Wie отношения (хп — хп-\)](хп— xj =0,590. Поскольку вычис-
IKfeHHoe нами значение больше табличного, мы имеем право
Читать варианту № 8 выскакивающей и исключить ее из всех
Доследующих операций по статистической обработке приведеп-
^4 Совокупности.
В данном примере вывод о правомочности исключения ва-
рранты № 8 как выскакивающей сделан с высоким уровнем
'Достоверности: вероятность того, что этот вывод правилен,
^вна. или превышает 99%. Однако возможны случаи, когда
^йденное в опыте отношение (хп — хп-Х)/(х)г — Х\) окажется
||®жду пограничными значениями для уровней достоверности
и 95%. Тогда мы не имеем права на'безоговорочный вывод
(исключении крайней варианты. Можно лишь отметить, что.
дика вероятность грубой ошибки при получении этой вари-
ты. В таком случае на последующих этапах наиболее строгой
актовкой, хотя и связанной с дополнительными затратами
уда, будет рассмотрение результатов обработки как совокуп-
сти с исключенной крайней вариантой, так и всей исходной
вокупности. Нередко в соответствии со смыслом экспери-
*нта такая двойственность оценки не мешает достижению
ли исследования. В противном случае необходим дополни-
тельный эксперимент. Наконец, если найденное в опыте значе-
ЙЖ (хп — хп-\)1(хп — %1) меньше пограничного уровня досто-
верности 95%, то предположение о том, что' крайняя варианта
ЭДожет быть исключена, отвергается безоговорочно.
ЛлТак же точно можно проверить и предположение о том, что
^ускакивающей является наименьшая варианта. При этом сле-
ДУ^т рассчитать аналогичное описанному выше отношение
Хо — Xi Х9 Xi 4— 1 м ,
— ----—, т. е. —2—1 =0,1.
хп — Ху’ xs — Xy 31 — 1 ’
Дйгко убедиться, что в этом случае величина отношения на-
Шого ниже табличного значения для п = 8 даже для уровня
Дретоверности 95% и, следовательно, нет оснований для исклю-
Wbw наименьшей варианты.
9
Читатель, по-видимому, обратил внимание на то, что
в табл. 1 приложения представлены пограничные значения и
для двух других приемов оценки выскакивающих вариант. Они
отличаются от описанного не в принципе, а некоторыми осо-
бенностями, повышающими продуктивность метода в отдельных
ситуациях. Так, отношение (хп — хп_\)1(хп— х2) позволяет
эффективнее выявлять выскакивающую наибольшую варианту
в условиях, когда предполагаются выскакивающими сразу две
меньшая варианта тоже является выскакивающей. Отношение
же (хп — хп_2)/(хп — Xi) позволяет эффективнее решать задачу
в условиях, когда предполагаются выскакивающими сразу две
наибольшие варианты. Иногда возникает положение, когда для
проверяемого ряда вычислены три описанных вида отношений
и лишь одно из них превышает пограничное для уровня досто-
верности 99%. Следует подчеркнуть, что это уже дает право
на безоговорочное исключение крайней варианты. Неэффектив-
ность двух других отношений показывает лишь, что в данной
ситуации их «мощность» оказалась недостаточной.
Выполнив операции по исключению выскакивающих значе-
ний, можно рассчитать среднюю арифметическую. Мы полагаем
излишним приводить общеизвестную формулу для ее расчета.
Вычисление средней геометрической (хГеом) представляется
немногим более сложным, чем расчет средней арифметической,
что обусловлено введением дополнительной операции по обра-
ботке вариант — логарифмирования каждой из них. Следует
подчеркнуть, что в этом случае описанные выше технические
операции по подготовке совокупности к расчету средних нужно
проводить только после логарифмирования. Дальнейшие опе-
рации состоят в проверке наличия выскакивающих значений
методом, который изложен выше, и затем в вычислении сред-
ней арифметической логарифмов вариант (%ig). Последняя равна
логарифму средней геометрической. Поэтому в заключение
средняя геометрическая вычисляется как антилогарифм Xjg.
Ниже приведен пример расчета (пример 2 — все данные в нем
расположены в порядке возрастающих значений). Пример
подобран так, что наряду с вычислением средней геометриче-
ской иллюстрируется случай, когда для операции исключения
выскакивающей варианты наиболее эффективно отношение
(хп — хп-2) /(хп — Xi). Как видно, только это отношение пре-
вышает табличное значение для м = 9 и, следовательно, дает
право для исключения х9 как выскакивающей варианты.
Интересно отметить, что если в этом примере вместо расчета
средней геометрической с операцией выявления выскакивающих
вариант, требующего затраты определенного времени, найти
медиану, что гораздо проще, то мы получим довольно близкий
результат: Ме = 3,3 • 10~5. Это не случайная близость. При числе
вариант, превышающем четыре, можно, как правило, обхо-
10
Пр»
мер 2. Вычисление средней геометрической
Дозы препаратов противокоревой вакцины, обеспечивающие защиту
50% экспериментальных животных от заражения
№ варианты Im D5Q lg Im Oso (lg Im Dso+5) X100
sass- 1 2,4.10-5 5?38 38
2* 3,0-10-5 5,48 48
3 . 3,0-10-5 5,48 48
4 3,2-10-5 5,50 50
5 3,3-10'5 5,52 52
6 3,7-10-5 5,57 57
7 5,0-10-5 5,70 70
- 8 1,0 -10 4 4,00 100
9 2,7 - 10’4 4,43 143
2%i = 463 (без х9)
Проверим, не является ли А'у выскакивающей:
Xn—Xn-\ _ 143—100 = 0,410,
143—38
xn — xn-i _ 143—Ю0 ' - 0,453,
*n — *2 143—48
Xn — Xn-2 _ 143—70 - 0,695.
*п — *1 ' 143—38
Это позволяет ис-
ключить х9 как вы-
скакивающую.
- 463
Xig=«=g: 100 — 5=5,58 (Деление на 100 и вычитание 5 — опера-
ции, обратные тем, которые были произведены с вариантами при приведении
ихЛк виду, удобному для вычислений),
XreoM = antilgxig = 3,8 • 10-5 мл.
диться медианой в качестве средней характеристики для сово-
купностей, подлежащих в принципе о^фаботке с применением
средней геометрической.
Цто касается средней гармонической (//), то ее расчет по
технике очень близок к вычислению средней арифметической и
не заслуживает специальных пояснений в настоящем руко-
водстве.
2. Оценка варьирования данных и границ
доверительных интервалов средних
Основой многих важных операций по статистической обра-
ботке экспериментальных данных является, как известно, вы-
числение показателей, характеризующих степень случайного
варьирования данных. Как правило, таким показателем служит
оценка^ стандартного отклонения (квадратичного отклонения,
средней квадратичной ошибки) s. Она используется, в частно-
сти, при обработке тех совокупностей, для которых правомочно
вычисление средних арифметической, гармонической и геомет-
11
рической (в последнем случае применительно к логарифмам
вариант и %ig).
Однако классические операции расчета s довольно гро-
моздки. Поэтому мы приводим экспрессный метод ее вычисле-
ния, основанный опять-таки на оценке различий между зна-
чениями крайних вариант в совокупности. Важным условием-
применения этого метода является предварительное выполнение
описанных выше операций по исключению выскакивающих ва-
риант. Метод достаточно эффективен применительно к совокуп-
ностям с числом вариант /2^20.
Весь расчет осуществляется с помощью простой формулы
где так называемый размах варьирования Wn=xn— ад, т. с.
разности между крайними вариантами в упорядоченном ряд\,
a dn находится по табл. 2 приложения против соответствующего
значения п. Поясним применение метода на примере 1. Там
Г7 = х7 —Х! = 12—1 = 11, a d7 = 2,704; тогда 5 = 11/2,704 = 4,1.
Заметим, что вычисление $ с помощью классического метода
дает несколько меньшее значение (3,7), т. е. экспрессный метод
обеспечивает в данном случае некоторую «перестраховку»
в оценке варьирования. Это вообще характерно для большин-
ства случаев применения экспрессного метода.
Опираясь на вычисление размаха варьирования и специаль-
ные таблицы, можно также значительно ускорить оценку гра-
ниц доверительных интервалов средних. Так, верхнюю и
нижнюю границы доверительного интервала средней арифме-
тической можно оценить соответственно по формулам
x+k^Wn, x-kw-Wn,
где kw находят по табл. 3 приложения для уровня достоверно-
сти 95 или 99%. В примере 1 границы доверительного интер-
вала средней арифметической для уровня достоверности 95%
составят
^ZI^6,3+0,33-ll 10,
^—^-^—6,3—0,33-11=2,
а для уровня достоверности 99% —
6,3+0,51-11 = 12,
6,3-0,51 • 11 = 0.
Заметим, что эти значения границ доверительного интервала
очень близки к находимом с помощью классических приемов
(9,44-2,6 и 10,94-0,8 соответственно), хотя и в данном случае
имеется некоторая «перестраховка».
Очевидно, что оценка границ доверительного интервала
средней геометрической делается так же, с тем лишь услож*
12
Бм, что все операции производятся с логарифмами вариант.
' необходимости в заключение вычисляются соответствую-
йнтилогарифмы.
]резвычайно простой метод существует для оценки границ
ительного интервала медианы. Для этого, располагая
^^доченной совокупностью вариант, достаточно по табл. 4
п ожения найти номера вариант, которые могут быть при-
нядйлкак пограничные значения границ доверительного иптер-
Необходимо, однако, иметь в виду, что последний метод
сЙйовится достаточно практичным, как правило, для совокуп-
нжгей с числом вариант, превышающим 15 4-20. При меньшем
вариант он приводит к слишком «перестраховочным» зпа-
чЧ^ям границ. Легко убедиться, что его приложение к при-
1 дает относительно очень широкий интервал, охватываю-
ЙЙ1всю совокупность от первой до последней варианты (1~
даже для уровня достоверности 95%. Вместе с тем
вЗЙфимере 3, представленном ниже, границы доверительного
щ&рвала оказываются весьма близкими к получаемым с по-
щЬю более громоздких методов. В этом примере для уровня
д^ФЙверности 99% данный метод является наиболее эффектпв-
н|ф;по сравнению с другими статистическими приемами.
3. Оценка границ доверительного интервала медианы
Содержание антитоксина в крови людей после введения
столбнячного анатоксина
(в АЕ)
Варианта № 1 . .. <0,005 Варианта № 18 ... 0,010
» № 2 . .. <0,005 » № 19 ... 0,015
» № 3 . .. <0,005 » № 20 ... 0,015
» № 4 . .. <0,005 » № 21 ... 0,015
» № 5 . .. <0,005 » № 22 ... 0,025
» № 6 . .. <0,005 » № 23 ... 0,025
» № 7 . .. <0,005 » № 24 ... 0,025
» № 8 . . . 0,005 » № 25 ... 0,035
» '№ 9 . .. 0,005 » № 26 ... 0,050
» № 10 . .. 0,005 » № 27 ... 0,050
» №11. .. 0,005 » № 28 ... 0,050
» № 12 . .. 0,005 » № 29 ... 0,050
» № 13 . .. 0,005 » № 30 ... 0,050
’ » № 14 . .. 0,005 » № 31 ... 0,075
» № 15 . .. 0,005 » № 32 ... 0,100
» № 16 . .. 0,005 » № 33 ... 0,125
» № 17 . .. 0,010 » № 34 ... 0,400
=0,010. Границы доверительного интервала ДЛЯ уровня достоверности
95% Хц до Х24, Т. е. 6,0054-0,025; для уровня достоверности 99% —
от До Х25, т. е. 0,005 ч-(У,035.
>-
4 3. Оценка достоверности различий средних величин
.Сравнение независимых совокупностей вариант. Начнем
РШения наиболее трудной задачи — сравнения совокупностей,
TW^aumx частично полуколичествепные данные и не подле-
13
жащих поэтому обработке с применением традиционных, так
называемых параметрических критериев. Ниже приведен соот.
ветствующий пример (пример 4).
Пример 4. Сравнение независимых совокупностей с полуколичественпымз
данными
Активность PH К-полимеразы в препаратах
хроматина из ядер ткани печени мышей
различного возраста
(в условных единицах)
№ варианты
4—6-дневные
мыши -
70—75-дневные
мыши
1
2
3
4
5
6
7
3
5
6
9
9
1-0
>10
Ме = §
<1
<1
<1
1 -:-2 *
4
7
Мс-1-2
* Результат не может быть по условиям опыта
установлен с большей определенностью.
Как видно из примера 4, для сравниваемых совокупноста
невозможны расчеты средних обычного типа. Можно вычислив
лишь медианы. Попытка оценить различия, сравнивая граничь
доверительных интервалов медиан, установленные так, как по
казано раньше (стр. 13), в данном случае будет неэффектив
ной; читатель легко может в этом убедиться. Это, разумеется
не исключает в других случаях успешную оценку достоверное^
различий медиан простым сравнением границ их доверительны
интервалов. Если границы их не перекрываются, то можно счи
тать различия установленными с уровнем достоверности, боль
шим или равным тому, с которым оценивались границы дове-
рительных интервалов. Однако, как уже упоминалось, npi
малом числе вариант оценки границ доверительных интервале
медиан оказываются слишком щедрыми, и приведенный при
мер 4 требует обработки с помощью более эффективных мето
дов. К этому побуждает также то обстоятельство, что различи?
медиан выглядят здесь довольно значительными.
Весьма быстрая и строгая оценка может быть произведен"
с помощьюч так называемого критерия U, который в различны'
руководствах фигурирует как критерий Мэпн-Уитнея (Siegel
1956), Уайта (Урбах, 1963), Вилкоксона для независимых со
вокупностей (Ван-дер-Варден, 1960; Урбах, 1964). Для его вы
числения объединим варианты обеих совокупностей и располо
14
#им их в порядке возрастающих значений. При этом, однако,
выпишем значения вариант каждой совокупности в разных
строчках:
<1, <1, <1, 1-2, 4, ! 5‘j, 7,
3, {_5 }, 6, 9, 9, 10, >10.
Далее рассчитаем так называемое суммарное число инверсий
для верхнего и нижнего рядов. Число инверсий для каждой из
вариант — это число вариант другого ряда, меньших по вели-
чине. Например, число инверсий для варианты 4 верхнего ряда
равно 1, так как только одна варианта нижнего ряда (3)
меньше 4; число инверсий для варианты 7 верхнего ряда
равно 3, ибо три варианты нижнего ряда (3, 5 и 6) меньше 7.
Труднее обстоит дело с расчетом числа инверсий для вари-
анты 5, так как в нижнем ряду есть варианта с равным зна-
чением. В этом случае необходимо рассчитать число инверсий
и для предположения, что при более точном определении ва-
рианта верхнего ряда была бы несколько большей, и для про-
тив,оположного предположения — что она оказалась бы не-
сколько меньшей. Первое предположение дает число инверсий,
равное 2, а второе—1. В качестве рабочего значения следует
принять среднее—1,5. Теперь вычислим суммы чисел инверсий
’ для верхнего ряда:
0+0+0-1-04 1-j-l, 5 +3 = 5,5
и для нижнего ряда:
4+5,54 6+747+74-7=43,5.
Значением критерия U является меньшее из суммарных
чисел инверсий, т. е. 5,5 в данном примере. Оценить найденное
из опыта значение U можно с помощью табл. 5 приложения.
Там приведены пограничные значения U для сравнения сово-
купностей с разным числом вариант. Если найденное значе-
ние U меньше соответствующего пограничного значения (в дан-
ном примере для П\=7 и П2 = 7 и уровня достоверности 99% оно
/равно 6), то различие средних характеристик совокупностей
Доказано. Если бы найденное значение U было меньше погра-
ничного значения для уровня достоверности 95%, но выше
такового для уровня достоверности 99%, то мы получили бы
право на предварительное заключение о наличии существенных
различий. Приведенная в приложении табл. 5 дает возможность
сравнивать лишь совокупности с числом вариант не более 20
каждая. При необходимости обрабатывать совокупности с боль-
л Шим числом вариант на основе критерия U можно обратиться
к руководствам Б. Л. Ван-дер-Вардена (1960) и В. Ю. Урбаха
(1963, 1964). Можно также воспользоваться и иными крите-
риями такого типа, которые несколько сложнее, но еще более
15
эффективны (Ашмарин, Воробьев, 1962; Ван-дер-Варден, 1960;
Урбах, 1963, 1964; Лашков, Поляков, 1971).
Теперь обратимся к сравнению независимых совокупностей,
состоящих только из количественных данных. Заметим, что. кри-
терий U и иные критерии такого типа вполне пригодны в этом
случае и нередко оказываются весьма эффективными. Однако
чаще в этом случае эффект достигается с помощью других
приемов. Классические методы сравнения совокупностей, харак-
теризуемых средними арифметическими (или средними геомет-
рическими и гармоническими после соответствующей обработки
исходных данных), требуют довольно громоздких расчетов. Они
могут быть существенно облегчены оценкой стандартного откло-
нения с помощью быстрого метода, изложенного для оценки s
выше. Но это не исключает целого ряда последующих вычис-
лений.
Излагаемый ниже метод сравнения средних, основанный
опять-таки на оценке размахов варьирования, позволяет свести
вычисления к минимуму. Поясним его на примере 5 (данные
расположены в порядке возрастающих значений).
Пример 5. Сравнение независимых совокупностей с, количественными дан-
ными на основе оценки размахов варьирования
. Коэффициенты специфичности препаратов ДНК
из Е. со И и S. tn ar ces cens
№ варианты | Е. coll S. marcescens
1 1,01 1,08
2 1,04’ 1,14
. 3 1,04 1,18
4 1,06 1,20 .
5 1,08 1,25
6 1,09 1,30
7 1,12
8 1,31 *
Ха = 1,06 хь = 1,19
№«=0,11 №ft = 0,22
* Результат исключен как выскакивающий (см.
пример 1).
Вычислим отношение размахов варьирования. Оно составит
W^max/W^inin —0,22/0,11 =2,000. С помощью табл. 6 приложения
убедимся, что оно не превышает пограничного значения 2,034
для уровня достоверности 95% и соответствующих чисел ва-
риант совокупностей (til ДЛЯ ll^max рЗВНО 6, а п2 ДЛЯ IFmin
7). При пользовании табл. 6 важно по горизонтали
брать п для совокупности с большим U7, а по вертикали —
с меньшим W. Заметим, что на данном этапе метода «пере-
ходным» уровнем достоверности является именно 95%. Если
16
Дугпптр.ние размахов превышает пограничное значение, то от
Ирмкнейшего расчета по предлагаемому методу следует воздер-
Ояться и применить традиционные методы, описанные в ряде
Жководств (Ашмарин, Воробьев, 1962; Бейли, 1962; Длин,
Mafift; Сепетлиев, 1968; Урбах, 1963, 1964; Фишер, 1958; Янко,
i&jifil). Далее вычислим среднее значение размахов W=(Wa +
йо|Г{,)/2 = (0,22+0,11)/2^0$?и умножим его на коэффициенты
yL =0,49 и 0,70, находимые по табл. 7 приложения против
^ртветствующих суммарных чисел вариант и уровней досто- •
уЦЙйности 95 и 99%. Произведения составят 0,49-0,17=0,08 и
0.17=0.12. Если различия средних^ достоверны, то абсо-
|жртное значение их разности |х& — ха|=0,13 должно быть
ж&ыпе одного или обоих произведений. В первом случае де-
Оается предварительное заключение о существенности разли-
|рий. во втором различие можно считать доказанным. Рассмат-
Ошаемый пример демонстрирует, очевидно, случай высокой
достоверности различий.
йКШля сравнения с традиционными методами укажем, что
йдследние дают несколько меньшие критические значения раз-,
Дугей между средними — 0,06 и 0,11. Таким образом, и здесь
^Вйденение быстрого метода связано с некоторой, хотя и не-
Мийчительной. «перестраховкой».
Ж+Заметим также, что табл. 7 приложения дает строгие оценки
равных числах вариант в сравниваемых совокупностях или
случае, если разница П[ и «2 не превышает единицы. При
«большей разнице гц и «2, предусматриваемой последним столб-
ЯЙм= таблицы, оценки следует считать приближенными.
^^Сравнение совокупностей с попарно сопряженными вариан-
КМи. Анализ различий в том случае, когда варианты в сово-
вЬностях попарно сопряжены (например, контрольное и опыт-.
Ке .определения на каждой серии культуры, .на каждом живот-
Км и т. п.), — задача в общем более простая, нежели сравнение
Девависимых совокупностей. Для ее решения существуют очень
Дйстрые и в то же время вполне строгие приемы. Приходится
•Циль удивляться тому, что биологи чаще пользуются куда бо-
трудоемкими методами обработки, либо не зная о существо-
вйнии быстрых способов, либо полагая, что их простота таит
в®£ебе какие-то произвольные допущения.
1+^. Прежде. всего следует обратить внимание на критерий зна-
относящийся, как и описанный выше критерий U, к кате-
гррии непараметрических. Помимо быстроты, применение этого
ДЦйтерия дает возможность обрабатывать не только количест-
венные, но и полуколичественные данные. Соответствующий
jWH.Mep (пример 6) представлен ниже. Вся обработка данных
уводится к отметке о том, больше ( + ), меньше (—) или не
уйшчается ( = ) от контроля результат в опытном определении,
:^>^лее к п°Дсчету плюсов и минусов. Как видно. «a. HwiMepiadSi
17
Пример 6. Сравнение зависимых совокупностей с полу количественным и
данными на основе критерия знаков
Интенсивность реакции Бюрне при введении стандартного
и модифицированного препаратов бруцеллина
(размеры участка покраснения в см)
№ варианты Стандартный бруцеллин Модифицирован- ный бруцеллин Оценка результатов опытных определений по сравне- нию с кон- трольными
1 2X3 1X1
2 0 0 =
3 1X1 0 —
4 0 0 —
5 0 0 =
6 4X5 1X1 —
7 1X1 0 ——
8 2X4 2X3 —
9 2X3 2X3 =
10 0 0 —
11 2X3 >3X5* +
12 1X1 0 —
13 3X5 2X4 —
14 3X4 1X1 —
15 >5X7* 2X3 —
16 4X5 - 1X1 —
17 3X5 2X3 —
* Нечеткая граница участка.
в 1 случае результат в опыте выше, а в 11 случаях, напротив,
ниже контрольного. Для дальнейшего замечаем большую из
этих цифр, а именно 11. Случаи равенства результатов из по-
следующих расчетов исключаются, и определяется суммарное
число только тех данных, в которых отмечены отличия контроля
от опыта, т. е. 11 + 1 = 12. В табл. 8 приложения находим про-
тив суммарного числа таких определений и уровня достовер-
ности 95 или 99% пограничные значения критерия. Если боль-
шее число случаев с однозначным отличием от контроля равно
табличному значению или выше его, то можно считать, что
результаты опытных определений в среднем достоверно пре-
вышают контрольные. В нашем примере число минусов (11)
совпадает с пограничным значением для уровня достоверности
99%. Это позволяет считать достоверность различия доказан-
ной.
Иногда для аналогичных оценок необходим более мощный
непараметрический критерий Вилкоксона. Его вычисление лишь
немногим сложнее. С ним можно познакомиться по В. Ю. Ур-
баху (1963, 1964), К. В. Лашкову и Л. Е. Полякову (1971)
и др.
1я
в тех случаях, когда мы имеем дело только с количествен-
ными данными, которые можно осреднять, вычисляя средние
арифметическую, геометрическую или гармоническую, про-
цедура сравнения контрольных и опытных определений сво-
дятся к расчету средней разности каждой пары вариант и да-
лее к оценке границ доверительного интервала этой средней.
Ниже приведен соответствующий пример (пример 7). Задача,
Пример 7. Сравнение зависимых совокупностей с количественными дан-
ными на основе средней разности каждой пары вариант
Содержание глюкозы в крови людей до введения и через сутки
после введения депонированного препарата инсулина
(в лг°/о)
№ варианты
До введения
инсулина
Через 24 ч после
введения инсулина
Разность ре-
зультатов в опыте
и контроле
1
2
3
4
5
6
7
8
9
129
147
132
141
112
156
101
139
125
101
95
104
108
114
134
88
89
133
—28
—52
—28
—33
4-2
—22
—13
—50
4-8
х = — 24
Гп = -52 —
-(4-8) =60
очевидно, состоит в том, чтобы оценить, достоверно ли средняя
разность между контрольными и опытными определениями
.отличается от нуля. Тогда можно считать доказанным эффект
^данного препарата инсулина через 24 ч после введения. Для
этого вычисляем U7n = 60, по табл. 3 приложения находим
95 = 0,25 и 99 = 0,37, рассчитываем произведения
Wn -^,95 = 60-0,25 = 15,0,
Wn-kw, 99=60-0,37=22,2
и определяем границу доверительного интервала средней, бли-
жайшую к нулю:
*+ wn- kw> 95= -24+15,0= -9,0,
л+ Wn - kWi 99= -24+22,2= -1,8.
19
Как видно, даже для наиболее строгого уровня достоверности
доверительный интервал средней не включает нуль, иначе го-
воря, весь интервал расположен по одну сторону от нуля. Сле-
довательно, эффект инсулина можно считать доказанным.
4. Отбраковка препаратов
Приведем теперь быстрый метод отбраковки препаратов,
средние характеристики которых не соответствуют наперед за-
данному уровню. Это имеет существенное значение и в иссле-
довательской практике (например, при проверке воспроизводи-
мости в данных условиях тех или иных методов выделения и
очистки биологически активных веществ), и в производстве тех
или иных препаратов.
Допустим, выход фракции гистонов, очень богатых лизином,
при выделении из ткани вилочковой железы теленка составляет
в среднем, по данным авторов метода, 440 мг из 100 г ткани.
Однако в лаборатории, где метод воспроизводился другими
исследователями, были получены данные, представленные ниже
(пример 8). Возникает вопрос: являются ли эти различия слу-
чайными или они следствие погрешностей в воспроизведении
метода (или же, как это иногда бывает, погрешностей в описа-
нии метода, или, наконец, недоработки метода авторами)?
Пример 8. Быстрая отбраковка препаратов
Выходы фракции гистрнов, очень богатых лизином,
из ткани вилочковой железы теленка
(в мг из 100 г ткани)
Варианта № 1 ... 232 Варианта № 4 ... 384
» № 2 ... 259 » № 5 ... 403
» № 3 ... 275 -
х=311
Г п=403 —232=171
Если мы обозначим через а наперед заданный уровень вы-
хода ~ (440 мг из 100 г ткани), то необходимый для оценки
эксперимента критерий можно вычислить как отношение
|а — x\/Wn- В нашем примере оно составит (440 — 311)/171 =
= 0,754. Оценим найденное значение по табл. 9 приложения, где
приведены пограничные значения критерия. Даже для наиболее
строгого уровня достоверности оно оказалось выше табличного
значения 0,685, что свидетельствует о неслучайном расхожде-
нии результатов воспроизведения метода выделения гистона
в лаборатории и данных, описанных авторами метода.
5. Фрагменты дисперсионного анализа
Дисперсионный анализ, как известно, служит одним из
самых совершенных и эффективных методов статистической об-
работки экспериментальных данных, особенно при одновремен-
ай^г изучении действия ряда факторов на то или иное явление.
|вЕнако, как правило, он связан с весьма громоздкими и уто-
^Рггрльными вычислениями. Нередко у исследователя, получив-
комплекс экспериментальных данных и просматривающего
|||В создается неутешительное впечатление, что действие изучае-
фактора не удалось выявить достаточно рельефно и что
'^^р^ходимо, по-видимому, продолжить эксперименты. Но это
впечатление. Строгой проверке его можно подвергнуть,
|1&изведя дисперсионный анализ, но громоздкость последнего
;^Жуждает многих исследователей идти по пути продолжения
||рдаеримента, подчас довольно трудного и дорогого. Исследо-
ватель инстинктивно предпочитает преодолевать трудности
Жщривычной ему области знания, избегая «чужой» области,
нет на то особых побудителей.
г^В^Поэтому задачей настоящего подраздела является описание
|||>йемов быстрого осуществления отдельных фрагментов диспер-
^Жонного анализа с тем, чтобы исследователь мог, помимо впе-
.^^Лений, получить убедительные указания о том, что экспери-
|Ййтальные данные заслуживают обработки по полной схеме
Й^рерсионного анализа. Необходимо подчеркнуть, что излагае-
здесь приемы не подменяют дисперсионного анализа по
^бссичесцой схеме, но дают объективные основания для того,
ИВ’бы решить, «стоит ли игра свеч», велика ли вероятность
что, осуществив утомительные расчеты, исследователь
дакажет интересующее его действие того или иного фактора,
р* у^Одно из важных преимуществ дисперсионного анализа со-
даг в том, что даже тогда, когда число повторных определе-
ВЙ в одинаковых условиях минимально, можно довольно точно
||feiniTb случайное варьирование, используя данные по всем
^^етаниям или градациям испытываемых факторов. Так, рас-
^Йтривая данные опытов, представленные ниже (пример 9),
убедиться в тщетности попыток обычного доказательства
^^товерности различий между средними, так как каждое из
Жх опирается лишь на две варианты и, следовательно, пока-
Жтели варьирования каждой совокупности будут, несомненно,
ftfe и м е Р 9- Однофакторный комплекс
Активность РНК-полимеразы в ядрах ткани почек белых мышей
разного возраста
... ................(в условных единицах)
Возраст мышей, дни
4-6 | 10—14 ! 25—30 45—50 60—70 80—90
^Мвта Ml.. И 10 6 3 4 5
№ 2 . . 13 7 8 7 4 2
X . 12,0 8,5 7,0 5,0 4,0 3,5
* 9 2 ' 3 2 , 4 0 3
21
очень велики. Однако дисперсионный анализ позволяет при-
влечь для оценки случайного варьирования все совокупности
и тем самым существенно повысить достоверность оценки.
Рассчитаем средний размах варьирования по всем совокуп-
ностям:
2+3+2+4+04-3
=2,33.
6
Далее оценим число степеней свободы f по формуле
/=/ (п—1),
где / — количество групп повторных определений, проведенных
в одинаковых условиях, а п — число вариант в таких группах.
В' данном случае f = 6(2 — 1) =6.
Этого оказывается достаточно, чтобы оценить различия
между средними/ Их можно полагать достоверными, если удов-
летворяется условие
\xa-'xb\>kN-Wldn.
Здесь слева — абсолютное значение разности сравниваемых
средних, dn — коэффициент из табл. 2 приложения, W— най-
денный выше средний размах, a kN— коэффициент, находимый
по табл. 10 приложения против соответствующих f и /V, где
N — численность вариант в группах, для которых рассчитаны
сравниваемые средние (в данном примере N равно /г, но, как
мы увидим ниже, возможны и другие ситуации). В нашем
примере dn= 1,128; kN для уровня достоверности 95% составит
2,45, а для уровня достоверности 99%—3,71. Отсюда kN-Wfdn
равно соответственно 5,1 и 7,7.
Как видйо из примера 9, некоторые разности между сред-
ними превышают эти значения. Так, представляются вполне
доказательными различия средних в группах с возрастом мы-
шей 4—6 дней, с одной стороны, и 60—70, 80—90 дней, с дру-
гой стороны. Более того, «обнадеживающими» являются и
различия средних для возрастов мышей 4—6 и 25—30, 45—
50 дней. Здесь снова уместно подчеркнуть, что эти заключения
в отличие от сделанных в предшествующих подразделах не
могут завершить статистическую обработку, а лишь служат
сигналом для проведения дисперсионного анализа по полной
схеме. Теперь, однако, исследователь будет осуществлять его,
имея в виду большую вероятность доказать влияние изучаемого
фактора даже в узких градациях возраста.
Пример 9 относится к области дисперсионного анализа
однофакторного комплекса. Ниже представлен пример двух-
факторного комплекса. Кроме возраста белых мышей, варьи-
рует еще один фактор — линия, к которой они принадлежат.
Следует заметить, что число факторов в общем не оказывает
влияния на описанную схему быстрой оценки случайного варьи-
22
кования и технику сравнения групповых средних. Это видно из
Примера 10.
Пример Ю. Двухфакторный комплекс
Активность РНК-полимер азы в ядрах ткани почек трех линий
белых мышей разного возраста
(в условных единицах)
Фактор В Фактор А
Возраст мышей, дни
4-6 10—14 25—30 45—50
.Линия белых мышей I 11 13 10 7 6 8 3 7 8,1
II 9 12 7 12 6 6 5 4 7,6
Ха. • Wn III 16 14 12,5 2 3 2 13 10 9,8 3 5 3 8 9 7,2 2 0 1 10 7 6,0 4 1 3 9,6
Проведем расчет, аналогичный описанному выше:
2+3+2+3-j-5+3+2--i-0+l+4-^-14-3 2 42
12
/=12 (2—1) = 12.
^ Значения критерия для сравнения средних, отражающих влия-
" нйе _фактора Л, составят при уровне достоверности 95%
kN* W/dn=\l,26 • 2,42)/1,128а^2,7, а при уровне достоверности
99% kN • Wjdn = (1,76 • 2,42)/1,128^3,8. Заметим, что здесь п = 2,
\ a Af=6, так как сравниваемые средние рассчитываются из
6 вариант каждая. Соответствующие значения для сравнения
средних, отражающих влияние фактора В, составят 2,3 и 3,3
(здесь n = 2, a 7V = 8).
Очевидно, таким образом, что несколько пар средних по
фактору А (12,5 и 7,2, 12,5 и 6,0 и др.) должны существенно
"Отличаться друг от друга и что для строгого доказательства
этого явления нет смысла повторять эксперимент, а, вероятнее
всего, достаточен дисперсионный анализ по полной схеме.
6. Оценка средней и варьирования при измерениях
с помощью шаблонов
При измерении различных объектов часто встречается си-
туация, когда индивидуальные определения размеров каждого
объекта очень трудоемки. Гораздо проще подсчитать количество
объектов, больших или меньших некоторого шаблона. Если при
23
этом верно предположение о приблизительной нормальности
варьирования размеров, то средний размер легко оценить по
формуле
где d\t d2— произвольно выбираемые размеры шаблонов, а рь
р2 — относительные частоты объектов, не превосходящих по
размерам соответствующие шаблоны. Значение коэффициента
р2 находится по табл. 11 приложения в зависимости от
величин р\ и р2. Хотя мы, как правило, не даем в настоящем
кратком руководстве обоснований излагаемых методов, следует
все же отметить, что оценка, находимая по приведенной фор-
муле, является оценкой максимального правдоподобия (Кул-
дорф, 1966).
Применение этого метода иллюстрируется ниже примером
(пример 11) измерений диаметра колоний дрожжей, выращен-
ных на плотной питательной среде. Нахождение среднего диа-
метра колоний экспрессным способом сводится к подсчету чисда
колоний, диаметр которых не превосходит диаметров двух шаб-
лонов: di = 9 и d2=10 мм.
Пример 11. Экспрессная оценка среднего размера колоний дрожжей
Диаметр колоний
(в мм)
Измерение обыч- ным способом Сравнение с шаблоном Измерение обыч- ным способом ! Сравнение 1 с шаблоном
10,4 >^2 10,0 = (/2
11,4 >б?2 6,8 <di
11,2 >d2 9,8
10,2 >^2 7,4 <rfl
12,0 >d2 10,0 — dz
12,4 >^2 8,8 <dt
8,6 <di 7,0 <d>
8,2 <di 9,2 <d2 ' ~
9,4 <Zd2 9,0 = d{
6,4 <t/i .8,0 <dx
Доля колоний pi, имеющих диаметр ^d\, равна 0,45. Доля колоний p2t
имеющих диаметр ^d2i составляет 0,70. Значение коэффициента KPi р2 =
=—0,20. Экспресс-оценка среднего значения диаметра колонии х=9,2. вред-
нее значение диаметра колонии, рассчитанное обычным способом, х=9,3.
Как видно из примера, сравнение средних, вычисленных
обычным и быстрым способами, демонстрирует практически
полное отсутствие потери точности при экспрессном способе.
Это следует также из приводимой ниже оценки варьирования.
Варьирование при измерениях с помощью шаблонов в форме
квадратичного отклонения s можно оценить по формуле
s—(d2 rfi) fPi,
24
где d\,d2, как и ранее, размеры выбранных шаблонов, a fp >р —
величина, находимая из табл. 12 приложения в зависимости от
доли объектов pi и р2, не превышающих по размерам шаблоны
di и d2.
Воспользуемся для иллюстрации расчета квадратичного от-
клонения тем же примером 11. Из табл. 12 приложения следует,
что fp t ,р 3=h54. Отсюда 1,54^1,5. Легко показать, что най-
денное таким образом значение очень близко к находимому
обычным способом. При необходимости на основе найденного
значения и общего числа измеренных объектов можно вычис-
лить доверительный интервал обычным способом.
II. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ
Планирование эксперимента, как и любое планирование,
предполагает поиск рациональной последовательности получе-
ния данных о свойствах изучаемых объектов или явлений.
В научно-исследовательской работе рациональная схема экспе-
римента (план эксперимента), естественно, должна состав-
ляться таким образом, чтобы при минимальной затрате времени
и средств получать максимум информации об интересующем
объекте. Именно в этом смысле можно говорить, что научные
методы планирования эксперимента дают возможность экс-
прессного достижения поставленной цели исследования, сокра-
щая затраты времени как на собственно эксперимент, так и на
статистическую обработку результатов.
Методы планирования, и в первую очередь статистические
методы планирования, существенно отличаются от методов
статистической обработки результатов наблюдений, где коли-
чественному анализу отводится пассивная роль обработки дан-
ных, полученных при случайном сочетании условий. В противо-
положность этому математический аппарат методов планиро-
вания эксперимента играет активную роль, определяя и даже,
можно сказать, диктуя исследователю жесткую схему поста-
новки эксперимента и последовательность анализа результатов.
Тем не менее, это совершенно не означает, что при применении
методов планирования эксперимента знания и опыт самого
экспериментатора не играют существенной роли. Наоборот,
неточно сформулированная задача или неверно выбранные от-
правные данные, «пройдя» весь путь математического аппарата
планирования эксперимента и анализа полученных результатов,
в ходе которого исключается возможность внесения корректив
и поправок, приводят хотя и к быстрому, но неполноценному
решению.
Прежде чем перейти к изложению материалов, относящихся
к методам планирования эксперимента, необходимо рассмотреть
сущность понятий «выход» и «факторы».
В своей работе исследователь может иметь дело со свой-
ствами, как не зависящими от времени, так и меняющимися во
времени. В первом случае под выходом следует понимать само
изучаемое свойство, — например, твердость сплавов, электро-
26
проводи ость растворов, ферментативную активность, урожай
Сельскохозяйственных культур, размеры исследуемых животных
Энного возраста и т. д. При изменении изучаемых свойств во
времени под выходом следует понимать фундаментальные
Параметры, характеризующие закон изменения этих свойств,
hjo сами не зависящие от времени. В данном случае наиболее
Плодотворным представляется кинетический анализ процесса,
Допускающий использование в качестве выхода величин кон-
стант скоростей процесса (удельные скорости), входящих
уравнения, описывающие ход изучаемого процесса во вре-
мени. Такими параметрами, например, могут явиться константы
-^сорости перекристаллизации сплавов при изучении их твер-
дости, химических реакций — при изучении электропроводности,
Инактивации — при исследовании свойств ферментов и т. д. Не-
обходимо отдавать себе отчет в том, что константа скорости
'как выход процесса не характеризует непосредственно изучае-
мое свойство, но позволяет количественно оценить его в любой
^Момент времени.
, Предлагаемое деление является условным, и в зависимости
широты поставленной задачи цель исследования и подходы
|могут быть сформулированы по-разному. Однако во всех слу-
|йдях в качестве выхода процесса следует использовать пара-
метр, не зависящий от времени. Само собой разумеется, что
|\этот параметр должен иметь четкое количественное выражение.
\ Величина выхода зависит от различных условий или, поль-
зуясь принятыми терминами, факторов. Особенности планиро-
вания эксперимента определяются той ролью, которая при-
дается факторам в данном исследовании.
I' Так, в простейшем случае, предполагающем изучение выхода
дали выходов при фиксированном сочетании изменяющихся фак-
торов, основная задача планирования состоит в определении
необходимого числа экспериментов, позволяющего получить
^достоверные результаты. В некотором смысле эта задача яв-
ляется как бы обратной той, которая решается при статистиче-
ской обработке результатов пассивного эксперимента. Такой
^элементарный план является необходимой составной частью '
иболее сложного планирования, предполагающего изучение вы-
* хода или выходов при различных уровнях и сочетаниях факто-
ров, которое часто проводится с целью отыскания оптимума
^изучаемого процесса.
1. Оценка необходимого числа экспериментов
Важнейшим этапом в постановке любого эксперимента,
Обусловленным естественным желанием экспериментатора по-
ручить достоверные представления об изучаемом свойстве (вы-
воде), является оценка необходимого числа наблюдений. Ре-
шение этого вопроса имеет очевидное практическое значение,
27
позволяя обосновать затраты времени и средств на то или иное
исследование.
Проблема достоверности в экспериментальных работах
всегда была и является актуальной, что связано, с одной сто-
роны, с неизбежной погрешностью метода измерения и, с дру-
гой стороны, с гетерогенностью свойств, характерной для био-
логических объектов исследования. Если же учесть, что в мно-
гофакторных системах, как правило, не удается поддерживать
значения всех факторов на строго постоянных уровнях, то не
покажется странным, что при проведении ряда повторных из-
мерений в эксперименте исследователь всегда получает набор
отличающихся значений выхода. Так как вариабельность ре-
зультатов определяется большим числом разнообразных причин,
то распределение полученных данных чаще всего подчиняется
нормальному (или близкому к нему) закону распределения,
в предположении которого и даны дальнейшие рассуждения.
При проведении всего мыслимого количества наблюдений,
которое реально определяется численностью совокупности, под-
лежащей изучению, исследователь получает набор величин
%i, х2, ..средняя арифметическая хИст* которых характе-
ризует истинное значение в случае однородной совокупности,
когда вариабельность результатов измерения свойств объектов
вызвана погрешностью метода. В том случае, когда причиной
вариабельности результатов измерений является гетерогенность
свойств объектов совокупности, средняя арифметическая хИст
всех мыслимых измерений дает представление о наиболее ве-
роятном значении выхода. При проведении всего мыслимого
числа измерений абсолютная достоверность не является проб-
лемой.
Однако на практике для оценки выхода используется средняя
арифметическая х из ограниченного числа измерений п, степень
вариабельности которых с определенной погрешностью можно
оценить на основании размахов варьирования (см. предыдущий
раздел):
(1)
Такое значение средней арифметической является оценкой ис-
тинного значения:
лист=х±^[/г-1] 5 [х], (2)
где tp[n— 1] — значение коэффициента Стьюдента для вероят-
ности р при числе измерений п (см. табл. 13 приложения),
s[x] = Wnldn^n — ошибка среднего значения. Произведение
tp[n—1]$М является не чем иным, как доверительным интер-
валом, на величину которого с вероятностью р истинное зна-
* Более подробно численная характеристика генеральной совокупности и
выборки рассмотрена в книге Н. А. Плохинского (1970).
28
1 —— J
чение (%ист) может отличаться отх. Отсюда следует, что средняя
арифметическая тем определеннее отражает истинное значение,
чем меньше величина этого доверительного интервала:
I"-1’- (3>
Из выражения (3) вытекает, что, увеличивая произвольно
число измерений, можно уменьшить 1Р до любых пределов.
Выражение (3) можно преобразовать для решения задачи
об установлении необходимого числа измерений, обеспечиваю-
щего заданную экспериментатором величину отклонения сред-
ней арифметической от истинного значения:
_ Wm ^[«-11 _
I~p - I*
где Ip — задаваемое с вероятностью p максимально допустимое
отклонение среднего значения от истинного, т — число изме-
рений в предварительном эксперименте, проводимом для оценки
точности метода.
. Практически, чтобы воспользоваться выражением (4), не-
обходимо в предварительных экспериментах оценить степень
вариабельности результатов измерений, полученных выбранным
методом исследования. От той точности, с которой определена
величина Wm/dm, зависит и та достоверность, с которой можно
оденить число необходимых измерений в планируемом экспе-
рименте. Предполагается, что истинная степень вариабельности
измерений, которая могла бы быть получеца при проведении
всех экспериментов, лежит в пределах (с достоверностью 68%)
5 [xz]HCT = s (5)
у 2т
Подставляя выражение (5) в уравнение (4), имеем
Ip V 2т /
Выражение (6) дает возможность рассчитать необходимое число
измерений (экспериментов) п со степенью определенности, ко-
торая зависит от числа наблюдений т в предварительном экс-
перименте, поставленном для оценки точности метода.
В тех случаях, когда ошибка метода исследования опреде-
ляется традиционным способом в виде среднего квадратичного
отклонения
s [xz] =
п — 1
29
уравнение для расчета необходимого числа измерений приобре-
тает вид ___
[Х/] [m-1] (1 + 1/2тп±2/Г2/п)
п=------------------г---—----------- (6а)
1Р
Формулы (3) — (6а) не вполне строгие: варьирование оценки
So, определяемое по размаху и даже по классическим методам,
не подчиняется распределению Стьюдента. Однако принятые
допущения дают лишний «запас надежности», лишь несколько
снижая мощность метода.
Пример 12. Экспрессный метод расчета необходимой величины п при
Определение концентрации клеток путем подсчета
ш Xi ' X Wm
3 625 635 680 ‘ 647 55
5 603 606 625 635 680 630 77
10 577 594 603 606 625 633 635 656 680 684 629 107
15 577 577 592 594 603 605 606 622 625 633 635 650 656 680 684 625 107
20 577 577 592 594 603 506 606 622 625 629 631 633 635 650 656 671 673 680 684 730 636 153
Пример 13. Традиционный метод расчета необходимой величины п при
Определение концентрации клеток путем подсчета
m 1 Xi i ; * 1 s[^z] i
3 625 635 - 680 647 29,3
5 603 606 625 635 680 630 31,05
10 577 594 603 606 625 633 635 656 680 684 629 35,83
15 577 577 592 594 603 605 606 622 625 633 635 650 656 680 684 625 35,40
20 577 577 592 594 603 605 606 622 625 629 631 633 635 650 656 670 671 673 680 684 636 34,00
30
Формулы (3) — (6а) не являются вполне строгими: варьиро-
1Кцие оценки 5, определяемое по размаху и даже, если судить
|||ме строже, по классическим методам, не подчиняется распре-
ж^ению Стьюдента. Однако принятые допущения дают лишний
||||щас надежности» расчетов, лишь несколько снижая мощ-
метода. Выражения (6) и (6а), оценивающие необходи-
1|ре число планируемых экспериментов, показывают, что выбор
||й&йчин т и п определяется конкретными условиями исследо-
вания.
Йзных значениях т по уравнению (6)
йх под микроскопом в камере Горяева
Sfe? 100% жх 1_ /2ЙГ k-w п
^=2% X -^- = 4% X а пе - = 6% X
Oil'V' 8,5 0,41 3,39 727±511 182± 128 81 ±57
Же 12,2 0,32 0,88 158±92 40 ±23 18± 10
Ш 17,0 Ж' 0,22 0,33 83 ±35 21±9 9±4
17,1 Ifcr Вкк.;•• 0,18 0,22 55± 19 14±5 ' 6±2
R; 24,4 0,16 0,17 88 ±28 22±7 10±3
£ных значениях т по уравнению (6а)
& под микроскопом в камере Горяева
Ц-^il Г=^~ 100% X AjJrn— 1] S[S[*Z]] п
-"- = 2% X А» I -2-= 4% j х ±- = 6% X
4,528 9,92 0,41 588±414 147± 103 65 ±49
4,928 4,60 0,32 142±83 36±21 16±9
5,700 3,25 0,22 90 ±38 22± 10 10±4
5,660 2,98 0,18 73 ±26 18±6 8±3
5,346 2,86 0,16 60 ±19 15±5 7±2
31
Если предстоит провести большую серию однотипных иссле-
дований с использованием одной методики, целесообразнее
увеличить число предварительных измерений т, что гаранти-
рует более точное определение п. В этом случае, затрачивая
больше времени на предварительные измерения, мы выигры-
ваем в числе серийных определений в самом исследовании, так
как необходимое п уменьшается по мере увеличения точности
его определения (с ростом т).
Напротив, когда предстоит проведение однократного экспе-
римента, целесообразно, не затрачивая времени на большое
количество предварительных определений, рассчитать хотя и не
совсем точное, но заведомо избыточное число необходимых
экспериментов п.
Сказанное выше иллюстрирует пример 12, в котором
при расчете п принималось, что среднее значение определяемой
концентрации не должно отличаться от истинного более чем
на 2, 4 и 6% с достоверностью 99%.
Как видно из примера 12, необходимое число повторностей
существенно зависит в первую очередь от требуемой величины
доверительного интервала. Так, при расчете и, используя дан-
ные 20 предварительных определений, получаем, что для обес-
печения 2 %-ной величины относительного доверительного ин-
тервала результатов необходимо провести 88±28 параллельных
измерений в планируемом эксперименте, в то время как для
обеспечения 6 %-ной величины относительного доверительного
интервала достаточно уже 10±3 определения.
Кроме того, из примера 12 следует, что степень определен-
ности, с которой находят величину п, а также ее абсолютное
значение существенно зависят от числа т предварительных
экспериментов. Это связано с размерами доверительного интер-
вала при различных т, полученных из данных предварительных
экспериментов. При увеличении т по крайней мере до 20 зна-
чительно повышается степень определенности рассчитанных ве-
личин п.
Рассмотрим, например, случай, когда предполагается про-
вести 10 экспериментов по одной методике, причем требуется,
чтобы величина относительного доверительного интервала по-
лученных данных не превышала 4% с достоверностью 99%.
В этом случае, если ограничиться 5 предварительными экспе-
риментами (т = 5), необходимо 40±23 повторности, следова-
тельно, всего нужно планировать 400±230 определений. Если
же в предварительном эксперименте для оценки точности ме-
тода провести 20 измерений (вместо 5), то окажется, что для
достижения требуемой точности следует запланировать 22 ±7
повторности, а всего провести 220±70 определений.
Аналогичная оценка необходимого числа измерений п, про-
веденная по уравнению (6а), показывает, что при использова-
32
Вй традиционных методов статистики мы, совершая более
Купоемкие расчеты, не получаем существенно отличающихся
Якультатов (пример 13).
Традиционный метод планирования двух-трехфакторного
эксперимента по Зейделю — Гауссу
К? Определив необходимое для обеспечения заданной точности
|Всло измерений при строго фиксированных, постоянных зна-
ивциях факторов, можно перейти к следующей задаче в плани-
вЕкянии эксперимента, а именно к выяснению характера влия-
|шя одного фактора на величину выхода. Это часто встречаю-
щаяся задача. Например, изучается влияние pH на активность
Крмента, влияние концентрации одного из компонентов среды
параметры кинетики роста микроорганизмов и т. д.
Ц?. В этом случае, задав необходимую точность и изменяя на
Вределенную величину X значение фактора, проводим для каж-
В|гп его уровня п измерений величины выхода. В процессе
Санирования такого эксперимента основное внимание уде-
Кртся выбору единицы варьирования X. Хотя во многих слу-
Мях выбор величины X проводится интуитивно, тем не менее
||вд этом необходимо руководствоваться требованием, согласно
Ижорому единица варьирования фактора должна быть такой,
Жрбы .ожидаемое изменение величины выхода Ау было не
Жцьше заданного доверительного интервала при определении
|юхода. С другой стороны, необоснованное значительное уве-
мЙение единицы варьирования может привести к тому, что не
9Вш&ут выявлены характерные участки изучаемой зависимости
|||кстремальные точки). Как показывает опыт работы, при
идбле определений п, обеспечивающем достаточную точность
ИвЙерений выхода, величина % должна давать ожидаемое изме-
йргие выхода порядка 6—8 величин s[xj.
К* Полученные таким путем данные могут быть представлены
[•виде таблицы, графически или аналитически.
Ш.ьСледует отдавать себе отчет в том, что выход редко зависит
Жлько от одного фактора. Так, например, ферментативная ак-
шщность, кроме величины pH, определяется еще и температу-
й|рй; параметры кинетики роста микроорганизмов зависят от
концентрации целого ряда компонентов питательной среды и
|1|довий культивирования и т. д. Поэтому изучение влияния
||||ного фактора при всех прочих фиксированных дает лишь
||Встное решение. Для получения полного решения в случае
||Вучения влияния, например, двух факторов необходимо в рам-
излагаемого метода планирования проводить серию иссле-
ЯЙаний влияния одного фактора при разных уровнях другого,
этом требования к определению числа экспериментов и
||||$0РУ единицы варьирования остаются прежними.
Найденные в результате проведения такой серии экспери-
ментов данные можно изобразить в виде таблицы, а также
33
аналитически. Некоторые затруднения возникают при попытках
графического выражения, так как зависимость выхода от двух
факторов представляет собой так называемую поверхность от-
клика в трехмерном пространстве. Поэтому на практике при
графическом изображении результатов двухфакторного экспе-
римента приходится ограничиваться семейством кривых, отра-
жающих зависимость выхода от одного фактора при фиксиро-
ванных разных уровнях второго, или, другими словами, верти-
кальными сечениями поверхности отклика на разных уровнях
одного из факторов. Возможно также графическое изображение
в виде линий равных выходов (аналогично изолиниям топогра-
фических карт), которые являются горизонтальными сечениями
поверхности отклика.
Анализ полной картины дает возможность представить влия-
ние факторов в целом, определить оптимум выхода по двум
факторам. Вместе с тем попытки получения полной картины
влекут за собой необходимость постановки большого числа
экспериментов. Так, если, например, влияние каждого фактора
изучается хотя бы на 10 уровнях (что является еще не очень
большим числом уровней для получения детальной картины), то
требуется^ постановка 100 экспериментов по п определений
в каждом.
Поэтому на практике при отыскании оптимума выхода по
двум факторам экспрессным методом прибегают к сокращен-
ной схеме исследования. Вначале, зафиксировав значение од-
ного фактора на любом уровне, изучают зависимость выхода
от другого и устанавливают частный оптимум по данному фак-
тору. Далее, зафиксировав второй фактор на оптимальном
уровне и варьируя значения первого фактора, находят по нему
оптимум выхода. Предполагается, что оптимум по первому
фактору, найденный при значении второго фактора, соответ-
ствующем частному оптимуму по второму, является истинным
оптимумом по двум факторам. В этом случае число экспери-
ментов, естественно, значительно сокращается (20 эксперимен-
тов вместо 100 при изучении влияния факторов на 10 уровнях),
но имеется вероятность, что установленный экспрессным путем
оптимум не является истинным. Подобная ситуация может воз-
никнуть, когда исследуемые факторы влияют на выход не
независимо друг от друга, а во взаимодействии, т. е. влияние
первого фактора на выход изменяется при переходе второго от
одного уровня к другому.
Вертикальные разрезы поверхности отклика в случае двух
независимых и взаимодействующих факторов представлены на
рис. 1. Как следует из него, нахождение оптимума выхода по
Xi при фиксированном с последующим переходом к опреде-
лению х*1, х”1 и х1/ на уровне х°пт в случае независимых
факторов дает возможность найти истинный оптимум. В про-
34
тивоположность этому в случае взаимодействующих факторов
так может быть определен лишь ложный оптимум, а истинное
Значение оптимума можно найти только после постановки всей
$етки экспериментов.*
, Еще более сложным представляется использование этого
способа планирования эксперимента при изучении выхода, за-
висящего от трех и более факторов, особенно, когда они явля-
ются взаимодействующими. В данном случае целесообразно
Рис, 1. Вертикальные разрезы поверхности отклика
f(xi; х2) при разных уровнях х2 для случаев неза-
висимых (Л) и взаимодействующих (Б) факторов.
х[=а, х1*=2а, х12п=3а, xJ2v=Aa.
привлечение статистических методов многофакторного плани-
Й&ания экстремальных экспериментов, которые можно рас-
сматривать как полноценные экспрессные методы планирования
Чри поиске оптимума, когда уменьшение числа наблюдений не
сражается на достоверности получаемых данных.
.’^2 * Здесь не рассматривается как не имеющая принципиального отличия
Л^Иожность отыскания истинного оптимума путем «хождения по лаби-
предполагающего многократное повторение экспрессной схемы с ис-
пользованием в качестве отправных точек установленных значений частных
Жгамумов.
35
3. Метод многофакторного планирования
Применение современных статистических методов планиро-
вания экспериментов в значительной мере упрощает задачу
отыскания оптимальных условий протекания процессов. К та-
ким методам относятся: полный факторный эксперимент и дроб-
ные реплики; крутое восхождение по поверхности отклика;
описание почти стационарной (оптимальной) области; отсеи-
вающие эксперименты и др. Более подробно с этими методами
читатель может познакомиться по монографии В. В. Налимова
и Н. А. Черновой (1965). В данном подразделе излагаются ос-
новы полного факторного эксперимента.
Математически задача планирования эксперимента форму-
лируется следующим образом: нужно получить некоторое пред-
ставление о поверхности отклика факторов, которое в общем
случае можно аналитически изобразить в виде функции
= U1, %, Х3, • •> Xi).
где т] — выход процесса, т. е. параметр, подлежащий изучению
и оптимизации (например, выход биомассы при культивиро-
вании, скорость реакции, свойства вещества и т. д.);
х2, • •Хг —известные и изучаемые исследователем переменные
факторы, которые можно варьировать при постановке экспери-
мента (например, компоненты питательной среды, температура,
pH и т. д.). Другими словами, необходимо найти приближен-
ную зависимость выхода процесса от параметров.
Рассмотрим самый общий случай, когда процесс исследуется
при неполном знании механизма изучаемых явлений. Есте-
ственно, что вид функции т] в этом случае неизвестен, но для
решения экстремальных задач можно ограничиться поиском ее
разложения в степенной ряд.
Точность, с которой степенной ряд описывает тот или иной
процесс, зависит от порядка (степени) ряда, т. е. от того,
с каким показателем степени представлены последние члены
ряда. Если описывать какой-либо процесс в узком интервале
переменных хь х2, ..., Х{, то почти всегда можно воспользо-
ваться частью степенного ряда, отбросив члены высших поряд-
ков. Только для описания почти стационарной (оптимальной)
области необходимо пользоваться рядом, содержащим члены
второго, а иногда и третьего порядка.
Приступая к исследованию какого-либо процесса, мы пред-
полагаем, что известные условия, его определяющие, не опти-
мальны и, значит, выход процесса может быть описан степен-
ным рядом, не содержащим переменных во второй и выше
степени. Естественно, что попытка ставить задачу оптимизаций
заведомо оптимальных условий не представляется рацио-
нальной.
.36
|ЭДосле постановки эксперимента и определения коэффициен-
Й регрессии проверяется правильность принятого предполо-
Вния. Если условия процесса действительно не оптимальны,
^намечается программа крутого восхождения по поверхности
gUiHKa с целью нахождения оптимума. Если же анализ пока-
Р», что условия процесса, несмотря на наши предположения,
римальны, то тогда для описания области оптимума следует
Цользовать степенной ряд, содержащий члены высших поряд-
р (этот случай рассматриваться не будет).
|рИтак, процесс в первом приближении может быть описан
^пенным рядом, не содержащим членов высших порядков:
|. Ч=₽о+Е?Л-V^tjXiXj,
Рффициенты регрессии которого необходимо определить.
^.Пользуясь результатами эксперимента, мы можем опреде-
лять лишь выборочные коэффициенты регрессии й0, biy Ьц, ко-
|рые являются оценками для теоретических коэффициентов
Врессии Ро, Pi, получаемых только для некоторой гене-
альной совокупности, состоящей из всех мыслимых ответов,
Ж1
— ошибка, связанная с неучтенными факторами и по-
Шлностью метода; bi и Ьц состоят из коэффициентов регрес-
Ккак исследуемых хг- и х7-, так и не учтенных в эксперименте
Даторов; определяемый экспериментально свободный член
ивнения &о есть совместная оценка для теоретического сво-
дного члена уравнения, суммы коэффициентов при членах
Кших порядков и суммы ошибок. Таким образом, уравнение
Дфессии, получаемое на основании результатов эксперимента,
Величие от приведенного выше теоретического имеет вид
К' Л i U
К:
у — выборочная оценка для ц; b0, bit b{j — выборочные.
Оки для ₽о, Pi, Pij.
Д^пределив коэффициенты регрессии этого уравнения, мы
Дюйм представление о влиянии изучаемых факторов на про-
ЦЦ, о взаимодействии факторов и о направлении движения
Дртимальной области.
Каким образом, постановка полного факторного экспери-
1|уа сводится к следующим операциям: выбору уравнения
вйНссии, составлению плана полного факторного эксперимента,
дДзату коэффициентов регрессии, оценке значимости этих ко-
ИЬщиентов, анализу уравнения регрессии.
37
Выбор уравнения регрессии. В зависимости от числа изучае-
мых факторов, определяющих процесс, исследователь записы-
вает в общем виде уравнение регрессии без членов высших
порядков. Для двух факторов оно имеет вид
Л
а для трех факторов — вид
у = bG-\^ bixi-rb2x2J^-b3x3^b]! з-** 4-^2,3^2^3Н-
+ 61,2, 3*ЛХ3‘
В этих уравнениях х2, х3 — значения факторов; bQ — свобод-
ный член, равный выходу при X/ = 0; &2, Ь3 — коэффициенты
регрессии соответствующих факторов, указывающие на влияние
того или иного фактора на изучаемый процесс; 61,2, &i, з, 62, з—
коэффициенты регрессии при произведениях факторов, свиде-
тельствующие о наличии двойного взаимодействия между фак-
торами; 61,2,3 — коэффициент регрессии, указывающий на трой-
ное взаимодействие факторов. Аналогично записывается урав-
нение регрессии для четырех и более факторов.
Составление плана многофакторного эксперимента. Опыты
для определения коэффициентов регрессии должны быть по-
ставлены по строгому плану. Для каждого фактора, исследуе-
мого в данном эксперименте, выбирается условный нулевой
уровень 0х/, т. е. такие значения переменных, в области которых
начинается изучение процесса с целью получить направление
от выбранного условного нулевого уровня к оптимальным зна-
чениям факторов. Если выбор условного нулевого уровня не
диктуется какими-либо теоретическими или практическими
соображениями, то он может быть совершенно произволь-
ным.
Для тех же факторов выбираются единицы варьирования
Z/. Это те величины, на которые в данном опыте мы меняем
условия по каждому фактору в сторону увеличения или умень-
шения его от нулевого уровня. Выбор единиц варьирования —-
один из самых ответственных вопросов. Если для каких-либо
факторов выбраны слишком малые единицы варьирования, то
можно получить эффект данных факторов незначимым не по-
тому, что они не оказывают влияния на процесс, а потому, что
этот эффект будет ниже ошибки метода измерения выхода.
С другой стороны, при выборе слишком больших единиц варьи-
рования возникает опасность, что исследуемая поверхность
отклика не может быть описана уравнением, не содержащим
членов второй, третьей и выше степени. В каждом конкретном
случае единицы варьирования задаются исходя из опыта и
интуиции исследователя.
38
Уровни Oxf—Xi и 0x/4-Xi обозначим символами —1 и +1, или
просто — и + соответственно (кодированное обозначение).
^Таким образом, выбрав 0xi и Хг-, можно любое значение фак-
тора выразить в кодированных единицах. Например, если
в каком-нибудь опыте варьировали концентрации КС1 и NaCl
(два фактора х{ и х2) так, чтобы они принимали значения
только 5 или 10% (КС1) и 10 или 20% (NaCl), то опыт, в ко-
тором содержание КС1 составляло 10%, a NaCl — 20%, в кодо-
вом обозначении запишется х^ = 4-1 (4-), х2= + 1( + ), а кодовое
обозначение %i = + l( + ), х2 = —1(—) будет указывать на то,
что опыт проводился при содержании КС1 = 10% и NaCl =
= 10%.
После выбора 0х/ и Xi составляется матрица планирования.
При ее составлении исходят из того, что в данном эксперименте
должны быть исчерпаны все возможные комбинации значений
факторов, варьируемых на верхнем и нижнем уровнях (0х/ — Xi,
0х,+Хг). Необходимое число вариантов опыта равно 2г’ = Л\
где i— количество исследуемых факторов.
Для двух факторов матрица планирования, включающая
четыре варианта, имеет вид
№ варианта Планирование Расчет | Выход
Х1 | Х2 ' ~У N
1 +1 -1 —1 +1 ъ
2 +1 + 1 —1 —1 У2
з +1 —1 +1 —1 Уз
4 +1 4-1 +1 +1 А
Во втором столбце приведены значения фиктивной перемен-
ной х0=4-1, вводимой формально для расчетов bQ\ в третьем
и четвертом — значения переменных Xi и х2 (эти два столбца
Образуют собственно планирование); в пятом (расчетном)
столбце записано значение произведения XiX2, вводимого
в матрицу планирования для последующего вычисления коэф-
фициентов регрессии ftij2, и, наконец, в шестом — значения ре-
зультатов наблюдений в каждом из четырех опытов. Первая
Строка матрицы соответствует первому варианту опыта, в ко-
тором обе переменные находятся на нижнем уровне; вторая
строка — второму варианту опыта, в котором первая перемен-
ная находится на верхнем уровне, а вторая — на нижнем,
й т. д.
Для трех факторов хь х2, х3 матрицу планирования полу-
чают из матрицы для двух факторов, повторив ее дважды —
'Один раз при значении х3 на нижнем уровне, второй раз при
значении х3 на верхнем уровне:
№ варианта Планирование Расчет Выход ~У N
*0 *i *2 *3 *1*2 *1*3 *2*3 *1*2*3
1 . + — — — + 4- 4~ — ь
2 + + — — — — + 4- У2
3 4- — + — — + — 4- ,Уз
4 + + + — + — — — у4
5 4- — — 4- + — — 4- Уб
6 4- + — 4- — 4- — — Уб
7 4- — + 4- — — 4- — ъ
8 + 4- + 4- 4- 4~ + + Уз
Пусть теперь исследуются четыре фактора: *ь х2, х3 и *4.
Матрица собственно планирования в этом случае строится сле-
дующим образом. Вначале берется матрица для двух факторов
(без их произведения). Затем она повторяется дважды: при
х3 = — 1 и *3=4-1. Полученная матрица для трех факторов
снова повторяется дважды: для *4 =— 1 и х4= + 1. В результате
получаем матрицу собственно планирования для четырех фак-
торов:
№ варианта *1 *2 *3 *4 № варианта *1 *2 *3 *4
1 9 +
2 + — — — 10 4- — — +
3 — + — — И — + — +
4 + 4- — — 12 4- — +
5 — — 4- — 13 — — + +
6 + — 4- •— 14 + — + +
7 — + 4- — 15 — + к +
8 + + 4- — 16 + + + +
Кроме столбцов, соответствующих собственно планированию,
матрица должна содержать еще значения произведений факто-
ров *1*2, *1*2*3, *1*2*3*4 И Др. (СМ. СТр. 41).
-Аналогично составляется матрица для пяти и более факто-
ров. Однако использовать полный факторный эксперимент для
числа факторов более четырех нецелесообразно, так как коли-
чество необходимых опытов с ростом числа факторов растет
по показательной функции 2г’ и для Z = 5 нужно поставить уже
32 варианта определений. При числе исследуемых факторов
более пяти целесообразно пользоваться дробным факторным
планированием.
Следует отметить, что для избранного числа изучаемых фак-
торов матрица планирования, в которой условия опыта запи-
саны в кодированном обозначении, всегда имеет один и тот же
вид, но, естественно, в зависимости от характера эксперимента
40
меняются значения нулевого уровня 0Х1 и единиц варьирова-
ния Хг. Так, если в одном опыте при 0Х/ = 10 и Хг = 3 уровень —1
соответствует 7, а уровень +1 соответствует 13, то в другом
опыте при 0Х/. = 15 и Хг- = 5 уровень —1 соответствует 10, а уро-
вень 4-1 соответствует 20. Матрица планирования же в обоих
случаях имеет один и тот же вид.
Итак, приступая к изучению влияния факторов на какой-
либо процесс, исследователь на первом этапе определяет вид
уравнения, коэффициенты которого он найдет, реализовав опыт,
выбирает условный нулевой уровень и единицы варьирования
факторов, составляет матрицу планирования (см. пример 14).
Пример 14. Составление плана полного факторного эксперимента
Исследование влияния, концентрации солей КС1
и NaCl на выход биомассы растущей культуры
(в условных единицах)
0х. \ -1 4-1
Xi (КС1).................. 10 5 5 15
х2 (NaCl)................. 20 5 15 25
Матрица планирования
№ варианта *2 yii ..II V111 yN | yN
1 4- 4- 1300 1330 1330 1320
2 4- + — 1200 1340 1240 1260
3 4- + — 1410 1430 1450 1430
4 4- + + + 1790 1820 1940 1850
Уравнение, коэффициенты которого мы определили, реализовав опыт,
л
имеют вид y=b0 + biXi + b2x2+blt 2Х\Х2.
Поставив четыре варианта опыта с несколькими повторностями (в дан-
ном случае k=3) по двухфакторному плану и получив значения выхода yN
процесса в каждом варианте, приступаем к следующей операции.
Расчет коэффициентов регрессии. Пользуясь двухфакторным
планом, можно вычислить коэффициенты регрессии уравнения,
содержащего четыре члена (свободный член bQ, два линейных
эффекта Ь2х2 и взаимодействие факторов 61,2*1*2). Поль-
зуясь трехфакторным планом, можно вычислить коэффициенты
регрессии уравнения, содержащего восемь членов:
л
У ==^о + ^1Л1 + ^2-^2 + ^3Л:з+Й1> 2*1-*2 4" 61, 3-*1-*з4-62, 3*2^3 4“
4-61,2, 3-*р*2*3-
При исследовании i переменных уравнение регрессии содержит
jV = 2* члена. Из них один есть 60 (свободный член); i членов —
линейные эффекты 61ХЬ Ь2х2, Ь3Хз, ..., Ь^х^ а остальные — пар-
42
ные, тройные, четверные и т. д. взаимодействия. Приведенные
ниже способы расчета коэффициентов регрессии позволяют
.определить все Л7 = 2г* коэффициентов. Расчет коэффициентов
регрессии ведется по формулам
1/№уЛ,л^,
Ь1}= l/N^y^x?,
b0=llNZyNx",
где N = 2l — число вариантов в матрице планирования, yN—
значения среднего выхода процесса в 77-м варианте, XiN— зна-
чения данного фактора в 77-м варианте.
Для_нахождения Ьо необходимо вычислить сумму произве-
дений yN на значение фиктивной переменной и разделить ре-
зультат на 77 = 4 (в трехфакторной схеме делить на 8). В при-
мере 14
&O=1/7V (у1+у24-у3+У4) = 1/4 (1320+1260+1430+1850) = 1440.
Таким образом, Ьо есть средняя арифметическая из выходов
всех четырех вариантов и соответствует выходу процесса, когда
все факторы находятся на нулевом уровне.
Для нахождения bi необходимо вычислить сумму произве-
дений yN на значение ( + 1 или —1) фактора в соответствующем
столбце матрицы планирования и разделить результат на 2г‘ =
= N. В примере 14
^i^l/MVi (—1)+Уг (+ 1)4“Уз ( —1)+У4 ( + 1)] =
= 1 /4(—1320 +1260-1430+1850) = 90,
62 = 1/TV [у1 ( — 1)+у2 ( — 1)+у3 ( + 1) + У1( + 1)] —
= 1 /4 (— 1320— 1260+1430+1850) = 175.
Коэффициенты &i и Ь2 показывают, на сколько изменится выход
при изменении соответственно и х2 от 0 до ± IX.
При вычислении коэффициентов регрессии для взаимодей-
ствующих факторов значения XiXj берутся из расчетных столб-
цов матрицы планирования. Так, в примере 14 первому вари-
анту в матрице планирования соответствует значение у\ = 1320
И *1*2=+ 1, второму #2=1260 и %i%2 = — 1, третьему #з=1430
и Х1%2 = — 1 и четвертому #4=1850 и XiX2= + I. Отсюда легко
рассчитать
Ь', 2=1/N [У1 ( + 1)+У2 (—1)Ч-Уз (-1) ++ ( + 1)1 =
= 1/4 (1320-1260—1430+1850) = 120.
43
Коэффициент 2 свидетельствует о взаимодействии между
факторами, т. е. показывает, что влияние одного из факторов
неодинаково при разных значениях другого.
Расчет коэффициентов регрессйи можно вести несколько
иначе по формальной схеме:
№ ва- рианта *1 Х2 А 1 в bi
1 — — ь У_\ J/l + ^2 + ^3 + //4_ Ч4 (Уь+Уг + Уз+У*) (^о)
2 + — Уз Уз+У± #2 V4 (£2 #1+#4 Уз) (fol)
3 — + Уз У\ —У1 Уз + у 4^— У\_— У2 V4 (#3+^4—У_\—У2) (fo2)
4 + + У4 Уз — У 4 У1 — Уз У2 + У1 V4 (У4—Уз—У2-\~У\) (fol, 2)
Путем попарного сложения соседних значений yN выписываем
две первые строчки столбца А, затем, вычитая из последующего
предыдущее значение yN, составляем вторые две строчки этого
столбца. Та же операция проделывается со значениями
столбца А, чтобы получить столбец В. Разделив найденные
значения столбца В на 2г* = 22 = 4, получим столбец четырех
коэффициентов регрессии.
Первый коэффициент в столбце коэффициентов регрессии
всегда &0, остальные коэффициенты определяются так: если
в данной строке фактор Х[ имеет знак +, то найденный коэф-
фициент есть &ь если знак + имеет фактор х2, то найденный
коэффициент есть fo2, а если же знак + имеют оба фактора, то
это коэффициент foj,2. z
Аналогично рассчитываются коэффициенты регрессии и для
трех факторов, но в этом случае составляются три столбца и
уже результат последнего делится на 23 = 8.
Рассчитаем коэффициенты регрессии по формальной схеме
для примера 14:
№ ва- рианта Xi х2 Уя А В Ьг
1 1320 2580 5860 1440 (&0)
2 + — 1260 3280 360 90 (6t)
3 — + 1430 —60 700 175 (&2)
4 + + 1350. 420 480 120 (&!,2)
Вычисление коэффициентов регрессии обоими способами
дает одни и те же результаты. Но, рассчитывая коэффициенты
вторым способом, мы избавляемся от необходимости составле-
ния громоздкого плана, содержащего столбец фиктивной пере-
менной и столбцы произведений факторов, которые нужны
только для расчета коэффициентов регрессии первым способом.
Для рассмотренного варианта формальной схемы расчета
44
в матрице планирования эксперимента достаточно иметь
«столбцы со значениями факторов х2, х3, . . Xi и столбец
выхода процесса.
После нахождения величин коэффициентов регрессии и со-
ставления уравнения, которое в рассмотренном случае имеет
вид
у = 1440-1-90^! + 175х2 +
встает вопрос об оценке статистической значимости найденных
величин. Вместе с тем полученное уравнение регрессии (мате-
матическая модель процесса) показывает, что:
а) ненулевом уровне (КС1 — 10%, NaCl —20%) выход со-
ставляет 1440 единиц;
б) при изменении концентрации NaCl (%i) от нулевого
уровня на величину единицы варьирования ±М (т. е. на
±5 единиц) величина выхода изменится на ±90 единиц (±&i);
в) при изменении концентрации NaCl (х2) от нулевого
уровня на величину ±А,2 (±5) значение выхода изменится на
±175 единиц (±62);
г) значительная* величина коэффициента &Ь2 указывает,
что влияние одного фактора неодинаково для различных уров-
ней второго, и наоборот.
Оценка значимости коэффициентов регрессии. Для того
чтобы оценить значимость коэффициентов регрессии, необхо-
димо найти их выборочную дисперсию s2[6J. Для расчета коэф-
фициентов регрессии мы использовали средние значения yN из
трех повторностей. Для определения s2[6i] вычисляются (см. при-
мер 15): _ _
1. Построчные дисперсии s2[yNk]==^(yN — yNk)2/(k — 1), где
k — число повторностей в определении yN.
2. Дисперсия воспроизводимости s2[y]=2s2[yNk]/N— средняя
арифметическая из дисперсий выходов всех N вариантов опыта
(усредненная дисперсия). _ __
3. Дисперсия среднего значения s2[y] = s2[y]/k.
4. Дисперсия коэффициентов регрессии s2[62}=s2[r/]/7V. _От-
куда находим ошибку коэффициентов регрессии $[йг]=У$2[6г].
Часто мы не имеем возможности поставить три повторности
в каждом варианте, поэтому приходится рассчитывать коэф-
фициенты регрессии по одному определению. Как в этом случае
оценить их значимость?
Если в опыте каждый вариант имел только одну повтор-
ность (6=1), то дисперсия среднего значения совпадает с дис-
персией метода измерения, определенной в предварительных
* Вопрос о статистической значимости коэффициентов регрессии будет
рассмотрен ниже.
45
Пример 15. Вычисление ошибки коэффициентов регрессии
Исследование влияния концентраций солей КО и NaCl на выход биомассы
растущей культуры
(в условных единицах)
№ варианта Х1 Х2 Ж Ум у"1 VN
1 1300 1330 1330 1320
2 + — 1200 1340 1240 1260
3 + 1410 1430 1450 1430
4 + + 1790 1820 1940 1850
1- =
*/2[202+ (—10)2+ (—10)2]=300,
72[602+ (—80)2 + 202]=5200,
‘/J202+0»+ (—20)2]=400,
,/2[602+302+ (—90)2]=6300.
2. s2M= 2s2 Wl/JV =12200/4=3050.
3. «2Й= s2 [у ]/k =3050/3=1016,7.
4. s2[6i]=s2[i/]jV='/4-1016,7=254.
Откуда $[^]=У$2[£ч]==у254=16.
экспериментах * (т. е. за $2[у] принимается величина ошибки,
возведенная в квадрат). Если s2— дисперсия метода — известна
по более ранним опытам, то s2[bi]=s2/N и s[bi\=s/~/N (т. е.
ошибка коэффициента регрессии в раз меньше ошибки ис-
пользуемого метода, что является одним из достоинств много-
факторной схемы эксперимента).
Для оценки значимости коэффициентов регрессии составляем
неравенство
где s[&i] — ошибка коэффициента регрессии, a tp(f) — коэффи-
циент Стьюдента, находимый из табл. 13 приложения для за-
данной достоверности р и числа степеней свободы Д с которыми
были определены коэффициенты регрессии (число степеней
свободы f—N(k— 1). Для нашего примера / = 4(3—1) =8.
Оценим значимость полученных в примере 13 коэффициентов
регрессии для уровня достоверности 95%. Из табл. 13 прило-
жения находим /95(8) =2,31 (коэффициент Стьюдента для
уровня достоверности 95% и 8 степеней свободы). Если вы-
полняется неравенство bi>s[bi]tp (f) = 16 • 2,31 =37, то коэффи-
* Для этой цели следует использовать значения квадратичного откло-
нения s[xi], найденные в предварительных экспериментах при определении
необходимого числа повторностей (см. подраздел 2 настоящего раздела).
46
циенты значимы. В нашем примере Z?o=144O>37, &i = 90>37,
62=175>37, &i,2= 120>37, т. е. все коэффициенты значимы для
уровня достоверности 95%. Проверим значимость bi для р =
= 99%. В этом случае /99(8) =3,36 и $[&гКэ9 = 53,8. Легко убе-
диться, что все коэффициенты значимы и для уровня досто-
верности 99%. Если какой-либо коэффициент незначим для
выбранной достоверности, то его исключают из уравнения ре-
грессии.
После статистической оценки коэффициентов регрессии
окончательно записываем уравнение
у = 1440+90^+1 75л:2+120^^.
Формально, если коэффициенты регрессии при xif х2, х3,...
..., Хг значимы, то можно сказать, что данные факторы ока-
зывают влияние на изучаемый процесс (причем если получен
коэффициент со знаком —, то увеличение этого фактора при-
водит к уменьшению выхода, если коэффициент положителен,
то увеличение этого фактора ведет к увеличению выхода).
Сложнее, когда коэффициент при Xi оказывается незначи-
мым. В этом случае еще нельзя утверждать, что данный фактор
вообще не влияет на процесс. Коэффициент регрессии может
быть незначимым по многим причинам, в частности:
* а) выбрана слишком маленькая единица варьирования для
данного фактора, а ошибка метода велика;
' б) нулевой уровень по данному фактору лежит уже в опти-
муме, и, следовательно, изменение концентрации данного фак-
тора на величину Кг может не вызвать изменения выхода;
в) и, наконец, данный фактор действительно не оказывает
никакого влияния на процесс, так как не имеет к нему отно-
шения.
Чтобы выяснить причину установленной незначимости коэф-
фициента, поступают следующим образом. Ставится новый фак-
торный эксперимент с другими значениями 0х/ и с увели-
ченным числом повторностей k для уменьшения s[bi]tp(f). При
этом выбирается более высоким. Если и в этом случае коэф-
фициент регрессии окажется незначимым, то можно делать
вывод о близости нулевого уровня этого фактора к оптималь-
ному значению.
S; Анализ уравнения регрессии. После постановки полного фак-
торного эксперимента, расчета коэффициентов регрессии,
|Ьшибки и определения их значимости необходимо проверить
1рринятую гипотезу о линейности системы, т. е. гипотезу о том,
Жто выход процесса может описываться уравнением без квадра-
тичных членов и, возможно, без членов, учитывающих парные
В выше взаимодействия.
J Оценка значимости коэффициентов регрес-
сии при членах высших порядков. При постановке
47
многофакторного эксперимента априорно предполагалось, что
выход процесса в области исследования может быть описан
уравнением без квадратичных, кубичных и т. п. членов. При
такой постановке эксперимента свободный член уравнения Ьо
является совместной оценкой
II 1...Н
• - + ^/. . j + ^5.
Если принять предположение о том, что коэффициенты ре-
грессии при членах высших порядков незначимы, то SPu = 0
и bo= + т. е. Ьо есть чистая оценка р0. Чтобы это проверить,
необходимо поставить дополнительный опыт с несколькими (г)
повторностями в «центре» эксперимента, т. е. такой опыт, в ко-
тором все факторы'будут находиться на нулевом уровне. Вы-
численное среднее значение уо явится чистой оценкой для ро,
а разность
__ а и
|Уо-М = 1₽о-(?о+£М1 = Е₽н
— оценкой для суммы коэффициентов регрессии при членах
высших порядков. Если эта разность незначима, то выход
процесса действительно может быть описан уравнением без
квадратичных членов.
Итак, зная &0 и $2[60] = s2[&i], для оценки значимости разно-
сти |#о—&о| воспользуемся формулой
ГУо-*о|>К^ V(N+z)/Nztp(f),
где
(ЛГ_1)52М+(г_1)52[у0]
5 = ' 7V+T-2
— среднее взвешенное из двух дисперсий. В этих соотношениях
приняты следующие обозначения: Ьо — свободный член в урав-
нении регрессии, вычисленный после постановки многофактор-
ного эксперимента, содержащего 2’=W вариантов; — дис-
персия коэффициента регрессии; у0— среднее значение из z по-
вторностей в опыте_с переменными _Xi, *2, х», находящимися на
нулевом уровне; s2[z/0] — дисперсия у0\ $2[уо]=2[уо—«/oF/zC?—1);
ip (f) — значение коэффициента Стьюдента для выбранного
уровня вероятности и (N+z—2) =f числа степеней свободы,
находимое из табл. 13 приложения.
Если неравенство выполняется, то разность |г/о —6о| значима
и, следовательно, квадратичные члены в уравнении регрессии
отбрасывать нельзя. Невозможность отбросить квадратичные
члены в уравнении регрессии указывает на значительную кри-
визну поверхности отклика вблизи оптимума. В этом случае
необходима постановка факторного эксперимента с меньшими
единицами варьирования. Если же проведенный анализ пока-
жет, что |*/о~ 6о| незначимо отличается от нуля, то принятое
48
предположение о возможности описания выхода процесса без
членов высших порядков справедливо. В этом случае жела-
тельна также (для упрощения математической модели про-
цесса) проверка возможности описания выхода только линей-
ными членами, без их парных взаимодействий.
Проверка возможности описания процесса
линейной моделью. Чтобы проверить, можно ли отбро-
сить парные взаимодействия в уравнении регрессии, поступают
следующим образом. В матрице планирования (пример для
двух факторов) рядом со значениями yN, описывающими выход
процесса в каждом из вариантов опыта, записываются значе-
ния выхода yN, рассчитанные по уравнению регрессии с отбро-
шенными членами парных взаимодействий для значений фак-
торов хь х2, ..Хг, соответствующих каждому варианту.
№ ва- рианта Xi х2 1 1 — 1 У'Я 1 Л | yN — + ^1X1 4-Z?2^2
1 — — 1 Z/l = ^o + ^l ( 1) + ^г(— 1 )
2 + — У_2 Z/2=^o + ^i (+ 1) +^г(—1)
3 — + J/3 Уз=Ьо + Ь1 ( 1) + ^2( + 1)
4 + + f/4 1 Уь — Z?o + ^i ( + 1) + Ь2 (+1)
Ватем рассчитывается разность |#лг — ук\ и ^|2 для каж-
дого из N вариантов. После чего вычисляется дисперсия не-
адекватности данной модели (модели без парных взаимодей-
ствий)
52ад-Е (Удг—УаО/Л—I— 1,
[де N — число вариантов в многофакторной схеме, равное 2г';
N—i— 1)—число отброшенных взаимодействий, равное (2*—
- i— 1) .*
Далее, сравнив s2aI с $2[у] (дисперсией воспроизводимости,
рассчитанной выше), по критерию Фишера оценим возможность
Сбрасывания членов парных взаимодействий: Fpac4 = s2aA/s2r^];
Во табл. 14 находим F(fi; f2) (значение критерия Фишера для
степеней свободы fi и f2), где f{=N—i — 1 и f2 — число степеней
свободы, для которого определялась дисперсия воспроизводи-
мости tf2 = k — 1). Если ЕРасч>-Р(Л; ^2), то мы не можем отбро-
* В этом случае, если при статистическом анализе значимости коэффи-
1ентов регрессии было исключено из уравнения i линейных членов урав-
!ния, то общее число отброшенных членов равно
Л
N 4- Z — / —• 1 и
С2 — N /V/
ад дг + / - / — 1
49’
сить парные взаимодействия и утверждаем, что линейное при-
ближнее неадекватно. Если Ерасч^Е(Л; /2), то это значит, что
выход может достаточно точно описываться полученным урав-
нением регрессии без парных взаимодействий.
4.~Метод крутого восхождения
Представим себе человека, с завязанными глазами стоя-
щего на склоне. Он должен пройти кратчайшим путем по
направлению к вершине или подножию возвышенности. Есте-
ственной в такой ситуации является попытка оценить направ-
ление склона. Длй этого человеку необходимо сделать по
крайней мере по одному шагу поочередно во все четыре сто-
роны. Заметим, что чем круче склон, тем меньше по размеру
шаг ему надо сделать, чтобы достоверно оценить направление
движения. Получив сведения о крутизне склона, он может
идти в нужном направлении — к вершине или подножию. При-
близившись к участку поверхности, в пределах которого каж-
дый дальнейший шаг в выбранном ранее направлении уже не
сопровождается подъемом или спуском, человек может сделать
заключение о достижении цели. Тем не менее для достоверно-
сти он должен убедиться в том, что он действительно нахо-
дится на вершине (или у подножия), для чего ему необходимо
снова оценить крутизну поверхности того участка, ца котором
он остановился, сделав поочередно по шагу во все четыре
стороны.
Этот простой пример иллюстрирует поиск оптимума мето-
дом крутого восхождения по поверхности отклика в направле-
нии градиента линейного приближения, который можно оценить
в результате реализации полного факторного эксперимента.
Полученное при этом уравнение регрессии описывает неболь-
шой участок поверхности отклика площадью 22цХ2Х2 в случае
двух факторов или 2ZiX2Z2X. . .X2Zt- в случае гиперповерхно-
сти при исследовании большего числа факторов. Величины ко-
эффициентов регрессии при линейных членах дают необходимое
представление о пропорции, в которой следует менять факторы,
чтобы достигнуть оптимума.
Пусть для описания небольшого участка поверхности от-
клика двух факторов был поставлен полный факторный экспе-
римент с нулевым уровнем в точке %i = 3, х2=2. Единицы
варьирования были равны: Xi=2 и Х2=1. Уравнение регрессии
получено в следующем виде: у52 +11 хг + 6х2. Чтобы найти
оптимальное значение факторов Xi и х2, необходимо знать, на
сколько надо менять их величину в последующих опытах,
чтобы попасть в зону оптимума.
Бокс и Уилсон показали, что если поставить серию опытов,
в которой в каждом последующем варианте содержание х{ и х2
менять пропорционально произведению коэффициента регрессии
50
данного фактора на величину его единицы варьирования, то
»акое движение по поверхности отклика и будет кратчайшим
(утем к зоне оптимума.
В нашем примереХ1 = 2, bx = 11, &iA! = 22; Х2=1, Ь2 = 6; Ь2Х2 = 6.
J качестве «шага» возьмем 1/10 от ЬД;. Тогда план опыта по
крутому восхождению будет выглядеть так:
Ь варианта .12 3 4 5
1 ♦
'2 •
• 0Х1
°-Г2
0+0,1
0+0,1 &2Х2
0 + 0,2
O+O^Zj
0 + 0,3 Ь[К\
0+0,3 &2Z2
0 + 0,4 ^2^*2
0+0,4
раменяя условные обозначения уровней факторов в кодирован-
ных переменных их реальными численными величинами, полу-
чаем такой план эксперимента:
варианта
3
2
3+2,2
2+0,6
3+4,4
2 + 1,2
3+6,6
2+1,8
3+8,8
2+2,4
Реализовав эту серию опытов, мы, например, получили следую-
щие значения выхода:
№ варианта
Выход . .
1 2 3 4 5
60 70 80 80 60
.Как видно, начиная с третьего варианта дальнейшее изменение
Значений факторов (движение по градиенту) уже не приводит
к изменению выхода. Таким образом, можно считать, что опти-
мальное соотношение факторов составляет Xi=7,4, х2 = 3,2.
j Чтобы уточнить оптимальное соотношение, ставится новый
факторный эксперимент в найденной зоне оптимума, и если
^какой-либо из коэффициентов регрессии при линейных членах
Скажется значимым,* то необходимо скорректировать соответ-
ственно полученное оптимальное соотношение, наметив после-
дующую программу крутого восхождения по вновь рассчитан-
ному градиенту. При этом следует учитывать:
1. Если анализ уравнения показывает, что изучаемый про-
цесс не может быть описан полученным уравнением без членов
|высших порядков, то это свидетельствует о близости почти ста-
ционарной области и крутое восхождение в таком случае про-
изводить нецелесообразно. Более эффективна постановка не-
скольких многофакторных экспериментов с выбором нулевого
уровня при таких значениях факторов хь х2, ..., хг-> при кото-
рых был получен наилучший результат в предыдущем экспери-
менте. Нулевой уровень в том опыте, в котором все коэффи-
циенты регрессии при линейных членах окажутся незначимыми,
Можно принять за оптимальное соотношение факторов хь
Х2, . . ., Х{.
* Напомним, что в зоне оптимума коэффициенты регрессии должны
•быть незначимыми при линейных членах уравнения.
51
2. Если анализ уравнения показывает, что изучаемый про-
цесс может быть описан уравнением без членов высших поряд-
ков, но парные взаимодействия отброшены быть не могут, то
в этом случае можно наметить программу крутого восхождения.
Однако после нахождения оптимального соотношения обяза-
тельна постановка еще одного факторного эксперимента для
уточнения направления.
3. Если же линейное приближение адекватно, то в этих слу-
чаях всегда целесообразно и эффективно проводить крутое вос-
хождение.
Для лучшего усвоения изложенного материала рассмотрим
пример 16.
Пример 16. Использование метода полного факторного эксперимента и
метода крутого восхождения
Оптимизация минерального состава питательной среды по компонентам KCI.
NaCl и MgCl2 при культивировании микрообъектов
(в условных единицах)
Уравнение регрессии для трех факторов имеет вид
л
^2-^2 “Ь ^3-^32XjX2 + 3X1X3+ &2, 3X2X3 4" ^1, 2, зХ1Х2Хз-
Для определения коэффициейтов регрессии данного уравнения необхо
димо поставить N = 2*=23=8 вариантов. Чтобы иметь возможность оценить
значимость коэффициентов, причем число повторностей k равным 3.
Составим матрицу планирования: + 1 -1
KCI (xi) 10 2 12 8
NaCl (х2) 20 5 25 15
MgCl2 (х3) 12 2 14 10
№ ва- рианта Планирование Расчет Выход
I •Хо •Х1 -Х2 •Хз ВД ^1-Хз -х2х3 -X1-X9-X3
1 + — 1 — 1 1 г- 4- 90 130 140 120
2 + 4- — 1 1 — — 4- i + 280 300 320 300
3 + — * 1 ~ — 1 4- 1 —1- 245 260 305 270
4 + _ь 4- — _1_ — — 490 495 515 500
5 + — — 4- + — — 4- 250 150 200 200
6 + — 4- —. — — 425 400 435 420
7 + — + —4— — — — 300 325 425 350
8 + + + + -4- 4- + 4- 600 640 620 620
Для последующей оценки линейности уравнения регрессии был четырех-
кратно определен выход у0 при значениях факторов на нулевом уровне
(т. е. в «центре» эксперимента). Значения выхода составляли 300, 360, 380
и 280, откуда среднее значение выхода z/o=33O.
Рассчитаем коэффициенты регрессии:
к 120+300+270+500 4- 200 4- 420 4- 350 4- 620 2780
—-----------------g------------------= —g— = 348,
52
t —120+300+270+500 — 200+420 — 350+620
Ь}-------------------g
—120 — 300+270+500 — 200 — 420+350+620
&2- 8
—120 — 300 — 270 — 500+200+420+350+620
8
120 — 300 — 270+500+200 — 420 — 350+620
b$—
Ь., 2 =
b-t.3=
b,,z=
900
-8-=112,
700
-у-=88,
400
-^ = 50,
100
8 = '8 = 121
120 — 300+270 — 500 — 200+420 — 350+620 80
8 = 8 = 10’
120 + 300 — 270 — 500 — 200 — 420 + 350 + 620 0
8 = 8 = °’
—120 + 300 + 270 + 500 — 200 + 420 — 350 + 620 0_ _
8 “°-
£1,2,3= g
Вычислим ошибку коэффициентов регрессии:
1. Расчет построчной дисперсии
(120 — 90)2+ (120— 130)2 4- (120 — 140)2
— 700,
= 400,
= 975,
2
(300 — 280)2+ (300 — 300)2+ (300 — 320)2
2
(270 — 245) 2+ (270 — 260)2+ (270 — 305)2
2
(500 — 490)2+ (500 — 495)2+ (500 — 515)2
-----=175,
(200 — 250)2+(200 — 150)2+(200 — 200)2
2 — zbuu,
(420 — 425)2 + (420 — 400)2 + (420 — 435)2
2 -325’
(350 — 300) 2+ (350 — 325) 2+ (350 — 425)2
-------- _ - --------------------=4375,
(620 — 600)2+ (620 — 640)2+ (620 — 620)2
2
2. Расчет дисперсии воспроизводимости
s2[//]= М?У] =
= 400.
N
700 + 400+ 975 + 175 +2500 + 325+4375+400
9850
-~g— =1231.
1231
-3—410.
регрессии
410
:8~ = 5L
8
3. Расчет дисперсии среднего значения
— 52 [ У]
— LJ-
4. Расчет дисперсии коэффициентов
2ГА !
*2И= —=
Откуда ошибка коэффициентов регрессии равна s[6t]=Vs2[&i]=T61^7,15.
Число степеней свободы f=N(k—1)=8(3—1) = 16. Коэффициент Стью-
^ента для f=16 и 99% достоверности /99(16) =2,92.
53
Отсюда f99(16) -s[6d=20,9.
Проверим значимость коэффициентов
60 = 348>f99(16)$[6i]
&1=112>/99(16)фг
62= 88>/99(16)s bi_
Ьз= 50 > /99(16) <s[6i'
=20,9,
=20,9,
=20,9,
=20,9,
регрессии:
значимы для р=99%
bi, 2= 122>/99(16)s bi
^1,3=ю>/99(1б)5бг-:
^2,3= 0 ' >/99 (16)s bi
bi, 2,3— 02>/99(16)s bi
=20,9,
= 20,9,
= 20,9,
=20,9.
незначимы для р=99%
Коэффициенты 61,2, 61,3, 62,3, £1,2,3 незначимы и для р=95%.
Уравнение регрессии после отбрасывания незначимых членов имеет вид
л
у=348 +112x1+88х2+50х3.
Проанализируем это уравнение регрессии. Проверим правильность пред-
положения о возможности использования уравнения без членов высших по-
рядков. Составим неравенство _
i?o - М > V~s^(N+z)/zNtp(f},
~ (Л/— l)s2[&,]+(г — l)s2(y0)
где S2 =-----------N+r-2—------------
Для того чтобы оценить это неравенство, необходимо, кроме $2[6г], значение
которой было рассчитано выше, найти величину s2[r/ol- Для этой цели вос-
пользуемся результатами определения выхода при значениях всех факторов
на нулевом уровне («центр» эксперимента). Расчет s2[yo] ведется по формуле
- пг- 19 6800
S2[ >0] = 2 [ >0 — Уо] 1г(г — !) = 4 3~ = 5671
где z — число повторностей в определениях у0. Подставляя в неравенстве
числовые значения, получаем
1330 — 3481 >У2О6У (8+4)/8 -4f99(10) =8,8 • 3,17=27,9.
Различие между уо и Ьп статистически незначимо, следовательно, гипотеза
о возможности использования уравнения без квадратичных членов верна.
Так как в полученном уравнении регрессии коэффициенты, отражающие
взаимодействие факторов, незначимы, то, естественно, отпадает необходи-
мость оценки возможности их исключения из уравнения и можно сраз^
перейти к программе крутого восхождения:
Х1 ... 0Х1 =10 %i=2 61==110 61X1=220
х2 ... 0Л, =20 Хг = 5 62= 90 62Х2=450
Х3 ... O.V3=12 Х3=2 6з= 50 63X3= ЮО
В качестве «шага» изберем величину 7юо biU. Тогда план крутого восхож
дения будет выглядеть так:
Условия в кодированном обозначении
№ варианта 1 2 3 4 5 6
*1 ... 0x1 0+0,0161X1 0 -Ь 0,0261 0+0,0361X1 0+0,0461X1 0+0,0561X1
х2 ... 0х 2 0 + 0,0162Х2 0 + 0,0262Х2 0 + 0,0362x2 0+0,0462X2 0 + 0,0562Х2
Х3 ... охз 0+0,0163X3 0+0,026зХз 0 + 0,0363x3 0+0,04бзХз 0+0,056зХз
Условия в реальных величинах
Xi .. . 10 12,2 14,4 16,6 18,8 21,0
х2 .. . 20 24,5 29 33,5 38,0 42,5
х3 .. . 12 13,0 14,0 15,0 16,0 17,0
Выход 340 560 740 930 1080 i 1070
54
Реализованный опыт показал, что принятое решение о проведении кру-
того восхождения верно. Выход процесса при *1=21, х2=42,5 и х3=17,0
почти в три раза выше, чем на исходном нулевом уровне. Для уточнения
оптимального соотношения Xi, х2 и х3 нужно поставить трехфакторный
эксперимент с нулевыми уровнями 0Х1 =21, 0Х2=42,5 и 0ХзОх =17.
5. Стратегия поиска оптимума
Рассмотренные выше метод многофакторного планирования
и метод крутого восхождения по поверхности отклика дают
возможность достаточно достоверно и экономично (при мини-
мальной затрате сил и средств) определять оптимум по двум-
четырем исследуемым факторам.
Однако в действительности любой процесс, а в особенности
процесс с участием объектов биологического происхождения,
зависит от гораздо большего числа факторов. В этом случае
постановка полного факторного эксперимента становится чрез-
вычайно трудоемкой. Сложность объясняется, с одной стороны,
необходимостью проведения большого числа экспериментов, ко-
личество^ которых возрастает экспоненциально (Л/Г = 2г‘, где i —
число факторов), и, с другой, — трудностями обработки полу-
ченных данных (требуется наличие вычислительной техники)
и последующего анализа уравнения регрессии, содержащего
много членов. Поэтому экспериментатор вынужден ограничи-
.ваться одновременным исследованием максимум трех-четырех
факторов. Вследствие этого он всегда получает лишь частный
оптимум при каком-то, порой случайном, сочетании фиксиро-
ванных остальных факторов.
Исключить или уменьшить указанные затруднения при
реализации многофакторного эксперимента можно, воспользо-
вавшись приемом дробных реплик. Но этот вариант многофак-
торного эксперимента предполагает описание поверхности от-
клика уравнением регрессии, в котором неизбежно исключается
целый ряд членов, отражающих наличие взаимодействия фак-
торов. Учитывая, что взаимодействие факторов представляет
для исследователя особый интерес, ибо анализ взаимодействия
может помочь раскрыть сущность процесса, мы считаем, что
заведомый отказ от столь важной информации при планирова-
нии эксперимента методом дробных реплик делает этот метод
нецелесообразным.
Для сокращения числа факторов, подлежащих изучению,
в некоторых работах используется так называемый метод отсеи-
вающих экспериментов, цель которого — ранжировка факторов
по степени их влияния на выход и исключение из рассмотрения
тех, влияние которых в данном эксперименте оказалось стати-
стически незначимым. И опять-таки этот метод может быть
использован, лишь когда исследуемые факторы по своей при-
роде не могут быть взаимодействующими. В противном случае
имеется опасность исключить из рассмотрения факторы только
55
потому, что за счет взаимодействия их влияние могло про-
явиться лишь при ином, чем при проведении отсеивающего
эксперимента, сочетании исследуемых факторов.
И тем не менее у читателя не должно создаваться впечатле-
ние, что для отыскания истинного оптимума многофакторной
системы по всем факторам нет рационального пути. Один из
приемов, который представляется целесообразным использовать
при необходимости изучения многофакторной системы с взаимо-
действующими факторами, состоит в следующем.
Пусть изучению подлежит процесс, выход которого зависит
от 12 факторов, причем часть из них может взаимодействовать
друг с другом. Разобьем эти факторы на три или четыре группы
по четыре или три фактора соответственно в каждой. Количе-
ство групп и число факторов в каждой из них определяются
произвольно экспериментатором. Важно лишь, чтобы у экспери-
ментатора, основывающегося на априорных соображениях,
общем представлении о механизме процесса и предварительных
данных, была уверенность, что факторы, которые являются или
могут явиться взаимодействующими, не попали в разные
группы. Если такая уверенность есть, то путем постановки
полного факторного эксперимента можно найти частные опти-
мумы по факторам каждой группы, фиксируя факторы других
групп на любом постоянном уровне. Определив оптимальные
значения факторов в каждой группе, можно отыскать истинный
оптимум, который находится по значениям всех факторов в со-
ответствующих частных оптимумах.
Для того чтобы убедиться, не распределены ли взаимодей-
ствующие факторы по различным группам, что необходимо для
подтверждения истинности найденного описанным выше путем
оптимума, можно поступить следующим образом. Формально
считаем факторы, входящие в одну группу, одним каким-то
фактором. Например, если группа включает четыре соли: NaCl,
KCI, СаС12, MgCl2, то можно приготовить их смесь, взяв дан-
ные компоненты в определенной пропорции, и считать эту смесь
одним фактором, пропорционально увеличивая или уменьшая
содержание в ней составляющих. После этого проводится пол-
ный факторный эксперимент, в котором исследуется влияние
на выход искусственно созданных новых факторов.
Если при анализе полученного уравнения регрессии не по-
явится значимых коэффициентов при парных взаимодействиях,
то можно считать, что взаимодействующие факторы действи-
тельно не попали в разные группы. В противном случае следует
провести перераспределение факторов по группам. Иногда мо-
жет оказаться, что при любом разбиении взаимодействующие
факторы попадут в разные группы. Это вполне может прои-
зойти, когда число взаимодействующих факторов больше того
числа их, которое целесообразно объединить в одну группу.
56
В таком- случае поиск истинного оптимума более трудоемок и
включает следующие этапы:
1. Произвольное разбиение факторов, которое надо осуще-
ствлять, руководствуясь удобством проведения эксперимента и
не заботясь уже о размещении взаимодействующих факторов
по группам.
, 2. Нахождение частного оптимума в каждой группе факто-
ров при произвольных уровнях факторов в других группах. В ча-
стном случае оптимум может совпасть и с нулевым уровнем.
3. Нахождение частного оптимума в каждой группе при
значениях факторов остальных групп, фиксированных на уров-
нях, соответствующих ранее найденным частным оптимумам.
4. Повторение цикла исследований, указанных в предыду-
щем пункте, до тех пор, пока это не приведет к получению
истинного оптимума.
Таким образом, принцип нахождения истинного оптимума
выхода, зависящего от большего числа факторов, часть из ко-
торых являются взаимодействующими, предполагает последо-
вательное преодоление лимитирующих факторов, влияние кото-
рых начинает сказываться на выходе только на уровне частного
оптимума.
Представляется, что предлагаемый метод «последователь-
ного преодоления лимитирующих факторов» с использованием
метода полного факторного эксперимента является более
перспективным по сравнению с методами дробных реплик и
отсеивающего эксперимента, справедливость чего подтверж-
дается при изучении даже таких сложных систем, как «клет-
ка—среда», при культивировании водорослей, дрожжей и жи-
вотных клеток.
6. Понятие о симплекс-планировании
Как было показано выше, использование определенных ме-
тодов и приемов планирования эксперимента дает возможность
при минимальном объеме работы избрать наиболее рациональ-
ный путь поиска оптимума. В самом общем виде такое плани-
рование включает определение необходимого числа повторно-
стей в вариантах, выбор сочетания и схемы изменения условий
экспериментов с последующей математической обработкой по-
лученных результатов, что в конечном счете дает возможность
составить представление о роли факторов, направлении к опти-
муму, а также сформулировать критерии достижения оптимума.
Вместе с тем существуют в полном смысле этого слова
экспрессные методы проведения поиска, в которых не только
число экспериментов, но и все расчеты доведены до минимума.
В данном случае речь идет о методе симплекс-планирования,
сущность которого заключается в планировании эксперимента
таким образом, чтобы точки, координаты которых соответ-
ствуют определенным сочетаниям значений факторов, лежали
57
Рис. 2. «Кантование»
треугольника при сим-
плекс-планировании.
в вершинах правильного симплекса, построенного в факторном
пространстве. Напомним, что правильным симплексом является
множество п+1 независимых точек, образующих правильную
выпуклую фигуру (многогранник) в n-мерном пространстве.
В двухмерном пространстве (плоскости) это правильный тре-
угольник, в трехмерном — правильный
тетраэдр и т. д.
Рассмотрим как наиболее нагляд-
ный вариант метод симплекс-планиро-
вания при поиске оптимума для двух
факторов и х2. Графически такой
симплекс в виде правильного треуголь-
ника представлен на рис. 2. Строить
этот треугольник при проведении пер-
вого эксперимента целесообразно так,
чтобы одна из его вершин находилась
в условно выбранной нулевой точке,
координаты которой Xi=x2 = 0 (эта точка аналогична условному
нулевому уровню плана полного факторного эксперимента).
Значения факторов при определении координат точек целесо-
образно выражать в условных единицах, а в качестве фунда-
ментального параметра планирования брать сторону симплекса.
При этом единицы варьирования в соответствии с геометрией
симплекса могут принимать различные значения. Для правиль-
ного треугольника они пропорциональны числам 1,0; 0,86; 0,5.
Таким образом, координаты вершин треугольника будут:
В Х1 х2 В
о 0 0 Уо
^4 0,5 0,86 Ул
В 1,0 0 Ув
В качестве примера рассмотрим симплекс-планирование при
поиске оптимума действия фермента по двум факторам: вели-
чине pH и температуре. За нулевой уровень, исходя из априор-
ных соображений, примем* значения рН = 5,0 и Г = 20°; %i = 0
(рН = 5,0) и х2 = 0 (Г = 20°). Далее выразим значения различ-
ных факторов в одинаковых единицах. Так, например, условную
единицу фактора (pH) принимаем за 0,5, а фактора х2 (Г) —
за 5°. Эта система характеризуется тем, что разные по своей
природе факторы, измеряемые в различных единицах, выража-
ются однотипно. В соответствии с изложенным выше первый
58
эксперимент по изучению активности фермента ставится при
следующих значениях факторов:
№ варианта Значение х{ Значение х2
условное истинное условное истинное
1 (0) 0 5,0 0 20
2 (А) 0,5 5,5 0,86 25
3 (В) 1,0 6,0 0 20
Пусть после реализации экспериментов в точках О, Л и В
(число повторностей в каждом варианте следует определять
согласно приведенным выше правилам и положениям) будут
получены соответствующие значения выходов у0, Уа и ув, при-
чем” у о<ув<Ул-
Для определения координаты точки следующего шага в по-
иске оптимума метод симплекс-планирования предусматривает
очень простой прием, заключающийся в построении на грани
предшествующего симплекса,, которая противостоит точке наи-
худшего выхода, нового симплекса. В нем точка постановки
нового эксперимента является зеркальным отражением точки
минимального выхода (точка 0* симплекса ВЛО* — рис. 2).
Для определения координаты точки 0* можно ограничиться
графическим методом построения равносторонних треугольни-
ков, имеющих общую сторону. В более сложном случае или при
желании воспользоваться расчетными приемами согласно пра-
вилам векторного исчисления координату точки 0* находят
как удвоенную среднюю координат старого симплекса без
точки наихудшего выхода, координаты которой вычитаются из
этого значения:
1л._2 -^r-.-.L^-,-g±^±S_________
7 п J
В нашем случае
^=2/2 (Va+Vb)-K
где VA, Vb, Vo — координаты соответствующих точек в вектор-
ной форме. Переходя к числовым значениям, координаты
точки 0* (см. рис. 2) определяем так
Х1=2 (1+0,5)12—0= 1,5,
х2 = 2 (0+0,86) 2—0=0,86.
Соответственно для нашего примера изучение активности фер-
мента на последующем этапе (после реализации первого экспе-
римента) нужно проводить при значениях факторов %i = 6,5
(pH), х2 = 25° (Т).
59
После постановки эксперимента в точке 0* и определения
величины выхода у0* его сравнивают со значениями г/о, Уа и ув
и в соответствии с приведенными выше правилами симплекс-
планирования ставят еще один эксперимент, «кантуя» симплекс
в ту или иную сторону. При этом следует иметь в виду, что
если при применении симплекс-планирования система симплекс
сов начинает вращаться вокруг некоторого наиболее высокого
значения, то после постановки п+Г-го эксперимента необходимо
прекратить дальнейшее движение и повторить опыт; давший
наибольший выход. При этом если одно из значений выходов
является максимальным, то нужно, провести проверку данного
выхода и затем на нем остановиться.
Особый случай представляет вариант, когда при постановке
эксперимента в новом симплексе (в разобранном выше случае
в точке 0*) выход будет получен также минимальный. При
такой ситуации необходимо возвратиться к старому симплексу
и при построении нового за исходную точку взять координату
второго наименьшего выхода (в разобранном случае точку В),
поставив затем эксперимент в «зеркальной» точке В* (на
рис. 2 не указана).
Таким образом, использование симплекс-планирования дает
возможность резко снизить число экспериментов по сравнению
с методом полного факторного эксперимента, где, кроме того,
добавление каждого нового фактора требует удвоения всего
числа экспериментов, а при симплекс-планировании— только
одного нового опыта (если выбрано правильное направление)
и еще одного (если выбрано неправильное направление). Ре-
зультаты, получаемые при симплекс-планировании, не зависят
от формы поверхности отклика, так как из всех данных нас
интересуют худшие результаты и при отрицательных резуль-
татах экспериментатор возвращается назад и повторяет «канто-
вание» симплекса. Как можно было видеть, метод не требует
проведения расчетов и может быть даже применен при изуче-
нии процессов, в которых функцию выхода нельзя измерить
количественно, а можно только оценить полуколичественно или
даже чисто качественно. При этом правила движения к опти-
муму не теряют своей строгости.
Вместе с тем, используя метод симплекс-планирования, мы
никогда не сможем оценить роль отдельных факторов и, что
важно при исследовании сложных процессов, не получим ни-
какой информации о взаимодействии факторов. К тому же экс-
прессность метода симплекс-планирования проявляется в пол-
ной мере лишь в тех случаях, когда затраты времени на про-
ведение самого эксперимента незначительны и основное время
экспериментатора уходит на расчеты (в случае постановки пол-
ного факторного эксперимента). В тех же случаях, когда экспе-
римент по своей природе является длительным (недели и ме-
сяцы), применение метода симплекс-планирования нерацио-
60
.нально, так как последовательность получения точек (например,
результаты изучения урожайности сельскохозяйственных куль-
тур) может растянуться на неопределенно долгий срок, ибо
построение следующего симплекса невозможно, прежде чем не
будет реализован предыдущий. В этом случае целесообразно
использование метода полного факторного эксперимента, поз-
воляющего одновременно поставить хотя и большее число ва-
риантов, но зато получить более полное представление о влия-
нии факторов и условиях движения к оптимуму.
ПРИЛОЖЕНИЕ
Таблица 1
Критерии для исключения выскакивающих значений *
п Уровень достоверности
95% 1 99%.
отношения* **
Л 71 ХП-] • Хп Хп-\ ' п Хп-2 X п—Хп-1 Хп—Xn-i Хп—ХП-2
Xn—Xi Х2—Х1 Хп—Х2 Х2—Х{ Хп—Х! Хз—Хг Хп—Х1 х2—Xi Хп—Х2 Х2—Xi Xn—Xi Х3—Х1
X п—Х[ Хп—Х2 X п—Х1 Хп—Х1 хп—х2 Хп Х[
3 0,941, . 1,000 1,000 0,988 1,000 1,000
4 0,765 v 0,955 0,967 0,889 0,991 0,992
5 0,642 | 0,807 0,845 0,780 0,916 0,929
6 0,560 । 0,689 0,736 0,698 0,805 0,836
7 0,507 ! 0,610 0,661 0,637 0,740 0,778
8 0,468 j 0,554 0,607 0,590. 0,683 0,710
9 0,437 0,512 0,565 0,5515 0,635 0,667
10 0,412 | 0,477 0,531 0,527- 0,597 0,632
11 о,з92' : 0,450 0,504 0,502 0,566 0,603
12 0,376 0,428 0,481 0,482 0,541 0,579
15 0,338 0,381 0,430 0,438 0,486 0,522
20 0,300 , 0,334 0,372 0,391 0,430 0,464
24 0,281 I 0,309 0,347 0,367 0,400 0,434
30 0,260 1 0,283 0,322 0,341 0,369 0,402
* Таблица составлена по Л. Н. Болыпеву и Н. В. Смирнову (1965).
** Верхний ряд отношений — для оценки выскакивающих наибольших
вариант, нижний ряд — для наименьших вариант.
62
Таблица 2
Значения коэффициента dn для оценки
стандартного отклонения по размаху
варьирования *
п dn п dn
2 1,128 12 3,258
3 1,693 13 3,336
4 2,059 14 3,407
5 2,326 15 3,472
6 2,534 16 3,532
7 2,704 17 3,588
8 2,847 • 18 3,640
9 2,970 19 3,689
10 3,078 20 3,735
1.1 8,173
* Таблица составлена по Л. Н. Большеву и
Н. В. Смирнову (1965).
Таблица 3
Значения коэффициента kw для расчета границ доверительных интервалов
средних по размаху варьирования *
п Уровень достоверности п Уровень достоверности
95% 99% 95% 99%
3 1,30 3,00 12 0,19 0,28
4 0,72 1,32 13 0,18 0,26
5 0,51 0,84 14 0,17 0,24 '
6 0,40 0,63 15 0,16 0,22
7 0,33 0,51 16 . 0,15 0,21
8 0,29 0,43 17 0,14 0,20
9 0,25 0,37 18 0,14 0,19
10 0,23 0,33 19 0,13 0,18
11 0,21 0,30 20 0,13 0,17
* Таблица составлена по Л. Н. Большеву и Н. В. Смирнову (1965).
63
Таблица 4
Номера результатов опытов, которые могут быть приняты в качестве
пограничных значений доверительного интервала медианы *
(при условии, что результаты опытов расположены и пронумерованы
в порядке возрастающих значений)
СП Уровень достоверности л о Уровень достоверности
3 95% 99% .3 95% 99%
с л
о « я Л 2 к Л к л о « § Я £ § л ч 2 ® л 05 Л л л
ч Л & я Ч СО S Л С-1 2.5 $ £ а § я £• и л Ли л . и £• ч Л Т л ? к 5 s сх Л U и л сх л Ф сх м С-1 ЕС S «5 и л СХ л Ф сх М Ь-
6 1 6 — — 27 8 20 7 21
7 1 7 — — 28 9 20 7 22
8 1 8 1 8 29 9 21 8 22
9 2 8 1 9 30 10 21 8 23
10 11 2 2 9 10 1 1 10 И 31 32 10 10 22 23 8 9 24 1 24
12 3 10 2 11 33 11 23 9 25
13 3 11 2 12 34 11 24 10 25
14 3 12 2 13 35 12 24 10 26
15 4 12 3 13 36 12 ' 25 10 27
16 4 13 3 14 37 13 25 11 27
17 5 13 3 15 38 13 26 11 28
18 5 14 4 15 39 15 27 15 28
19 5 15 4 1& 40 13 27 12 29
20 6 15 4 17 41 14 2? 12 30
21 6 16 5 17 42 15 28 13 30
22 6 17 5 18 43 15 29 13 31
23 7 17 5 19 44 16 29 14 31
24 7 18 6 19 45 16 30 •14 32
25 8 18 6 20 46 16 31 14 33
26 8 19 7 20 47 17 31 15 33
•64
^CiCiciciCiCiCiCiOiCiCiciciciciciciCTCici
OcD00-<JCiC14^00ND»-- OGDOO“4QiCi4^QONO—*О
Число опытов
Таблица составлена по Б. Л. Ван-дер-Вардепу (I960).
- —> ООФОФОООО-^
О СЛ СЛ 4^ CJ Ю- ND —1 — OOGD CDOO ^J-^JCiCiClCiD^COOOKDND
NO ND NO NO ND
Ci Cl Cl 4^ 4*
ND NO
ND NO
ND ND
00
OO 00
nd
W CO w
oo -o *q
©OCOCOOCDCOCDCDCOCOOOOOOOOOOOOOOOOOOOOO^q-vJ
OG0GD‘^CiCiH-*00ND'-‘OO00-<ICi014*C0ND—*0 0 00
СТ
4^4^00COOOCOGOCOGOOOOOOOOOCOOOOOOOCOOOGOGPCOOOG3NDNDND
oocD<£>oooooo*q--4CiCiCiCi4=*4*GoQocobOND~-*^— оо.со<х>ф
Ci Cl Ci Ci
О О CO QO
Cl
CI Ci Cl Ci Cl Cl CI Cl Ci Ci Cl Cl Cl
CiCiClCi4^4^Q0G0ND^— н-фф
oo
oo
oo
00
Ci
CO
Ci
Ci
co
Cl
GO
Cl
co
GO 00 OO CO CO 00 QO CO CO ND ND ND NO ND
OOOONDNDNO — —‘ О О О О Ф Э0 oo
ND
ND
C5 C5 Ci Ci Ci Ci Ci Ci Cl Ci Ci Cl ci От Cl
4^ GO GO ND ND О О CO CO 00 00 <! Ci Ci
Cl Cl Cl Cl Cl Ci Ci Ci Ci Ci Cl 4*.
От Ci 4^ 4^ Co ND ND >— •— ФОО
НИЖНЯЯ граница | 95% | Уровень достоверности II
верхняя граница \
нижняя граница || %бб !
верхняя граница
Число опытов
нижняя граница 95% I I Уровень достоверности
верхняя граница
нижняя граница |_ 99%
I верхняя - граница j
Д
Ю
О
Ja
о
£4
*
rt>
s
я
CP
pa
c\
Таблица 5
Пограничные значения критерия U *
а) Уровень достоверности 95%
«2 П{
2 3 4 5 6 1 1 7 8 9 10
3 — 0
4 — 0 1
5 0 1. 2, 4
6 0 2 3 5 7
7 0 2 4 6 8 11
8 1 3 5 8 10 13 15
9 1 1 4 6 ! 9 12 15 18 21
10 1 ! 1 4 7 11 i 14 17 | 20 21 27
п2 9 П\
10 11 12 13 1 14 15 16 । 17х 18 19 20 •
2 1 1 1 2 2 2 t 3 3 3 4 ~ 4 4
3 3 4 5 5 6 7 7 8 • 9 9 10 11
4 6 7 8 9 10 11 12 14 15 16 17 18
5 9 11 12 13 15 16 18 19 20 22 23 25
6 12 14 16 •17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 i 26 28 31 33 36 39 41 44 47
9 21 I 24 27 30 33 36 • 39 42 45 48 51 51
10 21 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 £7 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37, 42 47 51 56 61 65 70 75 80 84
14 36 41 46 5 к 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 ' 83 88 94 100
16 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 91 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
66
Продолжение табл. 5
б) Уровень достоверности 99 %
и2
3 4 5 6 7 8 9 10
5 — . 0 1
6 — 1 2 3
7 0 1 3 4 6
8 0 2 4 6 7 9
9' 1 3 5 7 9 И 14
10 1 3 6 8 11 13 16 19
ц2 «1
9 10 11 12 13 14 15 16 17 18 19 20
2 — — — — 0 0 0 0 0 0 1 1
3 1 1 1 2 2 2 3 3 4 4 4 5
4 3 3 4 5 ; 5 6 7 7 8 9 9 10
5 5 6 7 8 ! 9 10 11 12 13 14 15 16
6 7 8 9 11 1 12 13 15 16 18 19 20 22
7 9 11 12 14 1 16 17 19 21 23 24 26 28
8 11 Ч 15 17 ! 20 22 24 26 28 30 32 31
9< 14 16 18 21 I 23 26 28 31 33 36 38 40
10 16 19 22 i 24 ! 27 30 33 36 38 41 44 47
11 18 22 25 28 1 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 , 39 43 47 , 51 55 59 63 67
14 26 30 34 , 38 43 47 51 56 60 65 69 73
15 28 33 37 i 42 47 51 56 61 66 70 75 80
16 31 36 ’ 41 1 46 51 56 61 66 71 76 82 87
17 33 38 44 I 49 ; 55 60 66 71 77 82 88 93
18 36 41 47 - 53 . 59 65 70 76 82 88 94 100
19 38 44 50 56 ! 63 69 75 '82 88 94 101 107
20 40 47 53 60 . 67 73 80 87 93 100 107 111
Таблица составлена по С. Зигелю (Siegel, 1956).
67
Пограничные значения д;,я
П ДЛЯ ITmin п для
2 3 4 5 6 7
2 63,66** 95,49 116,1 131,2 143,0 152,6
12,71 19,07 23,21 26,22 28,57 30,49
3 7.370 3,194 9,986 4,373 11,71 5,144 12,98 5,712 13,98 6,160 14,81 6,528
4 3,725 2,027 4,789 2,663 5,489 3,075 6,010 3,381 6,424 3,623 6,765- 3,822
5 2,664 1,602 3,324 2,059 3,757 2,353 4,079 2,570 4,335 2,742 4,547 2,884
6 2,176 1,381 2,665 1,752 2,983 1,988 3,220 2,162 3,409 2,300 3,565 2,414
7 1,897 1,245 2,294 1,564 2,551 1,767 2,742 1,916 2,891 2,034 3,020 2,131
8 1,715 1,151 ~ 2,056 1,437 2,275 1,618 2,437 1,750 2,566 1,855 2,673 1,941
9 1,587 1,082 1,889 1,345 2,083 1,509 2,226 1,630 2,339 1,725 2,434 1,804
10 . 1,491 1,029 1,766 1,274 1,941 1,427 2,070 1,539 2,173 1,627 2,258 1,700
И Г,416 0,986 1,670 1,218 1,831 1,362 1,950 1,467 2,045 . 1,549 2,123 1,618
12 1,356 0,951 1,594 1,172 1,744 1,309 1,855 1,408 1,943 1,487 2,015 1,551
13 1,306 0,922 1,531 1,134 1,673 1,264 1,777 1,359 1,860 1,434 1,928 1,496
14 ' 1,264 0,897 1,479 1,101 1,613 1,227 1,712 1,318 1,791 ' 1,390 1,855 1,449
15 1,228 0,875 1,434 1,073 1,562 1,194 1,657 1,282 1,731 1,352 1,793 1,408
* Таблица составлена по Л. Н. Болыневу и II. В. Смирнову (1965).
* Верхнее значение — для уровня достоверности 99%, нижнее — для
68
Таблица 6
отношения размахов (F) 1
^гпах
8 9 10 11 i 12 13 14 15
160,6 167,6 173,6 179,0 183,8 188,2 192,2 195,9
32,10 33,49 34,70 35,77 36,74 37,61 38,41 39,15
15,50 16,11 16,64 17,11 17,54 17,92 18,28- 18,60
6,839 7,108 7,344 7,554 7,743 7,914 8,072 8,216
7,056 7,307 7,529 7,728 7,906 8,069 8,218 8,356
3,990 4,137 4,265 4,380 4,484 4,578 4,664 4,744
4,728 4,885 5,024 5,149 5,261 5,363 5,457 5,544
3,004 3,090 3,209 3,283 3,357 3,425 3,487 3,544
3,699 3,815 3,918 4,010 4,093 4,169 4,238 4,303
2,510 2,594 2,668 2,734 2,794 2,849 2,899 2,945
3,127 3,221 3,304 3,378 3,445 3,507 3,563 3,615
2,213 2,285 2,348 2,405 2,456 2,503 2,545 2,585
2,765 2,844 2,915 2,978 3,035 3,088 3,136 3,180
2,014 2,078 2,134 2,184 2,229 2,271 2,309 2,344
2,514 2,584 2,646 2,702 2,753 2,799 2,841 2,880
1,870 1,928 1,979 2,025 2,066 2,104 2,138 2,170
2,330 2,394 2,450 2,500 2,545 2,587 2,625 2,661
1,761 1,815 1,862 1,904 1,942 1,977 2,009 2,039
2,189 2,247 2,299 . 2,345 2,387 2,425 2,460 2,492
1,675 1,725 1,770 1,809 1,845 1,878 1,908 1,935
2,077 2,131 2,179 2,222 2,261 2,296 2,329 2,359
1,606 1,653 1,695 1,732 1,766 1,797 1,825 1,851
1,986 2,037 2,082 2,122 2,158 2,192 2,222 2,250
1,547 1,593 1,633- 1,668 1,701 1,730 1,757 1,782
1,910 1,958 2,001 2,038 2,073 2,105 2,133 2,160
1,499 1,542 1,580 1,614 1,645 1,673 1,699 1,723
1,845 1,892. 1,932 1,968 2,001 2,г31 2,058 2,084
1,456 1,498 1,535 f . 1,568 . 1,598 1,625 1,649 1,673
уровня достоверности 95%.
Таблица 7
Значения коэффициента k д* для оценки достоверности различия
двух средних по размаху варьирования
W1 + /Z2 Уровень достоверности Максимально допустимое абсолютное значение разности |«i—пЛ ** «1 1 Уровень достоверности Максимально допустимое абсолютное значение разности 1п1—л21 **
95% 99% 95% 99%
4 3,81 8,79 0 13 0,49 0,70 3
5 2,58 4,72 1 14 0,45 0,62 4
6 1,42 2,36 2 15 0,44 0,61 5
7 1,16 1,82 1 16 0,38 0,53 4
*8 0,87 1,31 2 17 0,38 0,52 5
9 0,80 1,19 3 18 0,34 0,47 4
10 0,64 0,93 2 19 0,33 0,46 5
1.1 0,61 0,88 3 20 0,31 0,43 6
12 0,53 0,76 4
1/ 1 . X X
V ni + я, =- dni+lh - - •
** Вполне строгими следует считать оценки k д при
|«1 — «г|<1.
Пограничные значения критерия знаков *
Таблица 8
Общее число опытов' (толь- ко + и —) Минимальные значения числа опытов с однозначным резуль- татом, при которых отличие от контроля достоверно с вероятностью не менее Общее число опытов (толь- ко + и —) Минимачьные значения числа • опытов с однозначным резуль- татом, при которых отличие от контроля достоверно с вероятностью не менее
95 % | 99% 95% 99%
6 6 . 22 17 18
7 7 — 23 17 . 19
8 8 8 24 18 19
9 8 9 25 18 20
10 9 10 26 19 20
11 10 11 27 20 21
12 10 11 28 20 22
13 11 12 29 21 22
14 12 13 30 21 23
15 12 13 31 22 24
16 13 14 32 23 24
17 13 15 33 23 25
18 14 15 34 24 25
19 15 16 35 24 26
20 15 17 36 25 27
21 16 17 37 25 27
* Таблица составлена по Б. Л. Ван-дер-Вардену (1960).
70
Продолжение табл. 8
Общее число опытов (толь- ко + и —) Минимальные значения числа опытов с однозначным резуль- татом, при которых отличие от контроля достоверно с вероятностью не менее Общее число опытов (толь- ко + И.’—) Минимальные значения числа опытов с однозначным резуль- татом, при которых отличие от контроля достоверно с вероятностью не менее
95% 99% 95% 99%
38 26 28 70 44 47
39 27 28 71 45 47
40 27 29 72 45 48
41 28 30 73 46 48
42 28 30 74 46 49
43 29 31 75 47 50
44 29 31 76 48 50
45 30 32 77 48 51
46 31 33 78 49 51
47 31 33 79 . 49 52
48 32 34 80 50 52
49 32 34 81 50 53
50 • 33 35 82 51 54
51 33 36 83 51 54
52 34 36 84 52 55
53 35 37 4 85 52 55
54 35 37 86 53 56
55 36 38 87 53 56
56 36 39 88 54 57
57 37 39 89 54 58
58 37 40 90 55 58
59 38 40 91 55 59
60 39 41 92 56 59
61 39 41 93 56 60
62 40 42 94 57 60
63 40 43 95 57 61
64 41 43 96 58 62
65 41 44 97 59 62
66 42 44 98 59 63
67 42 45 99 60 63
68 43 46 100 60 64
69 44 46 61
Пограничные значения критерия Таблица 9 ^ля отбраковки препаратов * IF п
н Уровень достоверности п Уровень достоверности
95% 99% 95% 99%
2 3,157 15,910 8 0,230 0,366
3 0,885 2,111 9 0,205 0,322
4 0,529 1,023 10 0,186 0,288
5 0,388 0,685 11 0,170 0,262
6 0,312 0,523 12 0,158 0,241
7 0,263 0,429 13 0,147 0,224
* Таблица составлена
по Л. Н. Большеву и
И. В. Смирнову (1965).
71
Продолжение табл. 9
п Уровень достоверности п Уровень достоверности
95% 99% 95% 99%
14 0,138 0,209 18 0,113 0,168
15 0,131 0,197 19 0,108 0,161
16 0,124 0,186 20 0,104 0,154
17 0,118 0,177 •
Таблица 10
Пограничные значения коэффициента kN * для быстрого сравнения
групповых и факторных средних
N
f 2 3 4 5 6 7 8 9 10
2 9,92** 8,09 7,01 6,27 5,72 5,29 4,96 4,67 4,43
4,30 3,51 3,04 2,72 2,48 2,30 2,15 2,03 1,92
3 5,84 4,76 4,12 3,69 3,37 3,12 2,92 2,75 2,61
3,18 2,59 2,25 2,01 1,83 1,70 1,59 1,50 1,42
4 4,60 3,75 3,25 2,91 2,65 2,45 2,30 2,17 2,06
2,78 ' 2,26 1,96 1,76 1,60 1,48 1,39 1,31 1,24
5 4,03 3,29 2,85 2,55 2,46 2,15 2,01 1,90 1,80
2,57 2,10 1,81 1,62 1,48 1,37 1,28 1,21 1,14
6 3,71 3,03 2,62 2,35 2,14 1,98 1,85 1,75 1,65
2,45 .2,01 1,73 1,55 1,42 1,31 1,22 1,15 1,09
7 3,50 2,86 2,47 2,22 2,02 1,87 1,75 1,65 1,56
2,36 1,93 1,65 1,49 1,36 1,26 1,18 1,13 1,05
8 3,36 2,74 2,38 2,12 1,94 1,79 1,68 1,60 1,50
2,31 1,88 1,63 1,46 1,33 1,23 1,15 1,09 1,04
9 3,25 2,65 2,30 2,05 1,86 1,76 1,62 1,53 1,45
2,26 1,84 1,60 1,43 1,30 1,21 1,13 1,06 1,01
10 3,17 2,59 2,24 2,01 1,83 1,69 ' 1,58 1,49 1,42
2,23 1,81 1,58 1.41 1,29 1,19 1.Н 1,05 0,99
И 3,11 2,54 2,20 1,97 1,79 1,66 1,55 1,47 1,39
2,20 1,79 1,56 1,39 1,27 1,17 1.10 1,04 0,98
^nl^n
81 * Верхнее значение —для уровня достоверности 99%, нижнее —для
уровня достоверности 95%.
72
Продолжение табл. 10
/
2 3 4 5 6 7 8 9 10
12 3.06 2,50 2.16 1,83 1,76 1,63 1.53 1,44 1,37
2,18 1,78 1,54 1,38 1,26 1,16 1,09 1,03 0.97
13 3,01 2,46 2,13 1.91 1,74 1,61 1,50 1,42 1,35
2,16 1,77 1,53 1,36 1,25 1,15 1,08 1,02 0,97
14 2,98 2,43 2,11 1,88 1.72 1,59 1.49 1,40 1,33
2,14 1,75 1,51 1,35 1,23 1.14 1,07 1.01 0,96
15 2,95 2,40 2,07 1,86 1,70 1,57 1,48 1,39 1,32
2,13 1,73 1,51 1,34 1,23- 1,14 1,07 1,00 0,95.
16 2,92 2,38 2,06 1,84 1,69 1,56 1,46 1,38 1,30
2,12 1,73 1,50 1,34 1,22 1,13 1,06 1,00 0,95
17 2,90 2,37 2,05 1,83 1,67 1,55 1,45 1,37 1,30
2,11 1,72 1,49 1,33 1,22 1,13 1,06 0,99 0,94
18 2,88 2,35 2,04 1,82 1,66 1,54 1,44 1,36 1,29
2,10 1,72 1,48 1,33 1,21 1,12 1,05 0,99 0.94
19 2,86 2.34 2,02 1,81 1,65 1,53 1,43 1,35 1,28
2,09 1,71 1,48 1,32 1,21 1,12 1,05 0,99 0.93
20 2,84 2,32 2,00 1,79 1,64 1,52 1.42 1,34 1,27
2,09 1,71 1,48 1,32 1,21 1,12 1,05 0,99 0.93
21 2,83 2,30 2,00 1,79 1,63 1,51 1,42 1,33 1,27
2,08 1,70 1,47 1,31 1,20 1,11 1,04 0,98 0,93
22 2,82 2,30 1,99 1,78 1,63 1,50 1,41 1,33 1,26
2,07 1,69 1,46 1,31 1,19 1,11 1,04 0,98 0,93
24 2,80 2,28 1,98 1,77 1,62 1,49 . 1,41 1,32 1.25
2,06 1,68 1,46 1,30 1,19 1,10 1,03 0.97 0,92
27 2,77 2,26 1,96 1,75 1,60 1,48 1,39 1,31 1.24
2,05 1,67 1,45 1,30 1,18 1,09 1.03 0,97 0,92
30 2,75 2,24 1,94 1,74 1,59 1,47 1,38 1,30 1,23
2,04 1,66 1,44 1,29 1,18 1,09 1,02 0,96 0,91
40 2,70 2,20 1,91 1,71 1,56 1,44 1,35 1,27 1.21
2,02 1,65 1,43 1,28 1,17 1,08 1,01 0,95 0,90
60 2,66 2,17 1,88 1,68 1,54 1,42 1.33 1,25 1,19
2.00 1,63 1,41 1,26 1,15 1,07 1,00 0,94 0,89
120 2,62 2,14 1,85 1,66 1,51 1.40 1,31 1,23 1,17
1,98 1,62 1,40 1,25 1,14 '1,06 0,99 0,93 0.89
78
Значения коэффициента К Pi> для экпрессной оценки
Pl
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45
0,05 —4,56 -2,73 -2,05 —1,69 —1,46 —1,31 -1,18 —1,09
0,10 3.56 — -5,33 -2,91 —2,10 -1,68 —1,44 —1,24 —1,11
0,15 1,73 4,33 — -5,20 —2,81 -2,00 —1,60 -1,32 —1,14
0,20 1,05 1,91 4,20 — -4,94 —2,62 -1,87 —1,42 -1,18
0,25 0,69 1,10 1,81 3,94 — —4,47 —2,39 —1,60 -1,24
0,30 0,46 0,68 1,00 1,62 3,46 — —4,00 —1,92 -1,33
0,35 0,31 0,44 0,60 0,87 1,39 3,00 —. —2,79 —1,50
0,40 0,18 0,24 0,32 0,42 0,60 0,93 1,79 — -2,08
0,45 0,09 0,11 0,14 0,18 0,24 0,33 0,50 1,08 —
0,50 0,00 0,00 0,00 0,00 0,00 0,00 ООО 0,00 0,00
0,55 —0,07 —0,09 —0,11 -0,13 —0,16 -0,20 —0’25 —0,34 -0,50
0,60 —0,13 -0,16 —0,19 -0,23 -0,27 -0,32 —0’39 -0,50 -0,66
0,65 —0,19 -0,23 —0,27 -0,32 —0,37 —0,43 —0’50 -0,61 -0,75
0,70 -0,24 —0,28 -0,33 -0,38 —0,44 —0,50 -0’57 -0,68 —0,80
0,75 -0,29 -0,34 —0,39 —0,44 -0,50 -0,56 -0,63 —0,73 -0,84
0,80 -0,34 -0,40 —0,45 -0,50 —0.56 —0,62 —0,68 —0,77 —0,87
0,85 -0,39 -0,45 -0,50 —0,55 —0,61 —0,67 —0,73 -0,81 -0,89
0,90 —0,44 —0,50 —0,55 —0,60 —0,66 —0,71 —0,77 -0,84 —0,91
0,95 -0,50 —0,56 -0,61 -0,66 —0,71 —0,76 —0,81 -0,87 -0,93
Значения коэффициента //?1> Р1 для экспрессной оценки квадра
Рг
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45
0,05 2,77 1,61 1,25 1,03 0,89 0,80 0,72 0,66
0,10 —2,77 — 4,17 2,27 1,64 1,32 1,12 0,97 0,87
0,15 —1,67 —4,16 —. 5,00 2.70 1.92 1,54 1,27 1,10
0,20 —1,25 —2,27 —5,00 — 5,88 3,12 2,22 1,68 1,41
0,25 — 1,03 —1,64 —2,70 - 5,88 — 6,67 3,57 2,38 1,85
0,30 —0,89 -1,32 -1,92 -3,12 —6,67 — 7,70 3,70 2,56
0,35 —0,80 -1,12 -1,54 -2,22 -3,57 —7,69 — 7,14 3,85
0,40 —0,72 —0,97 -1,26 —1,69 -2,38 -3,70 -7,14 — 8,33
0,45 —0,66 —0,87 —1,10 —1,41 -1,85 -2,56 -3,85 —8,33 —
0,50 —0,61 -0,78 —0,96 -1,19 -1,49 -1,92 -2,56 —4,00 —7,69
0,55 —0,56 —0,71 -0,85 —1,03 -1,25 -1,54 —1,92 —2,63 -3,85
0,60 -0,53 —0,65 —0,78 -0,92 -1,09 —1,30 —1,56 -2,00 -2,63
0,65 —0,49 —0,60 —0,70 -0,81 -0,94 -1,10 -1,28 -1,56 -1,92
0,70 —0,46 -0,56 —0,64 —0,74 —0,84 —0,96 -1,10 —1,30 —1,54
0,75 —0,43 —0,51 —0,58 —0,66 —0,75 -0,84 -0,94 -1,09 -1,25
0,80 —0,40 —0,47 -0,53 —0,60 —0,66 -0,75 —0,81 -0.92 -1,03
0,85 —0,37 —0,43 -0,48 -0,53 —0,58 -0,64 —0,70 —0,73 —0,85
0,90 —0,34 -0,39 -0,43 —0,47 -0,51 -0,56 —0,60 —0,65 —0,71
0,95 -0,30 —0,34 —0,37 —0,40 —0,43 -0,46 —0,49 —0,53 —0,56
. 74
Таблица 11
средних при измерениях с помощью шаблонов
Р2
0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95
—1,00 -0,93 —0,87 -0,81 -0,76 —0,71 —0,66 —0,61 -0,56 —0,50
—1,00 —0,91 -0,84 —0,77 —0,71 —0,66 -0,60 —0,55 -0,50 —0,44
—1,00 -0,89 —0,81 —0,73 —0,67 —0,61 -0,55 —0,50 -0,45 —0,39
—1,00 —0,87 -0,77 -0,68 -0,62 -0,56 -0,50 -0,45 —0,40 —0,34
—1,00 -0,84 —0,73 -0,63 —0,56 —0,50 —0,44 -0,39 —0,34 —0,29
—1,00 —0,80 —0,68 —0,57 —0,50 -0,44 —0,38 -0,33 —0,29 —0,24
—1,00 —0,75 —0,61 —0,50 —0,43 —0,37 -0,32 —0,27 —0,23 —0,19
—1,00 —0,66 -0,50 -0,39 —0,32 —0,27 -0,23 -0,19 —0,16 —0,13
—1,00 -0,50 —0,34 -0,25 -0,20 -0,16 -0,13 —0,11 —0,09 -0,07
— 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
-1,00 — 1,08 0,50 0,33 0,24 0,18 0,14 0,11 0,09
—1,00 -2,08 — 1,79 0,93 0,60 0,42 0,32 0,24 0,18
—1,00 —1,50 -2,79 — 3,00 1,39 0,87 0,60 0,44 0,31
—1,00 —1,33 -1,93 —4,00 — 3,47 1,62 1,00 0,68 0,46
—1,00 —1,24 —1,60 -2,39 -4,47 — 3,94 1,81 1,10 0,69
—1,00 -1,18 —1,42 —1,87 —2,62 -4,94 — 4,20 1,91 1,05
—1,00 —1,14 -1,32 —1,60 —2,00 -2,81 -5,20 — 4,33 1,73
—1,00 -1,11 —1,24 —1,44 —1,68 -2,10 -2,91 —5,33 — 3,56
—1,00 -1,09 —1,18 -1,31 —1,46 —1,69 -2,05 : —2,73 —4,55 —
Таблица 12
тичного отклонения при
измерениях с помощью шаблонов
Р2
L, „ 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95
0,61 0,56 0,53 0,49 0,48 0,43 0,40 0,37 0,34 0,30
0,78 0,71 0,65 0,60 0,56 0,51 0,47 0,43 0,39 0,34
0,96 0,85 0,78 0,70 0,64 0,58 0,53 0.48 0,43 0,37
1,19 1,03 0,92 0,81 0,74 0,66 0,60 0,53 0,47 0,40
1,49 1,25 1,09 0,94 0,84 0,75 0,66 0,58 0,51 0,43
1,92 1,53 1,30 1,10 0,96 0,84 0,74 0,64 0,56 0,46
2,56 1,92 1,56 1,28 1,10 0,94 0,81 0,70 0,60 0,49
4,00 2,63 2,00 1,56 1,30 1,09 0,92 0,78 0,65 0,53
7,69 3,85 2,63 1,92 1,54 1,25 1,03 0,85 0,71 0,56
— 7,69 4,00 2,56 1,92 1,49 1,19 0,96 0,78 0,61
—7,69 — 8,33 3,85 2,56 1,85 1,41 1,10 0,87 0,66
—4,00 —8,33 — 7,14 3,70 2,38 1,69 1,27 0,97 0,72
—2,56 -3,85 -7,14 — 7,69 3,57 2,22 1,54 1,12 0,80
—1,92 —2,56 —3,70 -7,69 — 6,67 3,12 1,92 1,32 0,89
-1,49 —1,85 -2,38 —3,57 —6,67 — 5,88 2,70 1,64 1,03
—1,19 -1,41 —1,69 —2,22 -3,12 -5,88 — 5,00 2,27 1,25
—0,96 —1,10 —1,27 —1,54 -1,92 —2,70 —5,00 — 4,17 1,67
-0,78 —0,87 —0,97 -1,12 —1,32 -1,63 -2,27 —4,17 — 2,78
—0,61 —0,66 —0,72 —0,80 -0,89 —1,03 -1,25 —1,67 —2,78 —
75
Таблица 13
Значения tP (по Стьюденту— Фишеру)
Число сте- пеней сво- боды Уровень достоверности Число сте- пеней сво- боды Уровень достоверности Число сте- пеней сво- боды Уровень достоверности
95% , 99% 95% 99% 95% 99%
1 12,71 63,66 12 2,18 3,06 23 2,07 2,81
2 4,30 9,92 13 2,16 3,01 24 2,06 2,80
3 3,18 5,84 14 2,14 2,98 25 2,06 2,79
4 2,78 4,60 15 : 2,13 2,95 26 2,06 2,78
5 2,57 4,03 16 ' 2,12 2,92 27 2,05 2,77
6 2,45 3,71 17 2,11 2,90 28 2,05 2,76
7 2,36 3,50 18 2,10 2,88 29 2,04 2,76
8 2,31 3,36 19 2,09 2,86 30 2,04 2,75
9 2,26 3,25 20 2,09 2,84 40 2,02 2,70
10 2,23 3,17 21 2,08 2,83 60 2,00 2,66
11 2,20 3,11 22 2,07 2,82 120 1,98 2,62
Таблица 14
Значения критерия Фишера для уровня достоверности 95%
: 1 2 3 4 5 6 8 12 24 оо
3 10,1 9,6 9,3 9,1 9,0 8,9 8,8 8,7 8,6 8,5
4 7,7 6,9 6,6 6,4 6,3 6,2 6,0 5,9 5,8 5,6
5 6,6 5,8х 5,4 5,2 5,1 5,0 4,8 4,7 4,5 4,4
6 6,0 5,1 4,8 ' 4,5 4,4 4,3 4,1 4,0 3,8 3,7
7 5,6 4,7 4,4 4,1 4,0 3,9 3.7 3,6 3,4 3,2
8 5,3 4,5 4,1 • 3,8 3,7 3.6 3,4 3,3 3,1 2,9
9 5,1 4,3 3,0 3,6 3,5 3,4 3,2 3,1 2,9 2,7
10 5,0 4,1 3,7 3,5 3,3 3,2 3,1 2,9 27 2,5
12 4,8 3,9 3,5 3,3 3,1 3,0 2,9 2,7 2,5 2,3
14 4,6 3,7 3,3 3,1 3,0 2,9 2,7 2,5 2,3 2,1
16 4,5 3,6 3,2 3,0 2,9 2,7 2,6 2,4 2,2 2,0
18 4,4 3,6 3,2 2,9 2,8* 2,7 2.5 2,3 2,1 1,9
20 4,4 3,5 3,1 2,9 2,7 2,6 2,4 2,3 2,1 1,8
25 4,3 3,4 3,0 2,8 2,6 2,5 2,4 2,2 2,0 1,7
30 4,2 3,3 2,9 2,7 2,5 2,4 2.3 2,1 1,9 1,6
35 4,1 3,3 2,9 2,6 2,5 2,4 2,2 2,0 1,8 1,5
40 4.1 3,2 2,8 2,6 2,4 2,3 2,2 • 2,0 1.8 1,5
50 4,0 3,2 2,8 2,6 2,4 2,3 2,1 1,9 1,7 1,4
60 4,0 3,1 2,8 2,5 2,4 2,2 2,1 1,9 1,7 1.4
88 4,0 3,1 2,7 2,5 23 2,2 2,0 1,9 1,6 1,3
100 3,9 3,1 2,7 2,5 ч 2,3 2,2 2,0 1,8 1,6 1,3
00 3,0 3,0 2,6 2,4 2,2 1,9 1,9 1,7 1,5 1.3
76
УКАЗАТЕЛЬ ЛИТЕРАТУРЫ
Адлер Ю. П. Введение в планирование эксперимента. М., 1969.
Ашмарин И. П.» Воробьев А. А. Статистические методы
в микробиологических исследованиях. Л., 1962.
Бейли Н. Статистические методы в биологии. М.» 1962.
Большев Л. Н.» Смирнов Н. В. Таблицы математической ста-
тистики. М., 1965.
Ван-дер-Варден Б. Л. Математическая статистика. М., 1960.
Длин А. М. Математическая статистика в технике. М.» 1958.
Каминский Л. С. Обработка клинических и лабораторных данных.
Л., 1959.
Кулдорф Т. Введение в теорию оценивания. М., 1966.
Лашков К. В., Поляков Л. Е. Применение методов непарамет-
рической статистики в научных медицинских исследованиях. — В кн.: Стати-
стические методы исследования в медицине и здравоохранении. Л., 1971.
Максимов В. Н.» Федоров В. Д. Применение методов мате-
матического планирования эксперимента. М., 1969.
Мейнелл Д., Мейнелл Э. Экспериментальная микробиология.
М., 1967.
Налимов В. В., Чернова Н. А. Статистические методы плани-
рования экстремальных экспериментов. М., 1965.
Плохинский Н. А. Биометрия. М., 1970.
Рокицкий П. Ф. Биологическая статистика. Минск, 1967.
Сепетлиев Д. Статистические методы в научных медицинских ис-
следованиях. М., 1968.
Статистические методы оценки достоверности. Под ред. А.М.Мер-
кова. М., 1965.
Урбах В. Ю. Математическая статистика для биологов и медиков.
М., 1963.
Урбах В. Ю. Биометрические методы. М., 1964.
Фишер Р. Статистические методы для исследований. М., 1958.
Янко Я. Математико-статистические таблицы. М., 1961.
Finney D. J. Statistical method in biological assay. L., 1952.
S i e g e 1 S. Nonparametric statistics for the behavioural sciences. N. Y.—L.,
1956.
ОГЛАВЛЕНИЕ
Стр.
Введение..............................................................3
Основные условные обозначения.........................................6
I. Быстрые методы статистической обработки опытных данных ... 7
1. Вычисление средних величин, исключение так называемых выска-
кивающих вариант ................................................... —
2. Оценка варьирования данных и границ доверительных интерва-
лов средних . •....................................................11
3. Оценка достоверности различий средних величин...................13
4. Отбраковка препаратов...........................................20
5. Фрагменты дисперсионного анализа.................................—
6. Оценка средней и варьирования при измерениях с помощью
шаблонов...........................................................23
II. Методы планирования экспериментов................................26
1. Оценка необходимого числа экспериментов.........................27
2. Традиционный метод планирования двух-трехфакторного экспери-
мента по Зейделю—Гауссу............................................33
3. Метод многофакторного планирования..............................36
4. Метод крутого восхождения . 50
5. Стратегия поиска оптимума.......................................55
6. Понятие о симплекс-планировании . ..............................57
Приложение..............................................• . 62
Указатель литературы.................................. . . , . 77