/
Текст
В. В. Налимов, Т. И. Голикова
ЛОГИЧЕСКИЕ
ОСНОВАНИЯ
ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
Издание 2-е,
переработанное и дополненное
Москва «МЕТАЛЛУРГИЯ» 1981
УДК 519.28.669
Рецензент: докт. тех. наук В. Г. Горский
УДК 519.28.669
Логические основания планирования эксперимента. Налимов В. В.,
Голикова Т. И. 2-е изд., перераб. и доп. М., «Металлургия»,
1980. с. 152
Первое издание книги вышло в 1976 г. В настоящем издании
объем материала увеличен примерно на 40%. В книге в простой
и доступной форме рассказывается о логических основаниях матема-
математической теории планирования эксперимента. Рассматривается связь
между различными критериями, дающими представление о том,
что есть хороший эксперимент. Показывается реалистичность тео-
теории: она охватывает, правда, на разном уровне формализации все
многообразие задач экспериментальных исследований от четкой их
постановки до совсем размытой. Новые главы посвящены проблемам
построения моделей, нелинейных по параметрам, и роли математи-
математических моделей в иаучиых исследованиях.
Предназначается для широкого круга специалистов — всех тех,
кто непосредственно имеет дело с проведением опытных исследова-
исследований, в какой бы области они. ни проводились, и в первую очередь
для металлургов. Ил. 1. Табл. 28. Библиогр. список: 117 назв.
Н
31001—040
040@1)—81
¦21-80 2601010000
Издательство «Металлургия», 1981
ВВЕДЕНИЕ
Эта небольшая книга — отнюдь не монография и
тем более не учебник по планированию эксперимента.
Задача книги скромнее — авторы хотят здесь рассказать
только о тех логических 'Предпосылках, на которых
базируется планировали с эксперимента, опускай почти
вое, что непосредственно связано с практикой его при-
применения. Вопросы практического применения достаточ-
достаточно хорошо изложены в многочисленных книгах, вышед-
вышедших как в нашей стране, так и за рубежом.
В настоящее время накоплен большой опыт приме-
применения планирования эксперимента -в самых различных
Областях деятельности — в научных и научно-техииче-
ских исследованиях, в практике промышленного экспе-
эксперимента, осуществляемого непосредственно в заводских
цехах, в сельском хозяйстве. В журнальных публика-
публикациях, общее число которых достигает несколько тысяч
[1-—5], достаточно широко освещены вопросы, связан-
связанные с применением 'планирования эксперимента. В то
же время общетеоретические основания планирования
эксперимента до сих пар остаются недостаточно разъ-
разъясненными. Пока еще никому не удалось написать хо-
хорошего руководства то планированию эксперимента ни
в нашей стране, ни за рубежом. В популярных руко-
руководствах, предназначенных для широкого 'круга чита-
читателей, рассматривается, как применять планы в тех или
иных конкретных ситуациях, как обрабатывать резуль-
результаты таких экспериментов и как их интерпретировать.
В книгах теоретической направленности рассматриваю-
рассматриваются специальные математические проблемы, возника-
возникающие при построении планов, отвечающих тем или
иным критериям оптимальности. При этом сама идео-
идеология планирования эксперимента оказывается опу-
опущенной в книгах как того, так и другого типа.
Это отставание теоретического осмысливания мето-
метода от его практического применения объясняется
особенностями его исторического развития. За пятьде-
пятьдесят лет существования идеология планирования экс-
эксперимента претерпела существенную эволюцию.
Развитие основных идей шло, как сначала казалось,
по нескольким, почти ле пересекающимся направле-
направлением. В каждом из них формулировались свои задачи,
излагаемые в свойственной этим задачам терминологии.
I* Зак. I3S Я
Впоследствии, однако, обнаружилась удивительная
общность во многих, казалось бы существенно различ-
различных по своей постановке задачах. Появилась возмож-
возможность осмысливания всего многообразия методов в
рамках неких более или менее единых представлений.
Развитие теоретических представлений позволило не
только построить новые планы эксперимента, но и
сделать нечто гораздо большее — дало возможность
четко сформулировать логику понимания того, что
есть хороший эксперимент.
Внешне планирование эксперимента выглядит как
математическая дисциплина—его высказывания фор-
формулируются на языке математики. Однако его логиче-
логическая структура отлична от построений чистой матема-
математики. Характерной особенностью математики является
четкий аксиоматически-дедуктивный метод построения
суждений. Но система постулатов в математике — это
отнюдь не пестрая мозаика отдельных исходных выска-
высказываний. Особенностью чистой математики является то,
что система постулатов образует своеобразные концеп-
концепции— математические структуры, богатые теми логиче-
логическими следствиями, которые из них могут быть выведе-
выведены. Согласно взглядам Бурбаки [6] наличие таких
¦структур, в которых имплицировано все содержание
математики, и есть та основная черта, которая отли-
отличает ее от других областей знаний. В планировании
эксперимента, как 'и в других разделах прикладной
математики, исчезают из поля зрения целостные ма-
математические ¦структуры. Они заменились в одном
¦случае пестрой мозаикой критериев—для этой мозаич-
мозаичной структуры потеряла смысл сама (постановка вопроса о
непротиворечивости, играющая столь большую роль в
структурах чистой математики, в других случаях на
математическом языке стали записываться некоторые
высказывания, основанные на не очень ясных интуити-
интуитивных соображениях, и тогда .вообще исчезла цепочка
силлогизмов, которая является одним из обязательных
внешних признаков традиционных математических по-
построений. Подробнее о сопоставлении чистой матема-
математики с прикладной можно прочесть в работе [7].
Как известно, аксиомой называется предложение,
принимаемое без доказательств и рассматриваемое как
исходное при построении той илш иной математической
теории. В планировании эксперимента роль аксиом иг-
играют критерии оптимальности эксперимента. Они при-
принимаются без доказательств — их правомерность осно-
основывается на нашем интуитивном представлении о том,
что есть хороший эксперимент. Будучи сформулиро-
сформулированными на математическом языке, критерии оптималь-
оптимальности становятся теми исходными высказываниями, на
которых строится вся дальнейшая теория.
Критерии оптимальности в планировании экспери-
эксперимента легко разбиваются на две группы. Одна из них —
группа статических критериев. Здесь речь идет о выс-
высказываниях, формулирующих требования, которым
должно удовлетворять некоторое, задаваемое планом
эксперимента расположение экспериментальных точек
в пространстве факторов — независимых переменных,
подлежащих варьированию. Роль теорем1 здесь играют
высказывания о свойствах планов. Их истинность,
т. е. соответствие их заранее высказанным утверждени-
утверждениям об оптимальности, проверяется путем доказательств.
Вся система суждений здесь носит чисто конструктив-
конструктивный характер — необходимо найти способ построения
плана, оптимального в том или ином смысле. Конструк-
Конструктивной деятельности здесь обычно предшествует необ-
необходимость доказательства ряда предварительных тео-
теорем. Критерии оптимальности планов образуют в об-
общем случае мозаику взаимно несовместимых высказы-
высказываний, хотя некоторые обобщения здесь возможны;
можно, соблюдая некоторые условия, выделить более
сильные, иерархически выше стоящие критерии.
В целом, однако, все наше гаредставление об опти-
оптимальности планов не может быть имплицировано в еди-
единой системе взаимно непротиворечивых высказываний.
И здесь создается новая, не свойственная традиционной
математике ситуация — возникает необходимость в со-
сопоставлении друг с другом планов, порожденных раз-
разными критериями. Численными методами можно опре-
определить, в какой степени план, порожденный одним кри-
критерием, оценивается с позиций других критериев.
В практической работе иоследователь-экапериментатор
отнюдь не всегда может отдать четкое предпочтение
одному из возможных критериев оптимальности. Часто
разумно остановиться на компромиссном решении, а для
1 Теоремами здесь мы называем, как это принято в логике,
высказывания, для которых существуют доказательства. Доказа-
Доказательством называем логическое действие, в процессе которого обос-
обосновывается истинность какого-либо утверждения.
этого необходимо иметь сравнительные числовые оценки
параметров планов. В лаборатории статистических ме-
методов МГУ закончена проводившаяся в течение нес-
нескольких лет работа по построению планов и числовой
¦оценке их параметров. Завершение этой работы и дало
возможность приступить к подготовке этой книги.
Ко второй группе критериев оптимальности относят
динамические критерии1. Здесь речь идет о проблеме
выбора оптимальной стратегии в последовательно про-
проводимой серии опытов. Нужны критерии, окажем, для
того, чтобы решить, как надо действовать в заводских
условиях, когда, варьируя управляемые переменные не-
непосредственно в цехе, мы хотим непрерывно следить
за дрейфом экстремума технологического 'Процесса; или
другой пример: как надо действовать, когда мы хотим
создать программу исследования для изучения биологи-
биологической активности очень большого числа препаратов,
в условиях, когда наложены серьезные ограничения на
возможное число опытов.
Во всех случаях речь идет об оптимальности всей
последовательности действий, образующей стратегию
эксперимента, а не об оптимальности отдельной серии
опытов, как это было в первой группе критериев. При
формулировке критериев оптимальности здесь на мате-
математическом языке записываются те высказывания, ко-
которые вам представляются правомерными на уровне
'наших интуитивных представлений. В этом 'Случае дело
с отчетливостью логических 'построений обстоит еще
хуже, чем в -предыдущем. При обсуждении проблемы
выбора оптимальной стратегии часто даже не удается
¦провести отчетливого разграничения между тем, что
здесь является аксиомами и что логическими следствия-
следствиями из них — теоремами. Записанное на математическом
языке высказывание об оптимальности той или иной
стратегии можно, конечно, рассматривать как аксиому.
Но остается не ясным, что считать здесь теоремами.
Теряется глубина логических построений. Все сводится
к тому, что строится алгоритм, соответствующий исход-
1 Термин «динамические» употребляется в некоторого! общенауч-
общенаучном смысле для характеристики состояния движения или изменения
какого-либо явления под влиянием действующих на него факторов.
Такое понимание этого термина отличается от того специфического
смысла, который вкладывается в него в теории оптимального
управления.
ному высказыванию, удобный для конкретного практи-
практического применения. Множество основополагающих ут-
утверждений о возможных стратегиях поведения опять-
таки образует мозаику высказываний, а отнюдь не ма-
математическую структуру в смысле Бурбаки.
Здесь снова возникает проблема сопоставления эф-
эффективности стратегий, порожденных разными выска-
высказываниями. Но в отличие от предыдущего случая эта
задача оказывается неразрешимой даже на уровне чис-
численного сопоставления. В предыдущем случае задача
численного сопоставления различных планов хотя бы
частично решалась, поскольку она сводилась к сопос-
сопоставлению отдельных параметров, характеризующих
структуру матрицы планирования эксперимента или
как-то зависящих от структуры матрицы. В случае с ре-
решением задач, натравленных на поиск оптимальных
стратегий, нельзя выделить параметры для численного
сопоставления. Единственное, что можно здесь сде-
сделать,— это попытаться построить некую метатеорию,
•сформулировав аксиомы сравнения стратегий. Но таких
аисиом можно придумать достаточно многой они опять-
таки будут образовывать только мозаику высказыва-
высказываний. Можно пойти дальше и построить метатеорию для
сравнения аксиом сравнения, но вряд ли это имеет
смысл.
Предложенная здесь бинарная система классифика-
классификации, конечно, не охватывает всего многообразия задач.
В некоторых случаях, например три постановке так
называемых отсеивающих экспериментов, мы сталки-
сталкиваемся с задачами смешанного типа, когда, с одной
стороны, нужно оценить параметры модели — это ста-
статическая составляющая задачи, а с другой —необходи-
—необходимо выполнить некоторые процедуры движения, скажем,
уменьшить размерность пространства независимых пе-
переменных.
Естественно, в задачах смешанного типа содержат-
содержатся трудности, свойственные задачам обоих типов.
Изложенное показывает те принципиальные труд-
трудности, с которыми приходится сталкиваться при попыт-
попытках построения теории оптимального -женернмента.
Придирчивый читатель может даже сказать, что здесь,
собственно, и нет теории в достаточно полном смысле
этого слава. И действительно, здесь невозможно по-
строение теории как некоего исчисления1, т. е. все со-
содержание теории нельзя получить как логический вывод
из некоторых начальных утверждений, образующих еди-
единую, внутренне непротиворечивую структуру. Единст-
Единственно, что можно сделать,— это провести некоторую
атаку на проблему, рассмотрев ее в различных мыс-
мысленно возможных ракурсах. Такая атака требует су-
существенной формализации наших представлений об
эксперименте, хотя мы отдаем себе отчет в том, что все
наши представления об эксперименте формализовать
нельзя, поскольку, наверно, любой эксперимент связан
в какой-то степени с эвристической деятельностью. Фор-
Формализуемую часть наших представлений об эксперимен-
эксперименте естественно осмысливать на языке математики, ко-
которая служит здесь для усиления логики наших сужде-
суждений об эксперименте. Когда мы говорим о математи-
математической теории эксперимента, то это не означает, что
здесь строится новая математическая дисциплина. Речь
•идет о создании формально-логического подхода к изу-
изучению проблемы эксперимента, формулируемого'на язы-
языке математики. Нечто аналогичное имеет место, ска-
скажем, в квантовой механике, которая, несмотря на всю
ее насыщенность математикой, не есть математическая
дисциплина. Вслед за работами Фреге, Рессела и Уайт-
хеда мы может рассматривать математику как часть
формальной логики.
Иногда мы встречаемся с утверждением о том, что
планирование эксперимента или хотя бы некоторые его
разделы —частный случай хорошо разработанных раз-
разделов математики. Так, в БСЭ читаем: «Под влиянием
приложений в химии и технике развилось планирование
эксперимента по поиску оптимальных условий протека-
протекания того или иного процесса. По существу эти методы
являются модификацией обычных численных методов
поиска экстремума с учетом 'случайных ошибок измере-
измерений»2. С этим высказыванием нельзя согласиться. Оно
звучит так же странно, как, скажем, звучало бы ут-
1 Принято считать, что исчисление задастся конечным алфави-
алфавитом его знаков, из которых составляются строчки, или «слова» в
алфавите, и правилам!!, позволяющими выводить слова из началь-
начальных или уже рапсе выведенных слов. Начальные слова могут зада-
задаваться непосредственно — списком или формулами, в которые могут
входить и содержательные переменные, на место которых можно
подставлять слова в алфавите.
2 БСЭ, т. 19, 1975, с. 630.
©ерждеше о том, что квантовая механика есть частный
случай того или иного раздела математики. Несмотря
ета насыщенность математикой, квантовая механика
имеет свое идейное содержание, связанное с существом
физической проблемы. Точно так же планирование эк-
эксперимента имеет свое собственное идейное содержание,
связанное с особенностями физического представления
об эксперименте; планирование экстремальных экспе-
экспериментов— это не inipocTo поиск экстремума, а нечто
гораздо большее — это поиск хорошего эксперимента для
решения экстремальной задачи.
Предлагаемая вниманию читателей книга написана
достаточно популярно. Авторам представляется, что
формально-логический анализ наших представлений об
эксперименте может быть интересен не только специа-
специалистам по математической статистике, но и широкому
кругу читателей, которые связаны в своей деятельности
с экспериментом. Первая глава книги носит вводный
характер. В .ней приводятся примеры хорошо и плохо
поставленных экспериментов и говорится о том, как
можно формализовать наши представления об экспери-
эксперименте для того, чтобы /построить теорию, позволяющую
ставить хорошие эксперименты. Все дальнейшие главы
посвящены детальному описанию на языке формализо-
формализованных представлений тех требований, которым дол-
должен отвечать хороший эксперимент.
Во втором издании объем материала увеличен при-
примерно на 40%. Введены две совсем новые главы —одна
из них подаящена проблемам построения моделей, не-
нелинейных по параметрам, другая—роли математичес-
(ких моделей в научных исследованиях, расширены
главы III и VI.
Эта небольшая книга, конечно, есть не более
чем краткий путеводитель по идеям планирования
эксперимента.
глава i киях, позволяющих следить за ходом явления и восеоз-
ХОРОШИЙ ЭКСПЕРИМЕНТ дать его каждый раз .при повторении этих условий
AUfu (БЭС, 2-е изд., т. 48, 1957).
дндпиз ПОНЯТИЯ «ЭКСПЕРИМЕНТ» 5. Эксперимент — операция, предназначенная для
*•АНАЛ __ обнаружения истины, принципа или эффекта или -после
первую главу в книге, посвященной логике эк- их ^я^уЖтш для уточнения или иллюстрации. Он
vtoirra мы должны были бы начать с того, чтооь отличаегся от наблюдения тем, что наблюдаемые явле-
енеримс ' понятия «научный эксперимент», ид- большей или меньшей степени контролируются
Гко бедует признать, что сделать это сколько-нибудь .^^ (En,cycl(>pedia Americana, v. 10, \ш).
удовлетворительно нельзя. Это определенае д.о ^ 6 Эксперимент: 1) испытывать или подвергать иопы-
\о бы содержать ответ на вопрос, как вемми тат^ч_ таиию, испытание, проверка; 2) средство или лекар-
й эксперимент? Ответить на этот вопрос д мож. СТВО) предназначенное для испытания; 3) действие или
общей и к тому же краткой форме "Р-1" 01Пределе- операция, предпринятые с целью обнаружения нового
Но все же мы приведем здесь нескольл изданий или проверки гипотезы, или иллюстрации известной ис-
аимствованны; ¦ 4^ б
ный
но
vo Но все же мы приведем здесь изданий или проверки гипотезы, или иллюстрации известной ис-
эксперимент», заимствованны; ¦ тины; 4^ подробная процедура, метод, система явле-
гпавным образом справочного харак тер а, '•* , ^ ^_ кий или последовательность действий, принятые в со-
мать делалась попытка обобщить имеющи с стоянии неуверенности относительно того, отвечают ли
зывания они цели (Oxford English Dictionary 1958)
,шш понятия «эксперимент», заимстины; 4^ подробная процедура, метод, система явле-
м образом справочного харак тер а, '•* , ^ ^_ кий или последовательность действий, принятые в со-
ь делалась попытка обобщить имеющи с стоянии неуверенности относительно того, отвечают ли
¦му поводу высказывания ,exnerimentum - про- они цели (Oxford English Dictionary, 1958).
1. Эксперимент (or латински!и J1 ельность в нау- 7. Само по себе понятие «эксперимент» в физике
ба, опыт) — чувстванно-шредметнаяi д авными средства- означает действие, направленное на искусственное соз-
' твляемая теоретически \ . б дание условий для осуществления того или иного физи
ба, опыт) уавными средства означет дст, р н у
ке,' осуществляемая теоретически \ . 0,имент» обычно дание условий для осуществления того или иного физи-
М'И. В научном языке термин «э Р ем дяя целого ческого явления и для наблюдения этого явления в
используется интуитивно в значении, ^а)правленнос условиях, то возможное™ наиболее чистых, т. е. не
ряда сопряженных понятии: ош ' познаниЯ) орга- осложняемых другими физическими явлениями (Жда-
«аблюдение, вооп-роизведение ®°ъвк ' проверка нов Г. Б. —В кн.: Современный детерминизм. Зако-
„изация особых Услтш (е™П^^™™ энциклопедия яы природы. М., «Мысль», 1973).
и т п ^илиии^ М и й
(П^^энциклопд рр )
предсказания и т. п. ^илии-и^ .д^ч Мы видим, что даже в этой совсем краткой подбор-
Т. 5. М., «Советская энциклопедия», ^
Эт (латинский е. р
u. ..-., - pvT),erimeiHum — проба, ке высказываний о смысле понятия «эксперимент» нет
2. Эксперимент (латинский е. р наблюдение ис- согласованности и ни одно из этих высказываний не
опыт): 1) научно поставленный °" аемых условиях, отвечает удовлетворительно на вопрос о том, как воз-
следуемого явления в т0™° У явления и воссоздать можен научный эксперимент.
позволяющих следить за сло&Ир1- 2) опыт, попытка Как можно всерьез воспринимать утверждение о том,
его при повторении этих.у ^ «'Советская энцикло что э-кшеримант есть предметно-чувственная деятель-
словарь иностранных слов. •, ность, осуществляемая познанными средствами? Если,
шедия», 1964). рматическое изменение уело скажем, исследователь в процессе эксперимента имеет
3. Эксперимент сист ,св.Язи его с другими < дело с рентгеновскими лучами, то что он предметно
«ни наблюдаемого явлен ^^ происхождения i чувствует? Разве рентгеновский спектрограф и процесс
целью выяснения его пр; р д > анньш процессом фотографирования и проявления пленки являются тео-
методов сознательного овл л коулный ученый Кювь' ретически познанными средствами? Вся особенность
Блестящий эиСП1еРим0Нтато'Рс1пердае1Нта: «Наблюдател' экспериментальной деятельности,в том числен научной,
так определяет задачи э^ ^ вопрошает и при заключается как раз в том, что мы, осуществляя ее,
слушает природу, экспер /ggc 1-е изд., т. 63, 1933) узнаем что-то новое об изучаемых явлениях, хотя и
яуждает ее разоблачиться» поставленный опыт, наолк пользуемся при этом средствами, механизм действия
4. Эксперимент — науч учитываемых уело которых остается всегда не понятным до конца,
денис исследуемого явления в точно у
10 "
Разве можно говорить о создании точно учитывае-
учитываемых условий для воспроизведения изучаемого явления?
Математическая теория эксперимента как раз и воз-
возникла из понимания того, что принципиально невоз-
невозможно создать точно учитываемые условия для прове-
проведения эксперимента; результат любого эксперимента
всегда связан с некоторой неопределенностью, и зада-
задача хорошей организации исследования заключается в
том, чтобы эту неопределенность минимизировать, но
отнюдь не в том, чтобы ее полностью устранить.
И уже 'совсем странно говорить о физическом эк-
эксперименте как о деятельности, направленной на наблю-
наблюдение изолированного физического явления. Тогда вза-
взаимодействие явлений совсем снимается с рассмотрения
и теряется понятие о математической модели в физике
и ее экспериментальной проверке.
Может быть лучше всего об эксперименте говорить,
пользуясь метафорами, так, как это и сделал Кювье,
(Когда сказал, что экспериментатор принуждает природу
разоблачаться. А еще лучше может быть вовсе не пы-
пытаться давать определения того, что есть эксперимент,
полагая, что это понятие не поддается компактному опре-
определению. Смысл его может стать ясным только после
того, как о нем будет много сказано. Задача этой не-
небольшой книги как раз и заключается в том, чтобы
попытаться ответить на пресловутый вопрос, как воз-
возможен научный эксперимент.
Интересно обратить внимание на то, что составители
многих словарей, видимо, поняли тщетность попытки
определить понятие «эксперимент». Ничего не сказано
об этом [понятии в таких хорошо известных изданиях
справочного характера, как энциклопедический словарь
Брокгауза и Ефрона, энциклопедический словарь Гра-
Граната, Encyclopedia Britanica. Chamber's Encyclopedia,
словарь Larusse и в нашей Физической энциклопедии.
2. ПРИМЕРЫ ХОРОШИХ И ПЛОХИХ ЭКСПЕРИМЕНТОВ
Несмотря на все трудности, связанные с понима-
пониманием того, что есть научный эксперимент, все же легко
привести примеры как хорошо поставленных экапери-
ментов, так и экспериментов в кпком-тп смысле явно пло-
плохих. Эти примеры, как нам кажется, сразу покажут, что
проблема логического анализа структуры эксперимента
существует реально и что она может быть сформулирова-
12
HaVa некотором весьма абстрактном уровне вне зависи-
зависимости от того конкретно содержательного значения, ко-
которое тот или иной эксперимент имеет в каждом отдель-
отдельном еУо использовании.
Начнем с самого простого и многократно описанно-
описанного примера — взвешивания трех объектов а, в, с на
аналитических весах (этот пример приводился уже
в работе [8]). Традиционно экспериментатор стал бы
.взвешивать эти объекты по схеме, приведенной в табл.1.
Таблица 1
ТРАДИЦИОННАЯ СХЕМА ВЗВЕШИВАНИЯ ТРЕХ ОБЪЕКТОВ'
Номер
опыта
1
2
Э
4
—1
+ 1
—1
j
—1
—1
+ 1
— I
—1
—1
—1
+ 1
Результат
взвешивания
Уо
У\
Уг
Уг.
1 Здесь и в табл. 2 обозначение «+1» указывает, что объект взвешнвапня
положен на весы; обозначение «—1» указывает на отсутствие объекта па
весах.
Вначале он делает холостое взвешивание, определяя
нулевую точку весов, затем по очереди взвешивают каж-
каждый из объектов. Это пример традиционно иопользуе-
могооднофакторного эксперимента. Здесь исследователь
изучает поведение каждого фактора в отдельности.
Масса каждого объекта оценивается только по резуль-
результатам двух опытов: того опыта, в котором на весы был
положен изучаемый объект, и холостого опыта. Напри-
Например, масса объекта а равна
А = У г — У о •
Дисперсия результата взвешивания
запишется в
виде
где в •{ у }— ошибка взвешивания.
Приведем теперь тот же эксперимент по несколько
иной схеме, задаваемой матрицей планирования, при-
приведенной в табл. 2. Здесь, как и в предыдущем случае,
каждая строка задает условия проведения одного
опыта.
13
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
ПРИ ВЗВЕШИВАНИИ ТРЕХ ОБЪЕКТОВ
Таблица 2
Номер
опыта
1
2
3
4
+ 1'
— 1
j
+ 1
— 1
+ 1'
— 1
+ !¦
— 1
— 1
+ 1
+ 1'
Результат
взвешивания
У\
Уг
Уз
У*
В первых трех опытах последовательно взвешива-
взвешиваются объекты а, Ь, с; в последнем опыте взвешиваются
все три объекта вместе — «холостое» взвешивание не
производится. Легко видеть, что масса каждого объ-
объекта будет задаваться формулами
^ _ У1—Уг — Уз + У4
С =
¦У1 + Уг—Уз Ч-
— У\ — Уг + Уз + У 4
Здесь числители получены путем умножения эле-
элементов последнего столбца на элементы столбцов а,
Ь, с. Мы видим, что при вычислении, скажем, массы
объекта а она входит в числитель два раза, и потому
в знаменателе стоит число 2. Масса объекта а, вычис-
вычисленная по приведенной выше формуле, оказывается не
искаженной массами объектов b и с, так как масса
каждого из них входит в формулу для массы а дважды
и с разными знаками.
Найдем теперь дисперсию, связанную с ошибкой
взвешивания при новой схеме постановки экспериментов.
Она равна
Аналогичным образом находим
и а2 {С} = о
Мы видим, что при новой схеме дисперсия взвеши-
взвешивания 'получается вдвое меньше, чем при традиционном
методе, хотя в обоих случаях на взвешивание трех объ-
объектов затрачивалось по четыре опыта. При традицион-
14
ном взвешивании мы должны будем все четыре опыта
повторить дважды для того, чтобы получить результаты
с такой же точностью, как и в первом опыте. В ре-
результате чего 'Происходит увеличение точности экспе-
эксперимента в два раза? В первом случае эксперимент был
поставлен так, что каждую массу мы получали лишь
¦из двух взвешиваний. При новой схеме эксперимента
каждая' масса вычислялась уже из результатов всех
четырех взвешиваний. Вторую схему эксперимента
можно назвать многофакторной. Здесь оперируют все-
всеми факторами (объектами взвешивания), так, чтобы
каждая масса вычислялась по результатам всех опы-
опытов, проведенных в данной серии экспериментов. Рас-
Рассмотренная задача взвешивания решается с помощью
слишком простой процедуры и вряд ли здесь нужно
.применять сложные схемы планирования эксперимента.
Пример со взвешиванием показывает, что даже в
простых задачах можно с удивительной отчетливостью
противопоставить плохой эксперимент хорошему.
Преимущество многофакторного эксперимента мо-
можно продемонстрировать и на более сложных задачах.
Пусть, например, нам a priori известно, что выход
некоторого продукта у линейно зависит от трех пере-
переменных (факторов) Х\, х2, Хъ- В частном случае это мо-
может быть температура, давление и содержание некото-
некоторого компонента. Нам нужно оценить значения
коэффициентов репрессии линейного уравнения
Е {У} = Л = ео + 0, х. + 02 х2 ¦{- 03 х3,
где Е — знак математического ожидания.
Каждую из переменных будем варьировать только
на двух уровнях и обозначать эти уровни знаками «—1»
¦и «+1». Если температура в наших опытах принимает
два значения, скажем, 100 и 120° С, то нижний уровень
температуры обозначим через «—1», а верхний — через
«+1». Воспользуемся для постановки опытов матрицей
планирования, гарнве-депшой в табл. 3*. Здесь та же
* Здесь мы имеем дело г так называемой матрицей Лдампра.
Матрицы Лдамкра Н — ¦/!•<> квадрг.тные матрицы размера .?><л (в
нашем стучае Л'— число опытов), состоящие из элементов +1 и —1,
удовлетворяющие условию HTH=JVI, где I — единичная матрица,
т —знак транспонирования. Матрицы Адамара можно построить
только для N — 2 и далее для N, кратного четырем. Сейчас извест-
известны методы построения таких матриц вплоть до iV=200 (за неболь-
небольшим исключением). ¦
15
схема планирования, что и в табл. 2, только факторы
а, Ь, с заменены независимыми переменными Х\, х2, хг
и добавлен столбец «фиктивной» переменной для оцен-
оценки свободного члена.
Таблица 3
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ДЛЯ ЛИНЕЙНОЙ МОДЕЛИ
С ТРЕМЯ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ
Номер
впита
1
2
3
4
Матрица коэффициентов X
х0
+1
+1
+1
+1
план эксперимента
X,
+777-
7+7 +
77++
Результаты
эксперимента
Уг
Уз
В соответствии с этой таблицей эксперименты вы-
выполняются следующим образом: в первом опыте пере-
переменные х2 'и хг находятся на нижних уровнях, хх — на
верхнем уровне; во вторам опыте переменная х2 нахо-
дится на верхнем уровне, а переменные Х\, xs на ниж-
нижних уровнях и т. д. Здесь мы 'имеем дело с насыщенным
'плавом, число наблюдений равно числу оцениваемых
параметров. Обозначим через Э вектор оценок параме-
параметров в, полученных по -методу наименьших квадратов.
План, приведенный в табл. 3, обладает следующими
свойствами:
N
N
u=l
u=\
u=\
Первое из этих условий — условие ортогональности
к столбцу из единиц, второе —условие нормировки,
третье —условие попарной ортогональности столбцов,
скалярные произведения всех векторов-столбцов равны
нулю. Это значит, что матрица независимых перемен-
переменных X, называемая также матрицей коэффициентов
(см. табл. 3), устроена так, что матрица 'ковариаций
(Хт X)-' для вектора оценок параметров уравнения
регрессии оказывается диагональной ', т. е. все кова-
риацИ'И cov \ 0i 9j } равны нулю и, следовательно, все
(коэффициенты регрессии определяются независимо друг
от друУа- И3 второго условия следует, что все диаго-
диагональные элементы матрицы (Хт X)-' равны 1/N. В
этом случае коэффициенты регрессии определяются
формулами
N
N
я)
с дисперсией
Из этих двух формул следует, что коэффициенты
регрессии оцениваются по всем Af опытам и соответст-
соответственно в ./V раз уменьшается дисперсия в их оценке по
сравнению с дисперсией единичного опыта. Последнее
обстоятельство является весьма примечательным. Пред-
Представьте себе, что мы имеем дело с последовательностью
./V независимых наблюдений уи у2, ..., г/лг;_тогда среднее
арифметическое этого ряда наблюдений у будет оцени-
оцениваться с дисперсией о2 \ у \ JN. В рассмотренном выше
случае все N коэффициентов регрессии оцениваютоя по
N опытам с дисперсией о2 \ у \ JN. Отсюда становится
очевидным хотя бы на интуитивном уровне, что нельзя
придумать такого расположения точек внутри области,
ограниченной единичным кубом, которое дало бы возмож-
1 Напомним здесь, что в матричных обозначениях вектор-стол-
вектор-столбец коэффициентов регрессии задается соотношением
в=(Х*Х)-»
причем
и коэффициент корреляции
cov
{9,,
V с и сИ
Здесь сц, ctj — диагональные и соответственно внеднагоналыше
элементы матрицы (ХТХ)~*, поэтому последняя называется ковари-
ковариационной матрицей уравнения регрессии или просто матрицей оши-
ошибок; матрица ХТХ называется информационной матрицей.
16
иость получить лучшие по точности оценки коэффици-
коэффициентов регрессии. Это утверждение может быть и строго
доказано1.
Интересующие нас четыре коэффициента регрессии
можно было бы оценить и с помощью традиционного
однофакторного эксперимента. В этом случае мы дейст-
действовали бы следующим образом: один эксперимент по-
поставили бы так, чтобы все независимые переменные
были на нижнем уровне, а дальше следовали бы три
опыта, в каждом из которых одна переменная на верх-
верхнем уровне, а две другие на нижнем. Всего было бы
поставлено опять четыре опыта. Но каждый коэффи-
коэффициент регрессии определялся бы только по двум опы-
опытам как тангенс угла наклона прямой, проведенной
через точки, абсциссы .которых соответственно равны
— 1 и +1.
В этом случае
Г У1 — Уо_ .„ ,п 1 а* (У)
В нашэм 'случае с тремя независимыми перемен-
переменными, ставя многофакторный опыт, мы выигрываем в
дисперсии в два раза. Если бы нашей целью было,
¦скажем, определение 15 коэффициентов регрессии, то,
поставив эксперименты по 'схеме, аналогичной приве-
приведенной в табл. 3, ,мы получили бы выигрыш уже в 8
раз! Однофакторный эксперимент оказывается явно
плохим, хотя в этом случае мы имеем дело с созда-
1НИ6М условий для изучения явления, не осложненного
другими физическими явлениями, и согласно высказы-
высказыванию, приведенному нас. 11 (определение 7), имен-
именно такое действие должно соответствовать представ-
представлению о физическом эксперименте. Следует ли отсюда,
что физики должны ставить только плохие в метроло-
метрологическом смысле эксперименты?
Можно показать, что эксперимент, проведенный по
схеме, заданной .в табл. 3, обладает и еще рядом при-
1 Обратим внимание на то, что здесь мы имеем дело с необы-
необычайно высокой эффективностью математического метода. Пгшом'шм -~ -. Л
для сравнения, что применение эффективных оценок при обработке 11 = 90 + 9i X\ -\- ...
результатов наблюдении в лучшем случае, когда выборки пе загряз-
загрязнены, дает возможность выиграть несколько десятков процентов
Применение линейного или динамического программирования лае г
выигрыш в 5—7% и то только в случае, когда исходные данные не
имеют ошибок.
нятых свойств, одно из которых называется ротатабель-
ностью. Оно означает, что получаемое с помощью
этого плана уравнение регрессии обладает тем свойст-
свойством, что дисперсия опенки модели зависит только от
длины радиуса, проведенного из центра эксперимента,
но не от угла, под которым этот радиус проведен1. Если
(принять за меру информации величину 1/сг2 {ч\\ , то
¦можно утверждать, что информация, содержащаяся в
уравнений регрессии, полученном для ротатабельного
плана, равномерно «раз/мазана» ото сфере (ib общем
случае гиперсфере) с радиусом г. Исследователь не
знает заранее той области факторного пространства,
пде находится интересующий его участок, поэтому пред-
представляется вполне разумным стремиться к такому
планированию эксперимента, при котором количество
информации, содержащейся в уравнении регрессии,
одинаково для всех эквидистантных точек.
Другое приятное свойство эксперимента, заданного
табл. 3. это упоминавшееся уже свойство .ортогональ-
.ортогональности. В этом случае коэффициенты регрессии оценива-
оцениваются независимо друг от друга. Тогда независимыми друг
от друга оказываются и доверительные границы для
оценок коэффициентов регрессии. Это имеет очень важное
значение при представлении, хранении и интерпретации
результатов исследования. Чтобы пояснить эту мысль,
рассмотрим трудности, связанные с интерпретацией не-
неортогонального эксперимента, т. е. такого экспери-
эксперимента, для которого векторы-столбцы матрицы
независимых переменных не ортогональны друг .другу
и, следовательно, cov -j 0; 0,- \ =?0. В этом случае при
представлении результатов исследования приходится
¦строить совместную доверительную область для всех
1 Это свойство в данном примере следует из того, что все ко-
коэффициенты регрессии оцениваются независимо с одной и той же
дисперсией, равной ог{у)!М. Применяя закон накопления ошибок к
уравнению регрессии
получаем
где л2 =.
A+г*),
18
19
'коэффициентов регрессии, задаваемую многомерным
эллипсоидом рассеяния.
В простейшем случае, когда мы имеем дело с урав-
уравнением регрессии для одной независимой переменной
и оцениваем, следовательно, два коэффициента регрес-
регрессии Во и 6ь совместная доверительная область будет
задаваться эллипсом рассеяния. Допустим теперь, что
мы хотим для 0о выбрать не значение 0О, оцененное
(методам наименьших квадратов, а какое-то другое,
близкое к нему, попадающее в область доверительных
границ, заданных эллипсом. Тогда этот выбор опре-
определит 'И доверительные границы для второго параметра.
Легко представить себе, насколько эта процедурна ус-
усложняется в многомерном случае. Представьте себе
теперь еще, что мы хотим данные, полученные по
многапараметричеокой задаче, занести в 'Память ЭВМ.
Как этот сделать — заносить туда параметры многомер-
многомерного эллипсоида рассеяния? Можно, конечно, вокруг
эллипсоида описать параллелепипед. Тогда запись
доверительных границ упростится, но они будут далеки
от реальных границ, к тому же с ростом размерности
резко увеличивается грубость такой аппроксимации.
Рассмотрим еще одну трудность, связанную с не-
неортогональностью планов. Допустим, что один иссле-
исследователь построил некую модель кинетики химического
(процесса, отразив в ней какое-то множество гипотети-
гипотетически возможных промежуточных реакций, а другой
построил для описания того же процесса несколько
отличную модель, введя в нее иные, также гипотети-
гипотетически возможные реакции. Тогда оценки параметров,
сделанные по неортогональным планам, дадут несовпа-
несовпадающие результаты для параметров и тех основных
реакций, которые оставались неизменными в обеих
моделях. Короче говоря, если в наших представлениях
о механизме реакции изменяются хотя бы какие-то
может быть и не очень существенные детали, то не-
немедленно должны будут измениться и оценки параме-
параметров, задающих основные составляющие химического
процесса.
Каждый раз, когда 'мы рассматриваем ту или иную
математическую модель, параметры которой оценены по
экспериментальным данным методом наименьших ква-
квадратов, нам надо иметь перед собой и ковариацион-
ковариационную матрицу (Хт X)-'. Без нее наше понимание модели
20
будет неполным, а порой просто" неверным. При этом
коррелированность параметров в модели, доставляющая
столь много неприятностей при 'интерпретации резуль-
результатов исследования, это отнюдь не свойство, присущее
самому изучаемому процессу, а только следствие того,
как устроена матрица X. Коррелированность парамет-
параметров определяется, с одной стороны, структурой выбран-
выбранной модели (модели для описания одного и того же про-
процесса можно выбирать по-разному), а с другой—располо-
другой—расположением экспериментальных точек.
Математическая статистика позволяет не только
оценить некоторым, наилучшим в каком-то смысле об-
образом параметры модели, ной получить некоторые мета-
представления о качестве оценок. Из этих метапредста-
влений и рождается, как это детально будет показано
дальше, возможность планирования, т. е. улучшения
эксперимента.
И, наконец, последнее. Представьте себе, что иссле-
исследователь ставил эксперимент так, что не очень нарушал
естественно текущий ход событий в лаборатории. Тогда
может сказаться, что наряду с независимыми перемен-
переменными Х\, ..., х„ на результат эксперимента могут еще
оказать влияние не регистрируемые, но спонтанно из-
изменяющиеся переменные 2Ь ..., гр. При этом перемен-
переменные 2 могут оказаться сильно закоррелированы с пере-
переменными х, и тогда все оценки, если даже они сделаны
то методу наименьших квадратов, окажутся смещен-
смещенными. Чаще всего с такими неприятностями приходится
сталкиваться в биологических исследованиях.
Представьте себе, что исследователь изучает действие некоторых
условий на поведение крыс. При этом опыты ставятся так, что
ежедневно некоторое количество крыс подвергается воздействию
одних и тех же условий; условия воздействия меняются только при
переходе от одного дня к другому. В результате такого исследова-
исследования обнаружено, что один из способов воздействия необычайно
эффективен — средний результат для всех крыс, испытанных за этот
день, во много раз превосходит квадратичную ошибку, которой
характеризуется разброс испытаний по отдельным крысам. Исследо-
Исследователь приходит к заключению, что он обнаружил некий бесспорный
биологический феномен. Но затем, много времени спустя, кто-то
вдруг вздумал повторить этот опыт и ничего похожего ие получил.
Одно из возможных объяснений такое: в тот злополучный день,
когда был получен высокий эффект, лаборантка поссорилась дома
с мужем и, придя на работу, выместила свою обиду на крысах —
существах очень нервных.
Такого смещения в оценках не (Происходит, если эк-
эксперимент рандомизирован относительно неконтроли-
21
руемых условий. В рассматриваемом случае надо было
бы все способы воздействия испытывать на разных кры-
крысах в течение каждого дня. Но технически это совсем
не просто осуществить — удобнее в течение одного дня
поставить все испытания в одних и тех же условиях.
Иногда возникает здесь еще и дополнительная труд-
трудность: объектов, предназначенных для ежедневного ис-
испытания, может быть меньше, чем вариантов испыта-
испытаний, и тогда возникает другая задача — рандомизация
с заложенными ограничениями.
Планирование эксперимента и возникло в 20—30-х
годах нашего века из потребности устранить или хотя
бы уменьшить систематические ошибки в сельскохо-
сельскохозяйственных исследованиях путем рандомизации усло-
условий проведения эксперимента. И сейчас многие книги,
особенно издаваемые за рубежом, излагают представ-
представления о планировании эксперимента, исходя из кон-
концепции рандомизации [10, 11].
Рандомизация условий проведения эксперимента —
это основное требование при постановке всякого гра-
грамотного исследования не только в биологии, но и в лю-
любой другой области знаний. И в химических лаборато-
лабораториях мы можем столкнуться с тем, что отсутствие над-
надлежащим образом проведенной рандомизации может
привести к смещенным оценкам из-за неучтенной неод-
неоднородности исходного материала или из-за неконтроли-
неконтролируемого изменения во времени экспериментальных ус-
установок и тех или иных реагентов. Известен случай,
когда диссертанту при защите диссертации был задан
вопрос: как могло получиться, что при оценке пара-
параметров ио двум сериям испытаний, одна из которых
проводилась с планированием эксперимента, а другая
без него, расхождение получилось столь большим, что
вероятность его появления должна быть оценена при-
примерно в 10~5. Ответ здесь простой: процедура планиро-
планирования оказалась натравленной не только на уменьше-
уменьшение дисперсии оцениваемых параметров, но также и на
рандомизацию относительно сопутствующих, спонтанно
изменяющихся и неконтролируемых переменных. В ре-
результате удалось избавиться от смещения в оценках.
Рассмотрим здесь еще пример, заимствованный из
практики работы одного металлургического завода.
В мартеновском процессе очень важно, чтобы содержа-
содержание углерода в момент расплавления колебалось в дос-
тлточно узких пределах. Естественным было бы стрем-
22
ление организовать процесс плавки так, чтобы содер-
содержание углерода в момент расплавления стало регули-
регулируемой величиной. Статистический анализ результатов
наблюдений показал, что содержащие углерода в мо-
момент расплавления линейно зависит от основности шла-
шлака (y = CaO/SiO2). Если бы мы захотели воспользо-
воспользоваться этой св'язью для интерполяции, определял, ска-
скажем, содержание углерода по основности, то все было
бы хорошо. Но попытка воспользоваться таким соот-
соотношением для регулирования технологического процес-
процесса оказалась неудачной. Причину этого легко удалось
объяснить. Как содержание углерода в момент рас-
расплавления, так и основность определяются одной и той
же причиной — содержанием чугуна в завалке. Но эта
переменная не поддается непосредственному измерению
и поэтому она не включается в уравнение регрессии.
В результате в линейном уравнении, связывающем со-
содержание углерода с основностью, коэффициент рег-
регрессии оказывается смещенным. Используя это линей-
линейное уравнение для интерполяции, мы ие нарушаем
внутренних связей в системе и поэтому, несмотря на
смешанную оценку, получаем правильные результаты.
Однако как только будет сделана попытка использовать
наше уравнение для управления процессом, так сразу
же будут нарушены внутренние связи между измеряе-
измеряемыми и неизмеряемыми переменными в системе, и сме-
смещенность оценки приведет к бессмысленным
результатам.
Коварство рассмотренного выше примера заключа-
заключается в там, что здесь мы имеем дело с ситуацией, где
действует скрытая переменная. Она не входит в матрицу
независимых переменных X и анализ ковариационной
матрицы (ХТХ)~1 не дает нам никаких оснований для
беспокойства. Дефектность нашей модели остается скры-
скрытой. Такого рода ситуации являются типичными при
изучении сложных систем —большая часть действую-
действующих там факторов (независимых переменных) остается
недоступной для непосредственного наблюдения. Поста-
Постановка любого активного эксперимента неизбежно нару-
нарушает в той или иной степени внутренние связи в системе
и таким образом спасает нас в какой-то мере от сме-
смещенных оценок. Но именно поэтому активный экспери-
эксперимент и труден—отсюда и понятно стремление исследо-
исследователя наблюдать пассивно за некоторым установив-
23
шимся процессом, а не экспериментировать активно.
Рандомизированный эксперимент, если процедура ран-
рандомизации хорошо продумана, должен полностью изба-
избавить результаты исследования от влияния скрытых
переменных.
И все же в этой книге мы хотим рассмотреть вопрос
о логических основаниях планирования эксперимента
не только с позиции рандомизации, а во всей доступной
нам сейчас полноте.
3. КАК МОГУТ БЫТЬ ФОРМАЛИЗОВАНЫ
НЕКОТОРЫЕ НАШИ ПРЕДСТАВЛЕНИЯ
О ХОРОШЕМ ЭКСПЕРИМЕНТЕ
Несмотря на наше неумение определить, что есть
научный эксперимент, мы все же можем достаточно
четко хотя бы на отдельных стримерах провести раз-
разграничение между хорошо и плохо поставленными эк-
экспериментами. И если мы теперь хотим пойти дальше —
построить теорию эксперимента, нам надо попытаться
формализовать наши 'представления о хорошем эк-
эксперименте.
Попытаемся разбить все мысленно возможные эк-
эксперименты на две группы. К одной из них отнесем те
задачи, в которых нужно решить вопрос о том, как наи-
наилучшим образом расположить экспериментальные точки
в пространстве независимых переменных. Такие задачи
будем несколько условно называть пространственно
локализованными, или статическими. К динамическим
'отнесем те задачи, в которых приходится заботиться
о стратегии исследования в целом, полагая, что в этом
случае исследование распадается на серию последова-
последовательно проводимых локальных экспериментов.
Начнем наше изложение с попытки формализовать
(представления о хорошем статическом эксперименте.
Чтобы сделать это, мы должны иметь возможность рас-
рассмотреть свойства всех возможных матриц планирова-
планирования эксперимента в некоторой заранее заданной обла-
области пространства независимых переменных. Этому, ес-
естественно, должно предшествовать задание той модели,
ради оценки параметров которой ставится эксперимент.
Таким образом, формализация наших представлений
о хорошем эксперименте начинается с записи модели.
На с. 15 мы записали модель в виде полинома первой
степени для трех независимых переменных и предло-
24
Таблица 4
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ДЛЯ МОДЕЛИ
С ДВУМЯ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ,
ВКЛЮЧАЮЩЕЙ ЭФФЕКТ ВЗАИМОДЕЙСТВИЯ МЕЖДУ ПЕРЕМЕННЫМИ
Номер
опыта
1
2
3
4
Матрица коэффициентов
Хо
4-1
4-1
41
41
Xl
±11+
Xl
I
41
+ 1
Xl X2
J
-1
+1
41
Результаты
эксперимента
Уч.
Уз
жили для оценки ее параметров матрицу планирования
эксперимента, представленную в табл. 3. Запишем те-
теперь модель в виде неполного полинома второй степени
для двух независимых переменных:
1\ = 0о + в1х1 + 0гхг + 0их1ха. A.1)
Для оценки параметров здесь можно предложить
план эксперимента, представленный в табл. 4. Сама
матрица X здесь выглядит так же, как и матрица, при-
приведенная в табл. 3: по строчкам и столбцам в одном
и том же порядке расставлены одни и те же элементы.
Но во втором случае над последним столбцом указано,
что он относится к произведению х\Х% т. е. служит для
оценки параметра 012. Если мы пользуемся моделью
без взаимодействия в случае, когда коэффициенты рег-
регрессии для эффектов взаимодействия не равны нулю,
то в этом случае оценки 0ь 02, 0з, полученные методом
наименьших квадратов, должны будут интерпретиро-
интерпретироваться так:
¦0,
о,
т. е. они являются оценками для сумм некоторых пара-
параметров. Здесь мы имеем дело уже со смешанными
оценками: четыре опыта не дают нам возможности сде-
сделать больше, чем оценить раздельно четыре коэффициен-
коэффициента регрессии: 90> 6Ь 82, 83.
Разделить оценки на .их парные составляющие мы
здесь не можем. Таким образом, матрица X приобрета-
приобретает истолкование в терминах эксперимента тогда, когда
она связывается с какой-либо моделью,
25
Выше мы рассмотрели план хорошего эксперимента
для взвешивания трех объектов а, Ь, с, не приводя при
этом модели. На самом деле такой план можно было
построить, только имея хотя бы в уме модель процесса
взвешивания. Она в данном случае должна была бы
быть записана так:
Т1 = 90 + 91х1 + 02х2-т-03хз, A.2)
где Xi — переменные, принимающие только два значе-
значения «+Ь> и «—1» в зависимости от того, помещен или
не помещен взвешиваемый объект на весц. Смысл этой
записи заключается в том, что мы признаем аддитив-
аддитивность процедуры взвешивания, не допуская в ней суще-
существования эффектов взаимодействия. При интерпретации
этой модели мы, естественно, принимаем, что
в1--±, 92->А, 03->-^,
1 2 2 2
-Г О -f- L. ...
где ц0— возможное смещение нулевой точки. Коэффи-
Коэффициент 0о при процедуре взвешивания нам практически
вычислять не нужно; в матрице, приведенной в табл.2,
мы даже- не записали столбец, состоящий только из
«+1», но в модели коэффициент 0О должен быть запи-
записан, чтобы она адекватно отражала результаты взвеши-
взвешивания по каждой строке1.
Допустим, что мы имеем дело с -моделью, нелиней-
нелинейной по параметрам, скажем, с экспонентой или суммой
экспонент, к которым так привыкли все, кто имеет дело с
задачами физической химии.
В общем виде запишем модели такого типа следующим
образом:
г] = <р (х, 9),
¦где х —•вектор независимых переметных;
8 — вектор параметров модели.
1 Естественно было бы записать модель взвешивания трех объ-
объектов следующим образом:
1] = Но + А Хх |- В х2 1 С х3,
полагая, что Xi могут принимать только значения 0 (когда на весы
i-тый предмет не положен) и +1 (когда на весы положен соответ-
соответствующий объект). Такого рода модели используются в том разделе
планирования эксперимента, который называется «Планы взвешива-
взвешивания» (подробнее см. об этом на с. 78).
26
Бели мы хотим оценить методом наименьших квад-
квадратов параметры по результатам наблюдений, то нам
надо будет линеаризовать нелинейную по параметрам
функцию, разлагая ее в ряд Тайлора в окрестности
некоторой точки 60. В результате мы приходим к рас-
рассмотрению информационной матрицы Хт X, полученной
из матрицы независимых переменных X размера Nyk
где элемент матрицы
Хги = I -
Г дф ( хц, еь
есть частная производная по параметру Qr в точке 0=8О
при значениях Хщ, х^и, ¦¦¦, хпи, соответствующих усло-
условиям некоторого ы-того опыта.
Мы .видим, что если модель задана нелинейно, то
для оценки ее параметров нам надо опять находить
матрицу (X* X)-1. Однако это мы можем сделать толь-
только в том случае, если нам известен не только вид функ-
функции, но и еще какие-то, хотя, бы очень грубые оценки ее
параметров. Оценки параметров в процессе эксперимента
улучшаются и в соответствии с этим, естественно, дол-
должен изменяться оптимальный план эксперимента. В этой
ситуации исследование разбивается на ряд последова-
последовательных шагав. На каждом шаге ставится некоторое
числю опытов и после этого происходят переоценка
коэффициентов и изменение плана. Такая стратегия
планирования называется последовательной [25].
Итак, мы видим, что, как только оказываются задан-
заданными модель изучаемого явления и план, сразу же
появляется возможность написать матрицу независи-
независимых переменных X, а затем и ковариационную матри-
матрицу (Хт X)-1. Последняя позволяет нам высказывать
суждения о качестве оценок параметров изучаемой
модели по результатам эксперимента. Если мы хотим
изменить в том или ином направлении качество оценок
'Параметров или модели в целом, то мы должны ка-
каким-то специальным образом задавать матрицу X.
1 впарь мы можем ответить на вопрос о том, когда
возможно планирование эксперимента. Ответ оказы-
оказывается 'простым: планирование локального эксперимента, •
оезуслов'но, возможно во всех тех случаях, когда еще
27
перед началом исследования можно сформулировать
предварительные знания в виде математической модели.
Практически это, наверное, возможно сделать во всех
случаях, когда исследователь изучает что-то, о чем он
имеет хотя бы весьма смутное представление общетео-
общетеоретического характера. Даже работы вспомогательного,
чнсго препараторского характера, требующие прежде
.всего необычайного искусства от исследователя, могу г
быть представлены моделями хотя бы такого типа, как
рассмотренная выше модель взвешивания. Для этого
надо уметь выделить те факторы, которыми он реально
может управлять, и записать предлагаемые взаимоот-
взаимоотношения. Конечно, явно невозможно записать модели
для открытий, скажем, для открытия такого типа, ка-
каким было открытие радиоактивности, сделанное Бек-
керелем. Но ведь это открытие и .появилось как нечто
неожиданное и непредвиденное, а >не как результат
'некоторого сознательного поиска.
Таиим образом, мы видим, что логически продуман-
продуманная постановка исследования включает в себя выбор
модели, с одной стороны, и выбор ллана эксперимента,
оптимального св .каком-то смысле для этой модели, с
другой. Решение первой из этих задач связано с глубо-
глубоким знанием объекта исследования; решение второй
задачи совершенно не зависит от объекта исследования.
Запись изучаемой .проблемы в виде математической
модели позволяет достигнуть такого уровня формали-
формализации, 'при котором мы можем полностью абстрагиро-
абстрагироваться от физического содержания задачи. К миру фи-
физической реальности исследователь должен возвращать-
возвращаться только на последнем этапе своего исследования —
при интерпретации модели. Мы будем рассматривать
только вторую из поставленных выше двух задач. Это
позволит вести изложение в достаточно абстрактном
плане, отвлекаясь почти полностью от обсуждения фи-
физического смысла при постановке задач в той или иной
конкретной области знания.
Вопрос о том, как выбирать математические модели
и как интерпретировать полученные с их помощью ре-
результаты исследования, надо рассматривать в книгах,
посвященных отдельным отраслям знаний. Наша зада-
задача— рассмотреть логику планирования эксперимент^
на том его этапе, который уже доведен до формулиров-
формулировки модели.
28
Итак, допустим, что дана модель изучаемого явле-
явления. Задача построения оптимальных планов экспери-
эксперимента сводится к тому, что нужно сначала на чисто
логическом уровне рассмотреть те требования, которы-
которыми может характеризоваться «хорошая оценка моде-
модели»; далее необходимо связать эти требования со
свойствами ковариационной или информационной мат-
матрицы и в соответствии с этим найти отвечающую этим
требованиям матрицу плана эксперимента. При этом,
конечно, заранее должна быть задала та область гаро-
странспва независимых переменных, где будет ставить-
ставиться эксперимент. Это может быть многомерный куб, шар,
правильный симплекс или какая-нибудь совсем несим-
несимметричная область.
Во многих случаях задача сводится просто к зада-
заданию свойств матриц некоторыми скалярными характе-
характеристиками и попытке найти связь между этими харак-
характеристиками и статистическими свойствами моделей.
Так, окажем, естественно потребовать минимизации
объема эллипсоида рассеяния1 оценок параметров урав-
уравнения регрессии. Это требование будет выполнено, если
мы найдем на множестве планов с заданным числом
измерении плаи с такой матрицей независимых пере-
переменных X, что детерминант матрицы (Хт X) будет
максимален или, что то же, минимален детерминант
ковариационной матрицы (Хт X)-'. Такие планы 'на-
'называются /^-оптимальными.
Таким образом, одно из важнейших статистических
свойств модели задается всего одним числом — детер-
детерминантом матрицы. Однако оно полностью не опреде-
определяет характера рассеяния оценок коэффициентов
регрессии — объем эллипсоида рассеяния может быть
минимальным, но сам эллипсоид может оказаться сли-
слишком вытянутым по одной из своих осей. Если иссле-
исследователь хочет минимизировать максимальную ось
эллипсоида рассеяния, то он должен суметь построить
такую матрицу плана, которой бы соответствовала
Это требование, как и некоторые другие, является естествен-
естественным обобщением критерия совместных эффектных оценок, введен-
введенных в математическую статистику еще Р. Фишером. Если раньше
треоовалось построить алгоритм для вычисления параметров урав-
^ЯпРеГре0СИИ Так (см- с- 38>' чтобы ПРИ заданном плане эллип-
эллипрассеяния оценок параметров был минимальным, то теперь по-
f тР^б°ваиие преъ
р , р
rnn^f Р^виие предъявляется к построению плана при заданном
способе обработки результатов наблюдений.
29
ковариационная матрица с минимальным значением
максимального характеристического числа. Это будет
так называемый ?-оптимальный план. Исследователь
может потребовать, чтобы минимальной была средняя
дисперсия оценок коэффициентов регрессии. Этому
требованию удовлетворяют эллипсоиды рассеяния с
наименьшей суммой квадратов длин осей. Соответст-
Соответствующие планы называются Л-оптимальными; относя-
относящиеся к ним ковариационные матрицы имеют наимень-
наименьшие значения следа.
Мы не будем здесь перечислять все те требования,
которые можно предъявить к планам эксперимента,
отвечающим нашим представлениям о том, что такое
хороший эксперимент. Подробно об этом будет расска-
рассказано в следующей главе. Здесь важно отметить толь-
только, что, как правило, за исключением некоторых очень
простых моделей, нельзя предложить плана, который
бы отвечал одновременно всем или хотя бы нескольким
важнейшим критериям оптимальности. Нужно искать
компромиссное решение. В этом сейчас важнейшая за-
задача 'планирования эксперимента. Чтобы выполнить ее,
приходится, пользуясь численными методами, строить
планы, соответствующие какому-нибудь одному кри-
критерию, а затем оценивать для этих планов численные
характеристики, соответствующие другим критериям, и
в завершение выбирать на множестве всех 'планов наи-
наилучшее компромиссное решение.
Эту задачу оказалось возможным решить только
'частично. Трудность здесь состоит в том, что далеко
не все желательные нам свойства планов можно хо-
хорошо оценить численно. Если мы, например, имеем
дело с D-оптимальностью, то здесь все обстоит вполне
благополучно. Достаточно нам найти для некоторых
заданных условий D-оптимальный план и тогда для
любого другого плана, 'построенного в той же области
значений независимых переменных, мы можем оценить
отклонение от D-оптимальности (отклонение от мини-
минимального значения определителя |(Хт X)-1 N\), и эта
оценка даст лам вполне четкое представление о том,
насколько увеличился объем эллипсоида рассеяния.
У нас появляется возможность оценивать с позиций D-
оптимальности планы, построенные в соответствии с
какими-нибудь другими требованиями.
Ничего подобного нельзя сделать с критерием орто-
ортогональности. Для ортогонального плана мы можем
30
•задать числовую меру: отношение Пс«/|(Х'Х)-Ч,
е с.. это диагональные элементы матрицы
(Хт X), должно быть равно единице. Но вот откло-
отклонение значения этого отношения от единицы для неор-
тогональных планов мало что нам говорит, ибо здесь
одно и то же числовое значение отклонения может ха-
характеризовать планы, в которых один раз какой-ни-
какой-нибудь один коэффициент регрессии (окажем, 0О) будет
.сильно закоррелирован только со всеми коэффициен-
коэффициентами типа Ън, в другой раз план, в котором все коэф-
коэффициенты регрессии, хотя и в меньшей степени, будут
закоррелираваяы друг с другом.
Ясно, что дри интерпретации модели мы будем
иметь дело с существенно различными ситуациями. Не
удается придумать такую компактную меру неортого-
нальности, которая бы отчетливо характеризовала сте-
степень «оррелираванности (различных параметров в
модели.
И еще одно замечание. Выше мы уже много раз
говорили о том, что матрица независимых переменных
X у нас появляется только после того, как оказывается
заданной модель. Ясно, что для описания одного и того
же явления можно задать несколько моделей, но вот
что здесь парадоксально: не для всех моделей, описы-
описывающих одинаково хорошо одно и то же явление, мож-
можно построить планы, дающие достаточно слабую кор-
релированность параметров. Рассмотрим здесь в каче-
качестве примера хорошо известное уравнение Аррониуса:
к = кое~Ю', A.3)
где k—зависимая переменная — константа скорости
реакции;
>/? — универсальная тазовая постоянная;
Т — температура;
ku и Е — параметры модели, подлежащие оценке по
экспериментальным данным.
Поскольку обычно переменная Т изменяется не бо-
более чем на 10—15% от среднего, в интервале возмож-
возможного изменения информационная матрица для линеари-
линеаризованной модели всегда оказывается близкой к вырож-
вырожденной. Это многократно отмечалось в ряде работ.
Наиболее подробный анализ создающейся здесь ситуа-
ситуации дан в книге Д. Химмельблау [12] (ом. с. 423—425
31
и 439). Вырожденный, или, точнее, почти вырожденный,
характер матрицы Хт X приводит к овражному характе-
ipy поверхности для сумм квадратов отклонений, что,
конечно, значительно осложняет поиск оценок пара-
параметров. С этими трудностями встречался всякий, кто
занимался оцениванием параметров в моделях подоб-
подобного типа. Числовые значения коэффициентов корре-
корреляции оценок этих параметров могут доходить до 0,97
и 0,98, как это указано, например, в работе [13]. Воз-
Возникающие при этом трудности в интерпретации моде-
модели мы уже рассматривали выше.
В этом случае рекомендуется репараметризация,
т. е. переход к новой модели:
Ё_(_!__1\
Ь — Ь (Т\ р Я \ т т * П Л\
где Т_—(некоторое среднее значение температуры;
К (Т)—«средняя» константа, т. е. новый параметр
?_
А /ТЛ Ъ р Н~Т (\ Г.\
/Cq li I /vq С • I L .ОJ
Параметры ko(T) и Е оказываются закоррелирован-
ными слабее, коэффициент корреляции при подходящем
выборе плана удается снизить до 0,5 и в соответствии с
этим резко сужаются совместные доверительные грани-
границы. Но экспериментаторам часто все же не нравится
введение новой непривычной константы — это затрудняет
привычную интерпретацию, и, кроме того, новые резуль-
результаты оказываются несовместимыми со старыми.
Таким образом, даже при изучении одного и того же
явления возможности построения хорошего плана экс-
эксперимента определяются выбором модели. Планирование
эксперимента само по себе не может улучшить физиче-
физический смысл модели, оно улучшает только ее статистиче-
статистические свойства. Если, скажем, исследователь при изучении
кинетики химического процесса неверно записал проме-
промежуточные, непосредственно не контролируемые реакции,
то планирование даст ему только возможность оценить
некоторым наилучшим образом параметры этой неверно
записанной модели. Эта модель может даже оказаться
в статистическом смысле очень хорошей, если ее исполь-
использовать для целей интерпретации. Дефектность ее может
выявиться только при экстраполяции. Но ведь во многих
случаях модели только и строятся для того, чтобы знать
32
то направление в пространстве независимых переменных,
куда нужно двигаться, чтобы получить наиболее благо-
ПрИПлНанированиеаэксперимента может использоваться
для дискриминации конкурирующих гипотез, т.е. для вы-
?ппя лучшей из нескольких предложенных априори. И
чпесь если даже и говорится о том, что ведется поиск
модели задающей механизм явления, на самом деле с
помощью планирования эксперимента отбирается толь-
только та модель, которая обладает наилучшей интерполяци-
интерполяционной силой в области, отведенной для исследования
(подробнее о критериях в дискриминирующих экспери-
экспериментах см. в гл. VII). Формализация наших представле-
представлений об эксперименте и введение в обиход таких понятий,
как «эффективность плана», «выбор оптимальной моде-
модели», не должны затуманивать реального физического
смысла того, что мы при этом имеем в виду.
Несколько слов об общей постановке задачи при вто-
втором подходе, когда речь идет о стратегии в целом. К со-
сожалению, здесь вряд ли можно сформулировать какие-
либо достаточно общие высказывания. При первой по-
постановке задачи, когда мы рассматривали статические
оптимальные планы, все было достаточно ясно: перед на-
нами была модель — цель нашего исследования, и мы могли
составить матрицы X и соответственно (XTX)/iV и
(XTX)-W. После этого сразу становилось ясно, в каких
терминах можно вести разговор о том, что есть хороший
эксперимент. Высказывания сразу приобретали достаточ-
достаточно общий характер. Когда же речь идет о динамических
задачах — о стратегии всего исследования, таких воз-
возможностей у нас нет. Приходится каждый раз придумы-
придумывать какую-то свою, подходящую для данного конкрет-
конкретного случая систему действия, записывать ее на матема-
математическом языке. И все же сейчас накопилось много хоро-
хорошо продуманных высказываний о стратегиях исследова-
исследования в широкой постановке задачи, идейное содержание
которых изложено в гл. V.
2 Зак. 138
ГЛАВА II
КРИТЕРИИ ОПТИМАЛЬНОСТИ ПЛАНОВ
I. ВВЕДЕНИЕ
Допустим, что наши знания об изучаемом явлении
оказалось возможным формализовать в такой степени,
что мы смогли записать математическую модель. Задача
эксперимента, как об этом говорилось выше, тогда све-
дется к оценке параметров модели. Эксперимент надо
поставить так, чтобы параметры можно было оценить не-
которым наилучшим способом. Мы хотим получить «хо-
рошуго» модель в статистическом смысле этого слова,
Свойство модели быть хорошей нельзя задавать одним
требованием. Ниже мы рассмотрим все то многообразие
требований, которые можно предъявить к хорошей мо-
дели. Эти требования будем называть критериями опта-
мальности плана. Изложение материала дальше будет
идти, естественно, на математическом языке; здесь в бо-
лее строгой форме мы сформулируем и то, о чем говори-
лось выше. При этом мы должны будем ввести ряд но-
вых понятий, на которых строится эта область знаний.
Предположим, что связь между измеряемой величи-
нон у (х) и контролируемыми переменными *,, х2„ ..., хл
где fr (X) = (/, (х), ..., /л (х)) — вектор известных функций
От независимых переменных.
Частный случай линейной модели — это, например,
полином, аппроксимирующий функцию отклика в окре-
окрестности некоторой точки:
0^ = 6 + "У 9х ¦ + "У в,- xix- + V 6,7 х1. -\- ... B.3)
J
'=|
Частным случаем линейных моделей являются также
модели, которые обычно принято использовать при изу-
чении влияния факторов качественного характера. Это
так называемые модели эффектов уровней, которые обыч-
но записываются в виде системы равенств. Для двух
факторов, например, с s, и s2 уровнями соответственно
эта модель
Л-7 = Iх
+ Р/ + Уч A = 1
s2), B.4)
^ {У WI —т) (х, b), (/л
где Е{у(х)} —математическое ожидание величины у(\),
измеренной в точке с координатами хт= (хи ..., хп).
Ошибки измерений независимы и имеют нулевое ма-
тематическое ожидание. Функция ц(\, 6) зависит от не-
известных параметров 6i, .., Qk. Выбранная нами мо-
дель должна в заданной области изменения факторов
АГ], хъ ..., хп давать удовлетворительное представление
о функции отклика —некоторой истинной зависимости
изучаемого явления от этих факторов.
Основное внимание мы здесь уделим моделям, пред-
ставляющим собой линейные функции неизвестных пара-
метров ef; будем называть их линейными моделями. Та-
кую модель запишем в следующем виде:
- ню) -, (х, е, _ ,,,„»,+...+
- г (х)..
34
...
где неизВестные параметры модели-
„ истинное среднее*
а, —эффект /-того уровня первого фактора-
ft —эффект /-того уровня второго фактора-
7„_эффект взаимодействия этих уровней. '
„Область в пространстве переменных *„ ..., ,„, в кото-
рои мы считаем модель справедливой и в точках которой
возможно экспериментально получить отклик у, будем
называть областью планирования.
Предположим, что мы имеем N результатов измере-
ний величины у для тех значений независимых перемен-
ных xit которые не выходят за пределы области планпро
вания^1. Для получения оценок неизвестных параметров
Qt модели B.2) используем метод наименьших квадратов
Этот метод можно предпочесть другим, так как он поз-'
воляет получить лучшие линейные оценки параметров.
Обозначим через 0 вектор оценок параметров по ме-
Т°ДУ наименьших квадратов, а через в —вектор линей-
"ых несмещенных оценок, полученных любым методом'
(Напомним, что линейными оценками называются оцен'
: ™:ги собой лтейше функ'ии -аблюде-
2:
Зак- '38 35
раметров О;.) Пусть матрица D~ будет ковариационной
матрицей оценок параметров.
При заданном плане измерений наилучшие линейные
оценки параметров обладают среди всех линейных не-
несмещенных оценок наименьшей ковариационной мат-
матрицей:
Da=D — d, B.5)
6 6 '
где d — некоторая неотрицательно определенная мат-
матрица.
Более кратко это можно записать так:
Вследствие этого наилучшие линейные оценки имеют
наименьшую обобщенную дисперсию, или определитель
ковариационной матрицы:
в
в
B.7)
а также наименьшую среднюю дисперсию или след этой
матрицы:
¦+- trDA<4 trD B.8)
k 0 k 6
Теперь предположим, что мы имеем возможность вы-
выбирать не только метод обработки, но и координаты то-
точек, в которых могут быть поставлены наблюдения, т. е.
мы можем планировать измерения. Имеющиеся в нашем
распоряжении ./V измерений мы можем осуществить в лю-
любых точках области S6 ; в некоторых точках можно по-
поставить не одно, а несколько наблюдений. Планом будем
называть множество точек хг- (?=1, ..-, пг) в области $в ,
в которых производятся наблюдения (спектр плана), \\
соответствующие им значения nii— число наблюдений в
каждой из этих точек. Общее число наблюдений есть
m
N = V nii ¦ План будем обозначать через Е.
i=i
Можно записать
X. X 1 m
'•¦•' "' , Vm, = tf. B/.))
...... mm\ ,-=,
Введем еще понятие нормированного плана. Норми-
Нормированный план е — это совокупность спектра плана и от-
36
носительных весов, долей наблюдении в каждом из точек
спектра:
е —
/77/
/V Л,
U,..-. р„У
B.10)
Введем еще некоторые обозначения. Можно показать
[14], что при заданном плане метод наименьших квадра-
квадратов приводит к получению лучших линейных оценок U
вектора параметров 0 по формуле
в- (ХТХГ'ХТУ, B.11)
где Y — вектор наблюдений в точках плана;
X — матрица значений функций fi(x) в точках плана,
т. е. матрица с элементами:
xi! = fi(*i), {1=1,..., N; j = I , ... , k). B.12)
Матрица X называется матрицей коэффициентов, или
матрицей независимых переменных. Особую роль в пла-
планировании эксперимента играет информационная матри-
матрица плана А = ХТХ с элементами
ач =
У
[i (x;) fj (x,) .
B.13)
Матрица М=—А называется нормированной инфор-
информационной матрицей. Ковариационная матрица лучших
линейных оценок параметров записывается как <т2А-',
где о2 — дисперсия ошибки опыта. Нормированная кова-
ковариационная матрица —это матрица а2М~'; обозначим се
через o2D. Дисперсию оценки модели т] теперь можно
представить в виде
о2 {г]} = (тМт (х) A f (х)-= а'-ЛГ1 Г (х) Df (x);B.11)
обозначив fT(x)Df(x)=d(x), можно записать
(х).
B.П)
Таким образом, мы видим, что дисперсия оценки мо-
модели с точностью до константы равна d(x). Заметим, что
Для линейных моделей информационная и ковариацион-
ковариационная матрицы зависят только от выбора координат точек
37
плана и не зависят от истинных значений оцениваемые
параметров. Что же именно нужно учитывать при выбо-
выборе плана? На какие свойства оценок необходимо опи-
опираться здесь, формулируя некоторые критерии оптималь-
оптимальности?
2. СПИСОК КРИТЕРИЕВ
Предположим, что модель мы выбрали правильно,
т. е. в измерениях отсутствует систематическая ошибка
относительно данной модели. Это значит, что при выбо-
выборе критерия оптимальности основное внимание следует
обратить на случайную ошибку. Нас интересует точность
самих оценок параметров, которая полностью описыва-
описывается их ковариационной матрицей, а также точность
оценки модели в интересующей нас области, которая
представляет собой функцию B.14), зависящую от кова-
ковариационной матрицы оценок. Поэтому ясно, что крите-
критерии оптимальности плана должны определять некоторые
желательные свойства ковариационной (или обратной
информационной) матрицы.
Здесь можно обратиться к свойствам лучших линей-
линейных оценок и потребовать, чтобы выбираемый нами план
был «лучше» других планов, т. е. чтобы ему соответст-
соответствовала «наименьшая» ковариационная матрица [свойст-
[свойство, аналогичное B.6)]. Но, как правило, не удается
найти планов, имеющих «минимальную» ковариационную
матрицу, поэтому план приходится характеризовать не-
некоторым функционалом матрицы. В частности, можно
потребовать, например, чтобы свойства, аналогичные
свойству B.7) или B.8), выполнялись бы на множестве
планов.
Здесь мы рассмотрим несколько статистических кри-
критериев оптимальности планов, которые в этом смысле
являются как бы логическим развитием свойств луч-
лучших линейных оценок. Мы будем рассматривать также
некоторые статистические критерии, которые и не имеют
подобной логической связи со свойствами лучших линей-
линейных оценок, но тем не менее, формулируя их, мы требуем
улучшения некоторых статистических свойств модели.
Разобьем все статистические критерии на две боль-
большие группы. К первой группе отнесем критерии, связан-
связанные с точностью оценок параметров, ко второй — крите-
критерии и свойства планов, связанные с ошибкой в оценке
модели.
38
Свойствам оценок параметров можно дать наглядное
геометрическое истолкование, связав эти свойства со
свойствами их эллипсоида рассеяния. Пусть величины
Q Qh имеют распределение с математическим ожида-
ожиданием в и центральными моментами второго порядка
с п ;-— i; .^ k). Рассмотрим А-мерный эллипсоид, центр
которого совпадает с в. Допустим, что плотность распре-
распределения вероятности в этой области постоянна. Моменты
второго порядка этого распределения можно подобрать
таким образом, чтобы они совпадали с сц. Величины 0 и
с.. (it /=1, ..., k) определяют параметры эллипсоида, ко-
который называется эллипсоидом рассеяния. Для данного
метода оценки (в нашем случае наилучшие линейные
оценки) ориентировка, форма и объем этого эллипсоида
будут полностью зависеть от плана. Сначала остановим-
остановимся на критериях первой группы.
D-оптимальность. В теоретических исследованиях по
планированию эксперимента большое внимание уделяет-
уделяется критерию ?>-оптимальности (по начальной букве сло-
слова determinant). Планам е*, оптимальным по этому кри-
критерию, соответствует наименьший на множестве планов
определитель ковариационной матрицы:
D (е*)
= mm
D(e)
B.16)
Эллипсоид рассеяния оценок параметров для ?>-опти-
мального плана имеет минимальный объем. Этому кри-
критерию оптимальности планов уделено много внимания в
математической литературе. Для некоторых типов моде-
моделей разработаны методы построения D-оптимальных пла-
планов. Критерию ?>-оптимальности уделено особое внима-
внимание в работах американского математика Кифера и его
школы [15—23]. Кифер доказал наиболее общие поло-
положения, касающиеся связи критерия D-оптимальности с
некоторыми другими критериями и разработал отдельные
способы построения D-оптимальных планов.
А-оптимальность. Планам, отвечающим критерию А-
оптималыюсти (название происходит от выражения
average variance, т. е. средняя дисперсия оценок), со-
соответствует эллипсоид рассеяния с наименьшей суммой
Х°В» ДЛВД °Сей- В этом слУчае параллелепипед,
™Ш °К0Л0 эллипсоида рассеяния, имеет наимень-
наименьший™*^ ди5гоналн- Эт°му критерию отвечают планы
минимальной средней дисперсией оценок коэффициен-
39
тов или с наименьшим значением следа (trace) ковариа-
ковариационной матрицы:
lr D (e*) = min tr D (e). B.17)
с
Е-оптимальность. ^-оптимальным планам соответст-
соответствует наименьшее максимальное собственное значение
(eigen value) ковариационной матрицы:
D
= min max Я, (d (e)
B.18)
где Xi — собственное значение матрицы D(e). Выбирая
этот критерий, мы как бы не допускаем, чтобы отдельные
оценки параметров имели слишком большие дисперсии
и ковариации. Геометрически таким планам соответствует
эллипсоид рассеяния с наименьшей максимальной осью.
Интересно, что критерии этой группы можно предста-
представить в общем виде, а именно в виде требования миними-
минимизации некоторого функционала, зависящего от одного па-
параметра. Это впервые показано в работе Кифера [23].
Пусть Xi (е), ..., Xfc(e) —собственные значения матри-
матрицы D(e). Определим функционал Ф3)(е) следующим об-
образом:
J / * \ L
Фр (в) = [k-x tr D" (e)) " == IT1 У \Ч (г)
для
фо (е) = lim Ф (е) = | D (в) | и
Ф„о (е) = lim Фр (е) = max Я,- (е).
B.19)
План, минимизирующий Фр(е), назовем Фр-оптималь-
ным. Таким образом, функционал Фо(е) соответствует
критерию D-оптимальности, Ф1(е)—критерию Л-опти-
мальности, Фоо(е) —критерию ^-оптимальности. Любому
значению параметра р соответствует некоторый критерий
оптимальности плана, причем геометрический смысл наи-
наиболее очевиден для уже перечисленных выше критериев.
Ортогональность. К первой группе критериев можно
отнести также такой критерий, как ортогональность пла-
плана. План называется ортогональным, если ему соответст-
соответствует диагональная ковариационная (информационная)
матрица оценок. Для ортогональных планов все оценки
параметров независимы.
Этот критерий не требует минимизации какого-либо
функционала, однако он связан со свойствами эллипсои-
40
да рассеяния: для ортогональных планов эллипсоид ори-
ориентирован в пространстве параметров таким образом,
что направления его главных осей совпадают с направ-
направлениями координатных осей в пространстве параметров.
Можно попытаться количественно оценить близость за-
заданного плана к ортогональному с помощью некоторой
скалярной функции матрицы D(e). В качестве такой
функции можно было бы выбрать, как об этом уже гово-
говорилось выше, величинуfW|D| (где с« —диагональные
/= I
элементы D(.e)). Для ортогональных планов эта величина
равна единице. Но такая функция не позволяет различать
планы, дающие, например, малую закоррелированность
оценкам многих параметров и значительную закоррели-
закоррелированность оценкам двух или трех параметров. Практиче-
Практически! для оценки ортогональности можно пользоваться, на-
например, функцией max \рц\ (i?=j), где рц — коэффициент
корреляции оценок параметров регрессии, т. е. характе-
характеризовать отличие плана от ортогонального максимальным
коэффициентом корреляции или функцией (Sp?//^(^ —
—1)). Но ни одна из этих функций, конечно, не позволяет
дать представление о структуре корреляционной матри-
матрицы оценок параметров.
Рассмотрим теперь критерии оптимальности второй
группы, связанные с ошибкой оценки поверхности от-
отклика.
G-оптимальность. G-оптимальные планы (название
происходит от выражения genera] variance — общая дис-
дисперсия) минимизируют на множестве планов максималь-
максимальное значение дисперсии оценки модели, или величины
rf(x, е) i[cm. 2.I4)]; план е* G-оптимален, если
max d (х, е*) = min max d (x, e). B.20)
П Х г х
Применение G-оптимального плана как бы дает экс-
экспериментатору гарантию, что в области планирования не
окажется точек, в которых точность оценки поверхности
отклика слишком низкая.
Ч-оптимальность. Можно требовать от плана миними-
°РеДНеЙ диоперсии °Ценки модели; план е* назы-
d (x, e) dx . B.21)
Q-оптимальным, если
i
d (x, e*) d x = min
as e
41
Оптимальность планирования для экстраполяции. Два
последних критерия можно записать в более общем виде,
потребовав выполнения этих же условий в некоторой об-
области"^/, не обязательно совпадающей с областью пла-
планирования $€. В частности, если сЦфЭВ, эти критерии
будут критериями оптимальности для решения задачи
экстраполяции.
Ротатабельность. План называется ротатабельным,
если дисперсия оценки модели может быть представле-
представлена как функция расстояния до центра эксперимента, т. е.
можно записать d(x,e) —4\(г, е),где т-
Выполнение этого условия делает любое направление от
центра эксперимента равнозначным в смысле точности
оценки поверхности отклика. Если «информационные
контуры» плана представить как поверхности с равными
значениями дисперсии оценки модели, то для ротатабель-
ного плана эти поверхности будут представлять собой
сферы.
Максимальная точность оценки координат экстрему-
экстремума. Иногда выдвигается такое требование, как макси-
максимальная точность оценки координат точки экстремума:
d (хэ, е*) = min d (хэ, е),
е
B.22)
где Хэ—координаты экстремума оценки поверхности от-
отклика.
Как правило, при изучении поверхности отклика не-
необходимыми этапами бывают и построение модели, и ее
последующее исследование, в частности определение или
уточнение положения точек экстремума. Для построения
планов, минимизирующих дисперсию оценки поверхности
отклика в области экстремума, необходимо иметь пред-
предварительную грубую оценку его положения.
Униформность. Это критерий, требующий, чтобы дис-
дисперсия оценки модели в некоторой области вокруг цент-
центра эксперимента была практически постоянной.
Рассмотрим теперь критерий оптимальности, пользу-
пользуясь которым мы вместе со случайной ошибкой учитыва-
учитываем и систематическую погрешность, обусловленную соз-
сознательным выбором заведомо упрощенной модели. Допу-
Допустим, что вид истинной модели по некоторым априорным
сведениям нам известен. Пусть это будет некоторая функ-
функция т)(х). Но мы можем построить в заданной области
42
несколько другую, более простую модель; запишем ее в
V f- (x) 6/ Рассмотрим следующий обобщен-
виде 2dl
/=i
ный критерий оптимальности планов.
Минимизация среднеквадратической систематической
и случайной ошибки. Мы можем потребовать минимиза-
минимизации общего, случайного и систематического среднеквад-
ратического отклонения оценки выбранной модели от
истинной. Тогда оптимальный план е* минимизирует на
множестве планов выражение
U (x)
=i
-r,(x)|
J
dx.
B.23)
В качестве модели ^ ^ (x) 9' может быть выбран,
например, полином степени d, в то время как истинная
модель, по нашим предположениям, представляет собой
полином степени d+1 [31—34].
В работах [33, 34] выбирается с точки зрения подоб-
подобного критерия не только наилучший план, но и наилуч-
наилучший метод линейного оценивания.
Оптимальность планирования для проверки гипотезы
о неадекватности модели. Иногда же, наоборот, план мо-
может выбираться так, чтобы по возможности в лучших ус-
условиях проверить гипотезу о неадекватности модели, ес-
если мы предполагаем, что в области планирования верна
некоторая более сложная модель1 [31, 59].
Почти всегда можно предполагать, что на изучаемое
нами явление влияют некоторые факторы, которые мы не
регистрируем в процессе исследования. Как правило, из-
изменение уровней этих «мешающих» факторов в течение
всего эксперимента имеет некоторый систематический ха-
характер. Допустим, мы будем ставить опыты в экспери-
эксперименте так, что характер изменения независимых пере-
переменных также будет иметь некоторый неслучайный ха-
характер, например в первой половине всех измерений один
из факторов х, будет зафиксирован на верхнем уровне, а
во второй половине —на нижнем. В этом случае мы ри-
рискуем получить некоторый ложный эффект, который бу-
будет фактически обусловлен влиянием «мешающих» фак-
факторов, но будет отнесен нами к эффекту фактора х{. Если
13
же мы сознательно будем вносить элемент случайности
в очередность измерений, то влияние неконтролируемых
факторов сведется к некоторому увеличению случайного
разброса, т. е. к увеличению дисперсии одного наблюде-
наблюдения. Поэтому можно записать еще один критерий опти-
оптимальности планирования.
Рандомизация. Это случайный порядок проведения
измерений. Решение о необходимости рандомизации мо-
может повлиять и собственно на выбор точек плана, так как
иногда может оказаться, что выбор определенных усло-
условий измерений ограничивает возможность рандомизации.
Рандомизация может производиться не только для исклю-
исключения влияния переменных, неконтролируемым образом
изменяющихся во времени, но также и для исключения
влияния переменных, изменяющихся неконтролируемым
образом в пространстве (например, неоднородности ма-
материала, подлежащего исследованию).
Мы привели список критериев, отражающих наиболее
существенные требования, которые можно предъявить к
планам, желая получить хорошую в статистическом
смысле модель изучаемого явления. Остановимся теперь
на некоторых свойствах планов,, которые нельзя рассмат-
рассматривать как основные критерии оптимальности планиро-
планирования, но, как показывает практика, выполнение которых
весьма желательно. Эти свойства не улучшают качеств
самой модели, а лишь только упрощают процедуру про-
проведения исследования.
Насыщенность. Очень часто существенным является
требование, чтобы план содержал небольшое число из-
измерений. Если число измерений равно числу неизвестных
параметров, которые нужно оценить, то план называет-
называется насыщенным; планы с меньшим числом измерений не
позволяют найти единственные оценки всех параметров.
Обычно на практике используются планы, по числу из-
измерений близкие к насыщенным.
Композиционность. Это свойство, позволяющее разде-
разделить эксперимент на несколько этапов и постепенно пе-
переходить от простых моделей к более сложным, исполь-
используя предыдущие наблюдения. Например, сначала ставит-
ставится план для оценки коэффициентов полинома первого
порядка; при этом желательно, чтобы, кроме невырож-
невырожденности, план обладал и другими оптимальными свой-
свойствами. В случае необходимости на втором этапе к име-
имеющемуся плану добавляется несколько наблюдений, так
что все вместе они дают возможность оценить все коэф-
44
фициенты полиномиальной модели второго порядка
4 ГПоостота обработки. Практически важным оказывает-
оказывается требование простоты вычислений. Для других планов,
использующихся на практике, вся обработка результатов
эксперимента может проводиться вручную по простейшим
формулам Например, если выбранная модель —полином
второго порядка, то большинству планов, удовлетворяю-
удовлетворяющих приведенным здесь критериям оптимальности, соот-
соответствуют информационные матрицы блочной структуры
с большим числом нулевых элементов. Это, как правило,
позволяет записать удобные для ручного счета формулы
для получения оценок параметров.
При желании приведенный здесь список можно было
бы расширить. В статье Бокса [25], например, дан спи-
список более чем двадцати различных критериев.
3. СВЯЗЬ МЕЖДУ КРИТЕРИЯМИ,
ОБЩИЕ МЕТОДЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПЛАНОВ
Остановимся теперь на вопросе о связи между раз-
различными критериями оптимальности и свойствами пла-
планов. Чтобы дать по возможности полное представление
о такой связи, необходимо несколько расширить понятие
плана. Введем понятие непрерывного плана.
В начале этой главы мы говорили о нормированных
планах с заданным числом наблюдений N. В таких пла-
планах pi=mi/N, т. е.-числа /?, должны быть такими, чтобы
значения piN=nii были целыми, поскольку мы не можем
в точках плана делать дробное число измерений. Отка-
Откажемся теперь от этого условия и будем считать, что веса
могут быть и иррациональными числами. Обозначим эти
новые веса через ?*; соответствующие планы будем назы-
называть непрерывными. Таким образом, непрерывный план
можно записать так:
B-24)
гдеА*~Ие обязательно рациональные числа.
Можно и ещё больше расширить понятие плана и счи-
считать непрерывным планом любую вероятностную меру,
заданную на множестве т. Понятие непрерывного плана
пвел американский математик Дж: Кифер [15]. Ему при-
принадлежат важные результаты в теории планирования
45
эксперимента, касающиеся вопросов связи между Крите,
риями и методов построения оптимальных планов.
Основополагающим достижением в развитии матема-
тической теории планирования эксперимента оказалась
теорема Кифера — Вольфовица об эквивалентности не-
прерывных D- и G-оптимальных планов. Эта теорема
справедлива практически для любого множества экспе-
экспериментирования %в и для всех непрерывных функций
fг (х). Приведем здесь формулировку этой теоремы.
Теорема: План ?* D-оптимален тогда и только тогда,
когда он G-оптимален, и тогда и только тогда, когда
max d (х, ?*) = k,
B.25)
где k — число неизвестных параметров модели.
На множестве планов с заданным значением N (ина-
че они называются точными планами) эта теорема вы-
полняется только приближенно. Эта теорема была дока-
доказана в 1960 г. [17]; сейчас ее можно рассматривать как
частный случай более общих положений, доказанных в
работах Кифера [22, 23], Федорова [26], Федорова и Ма-
лютова [27] и др. Остановимся коротко на некоторых
результатах теории непрерывных планов.
Функционал |D(|) |, который минимизируется на мно-
множестве непрерывных планов при получении D-оптималь-
ных планов, представляет собой выпуклый функционал
матрицы D(|) [27]. Будем рассматривать всевозможные
выпуклые функционалы ковариационных матриц
Ф(Э(^)). Под линейной комбинацией планов ?i и ?2 с
коэффициентами а и 1—а, 0^а^1 будем понимать но-
новый план la, такой, что спектр его содержит спектры пла-
планов |] и |г, а веса точек этих спектров умножаются соот-
соответственно на а и на 1—а. Свойство выпуклости функ-
функционала cD(D(g)) означает, что для любых планов \i и \%
и для любых O^a^l должно выполняться неравенство
Ф (D Aа)\ < а Ф (D &)) + A _ а) Ф f D
• B.26)
Заметим, что почти все функционалы, на которых ос-
основаны перечисленные выше критерии оптимальности,
представляют собой выпуклые функционалы ковариа-
ковариационных матриц. Планы, минимизирующие функционал
Фф(?)), будем называть Ф-оптимальными. В работе
[27] приводится теорема об эквивалентности Ф-опти-
мальных планов и планов, которые минимизируют мак-
phmvm некоторой функции Фф(х, |) от переменных х в
Жрти SB Функция фв>(х, I) полностью определяется
вияом функционала Ф(О(|)). При этом от функционала
nwD*V квоме свойства выпуклости, требуется еще вы-
выполнение некоторых свойств, которые для интересующих
няг критериев также выполняются. Приведем, например,
фикции А*(х, I), которые соответствуют таким критери-
критериям, как D-, А- и Q-оптимальность [26] :
Функционал Ф (D (g)j Функция <рф (х, ?)
©f( dE
|D F)|
tr D (I)
f (x)
f Г (x) D (|) f (x) d x fT (x) M D g) f (x), где
JVl= I f (x) fT (x) dx.
Эта теорема представляет собой основу для создания
алгоритмов построения непрерывных оптимальных пла-
планов. Такие алгоритмы были предложены в работах Фе-
Федорова [26, 27]. Непосредственная оптимизация функ-
функционала Ф(Р(?)) на множестве планов представляет со-
собой задачу поиска экстремума в пространстве размерно-
размерности не более чем (k + 1)п (" + '- (см. [27]). Для отдель-
отдельных частных случаев размерность может быть значитель-
значительно снижена, но, как правило, она всегда остается слиш-
слишком высокой даже для современных вычислительных ма-
машин. В работах [26, 27] предложены алгоритмы, позво-
позволяющие свести задачу построения Ф-оптимальных планов
к последовательности задач поиска экстремума в прост-
пространстве размерности п. На каждом шаге итерационной
процедуры добавляется некоторый положительный вес в
ту точку области S6, в которой на данном этапе достига-
достигается максимум функции фф(х, ?). Доказана сходимость
последовательности получаемых таким образом непрерыв-
непрерывных планов к Ф-оптимальным планам при определенном
выборе шага.
Для определенных типов моделей и некоторых стан-
стандартных видов области 86 разработаны и аналитиче-
аналитические методы построения оптимальных по некоторым кри-
критериям планов. Это касается прежде всего критерия D-
оптимальности. D-оптимальным планам посвящено боль-
47
шое число математических исслед™маль ых Е
теоремы об эквивалентности для ?:°™ал?"н№иона-а
наиболее проста; функция срФ(х, |) дл* J^" „° ,е*
\П(Р)\ имеет очевидный статистический смысл, "Р"'^
&. то. ФУ»™»-™ "^Г^ТеГкТмГ™
числу параметров регрессии, dlk^ 0^ередь были полу.
именно для этого критерия в nej^y 4ским и п0 чис-
чены основные результаты и по dHd" план0В Впос
ленным методам построения непр р ными и аналити.
ледствии различными метода ми (ч оптимальные
ческими) были построены ^ „иболее интересных
планы и по другим критериям для
моделей [44, 47—51]. мпжно непосредствен-
Непрерывные планы не всегда мо^н задано некото-
но использовать на практике. ?.сли н пределенпи
рое общее число наблюдении л/, то iip i уеоывного
этих наблюдений между точками спектра не у ^ ^ ^
оптимального плана может оказаться hi измере.
некоторых точках можно сделать нецелое aToi1iRo
ний. При достаточно больших знач^™ fi ^ б.
малом числе точек спектра мы можем °™Р ^
ные части этих чисел и п0ЛУчитуаЛзаНа'б™ы некоторые
рывному оптимальному плдых ^V^ щ ^ т
методы округления не^рр результаты только при
они, как правило, дают хор р
Л^пИяХии поиска оптимальных планов на множестве
Задачу поиска опти"™ чИСЛОМ наблюдении
Т°Чзя'п'осьРешить гораздо труднее, чем задачу поиска
непрерывных оптимальных планов. Если мы ограничим-
ся мужеством точных планов, ^ не оказываются спра-
методом только для некоторых простых моделей [30].
Обзор результатов по теории и методам построения оп-
тимальных планов (главным образом ?>-оптимальных) с
п0ЛНЬШ списком литературы по этим вопросам имеется
в работе Р. Джона . Н. Дрейлера [35,.
Построить планы, удовлетворяющие одновременно
многим критериям оптимальности, удается только для от-
дельных простых моделей. Об одной такой модели мы
расскажем в следующей главе. Как правило, мы должны
остановиться на каком-то одном из основных критериев,
пожертвовав чем-то с точки зрения других критериев. В
этом случае желательно найти некоторое компромиссное
решение, т. е. выбрать план, который был бы близок к
оптимальным планам по разным критериям. Здесь под
близостью следует понимать то, что значение функцио-
нала> соответствующего данному критерию" оптимально-
^ для вы,бранного плана должно быть близко к опти.
мальному значению этого функционала. Математически
можно было бы сформулировать задачу построения пла-
нов, близких к оптимальным по нескольким критериям,
однако в достаточно строгой формулировке такая зада-
ча' наС1<олько нам известно, не решалась.
Интересные выводы относительно эффективности пла-
нов по разным критериям семейства Фр делаются в ра-
ботах Кифера Г23], а такЖе Кифера и Гэлила [47-491
Здесь исследуется главным образом эффективность не-
прерывных оптимальных планов.
Пусть Б-любой заданный план; Ej-планопти-
мальный относительно критерия фр. Отношение значения
критерия Фр для плана Бр к соответствующему значе-
Г^^Г " ~ Ф
ГГенет=жнГи ст^^
аналитически, численные методы построения значитель-
Посредственный поиск минимума функцио.
© =
B.27)
48
49
соответствует наибольшее значение минимального отно-
отношения ер.
Таким способом в работах [47—49] исследовалась
для некоторых полиномиальных моделей робастность D-t
А- и ^-оптимальных планов. Интересно, что для разных
моделей и разных областей планирования наиболее ро-
бастными могут быть планы, оптимальные по различным
критериям. В частности, например, для полинома второ-
второго порядка на шаре единичного радиуса или на много-
мерном кубе со стороной 2 с центром в начале координат
наиболее робастны Л-оптимальные планы, а для той же
модели на правильном многомерном симплексе наиболее
робастны ^-оптимальные планы.
Хотя некоторые планы здесь и выделяются как наи-
наиболее робастные, однако нужно отметить, что отношения
ev для этих сочетаний f и Яв (полиномы второго порядка
и указанные выше области планирования) не слишком
малы и для других оптимальных планов, т. е. мы не
много теряем в эффективности, используя любой из оп-
оптимальных планов. Однако в работе [23JL например, от-
отмечается, что имеются такие пары (f, <%), для которых
отношения эффективности могут быть очень малы для
соответствующих оптимальных планов. Одной из задач
теории планирования эксперимента можно считать поиск
таких семейств пар (f, й?), для которых оптимальные
планы робастны.
К решению задачи выбора плана, близкого к опти-
оптимальным по нескольким критериям, можно подойти и с
несколько другой стороны. Робастные к изменению кри-
критерия планы не обязательно искать среди оптимальных
планов. Из имеющегося набора планов для некоторых
стандартных моделей, содержащих небольшое число наб-
наблюдений и обладающих некоторыми удобными для при-
приложений свойствами, иногда можно выбрать планы,
удовлетворительные сразу по нескольким критериям.
ГЛАВА 111
ВЫБОР ОПТИМАЛЬНЫХ ПЛАНОВ
ДЛЯ ПОЛИНОМИАЛЬНЫХ МОДЕЛЕЙ
1. ВВЕДЕНИЕ
Полиномиальные модели получили широкое распространение (
практических исследованиях. Мы в основном остановимся на полино1
мах первой и второй степени от п независимых переменных дл'
50
типов области планирования. Соответствующие планы
принято называть планами петого и второго порядка.
, р и отклика с помощью
пимента принято на
еримента, р ^ нсследоваиию поверхности отклика с помощью
,,1«ых моделей связано с именем американского мате-
полиномиальных модел н ^^ ^ ^^ опубликовали первую
MafioTV ?этом направлении Г381. В то время еще не были четко
^оомулнрованы статистические критерии оптимальности планов
«спеоимХа: при выборе плана основное внимание уделялось
тяким их свойствам, как ортогональность и ротатабсльность. Свой-
Свойство ортогональности обеспечивает независимость оценок парамет-
пн Пользуясь ортогональными планами, можно отбрасывать
пяпаметоы которые в результате проперчи гипотез регрессион-
регрессионного анализа оказались незначимыми; «то никак не влияет на
опенки других оставшихся параметров. Ротатабельность плана поз-
позволяет легко получить представление об ошибке опенки модели в
любой точке области $? , «информативность» модели оказывается
одинаковой в любом направлении от центра эксперимента. Кроме
того, применение ортогональных и ротатабельных планов позволяет
проводить обработку материала вручную, что имело большое зна-
значение на первых порах применения планирования эксперимента, так
как в то время еще была недостаточно развита вычислительная
техника в прикладных институтах и на производстве.
В то время как для полиномиальных моделей первого порядка
можно построить планы, которые одновременно обладают свойст-
свойствами ортогональности и ротатабельности, для полиномов второго
порядка найти такие планы не удается. Здесь в практических за-
задачах критерию ротатабельности было отдано некоторое предпочте-
предпочтение. К свойствам ортогональности и ротатабельности можно доба-
добавить еше свойство композиционности. Композиционные планы вто-
второго порядка получаются добавлением некоторых точек к планам
первого порядка. Такое свойство даст возможность в прикладных
исследованиях сначала попытаться построить модель первого по-
порядка, а затем, если нужно, добавив наблюдения, перейти к модели
второго порядка.
Удобные свойства планов, предложенных в работах Бокса "
его школы, обеспечили им быстрое внедрение в практику. Вскоре
после появления работы Бокса и Хантера Г391, в которой описыва-
описывались Композиционные ротатабельиые планы второго порядка, был
предложен ряд новых композиционных, но теперь уже не ротата-
ротатабельных планов с небольшим числом наблюдений. Таких планов
появилось очень много и долго оставалось неясным, как именно
провести сравнительную оценку этих планов. Концепция Бокса не-
несмотря на ее плодотворность и широкий отклик среди эксперимен-
экспериментаторов, оказалась недостаточно общей для дальнейшего логичес-
логического развития.
tm™B 1960~1964 гг- в работах Кнфера были четко сформулированы
опенки f сТатистнческие критерии оптимальности планов для
первого п"еИНЫХ П° паРаметРам моделей. Оказалось, что планы
впрм»« п°РяДка, которые использовались ранее, оптимальны одио-
пооядкя°яС T04K« 3реННЯ многнх критериев. С планами второго
J^LL°бг7°яло несколько сложнее. В работах Киф^а и
оГпя 3' 44> 4?~521 былн встроены в некоторых
порядка уло х пля"иоовання непрерывные планы второго
Однако 'тя^,Г!ГГВ0'РЯТОЩИе Разли1Гным критериям оптимальности.
.<ише планы практически никогда не отвечают нескольким
пооядкя
51
критериям одновременно. Кроме тою, для их практической реалнза
ции необходимо слишком большое число наблюдений. Впоследствии
с помощью различных методов округления были построены планы
с небольшим числом измерений, близкие к оптимальным. Однако
обоснованно рекомендовать какой-то конкретный план для практи
ческого использования было трудно. Возникла задача сравнения
всех имеющихся планов по различным критериям с целью выбора
некоторого компромиссного решения. Нужно было найти множество
планов, которые были бы, во-первых, близки к оптимальным по
многим критериям и, во-вторых, удобны для практического исполь-
использования [40, 41]. Отметим, что впервые вопрос об использовании,
концепции /)-оптимальности в практических задачах планирования
эксперимента стал решаться в работах советских авторов [28, 37] \
2. ПЛАНЫ ПЕРВОГО ПОРЯДКА
Модель, представляющую собой полином первого порядка для
независимых переменных, запишем в виде
п
/=1
Иногда такие модели являются достаточно точной аппроксима-
аппроксимацией при исследовании механизма явлений. Но чаще они использу-
используются в экстремальных экспериментах, направленных на определение
оптимальных условий протекания процесса, для локального прибли-
приближения отклика и оценки градиента (о таких экспериментах мы
подробнее расскажем в гл. V). Невырожденные планы для оценки
параметров модели C.1) называются планами первого порядка.
Рассмотрим наиболее часто встречающиеся типы ограничений на
независимые переменные, которые определяют область планирования:
а) чаще всего в практических задачах границы варьирования
задаются отдельно для каждой переменной. Обозначим через г* на-
натуральные значения независимых переменных, которые измеряются,
например, в единицах времени, температуры, объема, длин и т. д.
Тогда мы имеем неравенства такого типа:
еременных можно задать в виде
п).
C.2)
От натуральных переменных обычно удобнее бывает перейти к
безразмерным переменным, приняв половину интервала варьирова-
варьирования каждой переменной за единицу. Тогда получим систему нера-
неравенств
— lsSTx/s^l (i -, 1, ... , п). C.3)
ОбластьЯ?, определяемая этими неравенствами, представляет гп
бой п-мерный куб;
б) иногда удобнее бывает не рассматривать сочетания крайних
условий для всех переменных; в этом случае область варьирования
* Следует заметить, что в монографиях по планированию эк-
эксперимента, вышедших в США (см. [10—12, 61]), до настоящего
времени не были освещены новые аспекты планирования при иссле-
исследовании поверхности отклика, связанные с 'работами Кпфера.
52
C.4)
i=\
птгюда линейным преобразованием легко перейти в безразмерных
переменных х< к л-мериому шару единичного радиуса:
2 »!«=¦•.
C.5)
в) каждая из переменных принимает три различных значения:
xi=\ о (/ = 1, ... , я); C.6)
1 + 1
г) каждая из переменных принимает два различных значения:
"! (i-1, ... . я). C.7)
Ограничения C.6) и C.7) возникают в задачах взвешивания на
двухчашечных н одночашечных весах; при этом ограничение C.7)
приводит к построению факторных планов для модели C.1). На этих
задачах мы остановимся подробнее в следующей главе. Сюда мы
включили такого типа ограничения, чтобы показать, что для планов
первого порядка разного типа ограничения на переменные часто
приводят к одинаковым решениям задачи выбора оптимального
плана.
Построение эффективных планов первого порядка для области
C.5) не представляет особых затруднений. Насыщенные планы в вер-
га
..г „.„ „.„,..„^„^„> „„„^.„..„.^ ., ^т^, ' Xt = 1 , ЯВЛЯ-
/=1
ются D-, G-, А- и ^-оптимальными для любого числа переменных п.
Кроме того, эти планы ортогональны и ротатабельны. Свойства оп-
оптимальности планов не зависят от ориентации симплекса. Эти планы
оптимальны на множестве непрерывных планов и в то же время оии
содержат минимальное число наблюдений.
Почти так же благополучно обстоит и с областью C.3). Планы,
получаемые из матриц Адамара (об этих матрицах мы говорили ъ
нял обладают свойствами D-, G-, А- и ^-оптимальности, ортого-
ортогональности н ротатабельности. Единственная неприятность заключа-
ся в том, что матрицы Адамара можно построить не для любой
BbiiLHw00™ "Р^трачства переменных xt. Они, как уже говорилось
nUV существуют, кроме случая п = 1, только для тех п, для кото-
которых /i-fi кратно четырем.
обычны" ДРУГИХ значений п оптимальные планы можно построить
ным вычеркиванием одного, двух или трех столбцов из плана,
построенного на основе матрицы Адамара1. Например, для /1=7
из матрицы Адамара получается оптимальный насыщенный план пер-
первого порядка, представленный в табл. 5. Для я = 6, 5, 4 оптимальные
планы получаются вычеркиванием соответственно любого одного.
Таблица 5
оптимальный насыщенный план первого порядка для л=:
Номер
опыта
1
2
3
4
5
6
7
8
— 1
+ 1
— 1
+ 1
-1
+ 1
|
+ 1
хг
]
— 1
+ 1
+ 1
|
— 1
+ 1
+ 1
*3
—1
—1
—1
—1
+1
+1
-1-1
+1
+1
-1
—1
+1
+1
— 1
+1
+ 1
— 1
+ 1
— 1
— 1
+ 1
+ 1
+ 1
+ 1
— 1
— 1
-1
— 1
+ 1
+ 1
х,
—1
+1
+1
—1
+1
—1
—1
+1
любых двух и любых трех столбцов этого плана. Однако эти планы
с вычеркнутыми столбцами уже не будут насыщенными. Задача по-
построения насыщенных планов для таких размерностей при ограниче
ннях C.3) сводится к нахождению оптимальной ориентации симп-
симплекс-плана, вписанного в многомерный куб. Эта задача решена п
работе [43]. i
Благополучное разрешение проблемы построения эффективных
планов первого порядка для ограничений C.3) позволяет считать
эту проблему закрытой и для ограничений C.6) и C.7). Действи-
Действительно, планы адамаровской конфигурации — это планы с элемен-
элементами —1 и +1; таким образом, ограничения C.6) и C.7) выпол-
выполняются автоматически.
3. ПЛАНЫ ВТОРОГО ПОРЯДКА
Пусть интересующая нас модель — полином второй степени от
независимых переменных. Запишем в таком порядке:
у}=
=б0
, *iQt +
/ —1 i i
9//. C.8)
План второго порядка — это невырожденный план для оценки
параметров полинома C.8). Здесь мы в основном остановимся на
планах для областей C.3) и C.5), т. е. на планах на кубе и шаре
Симметричными планами второго порядка здесь будем называть
планы, которые имеют следующую структуру информационной мат
рицы:
1 Строго говоря, существование матриц Адамара порядка N для
любых значегшй jV = O (mod 4) является только неопровергнутым
предположением; однако наименьшее Л', для которого матрицу Ада-
Адамара построить не удалось, равно 188.
1
A/
N а а ... а
а г р . . . р
а р г . . . р
Р Р
О
a In
Pi
п (л — 1)
C.9)
где In — единичная матрица порядка п.
Рассмотрим результаты нескольких работ по построению и срав-
сравнению планов второго порядка по различным критериям с целью
выбора множества компромиссных планов, достаточно близких к оп-
оптимальным по большинству из рассмотренных критериев.
В работах [47—49] производится построение и сравнение непре-
непрерывных Фр-оптимальных планов второго порядка; среди них выби-
выбираются планы, малочувствительные к изменению критерия оптималь-
оптимальности. В каталоге планов второго порядка [41] и в работе [40] пла-
планы сравниваются по нескольким критериям; основное внимание
уделяется точным планам с небольшим числам наблюдений, удобным
для практического использования. В работе [50] различные планы
второго порядка сравниваются по величине определителя информа-
информационной матрицы.
Здесь мы сравним с точки зрения нескольких критериев свойства
непрерывных и точных планов, вошедших в указанные работы. Для
сопоставления планов возьмем следующие критерии:
1) определитель нормированной ковариационной матрицы |М|;
2) след нормированной ковариационной матрицы tr D;
3) средняя по области планирования дисперсия оценки модели
"rf= f Р (х) Df (x) rfx= f d (x) dx;
4) максимальное собственное значение нормированной ковариа-
ковариационной Матрицы А,тах (Щ\
5) максимальное в области планирования значение нормирован-
нормированной функции дисперсии оценки модели
dmax = max d (x),
чтобы сравнение было более наглядным, удобнее пользоваться так
называемыми «приведенными» характеристиками, которые представ-
представляют собой некоторые преобразования основных характеристик. По
такой, например, величине, как) |М|, сравнивать планы неудобно, так
как она характеризует объем fe-мерного эллипсоида. Даже небольшие
•изменения длин осей эллипсоида приводят к значительному измене-
изменению его объема, поэтому даже очень близкие друг к другу планы мо-
могут по величине |М| отличаться на несколько порядков. Выберем пре-
54
55
образования характеристик'|М|, d, tr (D) и/-max из следующих сооб-
соображений. Предположим, что матрицу М~' плана можно записать ь
виде /I, где I — единичная матрица размера kXk. Вычислим вели-
величину / по каждой из наших характеристик; этим мы «приведем» .ха-
.характеристику к средней квадратической ошибке одного параметр;:
Отсюда преобразования имеют следующий вид [40]:
Величину Д будем вычислять по формуле
м-1 =
_ /tr D
tr =
г —II
max — I лтах
где
5 П2 -f 43 П -f 90
90
5n* + 25n -|- 16
2 (n-I-2) (п + 4)
C.10)
C.11)
C.12)
C.13)
для области C.3),
для области C.5).
, = |м-'Г/
Поскольку по всем этим критериям к настоящему времени име-
имеются оптимальные непрерывные планы второго порядка в областях
C.3) и C.5), то для сравнения планов удобно использовать их отно-
относительные эффективности по __этим критериям.
Обозначим через \Ж-*\*,И*, (г*, Х^ах характеристики соответ-
соответственно D-, Q-, А- и ^-оптимальных планов. Тогда эффективность
плана можно подсчитать по следующим формулам:
D-эффектнвность
М-1 , C.14)
eQ = d* fd, C.15)
e4=tr*/tr, C.16)
е, = Х* /Tmax- C-l?»
Q-эффектнвность
Л-эффективность
f-эффективност i>
Кроме этих основных, рассмотрим еще две характеристики планов'
характеристика неротатабельности Д и неортогональносг.1 Y'
Это характеристика неротатабел!
56
Д = max
C.18)
где d (R) — значения функции d (x) в точках, лежащих на расстоя-
расстоянии R от центра эксперимента. Значения d (R) будем рассматривать
только в направлениях на центры граней всевозможных размерностей
куба ;C.3); поэтому вычисленные величины Л представляют собой
оценки снизу характеристики неротатабельности. Для ротатабельных
планов !Д = 0. Величину
C.19)
можно рассматривать как некоторую скалярную характеристику не-
неортогональности плана. Для ортогональных планов у=1.
По характеристикам Д и у мы не будем проводить подробного
сравнения планов, считая, что они просто дают некоторую компакт-
компактную дополнительную информацию, полезную при выборе плана.
Даднм краткие справки относительно планов, которые мы вклю-
включаем в таблицы для сравнения.
1. Непрерывные D-оптимальные планы. Впервые такие планы
были построены Кнфером [18]. Имеется ряд работ, в которых усо-
усовершенствуются методы построения, находятся D-оптимальные планы
с минимальным числом точек спектра [21, 45, 46]. D-оптнмальиые
планы представляют собой «эталоны» по двум характеристикам:
|D| И dmax-
2. Непрерывные Л-оптимальные планы. Построены в работах
[48, 49, 51, 44] аналитическими н численными методами для областей
C.3) и C.5).
3. Непрерывные Е-оптимальные планы. Построены в работах
[48, 49, 51[|..
4. Непрерывные Q-оптимальные планы. Построены в работе
[44,] численным методом для области планирования C.3).
5. Симметричные квази-D-оптимальные планы. В работах [46, 52]
построены симметричные «асимптотически-О-оптимальные» планы с
небольшим числом наблюдений, с характеристикой |D-1|, сходящей-
сходящейся к соответствующей характеристике D-оптнмальиых планов при
увеличении размерности п.
6. Несимметричные квази-D-оптимальные планы. В работе [28]
Для размерностей п = 4, 5, 6 для 'области C.3) округлением непре-
непрерывных О-опгимальных планов построены несимметричные
планы, близкие по |D~'| к оптимальным и содержащие небольшое
™сло наблюдений. В работе [29] численным методом построены
«амзи-?)-оптимальные планы для области C.3) с заданными значе-
значениями числа наблюдений, содержащие точки спектров непрерывных
"-оптимальных планов.
Насыщенные точные D-, А- и Е-оптимальные планы. В работе
числеиным методом построены насыщенные планы на кубе.
г™тимальные "а миожестве планов с данным числом наблюдений,
^"Размерностей п—2, 3 и 4. В работе [51] приводятся для тех же
арностей построенные численными методами точные насыщенные
¦ с-оптимальные планы.
57
8. Композиционные ортогональные планы. Такие планы впервые
предложены в работе [38]. Этн симметричные планы используются
для областей C.3) и C.5). Заметим, что планы, удовлетворяющие
условию ортогональности, для модели C.8) построить невозможнее
так как нельзя сделать нулевыми коэффициенты корреляции межд\
оценками параметров 80 н 9». Поэтому ортогональными здесь услов.
но называются планы, для которых равны нулю все остальные коьф.
фицненты корреляции.
9. Композиционные ротатабельные планы Бокса. Этн планы пред.
ложены в работе [39]. Онн широко используются в практически.-;
исследованиях для областей C.3) н C.5). Структура композиционных
планов такова, что сначала можно построить только часть плана
(ядро) для получения оценок параметров 90, 0; и 0i,-, а затем, если
нужно, достроить план для получения оценок всех параметров моде-
модели C.8). В композиционных ортогональных и ротатабельных планах
Бокса ядро — это точки полного двухуровневого факторного плана.
Для получения оценок всех параметров модели C.8) ядро дополня-
дополняется «звездными» точками на координатных осях иа расстоянии а от
нулевой точки. Эти расстояния задаются условиями ортогональности
и ротатабельности. Для размерностей я ^5 можно в качестве ядра
использовать не полный факторный план, а только половину его ю-
чек (регулярную полуреплнку).
10. Симметричные планы типа Вп. Это планы с наблюдениями с
вершинах куба C.3) и в звездных точках с а=1 [41].
11. Композиционные планы, построенные на основе регулярных
реплик (планы Хартли). Этн планы по структуре сходны с компози-
композиционными планами Бокса, но содержат меньшее число наблюдении и
не обладают свойствами ротатабельности и симметричности [53].
12. Композиционные планы, построенные на основе нерегулярных
реплик (планы Вестлейка). Этн планы несимметричны, по числу на-
наблюдений близки к насыщенным Г5411:
13. Несимметричные насыщенные планы Рехтшафнера и Хоука
Эти планы представляют собой подмножества полного факторною
плана 3" с числом наблюдений, равным числу параметров модели
[50, 55].;
14. Трехуровневые планы Бокса—Бенкена. Бокс и Бенкен \'г
предложили способ построения симметричных, близких к ротатабель-
иым планов второго порядка мри условии, что каждая переменная
может изменяться не более чем на трех уровнях (+1, 0, —1). Такие
планы строятся на основе комбинаций двухуровневых факторньи
планов с неполноблочнымн сбалансированными планами (см. гл. IV).
Для размерностей я = 4 и 7 такие планы ротатабельиы.
¦15ч. Композиционные симплексно-сушмири^емые ротатабельные
планы. Планы этого типа используются для области C.5) Онн вклю-
включают точки правильного я-мерного симплекса, которые дополняются
еще некоторыми точками, определенный выбор которых позволяет
сделать план ротатабельным <[43, 57].
16. Насыщенные симплексно-суммируемые планы. На основе поа-
вильных я-мерных симплексов строятся неротатабельные насыщенные
планы [58].
17. Планы, композиционные по отношению к планам главные
эффектов. Этн планы позволяют! на первом этапе оценить параметр^
9ц, 9,- и 0if, а на втором достраиваются до полных планов второй1
порядка. Они содержат небольшое число наблюдений [41].
18. Полные факторные планы Зп. Они содержат всевозможны1
точки с координатами —1, 0, +1.
55
19 Минимаксные планы для проверки неадекватности моОели
первого порядка. Эти планы строятся так, чтобы по некоторому крн-
ерию наилучшим образом проверить неадекватность модели первого
порядка при условии, что истинная модель имеет вид полинома вто-
второго порядка )[59|]!,
Для всех перечисленных типов планов для размерностей п —
=_2-г-7 найдены указанные выше статистические характеристики.
Величины |М-'|, tr, d, Яшах, Д, у и значения эффективностен
даны для всех исследованных планов в табл. 1 —12 приложений.
В этих таблицах одной звездочкой отмечены симметричные планы,
двумя — ротатабельные.
Проследим некоторые общие тенденции в изменении характери-
характеристик для каждого типа планов. Сравним сначала планы отделыю по
каждой характеристике. _
1.| Характеристика | М-11, область планирования C.3).
Наилучшими, очевидно, являются непрерывные Д-оптимальные
планы, для иих ев=1. Большинство из рассмотренных планов
имеет D-эффективность не менее 0,85. Значительно меньшую ZJ-эф-
фективность имеют ротатабельные планы Бокса, ценгрально-компо-
зиционные ортогональные планы (я ^2), трехуровневые планы Ьок-
са — Бенкена (гс>3) и планы Хартли (п #5). Среди планов с высо-
высокой эффективностью для каждой размерности можно найти симмет-
симметричные планы с небольшим числом наблюдений, например симмет-
симметричные квази-/)-оптимальные планы, планы Вп, планы Вп с полу-
полурепликой. В тех же границах эффективности имеются гисыщенные
или близкие к насыщенным несимметричные планы (точные О-, Л- и
?-оптимальные, планы Рехтшафнера, несимметричные квази-^-оити-
мальные планы, планы, композиционные по отношению к ортогональ-
ортогональным планам главных эффектов). Непрерывные Л- и Q-оптимальные
планы и планы 3" имеют близкую к единице D-эффективность, в то
время как ?-оптимальные непрерывные планы имеют сравнительно
низкую О-эффектинность (порядка 0,7).
2. Характеристика й, область планирования C.3).
Лучшими по этой характеристике после Q-оптимальных планов
оказались планы Л-оптимальные и 3". По этой характеристике мож-
можно выделить группу планов с достаточно высокой эффективностью,
хотя разброс_эффективностей здесь несколько больше, чем для харак-
характеристики |М-'|. Большинство из рассмотренных планов имеет
Q-эффектнвность порядка 0,7—0,8. Отметим, что для некоторых типов
планов с высокой ^-эффективностью величина 6q резко уменьшается
с ростом размерности. Сюда отгюсятся, например, планы В, и В, с
полурепликой.
3. Характеристика tr, область планирования C.3).
Наиболее высокую Л-эффектнвность имеют планы (кроме Л-оп-
тимальных) Q-оптимальные и Зп. Характер изменения Л-эффектив-
ности для планов разных типов в зависимости от размерности очень
сходен с характером изменения Q-эффективиости.
4. Характеристика Xmax, область планирования C.3).
Лучшими нз имеющихся планов (после ^-оптимальных) здесь
вляются Q-оптнмальные планы. Разброс эффективностей по этому
Ритерию для рассмотренных планов очень велик. Многие типы пла-
°в резко ухудшаются с ростом размерности. Если для я = 2 боль-
инство планов имеет ^-эффективность порядка 0,5—0,7, то для
59
/l = G и 7 она снижается примерно до 0,3 0,1. В сня.чи с этим прп\„.
дится рекомендовать для использования планы с довольно ишиоц
^'-эффективное! ыо.
Рассматривая таблицы характеристик и зффектнвностей для об.
ласти планирования C.3) совместно для всех размерностей, мол,:,,
сделать вывод, что здесь не следует рекомендовав использои;ц,
планы какого-либо конкретного типа в целом для всех размерностей
Например, трехуровневые планы Бокса — Бенкепа для л = 3 именл
довольно высокую эффективность по всем критериям, а для п~.]
эффективность, близкую всего лишь к 0,5.
Для каждой размерности в отдельности имеются планы с вы-
высокой эффективностью по всем характеристикам. Можно предложить
следующий способ выбора плана для каждой размерности с учетом
всех характеристик. Произвольно устанавливаются границы зффек
тивности по каждому критерию, выбираются все планы, которые m
выходят за эти границы; среди этих планов выбирается план, наи-
наилучший по одной из характеристик (например, j JV\— * 1) с учетом чис-
числа наблюдений, свойств симметрии, ротатабельности и т. д. Как пра-
правило, если учитывать все эти свойства, возможности выбора на пос-
последнем этапе будут очень ограниченны.
Выпишем отдельно для каждой размерности группы симметрич-
симметричных и несимметричных планов с достаточно высокой эффективностью
по всем критериям (табл. 6).
Заметим, что границы эффективности по разным критериям мы
выбирали для каждой размерности свои, так как если для неболь-
небольших размерностей можно выделить несколько планов, у которых
имеется высокая эффективиость по всем критериям, то для л = б н 7
таких; планов совсем мало.
Из табл. 6 можно по каждой размерности выбирать для исполь-
использования, например, те планы, которые имеют подходящее число наб-
наблюдений и наибольшую D-эффективность. Например, если для л = 3
есть возможность сделать примерно 13—16 наблюдений, то можно
использовать план В3. Снижая произвольно установленные Гранины
эффективностей, можно несколько увеличить возможность выбор,!
планов в соответствии с различными требованиями.
Рассмотрим отдельио группу «эталонных» планов. Сюда мы отно-
относим D-, А-, Е- и Q-оптимальиые непрерывные планы, которые
задаются вероятностной мерой в области планирования. В работе
[49] сравнивались эффективности Фр-оптимальных планов по раз-
разным критериям группы Фр. Было установлено, что наименее) чувстви-
чувствительны к изменению критерия (робастны) для области планирования
C.3) Л-оптимальные планы второго порядка. Сравнение эффектпв-
ностей наших «эталонных» планов (в табл. 1—6) показывает, что Q-
оптимальные планы еще менее чувствительны к изменению критерия,
если принимать во внимание те четыре критерия, которые у нас рас-
рассматриваются (в работе .[49] Q-критерий н^ рассматривается, так
как он не входит в группу Фр).
Рассмотрим отдельно по разным характеристикам особенности
планов при ограничениях типа C.5), т. е. планов на шаре. Здесь мы
исследовали главным образом ротатабельпые и симметричные пла-
планы. По Q-критерию эффективности планов не вычислялись, так к.ж
по этому критерию пет оптимальных планов.
5. Характеристика |М~'|, область планирования C,5).
^-эффективность большинства рассмотренных планов достаточно
высока. Исключение составляют планы 3", построенные на кубе, впи-
60
Таблица 6
ПЛАНЫ П.\ КУПЕ С НАИЛУЧШИМИ
СОВМЕСТНЫМИ ХАРАКТЕРИСТИКАМИ
Размерность,
границы эфс1
тивносте!!
II?cl!MMi-l рИЧПЬК' П.'КШЬ
л = 2
е >0
ед>0
<э ^
е Э^О
Е "^
я=3
г „ :>О
Л'
«0 >о
V
я=4
*» ^>О
е . >0
Л
с? >0
л = 5
еА>0
еЕ >0
я=6
и
е . >0
А-^
е?>0
п = 7
е >0
ед>0
еЕ ^°
,8о
,86
,85
,65
,88
,86
,85
, 60
84
,85
,82
,48
,92
,84
,92
,57
90
64
72
39
60
60
57
36
Л-оптнмальиыП
?"-оптим;1льний
Л-оптпмальпый
Q-on Гц мальцы^
З2, композиционный орюго-
НA Л 1>Н ЫЙ
Симметричный квази-Л-опти-
квази-Л-оптимальный
Л-оптимальный
Q- оптимальный
Трехуровневый Бокса — Бен-
кона
]'
?-иптимальный
Л-оптимальный
Q -оптимальный
ВА
Симметричный квази-Л-опти-
квази-Л-оптимальный
3+
Л оптимальный
Q О1П н.мальиый
В$ с полурепликой
Зг'
А-оптимальный
Q-оптимальный
Симметричный квази-Л-оп-
квази-Л-оптимальный
Вь с полур-епликой
А -аи i пмпльный
Q-оптнмальный
Симметричный квп.тн-0-оп-
тимальный
Насыщенный точный Л-оп
тимальный
I laeuiiieHHbiii гочнмй Л-пп-
1 имальпый
fiecHMMCTpH4Hbifi квази-on
тимальный
Насыщенный точный Л-оп
тим.альный
Насыщенный точный Л-оп
гимальный
I [асыщеаиый точный ?-оп-
тимальный
Композиционный по othouic
нию к планам главных эф
фектов
Насыщенный точный Л-оп-
ти мальиый
Композиционный по отноше-
отношению к планам главных эф-
fK f>i/ тп п
Lp UK I U И
План Рсхтшафнера
План Рсхтшафисра
Насыщенный симплекснс-
суммицууемый
61
Таблица 7
санном в шар C.5), для л ^3=3; насыщенные симплексно-суммируемые
планы для л^5; ротатабелыше планы Бокса с полным ядром для
п^ Ь. Нужно отметить очень высокую D-эффективность трехуровне-
трехуровневых плалов Бокса — Беакена для всех размерностей.
Интересно, что ^-эффективность для ротатаоельных планов Ьок-
са с полным ядром начиная сл = 6 довольно резко уменьшается, в
то время как планы с половинным ядром для размерностей л = 6 и
? достаточно близки к ?*-оптимальным.
6. Характеристика d, область планирования C.5).
По этой характеристике выделяются в числе лучших трехуровне-
трехуровневых планы Бокса — Ьенкена, а также непрерывные D- и Л-опти-
мальиые планы. К числу худших можно отнести начиная с п = 3
планы 3", насыщенные симплексно-суммируемые и планы Хартли
(последние, за исключением п = 5).
7. Характеристика tr, область планирования C.5).
По Л-эффективиости можно к лучшим отнести, кроме Л-оптн-
мальных планов, D- и ?-оитимальиые, планы Бокса — Бенкеиа и ро-
гатабельиые планы Бокса (начиная с л = 5 с полурепликой). К наи-
наименее эффективным относятся планы 3™, насыщенные симплекспо-
суммируемые и планы Хартли (кроме л = 5), хотя даже для них Л-
эффегктивность достаточно высока (ж0,7).
8. Характеристика Лшах, область планирования C.5).
По ?-эффективиостн для всех размерностей к числу лучших от-
относятся ротатабельиые планы Бокса (для л=6 и 7 с тюлурепликой).
Для п=5 лучший ротатабельный симплексво-суммируемый план. (При
л = 4 ротатаоельный план Ьокса, трехуровневый план Бокса — Бен-
кена и симметричный квази-Д-оптимальный план по существу разли-
различаются лишь по числу нулевых точек; два последних могут быть по-
получены нз первого поворотом плана вокруг нулевой точной.) Непре-
Непрерывные /^-оптимальные планы по ?-эффекгнвности находятся в чис-
числе худших. Для остальных планов имеют место в основном те же
закономерности, что и для характеристик d и tr.
Сделаем некоторые выводы сразу по всем характеристикам для
планов второго порядка на шаре. Для этой области уже можно вы-
выделить типы планов, эффективных по всем рассмотренным критери-
критериям. К таким относятся планы Бокса — Беикеиа, ортогональные и ро-
ротатабельиые планы Бокса (если начиная с л = 5 использовать орто-
ортогональные и ротатабельные планы с половинным ядром).
Выпишем эффективные по всем характеристикам ротатабельные
и неротатабельные планы для различных размерностей (табл. 7)
начиная с л = 3 (для п = 2 все рассмотренные планы имеют доста-
достаточно высокую эффективность).
Табл. 7 далее можно использовать для выбора плана второго
порядка иа шаре в соответствии с дополнительными требованиями,
налагаемыми экспериментом.
Если при выборе плана мы хотим ориентироваться одновремен-
одновременно на несколько характеристик, интересно рассмотреть некоторые
общие тенденции связи между этими характеристиками по всем ис-
исследованным планам. Для этого можно, например, чисто формально,
понимая, что множество планов, которые мы рассматривая, не пред-
представляет собой случайную выборку, вычислить коэффициенты кор-
корреляции между каждой парой характеристик для каждой размерно-
размерности и полученные коэффициенты усреднить по всем размерностям.
Рассмотрим, например, пару характеристик d, tr. Пусть i—размер-
62
ПЛАНЫ НА ШАРЕ С НАИЛУЧШИМИ
СОВМЕСТНЫМИ ХАРАКТЕРИСТИКАМИ
Размерности,
границы эффек-
тивностей
л=3
eD><X85
6а>0,82
eE>0i,68
л = 4
eD>0:,87
еА>0!,83
е*>»,,6?
л = 5
ев > 0,86
еА>®,&3)
еЕ> 0,,75
л = 6
ев> 0.88
еА>01.87
еЕ> ft,70i
л = 7
eD> 01,87
ел>0,87
еЕ>0,7$
Ротатабельные планы
Д-оптималъиый*
?-оптимальный*
Ротатабельный Бокса
Л-оптимальный
Д-оптимальный
Трехуровневый Бокса —
Бенкеиа
Ротатабельный симплекс-
но-суммируемый
Несимметричный симп-
лексн'О-суммируемый 112
То> же
Л-опгимальиый
Е-оптимальный
Ротатабельный Бокса
с половинным ядром
Ротатабельный снмплекс-
но-суммируемый
Л-оптимальиый
?-онтимальный
Ротатабельиый Бокса с
половинным ядром
Ротатабельный симплекс-
н о- суммируемый
Л-оптимальиый
?-оптим'альный
Ротатабельный Бокса с
половинным ядром
Трехуровневый Бокса —
Бенксна
Ротатабельный снмплекс-
но-суммируемый
Неротатабельные планы
Трехуровневый Бокса —
Бенкена
Ортогональный
Ортогональный
Трехуровневый Бокса —
Бенкена
Ортогональный с поло-
половинным ядром
Трехуровневый Бокса —
Бенкена
Ортогональный с поло-
половинным ядром
* Здесь и далее верхние строки (Л-оптимальный, ?-оптимальный) читать
графе «Неротатабельные планы».
63
Таблица <S
КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ МЕЖДУ ХАРАКТЕРИСТИКАМИ
ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУБЕ
Характеристика
Тм-ч
d
tr
Л-max
м-1
1
0,84
0,92
0,48
d
0,84
1
0,96
0,74
tr
0,92
0,96
1
0,70
"max
0,48
0,74
0,70
1
носи, (/ = 2, 3,..., 7), /—номер плана для данной
(/=1, ..., h). Обозначим!
X1 т
2Гг'/
[Tav, =
размерности
C.20)
Тогда
(treD.-tr,7)
'i (d, tr) =
j=\
г (d, tr) =¦
C.21)
tr)
C.22)
Подобные коэффициенты были вычислены для каждой пары ха-
характеристик |М-!|, d, tr, Amax и приведены в табл. 8,9. Коэффици-
Коэффициенты корреляции между величинами d и tr для куба и для шара
близки к единице. Наиболее слабо закоррелированы характеристики
|M"
*; для шара их коэффициент корреляции близок к ну-
нуб
|[ р фф рр
лю. Этот факт можно учитывать, например, при выборе критерия.
Выбирая план по параметру tr, мы имеем большую вероятность по-
получить в результате план, близкий к оптимальным по остальным
критериям, чем при условии, что мы за основной параметр возьмем
|М-'|.
4. ПЛАНЫ ДЛЯ ПОЛИНОМИАЛЬНЫХ МОДЕЛЕЙ
НА СИМПЛЕКСЕ
Следует особо выделить тип ограничений на независимые перс-
мепные, который используется при изучении свойств различных сме
сей. Сумма компонентов смеси должна быть раина 100%. ноатом>
64
здесь нам легко перейти к ограничениям па переменные ^, xi= '•
/ = i
В химии и металлургии, например, такие ограничения налагаются
иа компоненты при построении диаграмм состав—свойство. Задача
планирования эксперимента здесь сводится к выбору плана на
(п—1)-мерном правильном симплексе с п вершинами, который за-
задается таким образом:
= 1, ... , л)-
C.23)
В этом случае переменные х,- не независимы; если при таком
п
условии записать полную полиномиальную модель, то условие^ х,=
= 1 приведет к тому, что она сведется к так называемой приведенной
модели. Приведенные полиномиальные модели первого и второго
порядков имеют соответственно вид
= Ш (х, 9) = 2 в/*/,
Е {У } = тJ (х, 9) = 2 е/ *1 + 2 9'/ *' Х1 ¦
C.24)
C.25)
/=]
Для ограничений C.23) в задачах, связанных с изучением диаг-
диаграмм состав — свойство, специфика поверхностей отклика такова,
что здесь часто нельзя ограничиваться полиномами первого и второго
порядков, если попытаться построить модель| во всей области C.23).
Как правило, поверхности оказываются более сложными, а зачастую
и негладкими.
Планированию на симплексе посвящена большая литература, ее
подробный список дан, например, в обзоре [24].
Таблица 9
КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ МЕЖДУ ХАРАКТЕРИСТИКАМИ
ПЛАНОВ ВТОРОГО ПОРЯДКА НА ШАРЕ
Характеристика
|м-М
d
Jtr
Amar
м '
1
0,69
0,74
0,19
d
0,69
1
0,93
0,69
tr
0,74
0,93
1
0,71
X
max
0,19
0,69
01,71
1
*@,25) Зак. 138
65
В работе [47] непрерывные Фр-оптимальные планы сравниваются
по разным критериям. Однако для этого случая пока не имеется до-
достаточно полной систематизации точных планов, подобной той, кото-
которая сделана для планов второго порядка на кубе и на шаре, поэтому
мы ие будем здесь входить в детали и говорить об особенностях раз-
различных планов и методов их построения. Отметим, что, хотя специ-
специфика области и заставляет ставить новые задачи при разработке
методов планирования, в логическом плане здесь ие возникает новых
проблем. Возможность четкого задания области планирования и вида
модели [быть может и более сложной, чем C.24) и C.25)] позво-
позволяет решать задачу выбора в рамках тех критериев, о которых мы
говорили в предыдущей главе.
ГЛАВА IV
ОПТИМАЛЬНОСТЬ
В ПЛАНИРОВАНИИ ЭКСПЕРИМЕНТА
ДЛЯ ДИСКРЕТНЫХ ПЕРЕМЕННЫХ
1. ВВЕДЕНИЕ
В практической деятельности экспериментатору часто
приходится иметь дело с существенно дискретными не-
независимыми переменными. Это прежде всего переменные
качественного характера. Если мы исследуем, например,
влияние на некоторый технологический показатель изме-
изменения марки стали или способа обработки сырья, то мы
не можем изменению уровней этих факторов поставить в
соответствие некоторую числовую шкалу. Мы можем
только «перечислить» уровни факторов, присвоив им в
произвольном порядке номера 0,1, ..., s, имея при этом в
виду, что здесь упорядоченность уровней имеет чисто ус-
условный характер.
Дискретный характер могут носить и количественные
переменные. Например, при получении чистых веществ
можно дистиллировать воду 1, 2, 3 раза, но не дробное
число раз, фильтровать раствор можно через 1, 2, 3
фильтра, но не через дробное число фильтров.
Если мы хотим для дискретных факторов построить
линейную по параметрам модель, то удобно записать
ее, проведя несколько иную параметризацию, чем это
делалось в случае непрерывных переменных. Мы можем
каждому уровню переменной приписать свой параметр —
эффект уровня, а каждому сочетанию уровней любой
66
группы факторов также поставить в соответствие отдель-
йый параметр — эффект взаимодействия уровней1.
Если иметь дело с одной переменной, то для непре-
непрерывной переменной можно, например, записать полино-
полиномиальную модель в виде
= ц (х, 9) = 60
для дискретного же случая запишем
Ун — V- + at + еп (г" = 1. 2; ,
D.1)
, D.::)
где \л — неизвестный параметр, так называемое среднее;
«г — эффект г-того уровня дискретного фактора;
гц — ошибка /-того наблюдения на t-том уровне фак-
фактора.
Если в модели D.1) мы имеем два неизвестных па-
параметра независимо от того, на скольких уровнях в
плане мы варьируем переменную, то во втором случае
при варьировании на двух уровнях мы имеем дело уже
с тремя неизвестными параметрами. Рассмотрим особен-
особенности моделей типа D.2) для дискретных переменных.
Здесь следует обратить внимание на то, что у нас
не хватает степеней свободы для оценки всех парамет-
параметров. Варьируя переменную на двух уровнях, можно оце-
оценить только два параметра, но отнюдь не три. Поэтому,
чтобы справиться с задачей оценки параметров, прихо-
приходится налагать на них дополнительные ограничения, Ес-
2
ли мы положим V ai = 0, то единственные оценки пара-
метров по методу наименьших квадратов могут быть по-
получены. Такого типа ограничение вполне естественно; оно
следует из определения параметров модели эффектов
уровней [60].
Раздел математической статистики, который называ-
называется дисперсионным анализом, строится >на моделях по-
подобного типа. Обработка результатов наблюдений здес:,
ведется так, что сначала проверяется гипотеза о равен-
равенстве нулю влияния изменения всех уровней данного фак-
фактора, т. е. о равенстве нулю величин аи' а2, ..., ocs. Отверг-
Отвергнув эту гипотезу, можно оценить некоторые функции па-
параметров, которые называются сравнениями. Сравне-
1 Строгое определение подобной модели имеется,
Чаботе [60].
3*@,25) Зак. 138 67
например, в
ния — это такие линейные комбинации параметров
S
ciai, для которых коэффициенты с,- удовлетворяют ус-
г = 0. Это условие, например, выполняется для
«1
линейных комбинаций (а*—aj), где i, /=1, ..., s, т. е. мы
можем оценить разности эффектов любых двух уровней
фактора.Сравнениями будути соотношения aj Уя»,
представляющие собой разности между эффектом /-того
уровня и средним по всем эффектам. Оценки параметров
при дополнительных ограничениях — это по существу
оценки сравнений последнего типа при этих ограничениях.
Техника дисперсионного анализа хорошо изложена во
многих руководствах (см., например, [10]).
Здесь важно обратить внимание на следующее. Тесты
для проверки гипотез в дисперсионном анализе могут
быть различными, и поэтому необходимо совместно рас-
рассматривать и оптимальность плана, и оптимальность те-
теста. Оптимальность плана здесь может рассматриваться
двояким образом: с одной стороны, так, как это было
сделано в предыдущих главах, т. е. для получения оп-
оптимальных оценок, а с другой — в совокупности с опти-
оптимальностью тестов, которые используются для проверки
гипотез дисперсионного анализа.
Вторая особенность планирования с дискретными
уровнями факторов состоит в том, что планы строятся на
множестве целых чисел. Модель накладывает новое ог-
ограничение на построение плана: план строится на той
многомерной решетке, которая определяется числом
уровней каждого фактора и членами, входящими в мо-
модель. Задача построения плана в отличие от случая не-
непрерывных переменных превращается в комбинаторную
задачу.
Обратим внимание еще на одно обстоятельство: план,
построенный для дискретных переменных, может быть
использован и для модели с непрерывными переменны-
переменными. Например, хорошо известный план 23, включающий
всевозможные сочетания уровней трех двухуровневых
факторов, может быть использован для моделей как с
непрерывными, так и с дискретными переменными. В не-
непрерывном случае, когда мы строим полиномиальную мо-
68
дель на кубе, точек, входящих в дискретный план, доста-
достаточно дл^ получения оценки этой модели. При этом план
оказывается оптимальным по многим критериям. Однако
здесь мы рассмотрели только частный случай; в общем
елучае построение оптимальных планов для непрерывных
переменных не сводится к целочисленным задачам.
Сделаем несколько замечаний исторического харак-
характера. Планы для дискретных переменных появились еще
в-20-х годах в связи с необходимостью выбирать экспе-
экспериментальные точки так, чтобы результаты.сельскохозяй-
результаты.сельскохозяйственных исследований не. зависели от неоднородностей
почвы. Одно из возможных решений здесь — рандомиза-
й|йя опытов относительно неконтролируемых переменных.
Другое решение — построение планов с разбиением на
блоки. При этом вводятся новые переменные, ограничи-
ограничивающие влияние неконтролируемых переменных. Долгое
время свойства планов для дискретных переменных дик-
диктовались; этими требованиями. Только в 50-х и 60-х годах
старые комбинаторные схемы стали рассматриваться с
точки зрения критериев оптимальности, учитывающих
статистические свойства оценок.
¦ . Исторически сложилось также и то, что для каждого
типа планов с дискретными переменными строилась своя
«хема проведения вычислений. Это позволяло получать
¦компактные простые; вычислительные схемы, но число
их было слишком велико. Широкое применение ЭВМ за-
заставляет пересмотреть эту традицию с тем, чтобы полу-
полупить возможность построения достаточно общих про-
программ. Задачу дисперсионного анализа легко переформу-
переформулировать в терминах регрессионного анализа; тогда вы-
вычислительные процедуры существенно унифицируются,
хотя вычисления становятся гораздо более громоздкими
[62]. После этих вводных замечаний мы рассмотрим ти-
типы моделей и соответствующие им планы с дискретными
оеременными.
2. КЛАССИФИКАЦИЯ ПЛАНОВ
ДЛЯ ДИСКРЕТНЫХ НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ
Чтобы в дальнейшем можно было более конкретно
говорить об оптимальности планов для дискретных пере-
переменных, приведем сначала краткий обзор различных ти-
¦Пов таких планов.
Простейшая схема — однофакторный план, допускаю-
'"' полную рандомизацию, т. е. план, содержащий опре-
4<0.5) Зак. 138 69
Деленное число наблюдений на каждом из s уровней за.
данного фактора. Порядок или место осуществления
каждого из N наблюдений может выбираться в соответ-
соответствии с некоторой случайной схемой.
Математическую модель в этом случае принято запи-
записывать таким образом:
у„ = |* + а/ + в// (i = 1 , . . • , s ; / = 1 , 1) - D-3)
где у и — результат /-того наблюдения на г-том уровне
фактора;
\i — независимый параметр, так называемое среднее;
аи— неизвестный параметр, эффект /-того уровня
фактора;
ец — случайная ошибка наблюдения.
Все ошибки неоднородности в условиях проведения
эксперимента, не связанные с изменением уровней факто-
фактора, при полной рандомизации входят в величины гц, при-
приводя к увеличению дисперсии опыта. Для исключения
этих ошибок применяется так называемое рандомизован-
ное блочное планирование. В таких планах все множест-
множество опытов разделяется на некоторое количество блоков
таким образом, чтобы внутри каждого блока было воз-
возможно проведение испытаний для всех уровней основного
фактора в однородных условиях. Ошибки, возникающие
вследствие неоднородности в условиях проведения экс-
эксперимента, здесь представляются как блоковые эффекты.
Для сохранения общности в изложении теории иногда
удобнее рассматривать множество блоков как совокуп-
совокупность уровней нового фактора. Однако необходимо учи-
учитывать, что блоковые эффекты часто требуют только ис-
исключения, а не оценки., Для учета и исключения влияния
двух типов неоднородности (двух блоковых факторов)
часто используются латинские квадраты. Обозначим
уровни основного четырехуровнего фактора символами
О, 1, 2, 3. Допустим, что мы хотим поставить 16 опытов,
по четыре опыта для каждого1 уровня основного фактора.
Рассмотрим квадрат 4X4, представленный в табл. 10.
В каждом столбце и в каждой строке квадрата каж-
каждый уровень основного фактора встречается один раз.
Комбинаторные построения такого типа называются ла-
латинскими квадратами. Будем рассматривать номера стол-
столбцов квадрата как номера блоков для первого типа неод-
неоднородности, номера строк — как номера блоков для вто-
второго типа неоднородности. Тогда, осуществляя план в со-
соответствии с этой схемой, мы можем получить взаимно
70
независимые оценки эффектов уровней основного фактора
и блоковых факторов1. Ниже мы более подробно остано-
остановимся на свойствах и методе построения латинских
квадратов.
Часто на практике возникает необходимость разбить
эксперимент на такие блоки, что каждый из «их не вме-
вмещает полного числа уровней основного фактора. В этом
случае желательно не просто разбросать уровни внутри
блоков, а постараться расположить их таким образом,
чтобы, несмотря на неизбежную потерю независимости,
получить достаточную информацию об основных эффек-
эффектах. Отсюда возникла теория не полноблочных планов.
Каждое множество блоков, как и прежде, можно рас-
рассматривать как дополнительный фактор, поэтому тео-
теорию неполноблочных планов можно представить как ча-
частный случай многофакторных (главным образом двух-
факторных) планов.
Наиболее полно развита теория сбалансированных не-
неполноблочных планов. Это планы с одним множеством
блоков: из s уровней основного фактора в каждый из b
блоков входит k уровней (&<s); каждый уровень встре-
встречается в плане г, каждая пара уровней в блоках % раз.
Таблица 11
ПРИМЕР НЕПОЛНОБЛОЧНОГО ПЛАНА
Блоки
1
2
Уровни основного
фактора
0
1
2
2
3
3
Блоки
3
4
Уровни основного
фактора
0
0
1
1
2
3
Рассмотрим, например, неполноблочный план, пред-
представленный в табл. 11. Всего основной фактор здесь име-
имеет четыре уровня, в каждом из четырех блоков! мы имеем
Во три уровня, каждый из уровней основного фактора
встречается в плане три раза, каждая пара уровней
встречается в блоках два раза.
В случае, когда имеется два источника неоднородно-
неоднородности и вводятся два множества блоковых ограничений,
аналогом сбалансированных неполноблочных планов яв-
являются неполные латинские квадраты, или квадраты
1 Здесь и далее под оценками параметров имеются в виду их
оценки по методу наименьших квадратов при дополнительных огра-
ограничениях иа параметры.
4*<0,5) Зак. 138 71
Юдена. В таких схемах в блоках одного множества со-
содержатся все уровни основного фактора; .относительно
же блоков второго множества схема представляет со-
собой сбалансированный неполноблочный план. План в
табл. 12, например, является квадратом Юдена.
Таблица 12
ПРИМЕР ЮЗЛДРЛТА ЮДЕНА
Блоки 2-го множества
"—
Блоки 1-го множества
1
2
3
1
0
1
3
2
I
2
4
3
2
3
5
4
3
4
6
5
4
5
0
6
5
6
I
7
6
0
2
Здесь по отношению ко второму множеству блоковых
ограничений (столбцам) план можно рассматривать как
сбалансированный неполноблочный план с константами
Если при постановке плана без блоковых ограничений
мы все N опытов можем осуществлять в случайном по-
порядке, то в; блочных планах рандомизацию можно произ-
производить только внутри блоков, поэтому в литературе такие
планы иногда называются планами с ограничениями на
рандомизацию. В планах же с двумя множествами бло-
блоковых ограничений нельзя проводить рандомизацию
внутри блоков, так как это нарушило бы структуру пла-
плана; поэтому здесь случайным может быть, например,
сам выбор латинского квадрата из множества возмож-
возможных латинских квадратов. Обзор методов планирования
в условиях неоднородностей можно найти в работе [63].
Дальнейшим логическим развитием однофакторных
планов для дискретных переменных являются многофак-
многофакторные планы, допускающие полную рандомизацию. Для
случая двух факторов, например, имеем такую модель:
yijk = г1 + а,- + Р/ -f- Уп + 8//А
(/ = 1 , . . . , Sj; у == I,..., s2 > к ^ \. , .. . , А),
где уци — результат k-тото наблюдения на сочетании
t-того уровня первого фактора и /-того уровня
второго фактора;
ц — общее среднее;
а,---эффект /-того уровня первого фактора;
72
Рз — эффект /-того уровня второго фактора;
уц — эффект взаимодействия t-того уровня первого
фактора и /-того уровня второго фактора;
ejjft — случайная ошибка наблюдений.
Здесь мы можем ввести определение факторной мо-
модели и факторного плана, которые обычно используются
для дискретных переменных. Полная модель для п фак-
факторов — это факторная модель: она содержит эффекты
уровней всех факторов и эффекты взаимодействия всех
уровней всевозможных групп факторов. Полную фактор-
факторную модель можно упростить, опустив некоторое множе-
множество членов. Для того чтобы модель оставалась фактор-
факторной, необходимо) выполнение следующего условия: если в
модель входит член, представляющий собой эффект взаи-
взаимодействия уровней каких-либо факторов, то в нее долж-
должны входить все эффекты взаимодействия уровней любой
подгруппы этих факторов [60]. Например, неполная мо-
модель эффектов уровней для четырех факторов
Уцы = Ц + а, + р/ + yk + 5/ + в// +
A=1, ... , Si, } = 1, ... , s2; k = 1,
это факторная модель, а модель
Уцы = Ц + а(- + р;- + у* + в
+ 0//* + в//*/
(i =1 Si, / = 1, ... , s2; k=l
&/ + Qtjk -f- enki
1=1,... , s4)—
D.5)
+ дп
eijkl
0ik
blk
s3; /=1,... ,s4) D.6)
не является факторной, так как в нее включены эффек-
эффекты взаимодействия уровней всех четырех факторов, но не
включены эффекты взаимодействия уровней групп двух
и трех факторов, содержащих четвертый фактор.
Планы, которые включают переменные с числом уров-
уровней, определяемым данной факторной моделью, и позво-
позволяют оценить эту модель, называются факторными пла-
«ами для данной модели. Факторную модель можно за-
зависать и в другой параметризации, представив ее, нап-
например, в виде полинома особого типа. Такое представле-
иие особенно удобно в случае, когда часть переменных
.Имеет дискретный, а другая часть непрерывный харак-
характер. Подробно об этом можно прочесть в работе В. 3.
Бродского [60].
Полные модели включают эффекты взаимодействий
Фровдей всевозможных групп факторов. Такой тип моде-
моделей требует постановки, как минимум, полного фаатор-
73
ного плана, т. е. опытов со всевозможными сочетаниями
уровней всех факторов. Это, как правило, обеспечивает
избыточную информацию, так как практически эффекты
взаимодействия высших порядков редко оказываются
значимыми. Поэтому в практических задачах чаще ис-
используются неполные факторные модели и соответствую-
соответствующие им дробные факторные планы. Остановимся несколь-
несколько подробнее на классификации многофакторных' планов.
Самый общий случай многофакторного плана — это
план, в котором каждый фактор меняется на произволь-
произвольном числе уровней, причем на каждом из уровней имеет-
имеется произвольное число наблюдений. Будем говорить, что
для данных d факторов выполняется условие пропорцио-
пропорциональности частот, если число совместных появлений в
плане любых уровней этих факторов в Nd~l раз меньше
произведения чисел их появлений по отдельности (здесь
N — общее число наблюдений в плане). Если для любых
d факторов из всего множества факторов, включенных в
эксперимент, выполняется условие пропорциональности
частот, то пла'Н называется регулярным факторным пла-
планом мощности d. Эти планы могут использоваться, когда
модель включает эффекты взаимодействия уровней фак-
факторов вплоть до порядка [d/2—1], где квадратные скобки
означают целую часть числа. Другие планы для этой мо-
модели называются нерегулярными.
Таблица 13
ПРИМЕР
Номер опыта
1
2
3
4
5
0
1
2
0
1
РЕГУЛЯРНОГО ПЛАНА МОЩНОСТИ
Х2
0
0
0
1
1
лз
0
1
0
1
0
Номер опыта
6
7
8
9
2
0
1
2
2
Х2
1
2
2
2
хз
0
0
0
1
Рассмотрим пример регулярного плана мощности 2.
Уровни факторов будем обозначать 0, 1,2, ... В плане из
девяти опытов длжтрех факторов, записанном в табл. 13,
каждый из трех уровней двух первых факторов встреча-
встречается по три раза, один из уровней третьего фактора
встречается три раза, а другой шесть раз. Рассмотрим
совместные числа появления различных сочетаний уров-
уровней первого и третьего факторов. Сочетания 0—0, 1—О,
79
2—0 появляются по два раза, а сочетания 0—1, 1—1,
2-—1 появляются1 по одному разу. Уровень 0 первого фак-
фактора и 0 второго фактора появляются в плане соответст-
соответственно три и шесть раз, совместно они появляются два ра-
.за;:поскольку 3-6:2=9, a d— 1 = 1, то для рассмотрен-
рассмотренных двух уровней факторов выполняется условие про-
пропорциональности частот. Подобную проверку можно про-
провести для уровней любых двух факторов.
Планы мощности 2 называются ещё планами главных
эффектов; им соответствуют модели, содержащие эф-
.фекты уровней и не содержащие взаимодействий (так
называемые аддитивные модели).
Для всех регулярных планов вычисления при провер-
проверке гипотез методами дисперсионного анализа оказывают-
оказываются чрезвычайно простыми. Кроме того, базируясь на ре-
регулярных планах, можно выбрать полиномиальную фак-
факторную модель, эквивалентную модели эффектов уров-
уровней, такую, что оценки ее параметров оказываются неза-
независимыми [60].
Частным случаем регулярных планов являются сим-
симметричные равномерные регулярные планы. Симметрич-
Симметричным факторным планом называется план, все факторы
которого имеют одинаковое число уровней; равномерным
называется план, у которого уровни любого фактора
встречаются одинаковое для данного фактора число раз.
Симметричный равномерный регулярный факторный
план мощности d называется ортогональной таблицей
мощности d и обозначается (N, k, s, d), где N — число
опытов; k — общее число факторов; s — число уровней
каждого фактора; d — мощность плана. В табл. 14 при-
приведен пример ортогональной таблицы мощности 2 (9, 4,
3,2).
Интересная часть теории
факторных планов —теория
построения ортогональных
таблиц. Она фактически явля-
является базой и для построения
несимметричных факторных
планов. В теории построения
ортогональных таблиц на осо-
особом месте стоят так называе-
называемые геометрические методы. В
их основе лежат свойства
и методы построения конеч-
конечных проективных геометрий.
Таблица 14
ОРТОГОНАЛЬНАЯ ТАБЛИЦА
(9, 4, 3, 2)
0
1
2
0
1
2
0
1
2
0
0
0
1
1
1
2
2
2
0
1
2
1
2
0
2
0
1
0
1
2
2
0
1
1
2
0
Соответствующие ре-
75
гулярные факторные планы называются геометрически,
ми; они содержат sh опытов (где k — целое число). Для
заданного геометрического плана можно выделить свя-
связанные группы эффектов, чтобы затем включать в мо-
модель по одному эффекту из каждой группы. Можно так-
также ставить обратную задачу: построение планов для за-
заданной группы эффектов, входящих в модель.
Частными случаями ортогональных таблиц являются
такие широко применяющиеся комбинаторные построе-
построения, как латинский квадрат и латинский куб, которые в
качестве факторных планов эксперимента использова-
использовались уже, например, в работе Фишера, относящейся к
1935 г. [64]. Частными случаями ортогональных таблиц
являются также множества ортогональных латинских
квадратов, кубов и гиперкубов.
Множество целых чисел 0, 1, ..., s— 1, расположенных
в виде матрицы размера (sy(_s), называется квадратом
размера s. Квадрат называется латинским, если каждое
целое! число встречается ровно один раз в каждой строке
¦и в каждом столбце. Два квадрата одного и того же раз-
размера ортогональны, если при наложении их друг1 на дру-
друга каждая упорядоченная пара целых чисел встречается
ровно один раз.
Множество целых! чисел 0, 1, 2, s— 1, расположенных
в виде кубической решетки (s><sXs), называется кубом
размера s. Куб называется латинским, если каждое целое
встречается ровно s раз в каждой плоскости, параллель-
параллельной любой грани куба. Два куба ортогональны, если при
наложении их друг на друга каждая пара упорядочен-
упорядоченных чисел встречается s раз.
Ортогональная таблица мощности 2 с числом строк
N—°s2 эквивалентна множеству попарно ортогональных
латинских квадратов, а с числом строк N=s3 — множест-
множеству попарно ортогональных кубов. Ортогональные табли-
таблицы, эквивалентные этим комбинаторным построениям,
получаются геометрическими методами для случая, когда
число уровней s можно представить в виде s = ph, где р —
простое число, h — целое.
Рассмотрим, например, приведенную выше ортого-
ортогональную таблицу (9, 4, 3, 2). Упорядочим строки ее так,
чтобы первые два столбца имели такой вид, как в табл. 11
(легко показать, что это всегда можно сделать). Будем
рассматривать элементы первого столбца как номера
строк латинского квадрата, а элементы второго столбца
как номера столбцов этого квадрата. Тогда остальные
76
•k — 2 (здесь k—2=2) столбца можно представить как
ft—2 латинских квадрата, разделив каждый столбец на s
столбцов квадрата и записав их последовательно. Таким
образом, мы| имеем четыре попарно ортогональных квад-
квадрата:
0
I
2
0
1
2
0
I
2
0
0
0
1
I
I
2
2
3
0
1
2
1
2
0
2
0
1
0
1
2
2
0
1
I
2
0
Два последних из этих квадратов — латинские. Мож-
Можно показать, что построенное таким образом множество
попарно ортогональных латинских квадратов является
полным; их число равно s— 1. Множество попарно орто-
ортогональных латинских кубов на основе ортогональной
таблицы мощности 2 с числом строк s3 строится анало-
аналогичным образом.
Можно подобные планы использовать и в записи, при-
принятой для ортогональных таблиц, и в том виде, в кото-
котором обычно представляются латинские квадраты и кубы.
Последнее представление является традиционным для
различных руководств по дисперсионному анализу.
В прикладных работах редко оказывается, что все
изучаемые факторы имеют одинаковое число уровней,
поэтому большее применение имеют несимметричные
факторные планы. Симметричные же планы представля-
представляют собой в основном базу для построения несимметрич-
несимметричных эффективных планов. Имеется несколько способов
построения регулярных несимметричных планов на осно-
основе регулярных симметричных. Некоторые способы дают
Таблица 15
ПОСТРОЕНИЕ НЕСИММЕТРИЧНОГО ПЛАНА МЕТОДОМ СЖАТИЯ
0
0
0
I
1
1
2
2
2
X,
0
1
2
0
I
2
0
1
2
0
1
2
1
2
0
2
0
1
Xt
0
2
1
I
0
2
2
1
0
а
х,
0
0
0
1
1
1
2
2
2
Хг
0
1
2
0
1
2
0
1
2
Хз
0
1
2
1
2
0
2
0
I
¦*<
п
I
0
0
0
1
I
0
0
С
77
возможность получать равномерные несимметричные
планы. Наиболее универсальный — так называемый спо-
способ сжатия — позволяет получать в общем случае регу-
регулярные несимметричные неравномерные планы из сим-
симметричных, объединяя любые два уровня заданного фак-
фактора. Например, если в симметричном факторном плане
для четырех трехуровневых факторов (табл. 15, столбец
а) для четвертого фактора уровням 0 и 1 поставить в.со-
в.соответствие уровень 0 двухуровневого фактора, а уровню
2 уровень 1 этого фактора, то получим регулярный не-
несимметричный план для трех трехуровневых и одного
двухуровнего фактора (табл. 15, столбец б). Полный об-
обзор методов построения несимметричных факторных пла-
планов имеется в работе [60].
3. ПЛАНЫ ВЗВЕШИВАНИЯ
К разделу планов с дискретными уровнями факто-
факторов следует отнести так называемые планы взвешива-
взвешивания, хотя исторически сложилось так, что задача вы-
выбора этих планов стоит несколько изолированно от
других задач планирования эксперимента [65, 66]. Мо-
Модели, о которых мы будем говорить в этом разделе,
могут использоваться в различных технических прило-
приложениях; термин «взвешивание» здесь применяется лишь
потому, что процедура взвешивания предметов очень
наглядно интерпретирует физический смысл моделей та-
такого типа. Примеры некоторых планов взвешивания
уже приводились в начальных главах этой книги, рас-
рассмотрим здесь эту проблему несколько 'более детально.
Задача взвешивания формулируется следующим об-
образом. Нужно оценить массу п предметов путем взве-
взвешивания их на двухгаашечньгх весах со стрелкой, причем
должна быть исключена еистематическа'я погрешность
(прибора. Пусть производится N взвешиваний. В каж-
каждом из них одна часть предметов может быть помещена
на правую чашку весов, другая часть — на левую, не-
некоторые предметы могут в заданном взвешивании не
участвовать.
Матрица плана взвешивания для п предметов с эле-
элементами xiu вводится следующим образом: л',-„ = 1, если
г-тый предмет в м-том взвешивании помещается на
правую чашку весов; хы ——1, если на левую; XiU = 0,
если f-тый предмет в ы-том взвешивании не участвует.
Модель можно записать следующим образом:
D>7)
щде 8о — неизвестная систематическая погрешность
весов;
8г — неизвестная масса t'-того предмета.
Нужно найти такую матрицу планирования, кото-
которая позволила бы оценить параметры 0о, 0i (t=l, •••, п)
так, чтобы свойства оценок отвечали некоторым зара-
заранее выданным критериям оптимальности. Планы взве-
взвешивания для этой модели не есть факторные планы.
Модель линейна по независимым -переменным; такого
рода факторным моделям соответствуют факторные
планы, в которых переменные варьируются на двух
уровнях. В нашем же плане взвешивания независимые
переменные изменяются на трех уровнях. Таким обра-
образом, эта задача имеет несколько обособленный хара-
характер.
Возможна вторая постановка задачи, при которой
элементы1 матрицы плана суть -f 1 и 0. Такая постановка
отвечает задаче взвешивания на одночашечных (без-
(безменных) весах в отличие от первой постановки задачи,
когда используются двухчашечные (химические) весы.
При этом элементы матрицы плана х\и=\, если t'-тый
предмет помещен на весы в ы-том взвешивании, и хы=^
в противном случае. Для этой постановки задачи также
может попользоваться модель D.7); здесь параметр Эг
означает половину массы г-того предмета, соответствую-
соответствующие планы взвешивания будут факторными планами.
Отдельно рассматривается проблема взвешивания без
смещения, когда известно, что 80 = 0.
Неизвестный свободный член в модели соответствует
взвешиванию на весах с «невыверенным нулем», или
со смещением. Известный свободный член в модели
соответствует взвешиванию на весах с «выверенным
нулем», или без смещения. В последнем случае известно
положение стрелки весов без ошибки, когда ни на одной
чашке весов нет предметов. На критериях оптималь-
оптимальности для планов взвешивания мы остановимся в сле-
следующем разделе.
79
4. ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОСТИ ПЛАНОВ
С ДИСКРЕТНЫМИ НЕЗАВИСИМЫМИ ПЕРЕМЕННЫМИ
В течение длительного времени основными крите-
критериями оптимальности при выборе планов с дискретными
факторами были возможность рандомизации и простота
обработки при 'проведении дисперсионного анализа.
Для многофа'кторных 'планов наиболее важным крите-
критерием считалась регулярность планов. Расчеты для ре-
регулярных планов очень просты и могут проводиться без
привлечения ЭВМ. В определенном смысле регуляр-
регулярность эквивалентна критерию ортогональности планов,
для регулярных планов независимы оценки параметров
полиномиальных моделей, эквивалентных моделям эф-
эффектов уровней. В моделях же эффектов уровней для
та'ких планов равны нулю ковар'иации между группами
оценок параметров, относящихся к каждому фактору.
С развитием работ, посвященных критериям опти-
оптимальности в планировании эксперимента [20, 42], по-
появилась возможность взглянуть на старью комбинатор-
комбинаторные схемы с точки зрения более общих статистических
критериев1.
Имеется некоторая особенность в методах обработки
экспериментов с дискретными факторами. Для моделей
с непрерывными переменными обычно сначала находят
оценки параметров моделей с помощью метода наи-
наименьших квадратов, а далее, если нужно, проверяется
гипотеза о их незначимости с помощью некоторых ста-
статистических тестов. Для моделей же с дискретными
переменными принято сначала проверять гипотезы о не-
незначимости определенных групп параметров с помощью
методов дисперсионного анализа, а далее, если такого
рода гипотезы отвергаются, находить методом наимень-
наименьших квадратов оценки параметров при наличии огра-
ограничений на некоторые линейные комбинации параметров.
Та'ким образом, для дискретных факторов важно
выбрать такой план эксперимента, чтобы уменьшить
вероятность ошибки при проверке гипотез с помощью
некоторого теста на первом этапе. Здесь важна уже
совокупность свойств плана и свойств теста. Тесты
обычно характеризуются свойствами их функции мощ-
мощности, т. е. вероятностью отвергнуть неверную гипотезу
в зависимости от истинных значений параметров. Ки-
фер [20] впервые ввел 'Понятие процедуры как сово-
совокупности плана эксперимента и теста для проверки ги-
$0
лотезы. Свойства процедуры наиболее полно характери-
характеризуют достоверность выводов в задачах дисперсионного
анализа.
Поскольку в этой книге мы вообще не касались
свойств тестов, то введение понятия критериев оптималь-
оптимальности процедур было бы затруднительным. Здесь важно
отметить, что и в этом случае не теряет смысла выбор
планов в соответствии с теми критериями, о которых
говорилось IB гл. II. Об этом можно судить, например,
по следующим результатам, принадлежащим Ки-
феру [20].
Как уже отмечалось, выше, неполноблочные планы
можно рассматривать как планы с дискретными уровня-
уровнями дл'я двух факторов — основного и блокового. Будем
рассматривать множество планов для двух дискретных
факторов; при этом первый фактор имеет s уровней, вто-
второй Ъ уровней, а в 'сочетании с каждым уровнем второго
фактора может встречаться ровно k<s уровней первого
фактора (это последнее условие означает, что размер
блока задан). Кифер показал, что на множестве таких
планов с заданными константами сбалансированные не-
неполноблочные планы, если они существуют, являются
?)-аптимальными для оценки сравнений, относящихся
к первому фактору, а вместе с ^-критерием для провер-
проверки гипотез относительно этих сравнений такие планы
¦образуют оптимальную в некотором смысле процедуру.
Аналогичное утверждение было доказано относитель-
относительно квадратов Юдена. На множестве планов для трех
дискретных факторов (таких, что число уровней первого,
второго и третьего факторов соответственно S, /, К с чис-
числом наблюдений N = 1K) 'квадраты Юдена, если они су-
существуют, D-оптимальны для оценки сравнений, относя-
относящихся к первому фактору, и .имеете с ^-критерием обра-
образуют оптимальную процедуру. Заметим, что необходимым
условием существования квадрата Юдена является тре-
требование, чтобы одно из соотношений I/S или K/S было
целым. На русском языке эти результаты приведены
в работе [42].
Поскольку на некотором этапе необходимо получать
оценки по методу наименьших квадратов параметров
моделей для дискретных планов (с учетом ограничений
на параметры) и линейных функций от параметров срав-
сравнений, то на критерии оптимальности планов здесь мож-
можно смотреть и в прежнем смысле — как на критерии для
81
выбора планов при получении оптимальных оценок вне
зависимости от тестов для проверки гипотез.
В работе [60] рассмотрен вопрос об оптимальности
регулярных факторных планов. Рассматривается мно-
множество всевозможных факторных планов для заданной
факторной модели. Точки плана могут выбираться в лю-
любом сочетании уровней для п факторов с заданным чис-
числом уровней. Таким образом, областью планирования
здесь является многомерная решетка с su s2, ..., sn
узлами, где Si — число уровней i-того фактора. Показа-
Показано, 'что для заданной модели регулярный факторный
план D-аптимален тогда и только тогда, когда он рав-
равномерен. Таким образом, все равномерные факторные
планы являются D-отгшмальными (планами для оценки
параметров факторных моделей.
Кроме того, здесь найдены достаточные условия
оптимальности планов для случая, когда только часть
факторов IB факторной модели имеет дискретный харак-
характер, другая же часть факторов — количественного ха-
характера, уровни ,их могут выбираться произвольно.
В этой же работе приводятся результаты по оптимальнос-
оптимальности регулярных факторных планов с точки зрения кри-
критериев А и Q. Отдельно можно рассмотреть вопрос
о критериях оптимальности для планов взвешивания.
Критерии эффективности планов взвешивания были
введены Мудом [67], Кишеном [68] и Эренфель-
дом [69]. По существу эти критерии сводятся к крите-
критериям А-, D- и ^-оптимальности. Областью планирова-
планирования $& т этой задаче являются вершины куба для задачи
взвешивания на одночашечных весах и вершины этого
куба имеете с центрами его граней всевозможных раз-
размерностей для задачи взвешивания на двухчашечных
весак.
Тем не менее представляло бы интерес нахождение
А-, D- или ^-оптимальных планов взвешивания в классе
плашов первого порядка на кубе. Однако обычно (за
исключением двух случаев, [73—75]) задача так не
ставится. В основном оптимальные планы отыскивают-
отыскиваются, вонпервых, в классе планов взвешивания, а, ©о-вто-
рых, в классе планов с заданным числом наблюдений
(в большинстве случаев т классе насыщенных планов).
Однако к этим двум естественным ограничениям добав-
добавляется еще одно: множество рассматриваемых планов
сужается до множества планов, обладающих определен-
определенной информационной матрицей. В последней равны
82
между собой -все диагональные элементы с одной сто-
стороны и внедиагональные — с другой.
Таким образом, информационная матрица зависит
всего от двух параметров. Такое упрощающее предполо-
предположение несколько обедняет постановку задачи, однако
дает возможность в некоторых случаях ее решить
[69—72]. Отказ от такого предположения был осу-
осуществлен только для случая, когда отыскивались D-cm-
тимальные планы.
Первый пример этого—нахождение D-оптимальных
планов, в классе насыщенных планов [73, 74]. Прн этом
было показано, что такие планы совпадают с Ьопти-
мальными в классе насыщенных планов первого поряд-
порядка на кубе. Нахождение таких планов стало возмож-
возможным только с применением вычислительной техники.
Второй пример относится к построению планов взвеши-
взвешивания для безменных весов без смещения, D-оптималь-
ных в классе планов первого порядка на кубе [75].
Такие планы представляют практический интерес, пос-
поскольку содержат небольшое количество точек.
Таким образом, несмотря на некоторую изолирован-
изолированность проблемы взвешивания, она легко умещается
в рамйи общей для планирования экспериментов систе-
системы критериев.
5. О КАТАЛОГЕ ФАКТОРНЫХ ПЛАНОВ
Методы планирования экспериментов для дискрет-
дискретных факторов широко используются в прикладных ра-
работах. Факторные модели могут удовлетворительно
описывать различные зависимости в металлургии, хи-
химии, биологии, сельском хозяйстве и т. д. Поэтому
в настоящее время стоит вопрос о создании хороших
каталогов факторных планов. Однако уже из определе-
определения факторной модели ясно, что число таких моделей
очень велико. Даже если зафиксировать число факто-
факторов п и число уровней S* (i=l n) каждого фактора,
то трудно выписать всевозможные факторные модели
для этих факторов, если п и s{ не очень малы.
Число различных способов построения факторных
'Планов также велико, один только способ построения
геометрических факторных планов, например для двух-
двухуровневых с числом наблюдений N = 32, дает тысячи
различных планов для разных моделей. Задача построе-
построения эффективного факторного плана для конкретной
83
ситуации не «оегда может быть легко решена не только
исследователем-экспериментатором, но и специалистом-
математиком. Это приводит к необходимости создания
удобных каталогов. С одной стороны, это могут быть
печатные .издания, с другой — разветвленные алгорит-
алгоритмы, предназначенные для реализации на ЭВМ.
Что касается последней возможности, здесь нужно
отметить следующее обстоятельство. Обычный способ
'построения «машинного» каталога состоит либо в реа-
реализации численной процедуры общего характера, либо
(В создании объемного архива >с матрицами оптималь-
оптимальных планов, или, что почти то же самое, в получении
элементов этого архива с помощью аналитических про-
процедур. Однако 'постепенно стало ясно, что эти пути по
отдельности неприемлемы для данной задачи. Общие
численные методы обычно довольно неустойчивы при
большой размерности задачи и приводят к увеличению
времени очета. Аналитические же методы при всем сво-
своем многообразии не дают решения для достаточно ши-
широкого класса задач.
Продуктивным оказался подход, при котором соче-
сочетаются и численные, и аналитические методы. Такой
подход реализуется, например, в [подсистеме «Фактор-
«Факторное плагацрование», системы «Экспериментатор — ЭВМ»,
которая разрабатывается совместно специалистами
МГУ, объединения «Позитрон» и ВНИКИЦМА.
В этой подсистеме {76, 77] сочетаются аналитичес-
аналитические методы построения факторных планов и численные
преобразования планов. Аналитические методы исполь-
используются при построении геометрические регулярных рав-
равномерных планов, обладающих широким спектром оп-
оптимальных свойств. Геометрические планы включают
как частный случай различные -«латинские» планы
и многие другие. Численные преобразования этих пла-
плавов дают возможность построить план, близкий к опти-
оптимальному, практически для любой конкретной задачи
ф акторного пл агаирша ни-я.
глава v
ВЫБОР ОПТИМАЛЬНОЙ СТРАТЕГИИ
В ДИНАМИЧЕСКИХ ЗАДАЧАХ
До сих пор мы рассматривали критерии оптимальности стати-
статических задач, в которых модель изучаемого явления задана, н целью
эксперимента является оценка ее параметров. Теперь нам предстоит
84
рассмотреть проблему оптимизации в динамических задачах. Строго
говоря, к динамическим надо было бы отнести те задачи, в которых
исследователю приходится двигаться в пространстве независимых
переменных, выбирая ту его область, которая может оказаться наи-
наиболее благоприятной для дальнейшего исследования. Весь класс по-
подобных задач отличается от ранее рассмотренных тем, что экспери-
экспериментатора интересует уже не модель изучаемого явления, а сама
процедура поиска того пространства независимых переменных или
той его области, где может находиться что-то благоприятное для
него.
Далеко не всегда можно построить математическую модель для
процедуры поиска. Во многих случаях приходится просто ограничи-
ограничиваться разговором на математическом языке о том, как лучше вести
|юиск. И в этом случае не удается достаточно отчетливо сформулиро-
1ать критерии оптимальности поиска. Конечно, далеко ие всегда мож-
ю четко разграничить статические и динамические задачи. Иногда
фоблема оказывается поставленной так, что приходится решать од-
ювременно две задачи — динамическую и статическую. Однако, исхо-
ця из дидактических соображений, все же разумно проводить отчетли-
юе разграничение в логической структуре двух разных постановок
1адач. Ниже показано, как решается вопрос о выборе оптимальной
пратегии в динамических задачах.
1. ДВИЖЕНИЕ В НАПРАВЛЕНИИ К ЭКСТРЕМУМУ
Широкий класс экспериментальных исследований можно отнести
: классу экстремальных задач. Здесь речь идет о поиске той обла-
:ти пространства независимых переменных, где изучаемый процесс
!ротекает оптимальным образом. В задачах такого типа обычно
[риходится иметь дело с достаточно большим числам независимых
временных. Такие задачи возникают тогда, когда механизм явле-
1ия недостаточно известен. В качестве модели изучаемого явления
[риходится выбирать полиномы. Интерпретация результатов иссле-
(оваиия, представленных полиномиальной моделью, делается с по-
ющыо анализа его геометрического образа — поверхности отклика,
юэтому данный класс задач принято также называть (особенно в
арубежной литературе) планированием при изучении поверхности
тклнка.
При решении экстремальных задач нет необходимости описы-
ать поверхность отклика одним полиномом во всей интересующей
сследователя области независимых переменных. ,В этом случае
ришлось бы обращаться к полиномам слишком высоких степеней —
адача стала бы непомерно громоздкой. Выгоднее широко поставлен-
уго задачу решать последовательно, разбивая ее на ряд локальных
адач. Сначала выбирается некая небольшая область в пространстве
езавнеимых переменных, и в этой области ставится эксперимент, ре-
ультаты которого представляются полиномам первой степени. Далее
зоисходит движение в пространстве независимых переменных по
•адиенту линейного приближения. Если нужно, делается еще одно
ннейное приближение и так продолжается до тех пор, пока иссле-
эватель не попадает в ту область пространства независимых пере-
енных, где уже приходится ставить эксперименты для представле-
результатов полиномом второго порядка.
Эта шаговая процедура решения экстремальной задачи была
1ервые предложена Боксом и Уклсопот. в 1951 г. Сейчас она широ-
85
ко и успешно применяется в самых разнообразных областях иссле-
исследовательской деятельности и подробно описана во многих руковод-
руководствах. Здесь важно обратить внимание па то обстоятельство, что,
строго говоря, у нас нет отчетливо сформулированной математиче-
математической модели для выбора всех этапов шаговой процедуры и нет четко
сформулированных критериев оптимальности. Разговор о движении
ведется иа математическом языке, но ... не всегда ясным! После пер-
первого же сообщения Бокса и Уилсона появилось, казалось бы, очень
серьезное возражение: движение по градиенту не инвариантно к мет-
метрике пространства независимых переменных. Изменяя масштаб но
одной из координатных осей, мы можем увеличить или уменьшит1,
крутизну поверхности в направлении этой оси. Выбор масштаба
всегда произволен, в чем же тогда физический смысл движения по
градиенту? В дальнейшем оказалось, что это, казалось бы, крайни
неблагоприятное обстоятельство можно удобно использовать, варьп
руя метрику пространства независимых переменных и таким образом
изменяя стратегию движения. Один из примеров удачного изменения
метрики пространства независимых переменных в процессе движе-
движения к экстремуму описан п работе [36].
В логическом плане здесь все оказывается очень поучительным:
нет модели для процедуры движения, не ясно, что и в какой степени
оптимизируется, нет однозначных решений, вытекающих из оОщп\
соображений, формулируемых на языке математики. И все же во
процедуры становятся логически легче осмысливаемыми, чем это бы
ло раньше при традиционном методе поиска оптимальных условий
протекания изучаемых процессов, когда эксперименты ставили так.
что каждую переменную варьировали по очереди и затем по резуль-
результатам таких однофакторных экспериментов пытались угадать место-
местоположение экстремума. В этом успех метода с его частичной, очень
неполной формализацией.
2. СУЖЕНИЕ ОБЛАСТИ В ПРОСТРАНСТВЕ
НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ РАДИ УПРОЩЕНИЯ МОДЕЛИ
При решении экстремальных задач приходится иметь дело с
одной из стратегических задач динамического характера — сужать
область пространства независимых переменных. Один раз это при-
приходится делать при выборе той части области независимых перемен-
переменных, где поверхность отклика можно было бы представить полино-
полиномом первого порядка. Эта задача сама по себе достаточно неопреде-
неопределенна. Область надо выбирать, с одной стороны, достаточно узком.
иначе полином первого порядка не будет адекватно описывать изу-
изучаемый процесс, а с другой — возможно более широкой, с тем чтобы
как можно меньше была дисперсия оценок коэффициентов регрессии.
¦Второй раз к сужению области независимых переменных при-
приходится обращаться в том случае, когда полином второй степени,
построенный в районе оптимального протекания процесса, адекват-
адекватно не описывает результаты наблюдения. В этом случае, вообш'"
говоря, можно принять одно из следующих решений:
1. Попробовать произвести преобразование независимых пере-
переменных и зависимой переменной, построив алгоритмы преобразова-
преобразования так, чтобы они позволили получить новые переменные, в прост-
пространстве которых может быть построена адекватная полиномиальна
модель. Иногда таким путем удается получить удивительные резуль-
результаты. В одной из работ [79] приводится такой пример. Исследои.!-
тел (видимо, не подумав) включил в рассмотрение среди прочих ч
две такие переменные: х% — амплитуду циклической нагрузки и
X} — длину нити. В пространстве таких независимых переменных не
удалось получить достаточно простой модели, адекватно описываю-
описывающей наблюдения. Преобразование переменных позволило найти
почти очевидное, имеющее физический смысл решение — перейти
к одной переменной Xk=Xijxit дробной амплитуде нагрузии, и все
спало хорошо: достаточно простая модель оказалась адекватной,
улучшилась точность в оценке параметров, облегчилась физическая
интерпретация. Обращение к языку математики позволило воспол-
восполнить недостаточную интуицию исследователя. Однако ясно, что в
общем случае такой «механический» поиск лучшей модели не может
дать хороших результатов. Модель можно вывести логически
только из 'некоторых предпосылок, но отнюдь| не из результатов наб-
наблюдений. Предпосылки возникают в нашем сознании как догадки
[104, 105].
2. Перейти от представления результатов в виде полинома вто-
второй степени к полиному третьей степени. Это требует естественно,
дополнительных опытов и очень осложнит интерпретацию.
3. Сузить исследуемую область пространства независимых пере-
переменных. Здесь опять-таки надо суметь- так провести эту процедуру,
чтобы получить область, в которой полином второй степени описы-
описывает результаты наблюдений адекватно и в то же время с макси-
максимально возможной точностью.
Какое из этих решений принять? Если принять третье, то как его
выполнять? Здесь мы опять имеем дело с процедурой, которая не за-
задается какой-либо моделью. И все же само обсуждение возможных
вариантов ведется! с высокой степенью логической четкости. Отсюда и
привлекательность такого способа обсуждения динамической задачи.
3. ДВИЖЕНИЕ В ПРОСТРАНСТВЕ
НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ ПРИ ПРОСЛЕЖИВАНИИ
ЗА ВРЕМЕННЫМ ДРЕЙФОМ ТЕХНОЛОГИЧЕСКОГО
ПРОЦЕССА
Одна из важнейших задач управления технологическим процес-
процессом непосредственно на заводе — это слежение за неконтролируемым
изменением технологического процесса. Любой технологический
процесс зависит от многих независимых переменных, не поддающихся
контролю. Их спонтанное изменение приводит к дрейфу области
оптимального протекания процесса. Нужно, варьируя контролируе-
контролируемые переменные, находить области, благоприятные для протекания
процесса. Задача сводится к поиску условного- экстремума в той
своеобразной ситуации, когда ограничивающие условия самопроиз-
самопроизвольно изменяются и остаются неизвестными.
Поиск условного экстремума ведется путем непрерывно проте-
протекающего эксперимента. Условия протекания технологического про-
процесса все время изменяются — процесс слегка «покачивается» с тем,
чтобы в результате проведения! технологических операций получать
не только нужную продукцию, но и информацию о том направлении,
в котором надо двигаться, чтобы все время находиться вблизи точ-
точки с наилучшим в некотором смысле выходом продукции.
Один из методов решения этой задачи — это предложенное
Боксом эволюционное планирование, которое представляет собой
87
86
просто некоторую модификацию планирования эксперимента для
поиска экстремума. Существенно новой здесь оказалась стратегия
всей продукции. Каждый цикл опытов проводится с ft-кратным
повторением для понижения влияния шумов, которые, естественно,
очень велики в технологических производственных процессах. По-
Поэтому первое, что надо суметь сделать, — это выбрать некоторым
разумным образом число параллельных опытов к.
Затем после завершения цикла надо принять решение о том,
что делать дальше. Можно например, перенести центр эксперимента
в новую, более благоприятную точку пространства независимых
переменных или же поступить иначе — исключить из рассмотрения
часть независимых переменных, заменив их на новые переменные,
ранее не участвовавшие в эксперименте, и т. д. В этой процедуре
не возникло новой проблемы с выбором плана — оптимальность
используемых здесь факторных планов может рассматриваться и
рамках критерия Д-оптимальности. Что касается стратегии, т. с.
выбора процедуры, то ее логика развивалась на чисто интуитивных
основаниях.
Здесь мы имеем интересное сочетание задач двух типов — ста-
статической, когда реализуется D-оптимальный план в той или иноп
области пространства независимых переменных, и динамической,
когда принимается какое-то решение о перемещении в пространстве
независимых переменных. В первом случае есть модель технологи-
технологического процесса, заданная полиномом, и есть критерии оптималь-
оптимальности для выбора соответствующего плана, во втором случае име-
имеются только некоторые высказывания весьма общего характера.
Они не определяют однозначной программы действия, но дают воз-
возможность отчетливо обсуждать возможные альтернативы.
Несколько позднее была предложена симплекс-процедура для
решения той же задачи (подробнее о ней см. в книге i[36]). В этом
случае наблюдения осуществляются в вершинах правильного сим-
симплекса, построенного в многомерном пространстве независимых
переменных. Затем зеркально отображается та вершина симплекса,
где выход технологического процесса оказывается минимальным.
Отображенная точка вместе с оставшимися вершинами образует
новый симплекс. Далее продолжается та же процедура отображе-
отображения. Алгоритм отображения имеет несколько дополнительных правил,
позволяющих исключить процедуру закручивания вокруг одной
точки. Можно показать, что, применяя такую процедуру, мы найдем
область экстремума с точностью, задаваемой размерами симплекса.
Затруднения возникли при попытках сравнить стратегию сим-
симплекс-процедуры с другими стратегиями эволюционного планирова-
планирования. Особенно остро встал вопрос о сравнении стратегий, когда по-
потребовалось сравнить регулярные процедуры прослеживания за дрей-
дрейфом экстремума со случайными процедурами. Симплекс-процедуре
был противопоставлен метод случайного поиска. В своей простей-
простейшей форме случайный поиск сводится к следующему: в «-мерном
пространстве независимых переменных выбирается исходная точка
х., и через нее проводится прямая в случайном направлении; на
этой прямой по обе стороны х,- на расстоянии р* реализуются два
опыта; опыт с лучшим результатом задает исходную точку х%+\
для случайного построения второй прямой и т. д. Случайный поиск,
строго говоря, не включает в себя задачи планирования — это
процедура, в которой задается только стратегия.
Сравнение метода случайного поиска с симплекс-процедурой
можно производить путем моделирования задач на ЭВМ. Но при
88
этом нужно выбрать критерия сравнения и четко оговорить условия
проведения моделирующих опытов. Например, в одной из матема-
математических работ, посвященных такому сравнению, чтобы поставить
сравниваемые методы в одинаковые условия, авторы потребовали,
чтобы Pi было равно радиусу сферы, описанной вокруг симплекса.
С позиций математики такой подход казался вполне логичным.
Однако с позиций экспериментатора это требование вызвало явное
недоумение: при проведении случайного поиска исследователь уже
во втором опыте выходит за границы того куба, которым ограни-
ограничено пространство независимых переменных, отведенных для экспе-
эксперимента. Чем выше размерность пространства независимых пере-
переменных, тем в более неблагоприятных условиях оказывается сим-
симплекс-процедура: она будет проводиться в сфере меньшего радиуса,
чем процедура случайного поиска. Нужно некоторым специальным
образом переделать стратегию случайного поиска, чтобы сделать ее
сопоставимой с симплекс-процедурой,
В работе [80] приводится интересная коллекция критериев для
сравнения методам поиска экстремума. Она делится на локальные и
глобальные критерии. В локальных критериях рассматриваются
потери на поиск на одном этапе и вероятность ошибки, т. с. вероят-
вероятность ошибочного шага. В нелокальных критериях рассматриваются
число проб, необходимое для решения поставленной задачи с ta-
данной невязкой (точностью), и невязка, под которой понимается
среднее отклонение найденного значения от экстремума п данной
ситуации. Видимо, не нужно очень большой фантазии для того,
чтобы увеличить число критериев для сравнения этих стратегий,
и, пользуясь этими критериями, мы будем получать все новые и
'новые результаты. Следует обратить внимание еще и на то обстоя-
обстоятельство, что сравнение различных методов поиска проводилось при
явно упрощенной постановке задач, когда не принималось во вни-
внимание неконтролируемое движение экстремума.
В логическом плане возникшая здесь ситуация представляется
также весьма любопытной. Есть отчетливо записываемые алгоритмы
Поиска. Они представляют собой просто запись того, что мы
хотим или, быть может, лучше сказать — можем делать. Но нет
возможности построить систему критериев оптимальности. Мы не
можем придумать ничего такого, что позволило бы нам сказать, как
надо наилучшим образом ловить то, что от нас неизвестным обра-
образом ускользает. Читателю, вероятно, бросается в глаза то, что *та
глава по стилю существенно отличается от двух предыдущих. Раз-
Размытость ситуации неизбежно приводит к размытости решений, если
даже они и формулируются в| математических терминах.
ГЛАВА VI
КРИТЕРИИ ОПТИМАЛЬНОСТИ
В ОТСЕИВАЮЩИХ ЭКСПЕРИМЕНТАХ
1. УМЕНЬШЕНИЕ РАЗМЕРНОСТИ ПРОСТРАНСТВА
ВЕЗАВИСИМЫХ ПЕРЕМЕННЫХ В ЗАДАЧАХ ОТСЕИВАНИЯ
Иногда в процессе исследования приходится выби-
ать само пространство независимых переменных, вы-
еляя представляющие интерес переменные из большого
Зак. 138
89
числа потенциально возможных. Так возникает задача
отсеивания. При решении технологических проблем за]
дача отсеивания формулируется следующим образом
Имеется большое число независимых переменных, при
чем мы подозреваем, что только некоторые из них су
щественно влияют на интересующий нас технологичен
кий процесс. Эти факторы нужно выделить. Это значит]
что надо уменьшить размерность пространства незаед'
'симых 'переменных. В новом пространстве должна быт
'построена простая полиномиальная модель, она може
содержать, например, только линейные члены и парны
¦взаимодействия. Здесь мы опять имеем дело с задаче
смешанного типа. С одной стороны, нужно построит
модель процесса (это 'Статическая задача), а с другой -
нужно уменьшить размерность пространства независ?
мых переменных. Для 'решения этой задачи должй
быть [разработана специальная стратегия, которая обе*
печивала 'бы и наибольшую вероятность обнаружени
всех значимых эффектов и возможность получения аи?
иск параметров найденной модели.
Первое практическое решение задач подобного рол
было предложено Саттерзвайтом в 1956 г. (подробна
об этом изложено в работах [36, 81]). Его исходив
предпосылки формулируются так: среди очень болышя
числа эффектов s, взятых под подозрение, должно быч
совсем небольшое число доминирующих эффектов. ЕсЛ
все эффекты проранжиравать по величине вклада, вн<
симого ими в суммарную дисперсию, то мы должн
получить экспоненциально убывающую функцию. Зад;
ча исследователя заключается в том, чтобы, использ]!
небольшое число опытов N, выделить доминирующи
факторы на шумовом поле, созданном остальными Mi
лозначимыми факторами и ошибкой эксперимента. З'деч
'приходится использовать планы, в которых число опв
тов N меньше числа эффектов s. Число степеней овоб*
ды оказывается отрицательной (величиной, и задач;
естественно,'не может быть решена обычными методам
Модель может быть записана в таком виде:
У = 9о + 2 8' *' + а '
F.В
где а =
е'
N
Мы предполагаем, что влияние s—/ малозначимых
аффектов можно отнести к шумовому полю, увеличив,
таким образам, дисперсию ошибки опыта:
где а2 (г) — дисперсия чистой ошибки опыта.
(полагая, что некоторые Xi = xvXt).
90
Но в модели, записанной в таком В'иде, слишком
много неизвестных: неизвестно, чему равно /; неизвестно,
какие именно эффекты должны быть включены в груп-
группу значимых эффектов. Таким образом, если мы даже
зададимся некоторым значением / (оно, очевидно, долж-
должно быть не больше числа опытов, которое мы в сос-
состоянии осуществить), то по существу мы будем иметь
C!s различных моделей в разных подпространствах не-
независимых переменных. Из них нужно по некоторому
критерию (например, по величине остаточной диспер-
дисперсии) выбрать ту модель, которая содержит значимые
факторы. Необходимо выбрать план, который позволил
бы это осуществить хотя бы теоретически (практически
мы, конечно, не имеем возможности делать полного пе-
перебора всевозможных сочетаний, и нам придется выб-
выбрать какой-то более простой способ выделения значи-
значимых эффектов). К плану мы должны предъявить и еще
никоторые требования: необходимо, чтобы эффекты, ко-
которые мы выделим, по возможности были «чистыми»,
а не представляли бы собой суммарный результат
действия нескольких значимых эффектов.
Таким образом, сама постановка задачи — недоста-
недостаточно четкая. Мы знаем, чего мы хотим, но задача на-
наша слишком сложна; к плану с небольшим числом опы-
опытов приходится предъявлять слишком много различных
требований. Критерий, которым можно характеризовать
план, назовем величиной его разрешающей способнос-
способности — способности выделить доминирующие эффекты из
большого числа возможных.
Для дискриминации моделей типа F.1) варьировать
переменные нужно на двух уровнях. Интуитивно ясно,
что в связи с большой сложностью постановки задачи
в выборе плана должен участвовать элемент случайнос-
случайности. Критерием «разрешающая способность» можно ха-
характеризовать сам метод выбора плана.
Саттерзяайт предложил, например, в каждом опыте
и нижний уровень переменных выбирать слу-
91
Зак. 1J8
чайным образом, с вероятностью 1/2- В последующих
работах (см., например, [36]) были предложены пла-
планы, которые представляют собой некоторое случайное
смешение регулярных частей полного факторного
плана 2s.
При обработке отсеивающего эксперимента вместо
полного перебора .приходится прибегать к некоторому
методу направленного перебора с наложенными огра-
ограничениями, 'который дает возможность с большой ве-
вероятностью решить эту задачу при достаточном числе
опытов N в случае, если выполняются указанные выше
исходные предпосылки.
Простейший метод обработки — это построение и ис-
исследование так называемых диаграмм рассеяния. Здесь
обработка производится для каждой 'переменной в от-
отдельности, влияние остальных факторов при этом рас-
рассматривается как случайная ошибка. Во всяком случае
моделирование задач подобного рода на ЭВМ показы-
показывает, что исследователь может таким образом получить
вполне разумные результаты; выделить доминирующие
эффекты среди очень большого числа предполагаемых,
Правда, здесь мы не можем требовать эффективности
и несмещенности оценок — остаточная дисперсия здесь
задается не только ошибками эксперимента, но и не-
неучтенным влиянием малозначимых факторов, которые
варьировались в процессе проведения эксперимента.
Все это мало смущает исследователя: выделив неболь-
небольшое число доминирующих эффектов, он может на сле-
следующем этапе поставить совсем небольшую серию эк-
экспериментов для уточнения численных оценок эффектов
н для разделения совместных оценок в тех ситуациях,
когда найденные значения коэффициентов регрессии
отражают совместное действие нескольких эффектов.
Метод Саттерзвайта, названный методом случайного
баланса, сразу же подвергся резкой критике со стороны
математиков. Возражение вызвал сам факт появления
метода, не имеющего четкого теоретического обоснова-
обоснования, в котором, более того, нарушаются оба канонизи-
канонизированных требования — несмещенность и эффективность
оценок. Случайное (нетрадиционное) планирование так-
также представлялось тогда явно уступающим регулярно-
регулярному планированию. Тем не менее метод стал применять-
применяться. Имеется ряд работ, в которых с помощью этого ме-
метода были получены весьма интересные результаты-
Были, вероятно, и многочисленные неудачи, когда ме-
92
тод применялся в тех случаях, когда не выполняются
.исходные предпосылки, но неудачные результаты обыч-
обычно не публикуются.
Отметим, что практический и особенно теоретичес-
теоретический интерес к методу случайного баланса был возрож-
возрожден советскими учеными. У нас этот метод вошел в ру-
руководства по планированию эксперимента, имеется ряд
интересных примеров его применения. Были сделаны
попытки дать математическое обоснование метода слу-
случайного баланса, но задача в постановке, предложен-
юй Саттерзвайтом, оказалась слишком сложной. При-
илось прибегнуть к значительным упрощениям: пред-
предположить отсутствие случайной ошибки в наблюдениях
i возможность производить полный перебор при обра-
(ютке данных.
В работе Л. Д. Мешалкина [82J при таких допуще-
допущениях для линейной модели находится соотношение меж-
|ду величинами N (число наблюдений), I (число значи-
значимых эффектов) и s (число подозреваемых эффектов)
и вероятностью построить план, выделяющий все су-
существенные эффекты. Показано, что, пользуясь о писан-
писанной выше случайной процедурой планирования (уровни
каждой переменной выбираются с вероятностью 1/2),
мы можем построить такой плане вероятностью 1—2~т,
где i/n = N — / — log2 (s — /+1). Например, для величин
/^12, N=23, 5 = 75 такой план будет построен с веро-
вероятностью, большей чем 0,96. Это значит, что разрешаю-
разрешающая способность такого метода планирования доста-
достаточно велика при условии, если выполняются очень
кесткие предпосылки. Положительный характер этих
>езультатов имеет 'большое значение: он показывает,
то сама постановка задачи правомерна.
Важно отметить появление нового и необычного для
ланирования эксперимента критерия. Это критерий
разрешающей способности — возможности выделения
Доминирующих эффектов среди очень большого числа
Юдозреваемых. Это даже не столько критерий плани-
планирования эксперимента, сколько критерий для всей про-
процедуры, включающей, кроме метода планирования, и
[лгоритм обработки результатов наблюдений.
В настоящее время работы >по теории планирования
ггоеивающих экспериментов успешно развиваются. У
ас их развитие связано с работой математического
еминара в МГУ. Здесь получен ряд новых интересных
Результатов. Один из важнейших — это выяснение связи
93
методов решения задачи отсеивания с теорией передачи
информации, доказательство асимптотической опти-
оптимальности случайного планирования. Постановка за-
задачи, решение которой послужило толчком к этим ин-
интересным выводам, принадлежит М. Б. Малютову [83,
84J и 'представляет собой по существу некоторый упро-
упрощенный дискретный вариант задачи отсеивания, о кото-
которой шла речь выше. В этой постановке ее можно сфор-
сформулировать как задачу планирования эксперимента лри
поиске неисправных элементов.
Рассмотрим некоторую систему, сотоящую из
большого числа элементов s. Пусть система функцио-
функционирует нормально, если число неисправных элементов в
ней не превосходит некоторого критического уровня
/^s. Когда число неисправностей достигает уровня /,
необходимо отыскать и заменить неисправные элементы.
Методы выделения/неисправных элементов из большого
числа s элементов можно рассматривать как планиро-
планирование отсеивающих экспериментов.
Будем называть неисправные элементы значимыми
факторами, и пусть все факторы Xj (у'=1, ..-, s) могут
принимать только два значения (исправному элементу
приписывается значение нуль, неисправному — едини-
единица). Бели в i-том опыте хотя бы один фактор, вклю-
включенный в число проверяемых в этом опыте, находится
на уровне 1, то измеряемая функция i/i принимает
значение 1, в противном случае она принимает значе-
значение 0. Результат измерения может быть получен без
ошибки или с ошибкой, в .последнем случае на выходе
получаются случайные величины Z{, равные 0 или 1,
причем известны вероятности получения 2^ = 0 при усло-
условии, что Уг=\, и наоборот.
В качестве модели здесь можно рассматривать функ-
функцию r\ (x, G), зависящую от вектора переменных хт =
= {хи ..., xs) и вектора параметров1 6Т= Fi, ..., 6() следую-
следующим образом [85]:
(х, в) = т|
, ... , xs\
6lt
1, если >? хв. У- 0
F.2)
Вектор неизвестных параметров 0 является векто-
вектором, каждая компонента которого — номер значимого
фактора. Этот вектор принадлежит множеству векторов
размерности /, компоненты которых могут принимать
значения 1, 2, ..., s. Задача заключается в том, чтобы
указать матрицу планирования \ хц \ с числом строк
N и числом столбцов s, элементы которой показывают,
включен или не включен фактор Xj в f-тый опыт, и метод
обработки результатов zu ..., z.\ такие, чтобы с заданной
вероятностью ошибки определить неизвестный вектор; па-
параметров с помощью минимального числа опытов.
Интересно, что многие результаты здесь были полу-
получены с помощью концепций теории информации. На язы-
языке теории информации, задавая уровни факторов X;, в I-
том опыте, мы кодируем сообщение о значимых факто-
факторах в двоичную последовательность уг, далее нужно де-
декодировать сообщение, анализируя 'последовательность
Zi. Существенная дискретизация, четкая постановка за-
задачи и использование теоретико-информационных сооб-
соображений позволили получить интересные результаты
и продвинуться достаточно далеко в решении этой про-
проблемы отсеивания. В работах [83—85] предложены
стратегия проведения наблюдений и различные способы
анализа эксперимента, даны оценки числа наблюдений
и сложности обработки при использовании этих спо-
способов.
Оказалось, что с точки зрения уменьшения числа
наблюдений выгодно в каждом опыте уровни факторов
выбирать случайно с вероятностью р {Xj — 0} =2"'/'=
= q. Этот результат принципиально важен, так как
?десь строго доказываются преимущества случайного
"планирования для задач отсеивания. Декодировать
сообщение теоретически можно, например, осуществ-
осуществляя перебор всевозможных сочетаний из s no / факто-
факторов. Показано, что для случая, когда на выходе зна-
значения i/i измеряются без ошибки, если использовать
План с N опытами, где
N > / log2 s + 2 / log2 / — Mog2 Я F.3)
0, если
при произвольном O^^sSll, то стратегия перебора обе-
печивает вероятность однозначного определения векто-
а параметров 9, большую, чем 1—X [83].
При помощи некоторых модификаций задачу можно
(начительно приблизить к реальным условиям. Напри-
!ер, можно отказаться от требования, что число зна-
94
чимых факторов задано, а предположить, что известно
только некоторое его априорное распределение; можно
ввести несимметричную ошибку на выходе; существен-
существенными являются отказ от метода полного перебора при
декодировании и замена его менее трудоемкими ме-
методами, требующими по возможности небольшого уве-
увеличения числа опытов для обеспечения прежней веро-
вероятности определения вектора 9. В работе [85] предло-
предложен так называемый метод пофакторного декодирова-
декодирования, который сводится к расчету по результатам опы-
опытов для каждого фактора некоторого отношения
правдоподобия и к сравнению его с заданным крити-
критическим значением. Этот метод можно считать аналогом
метода диаграмм рассеяния при обработке эксперимента
в случайном балансе.
С единых позиций разнородные результаты, полу-
полученные в теории отсеивающих экспериментов нашими
и зарубежными учеными, рассмотрены в работе
М. Б. Малютова [86]. Здесь определяются следующие
основные направления этой теории: получение нижних
оценок для числа необходимых экспериментов в разли-
различных постановках задачи отсеивания; даказательетво
существования необходимых планов при заданном числе
экспериментов; построение простых и удобных для
анализа регулярных планов для задачи отсеи-
отсеивания, содержащих, быть может, не наимень-
наименьшее число наблюдений; создание упрощенных про-
процедур анализа эксперимента, не требующих слишком
большого числа операций. В этих направлениях уже
сейчас получены интересные результаты, которые гово-
говорят об общей перспективности теории планирования
отсеивающих экспериментов.
2. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
ПРИ ПОСЛЕДОВАТЕЛЬНОМ ОТСЕИВАНИИ
При последовательном отсеивании план экспери-
эксперимента осуществляется не сразу, а поэтапно и может
изменяться в зависимости от результатов уже произ-
произведенных наблюдений. Число опытов здесь заранее не
фиксируется.
В логическом плане очень интересна задача биоло-
биологического отсеивания. Она формулируется так: нужно
найти какое-то совсем небольшое число биологически-
активных препаратов среди очень большого числа по-
96
тенциально возможных. В такой постановке задачи
исследователя совсем не интересует механизм биологи-
биологической активности. Его беспокоит только эффектив-
эффективность самой очень дорогостоящей процедуры. В этом
случае удается построить математическую модель в
пространстве независимых переменных, носящих чисто
экономический характер.
Рассмотрим следующую задачу: среди множества
химических препаратов надо найти совсем небольшое
подмножество биологически активных, скажем, анти-
; канцерогенных, мутагенных или каких-либо еще. Эта
необычайно громоздкая и трудоемкая процедура от-
отсеивания должна быть 1как-то разумно организована.
Здесь речь идет не о выборе оптимального статического
(плана в пространстве независимых переменных, а о вы-
выборе оптимальной стратегии, т. е. оптимального соот-
соотношения между теми переменными, которыми задается
организация процесса отсеивания.
Можно предложить несколько различных моделей
для проведения последовательного отсеивания. Одни
из них могут быть чисто последовательными в смысле
Вальда; это значит, что строится процедура, в которой
после каждого испытания принимается одно ив трех
возможных решений: 1) прекратить испытание и при-
принять нуль-гипотезу; 2) испытание продолжать; 3) пре-
прекратить испытание и отбросить нуль-гипотезу. Число
испытаний здесь заранее не фиксируется. Известно, что
последовательные процедуры в среднем в два раза эф-
эффективнее статических. На интуитивном уровне их
[обычно применяют в лабораторных испытаниях: ла-
кюрант не будет подвергать многократным повторным
Анализам пробу, в которой, скажем, содержание вред-
:ой примеси лежит далеко от браковочной границы,
;, наоборот, он будет всячески стремиться уточнить
результат, когда оно лежит вблизи границы. Но в
биологических исследованиях часто приходится отка-
отказываться от чисто последовательных процедур: они мо-
Тут слишком растянуться во времени.
Можно придумать «иолупаследовательные» схемы
юпытаний. Испытания могут носить групповой харак-
"ер. При поиске активных препаратов, например, на
кивотных испытывают сразу несколько веществ, а затем
:хорошие» группы препаратов подвергают дальнейшему
Детальному изучению. Ясно, что каждая модель создает
Ьвои проблемы. В последней модели, например, возни-
97
кает Задача распределения усилий между внут"рйгруп-
повыми и межгрупповыми исследованиями.
В технических приложениях подобную задачу мож-
можно сформулировать как задачу группового последова-
последовательного поиска дефектных элементов в некоторой
заданной группе элементов. Элементы («ли препараты)
будем рассматривать как факторы, а дефектные элемен-
элементы (или активные 'препараты) —как значимые фак-
факторы. Наиболее простая постановка задачи получается,
конечно, в случае, когда постулируется отсутствие
случайной ошибки наблюдения и каждый опыт указы-
указывает нам точно, имеется или не имеется значимый фак-
фактор в выбранной группе. К реальности, конечно, ближе
другая постановка задачи: имеется некоторая ненулевая
вероятность ошибок при отнесении каждой группы к
числу групп, содержащих «ли не содержащий: значи-
значимый фактор.
Математически модель здесь можно записать так:
имеется s факторов х\, Xi, ..., xs, среди «их I значимых
факторов (/ может быть неизвестно). Опыт в последо-
последовательной групповой процедуре проверок заключается
в том, что выбираются некоторые факторы (с учетом
результатов всех предыдущих опытов) и делается зак-
заключение о том, имеется ли среди них значимый фактор,
т. е. :в опыте каждый из s факторов полагается равным
нулю или единице: лг*=О,1, где «=1, 2, ..., s, и измеряе-
измеряется функция!
У
= У (х[, .. . , х{) =
0 если все значимые факто-
'ры равны нулю, F.4)
1 в противном случае
Обзор теоретических результатов по решению этой
задачи три различных дополнительных предпосылках
содержится в работе [87].
От дополнительных предпосылок зависит критерий
оптимальности, которым имеет смысл руководствова-
руководствоваться при выборе той или иной процедуры. Так, если
известны, например, априорные вероятности pi того,
что i-тый фактор окажется значимым, то естественно
называть оптимальной такую процедуру групповых
проверок, которая содержит наименьшее среднее число
опытов. Этот же критерий используется и в случае,
если сами априорные вероятности pi неизвестны, но,
например, известно, что все они равны между собой.
98
Если заранее известно, что количество значимых фак-
факторов равно некоторому наперед заданному числу (или
не превосходит его), то при выборе процедуры груп-
групповых проверок естественно минимизировать макси-
максимальное число опытов. Экономически это выражается
в том, что минимизируется средняя или максималь-
максимальная цена эксперимента.
В качестве примера рассмотрим одну последова-
последовательную процедуру, близкую к оптимальной в после-
последней (минимаксной) постановке [87]. Среди s факто-
факторов имеется / значимых. В этом случае стратегию
групповых проверок выгодно построить таким образом.
В первом опыте выбираются для проверки первые 2к
факторов, где k определяется из неравенства
2*<(s// — 1)<2*+I F.5)
(в случае, если такого k нет, т. е. s<2l, полагается k =
= 0).
Если результат первого опыта равен нулю, то среди
этих 2к факторов нет значимых; они исключаются из
рассмотрения, и остаются только s — 2h фактопоз, из
которых / значимые. Если результат равен единице, то
среди выбранных 2h факторов есть хотя бы один зна-
значимый. Его можно выделить из 2к факторов k группо-
групповыми проверками методом деления пополам. На следу-
следующем этапе уже ищется либо / значимых факторов
среди s — 2к факторов, либо I—1 значимых факторов
среди s—1 факторов в зависимости от результатов пер-
первого опыта. Третий этап строится аналогично второму
и т. д. Можно показать, что максимальное число опы-
опытов, необходимое для выявления всех ^значимых факто-
факторов, очень близко к его нижней границе, т. е. такой
план групповых проверок при указанных предпосыл-
предпосылках— практически оптимальный по минимаксному
критерию.
Различные предпосылки порождают процедуры от-
отсеивания различной структуры и сложности, однако
едва ли они полностью исчерпывают все многообразие
хотя бы чисто экономических проблем, возникающих в
реальных задачах биологического отсеивания. Рассмо-
Рассмотрим в качестве примера одну двухступенчатую про-
процедуру 'биологического отсеивания. На первой ступени
здесь производится грубое отсеивание, на второй —
более подробное исследование препаратов, отобпапных
на первой стадии. Введем в рассмотрение следующие,
99
величины: v — стоимость препарата; а — стоимость
первичного испытания препарата на одном животном;
b —стоимость исследования препарата на второй
стадии.
Допустим, что из предыдущего опыта известна веро-
вероятность q того, что каждый данный препарат активный.
Далее, как обычно, вводятся в рассмотрение вероятно-
вероятности ошибок первого и второго рода а и р (а — вероят-
вероятность ошибочного отрицания, р — вероятность ошибоч-
ошибочного 1признания). На первом этапе отсеивания среди
принятых к исследованию препаратов доля действи-
действительно активных составит q A — а), а доля ошибочно
признанных эффективными будет равна A—q) p.
Отсюда получаем среднюю стоимость полного иссле-
исследования одного препарата:
v + an + b [q A-й)+ A-9) р], F.6)
где п — среднее число животных, приходящих на один
препарат в данной процедуре. Введем теперь вполне
естественное допущение о том, что сумма средств,
отпускаемых на исследование (например, на одну не-
неделю), ограниченна и равна s. Число препаратов, кото-
которое можно последовать на эти средства, определяется
выражением
ЛГ=
F.7)
v + an + b [q (\-a) + {\-q) P]
Из них повторное испытание в среднем пройдет т
препаратов:
т = М [q (I— <z)+(l— q) p], F.8)
а число обнаруженных эффективных препаратов сос-
составит в среднем
;' ¦' L = sq (l-a) _ (б9)
v+an + b [q (\-a) + (l-q) p]
Теперь естественно стремиться так выбрать пара-
параметры процесса отсеивания, чтобы максимизировать
значение L как функции эффективности. Параметры
процесса следующие: число животных, приходящихся
«а препарат; параметры системы дискриминации, ска-
скажем, 'критическое значение активности или промежуток
времени, по истечении которого производится сравнение
результатов эксперимента с критическим значением.
Для каждого набора параметров можно вычислить
свои аир.
100
В приведенной выше модели максимизируется число
обнаруженных активных соединений, приходящихся на
единицу затраченных средств. С помощью этой же
модели можно решать и другие, чисто организацион-
организационные задачи. Например, можно ответить на вопрос,
каковы должны быть оптимальные соотношения меж-
между N — числом животных, имеющихся в лаборатории
в течение недели, и значениями Мят, или на вопрос,
каковы оптимальные значения М, N и т, позволяющие
находить в среднем один эффективный препарат в не-
неделю. Если N фиксировано, то можно ответить на воп-
вопрос, каково оптимальное среднее число соединений,
которое должно исследоваться в течение недели, и сколь-
сколько соединений будет поступать на вторую стадию. Этой
и подобным проблемам посвящено много публикаций,
например [88—91].
Практическая польза от моделей отсеивания несом-
несомненна. Они дают возможность найти некоторую наи-
наилучшую линию поведения, правда, при некоторых зара-
заранее предопределенных формах работы лаборатории.
Очень важно также, что подобные модели позволяют
стандартизировать процедуры биологических испыта-
испытаний: лоиак антиканцерогенных препаратов — это нацио-
национальная или даже общечеловеческая проблема и попыт-
попытка ее решения должна опираться на коллективные уси-
усилия, которые возможны только при стандартизации
процедуры исследования. И, наконец, последнее — изу-
изучение моделей отсеивания показало, что некоторые,
в биологическом смысле сильно отличающиеся процеду-
процедуры одинаково приемлемы. Биологи получают больше воз-
возможностей для выбора.
ГЛАВА VII
КРИТЕРИИ ОПТИМАЛЬНОСТИ ПЛАНОВ
ДИСКРИМИНИРУЮЩИХ ЭКСПЕРИМЕНТОВ
Исходя из соображений достаточно общего харак-
характера (см., например, [8]), можно показать, что экспе-
экспериментальные данные никогда не могут подтвердить
правомерность той или 'иной модели. Единственное, что
можно сделать,— это показать, что результаты наблю-
наблюдений не противоречат некоторой рассматриваемой га-
101
потезе. Известный английский философ К. Поппер
[92, 93] предложил даже отказаться от термина «про-
«проверка гипотез», заменив его термином «опровержимость
гипотез». Если в результате исследования данная гипо-
гипотеза не опровергается, то это еще не значит, что гипо-
гипотеза может быть принята, поскольку эти же результаты
наблюдений могут не противоречить и множеству дру-
других невысказанных гипотез. Результат исследования
будет более убедительным, если ввести в рассмотрение
несколько конкурирующих моделей. Так приходится
поступать при изучении механизма явлений; при этом,
естественно, приходится обращаться к моделям, нели-
нелинейным по параметрам.
Для решения вопроса о том, какой из заданных мо-
моделей отдать предпочтение, необходима постановка
так называемого дискриминирующего эксперимента. При
этом точки плана выбираются по возможности таким
образом, чтобы результаты измерений не были инва-
инвариантны относительно замены одной из конкурирующих!
моделей другой, т. е. эксперимент нужно выбрать так,:
чтобы поставить модели в критические условия.
Новая постановка задачи порождает новые критерии
и совершенно отличные от рассмотренных выше. Один
из критериев основан на некой мере, зависящей от раз-
разности между суммами квадрат.ических отклонений. Для
двух конкурирующих гипотез после проведения N наб-
наблюдений мы будем иметь дело с разностью Si (N) — S2 (N),
где
Sj (N) = J \yt - г,, (x,, 9/)l» (/=1,2). G.1)
Если эта разность недостаточно велика для того,
чтобы отдать предпочтение одной из конкурирующих,
гипотез, то следующий (jV+l)-fi эксперимент предла-
предлагается ставить в той точке, .где ожидается ее макси-
,мальное значение. Второй критерий основан на исполь-
!зовани,и модуля логарифма обобщенного отношения
правдоподобия, вычисленного для двух конкурирующий
гипотез: измерения размещаются так, чтобы добиться
наискорейшего роста этой величины. Наконец, в третьем
критерии в качестве меры для дискриминации гипотез
используется хорошо .известная в теории информации
мера расхождения Кульбака— выбор оптимального
плана сводится к максимизации этой величины. Из-за'
102
отсутствия места мы не имеем возможности здесь рас-
рассматривать эти критерии в деталях; подробно они опи-
описаны в книге [26], коротко — в [8]. Ограничимся здесь
некоторыми замечаниями общеметодологического ха-
характера.
Эти критерии, а число их легко может быть увели-
увеличено, не могут быть рассмотрены в рамках единого ак-
аксиоматического (построения. Попытка численного сопос-
сопоставления путем моделирования задач на ЭВМ вряд ли
будет полезной, поскольку для различных моделей, под-
подлежащих дискриминации, мы будем получать разные
результаты.
Система наших .суждений станет еще менее четкой,
если мы включим в рассмотрение одновременно две
задачи: процедуру дискриминации и процесс уточнения
параметров. Вторая из этих задач не требует формули-
формулировки новых критериев оптимальности. Здесь планы
можно строить, исходя из критерия ^-оптимальности.
Объединение двух задач в одну требует уже поиска
экстремума для суммы двух членов, один из которых
будет мерой дискриминации, другой — мерой точности
оцениваемых параметров. Ясно, что оба члена этой сум-
суммы должны быть взяты с какими-то весами. Остается
неясным, как выбрать эти веса и как изложить эту
проблему в рамках дедуктивных построений.
Накоплен уже большой опыт по практическому при-
применению планирования дискриминирующих эксперимен-
экспериментов, правда, еще недостаточно критически осмысленный.
Имеются и прямые сопоставления, показывающие, что
формализованные приемы планирования дискримини-
дискриминирующего эксперимента выигрывают по сравнению
с традиционными методами выбора области эксперимен-
эксперимента, основанными на интуиции. Хотелось бы сделать нес-
колыко предостерегающих замечаний в адрес формали-
формализованного подхода к выбору гипотез.
1. У нас никогда не может быть уверенности в том,
что «истинная» в каком-то смысле гипотеза включена
в рассматриваемое множество моделей. И если в ре-
результате дискриминирующих экспериментов мы припи-
приписываем одной из гипотез какую-то высокую вероят-
вероятности, ю это утверждение нужно понимать в некотором
песьма ограниченном смысле. Здесь речь идет о высо-
высокой вероятности гипотезы только по отношению к рас-
рассматриваемому в данном эксперименте множеству ги-
103
потез. Эта вероятность никоим образом ке является ме-
мерой истинности в каком-то абсолютном смысле, ибо
вполне возможно, что среди не включенных в рассмот-
рассмотрение моделей существует такая, которая будет лучше,
чем принятая нами, или хотя бы не будет отличаться
от нее в данной фиксированной области измерений.
2. Надо отдавать себе отчет в том, что при дискри-
дискриминации нелинейных по параметру моделей, претен-
претендующих на то, что они описывают механизм явлений,
мы в действительности только проверяем их интерпо-
интерполяционную силу. Особенно явно это проявляется в за-
задачах химической кинетики, где модели строятся так,
что они отражают многообразие всех промежуточных
реакций, а проверка модели происходит, как правило,
по образованию окончательного продукта. Неудивитель-
Неудивительно поэтому, что три экстраполяции лучшим может ока-
оказаться поведение той модели, которая три дискримини-
дискриминирующем эксперименте, проведенном в узком интервале
изменения 'переменных, набрала мало очков. Ниоткуда
не следует, что модель, которая ведет себя хорошо кай
интерполяционная в узкой области, действительно отра-
отражает всю сложность изучаемого явления и пригодна
для экстраполяции.
3. В 'моделях с нелинейной параметризацией, не-
несмотря на все ухищрения планирования, приходится
сталкиваться с высокой закоррелированностью пара-
параметров. Допустим, что исследователь или его оппонент,!
получив некоторую модель изучаемого явления, смогли
затем как-то иначе представить себе механизм проме-
промежуточных реакций. Вид модели, изменится, три этом;
изменятся ,и числовые оценки всех параметров, даже?
тех, которые выполняют в новой модели ту же роль,
которую они выполняли в старой. Можно, конечно, по-
попытаться изучать устойчивость модели к нарушению
части исходных предпосылок, но такие исследования-
вряд ли дадут обнадеживающие результаты.
Все изложенные здесь трудности связаны с самой
природой вещей. Если исследователь догадался и вклю-
включил «истинную» модель в систему гипотез, подлежащих
изучению, то .планирование эксперимента позволит ему
быстро прийти .к правильному решению. Если же такой
догадки не произошло, то исследователь долго будет
блуждать в лабиринте своих гипотез, придавая по ре-
результатам эксперимента больший вес то одной, то дру-
другой модели.
Ш
ГЛАВА VI11
ВЫЧИСЛИТЕЛЬНЫЕ ТРУДНОСТИ,
ВОЗНИКАЮЩИЕ ПРИ ПОСТРОЕНИИ МОДЕЛЕЙ,
НЕЛИНЕЙНЫХ ПО ПАРАМЕТРАМ
Развитие науки, наверное, всегда происходит так,
что новые отрасли знаний не толыко решают старые,
ранее возникшие проблемы, но и неожиданно выдви-
выдвигают совершенно новые, для решения которых нужны
принципиально новые концепции. Так получилось и с
планированием эксперимента. Здесь пришлось столк-
столкнуться с практически непреодолимыми трудностями
вычислительного характера при построении моделей,
нелинейных по параметрам.
В гл. I мы уже говорили о том, что нелинейная по
параметрам модель может быть линеаризована, и тогда
мы снова будем иметь дело с информационной матри-
матрицей ХТХ. В этом случае все процедуры, связа.нные как
с выбором критериев оптимальности плана, так и с оце-
оцениванием параметров, становятся весьма похожими на
те процедуры, которыми пользуются в случае с моде-
моделями, линейными по параметрам. Все различие, каза-
казалось бы, сводится только к тому, что при работе с мо-
моделями, нелинейными по параметрам, приходится учи-
учитывать предварительные грубые оценки параметров,'
и это приводит к необходимости использования после-
последовательной стратегии планирования.
Правда, при работе с моделями, нелинейными по па-
параметрам, приходится еще и с большей осторожностью
относиться к выбору критериев оптимальности плана.
На ряде примеров было показано, что при использова-
использовании критерия Д-оптимальности объем гиперэллипсоида
рассеяния уменьшается в основном за счет сжатия его
по малым полуосям, которые обычно на порядок мень-
меньше больших осей. В то же время, например, критерий
^-оптимальности стремится приблизить доверительную
область к сфере. При выборе критерия оптималь-
оптимальности надо научиться как-то учитывать вид модели, ес-
если она нелинейна по параметрам. Но все эти различия
сами по себе носят скорее технический, чем принципи-
принципиальный характер. Принципиальные трудности возника-
возникают в связи с необычайным осложнением всех вычисли-
вычислительных процедур. В задачу нашей книги не входит
рассмотрение вычислительных процедур планирования
16S-
эксперимента. Но на вычислительных трудностях, нося-
носящих принципиальный характер, мы здесь, естественно,
должны остановиться, поскольку они в перспективе дол-
должны изменить все наши представления о путях формаль-
формального построения моделей. Может быть, задачу надо сфор-
сформулировать шире и говорить о кризисе некоторых кибер-
кибернетических .представлений.
Развитие ЭВМ 'породило много иллюзорных надежд.
Одна из них — это вера в возможность построения прак-
практически сколь угодно сложных математических моделей,
основанных на изящном анализе грубых эксперимен-
экспериментальных данных. Казалось, что вычислительные маши-
машины смогут работать как своеобразные «математичес-
«математические спектрографы», разлагающие со сколь угодно вы-
высокой разрешающей способностью экспериментально
наблюдаемые данные на те составляющие их компонен-
компоненты, которые непосредственно не наблюдаются в опыте.
Трудно сейчас указать на такую публикацию, в которой
эта мысль >была бы отчетливо сформулирована и серь-
серьезно обоснована. Она возникла как-то сама собой и,
наверное, многими разделялась и разделяется до сих
пор. Это парадигма1, порожденная небывалыми техни-
техническими возможностями вычислительной математики.
Но всякая тарадигма рано или поздно начинает под-
подвергаться пересмотру.
Рассмотрим сложившуюся здесь ситуацию на при-
примере задач химической кинетики. Исследователь, наб-
наблюдая за изменением во времени выхода окончатель-
окончательного продукта химической реакции, хочет восстановить
механизм, отражающий промежуточные стадии, не наб-
наблюдаемые непосредственно в эксперименте. При этом
'исследователь исходит из того, что он, основываясь на
некоторых априорных сведениях, 'может записать сис-
систему дифференциальных уравнений, отражающих меха-
механизм промежуточных реакций и задающих параметры
модели. Априорные сведения не формализованы — они
включают в себя весь предыдущий опыт исследователя
или, может быть, даже весь опыт развития химии, дос-
доступный исследователю. Эти сведения всегда субъектив-
субъективны в том смысле, что они отражают некоторую персо-
1 Представление о парадигме как о системе размытых постула-
постулатов, определяющих представление о том, что научно и что не науч-
научно в иауке, ввел Кун [94].
106
нальную настроенность 'исследователя или той школы,
к которой он принадлежит.
Система дифференциальных уравнений может рас-
рассматриваться как некая исходная аксиоматика, опира-
опираясь на которую надо разложить опытно наблюдаемые
данные на составляющие их 'компоненты. Описок про-
промежуточных реакций термодинамически открыт. Их
число определяется, видимо, целиком имеющимися тех-
техническими возможностями. Сейчас можно встретить
публикации, в которых включается в рассмотрение до
20 параметров. Раньше, когда возможности вычисли-
вычислительной техники были развиты слабо, число промежу-
промежуточных реакций не превышало двух. Наверное, можно
было бы построить наукометрические графики, пока-
показывающие, как одновременно с развитием вычислитель-
вычислительной техники растет число промежуточных реакций,
включаемых в рассмотрение.
Ясна тенденция: развитие ЭВМ порождает искуше-
искушение строить модели, сложность которых ограничивается
только вычислительными возможностями. Поскольку
последние практически могут расти безгранично, то не-
неограниченной, казалось бы, должна быть и возможность
увеличения сложности моделей.
Сейчас уже накопился большой опыт, показывающий
те принципиальные трудности, с которыми приходится
сталкиваться при попытке использовать вычислитель-
вычислительные 'методы математики для разложения на составляю-
составляющие компоненты исходных экспериментально наблю-
наблюдаемых данных. Хорошо известна задача, возникающая
при измерении радиоактивного распада. В этом случае
приходится иметь дело с представлением результатов
наблюдений суммой экспонент. Внешне задача сходна
с задачей разложения суммарно регистрируемого коле-
колебательного процесса по отдельным периодическим со-
составляющим, но отсутствие ортогональности для пока-
показательных функций приводит к трудностям, не извест-
известным в гармоническом анализе. Описание этих труднос-
трудностей уже давно вошло в учебные руководства (см. поу-
поучительный пример, приведенный в [95]).
К методам «математической спектроскопии» прихо-
приходится обращаться и при анализе не аддитивных много-
многокомпонентных систем по спектрам поглощения, полу-
полученным с помощью физических спектрографов [961.
Здесь имеется несколько существенно различных пос-
постановок задач. Одна из них — анализ многокомиюнент-
107
ных смесей неполностью известного качественного сос-
состава. В обычной форме эта задача решается путем ап-
аппроксимации спектра поглощения неизвестных примесей
каким-либо алгебраическим многочленом. Во всех зада-
задачах такого типа приходится сталкиваться с неприятнос-
неприятностями, типичными для регрессионного анализа с неор-
неортогональной матрицей независимых переменных. Для
интересующей нас компоненты нельзя установить дове-
доверительной границы, не зависящей от того, как выбран
весь набор других компонент. Отсюда неоднозначность
в решении задачи.
Но вернемся к нашей задаче — построению моделей
в химической 'кинетике и рассмотрим ее в упрощенном,
благоприятном для нас варианте. Ее решение включает
следующие этапы. Система дифференциальных уравне-
уравнений интегрируется аналитически. Появляется функция
т] = ф(х; 9), нелинейная по параметрам. Нужно найти оп-
оптимальный план эксперимента, порождающий вместе с
предварительными оценками 9 матрицу независимых пе-
ременных X, осуществить его и затем, пользуясь методом
наименьших квадратов, оценить замечания параметровЭ,
найти для оценок доверительные границы и ер. Всему
этому, естественно, предшествует линеаризация — под-
подробнее об этом см. в работах [8, 12, 26, 62, 97].
Допустим теперь, что, решая какую-то конкретную
задачу, мы выполнили все, что рекомендовано в упо-
упомянутых 'выше руководствах. Тогда немедленно возни-
возникает вопрос о том, 'как быть с установлением довери-
доверительных границ для оцениваемых параметров. Этот воп-
вопрос во всей его сложности еще не был сколько-нибудь
обстоятельно рассмотрен в литературе, хотя он имеет
решающее значение, поскольку параметры рассматри-
рассматриваются как некоторые физические константы механиз-
механизма того явления, которое описывается моделью, нели-
нелинейной ,по параметрам. Эти константы подлежат чет-
четкой физической интерпретации, их числовые оценки
подлежат хранению—-они должны заноситься в спра-
справочные издания или в память ЭВМ.
Здесь возникают практически непреодолимые труд-
трудности, зачастую сводящие всю работу по оцениванию
'параметров ж некоторой 'иллюзорной деятельности.
Серьезный анализ показывает, что при изучении меха-
механизма явлений методами математического разложения,
суммарных данных по параметрам некоторой гипоте-
гипотетической модели мы имеем дело с тремя источниками
108
неопределенности. Один из них связан со случайной
ошибкой результатов измерений, другой — с неодноз-
неоднозначностью процесса оценивания параметров модели, по-
порождаемой сложностью этого процесса, и, наконец, тре-
третий— с возможностью различной формулировки той хи-
химической аксиоматики, которая задает набор тех или
иных промежуточных реакций.
Начнем наше описание с рассмотрения первой из
указанных выше неопределенностей —о ней мы уже не-
немного говорили выше. Здесь существенно прежде всего
то, что оценки для части параметров обычно оказыва-
оказываются корреляционно связанными с очень высокими
коэффициентами корреляции, доходящими иногда до
0,99 или даже до 0,999. Вид моделей оказывается таким,
что применение приемов планирования, направленных
на ортогонализацию информационной матрицы, оказы-
оказывается беспомощным. В этом случае записывать дове-
доверительные границы в виде привычного соотношения 9г±
±2а { 0г- } бесполезно, поскольку в такой записи
игнорируется информация о закоррелированности оце-
оценок. Исследователь, обращаясь к справочнику, компи-
компилирующему результаты исследований, может захотеть,
исходя из имеющихся у него теоретических данных,
выбрать в качестве приемлемой величины для оценки
того или иного параметра значение, лежащее не в
середине доверительного интервала, а где-то на краю
его. В соответствии с общей статической идеологией
последователь, конечно, вправе сделать такой произ-
произвольный выбор :в пределах заданного доверительного
интервала. Но при этом, учитывая высокую закоррели-
рованность оценок, нужно немедленно пересчитать до-
доверительные интервалы по всем другим параметрам.
Чтобы допустить такую возможность, придется в
справочники вводить не только оценки параметров, но
и всю связанную с ними ковариационную матрицу.
Это становится крайне громоздким.
Более того, из-за необходимости обращения к ЭВМ
смысл компилирующего справочника как инструмента
для наглядного представления данных полностью
теряется. Что можно сделать, чтобы сохранить нагляд-
наглядность? Можно ввести в справочники характеристиче-
характеристические числа ковариационной матрицы, которыми зада-
задаются оси эллипсоида рассеяния оценок, Но это никак
103
не создает наглядности в представлении многомерного
эллипсоида. Можно описать вокруг эллипсоида много-
многомерный 'параллелепипед. Здесь мы повысим нагляд-
наглядность представления — по каждому параметру будут
заданы максимально возможные доверительные грани-
границы, не зависящие от того, как зафиксированы оконча-
окончательные значения для других параметров. Но это нам
обойдется очень дорого — объем параллелепипеда в
многомерном случае будет значительно превосходить
объем эллипсоида, особенно если учесть, 'что в случае
нелинейной параметризации мы будем иметь дело не с
эллипсоидами, а с эллипсоидоподобными фигурами, даю-
дающими в двумерных сечениях причудливые бананообраз-
ные фигуры. Можно в справочники ввести двумерные се-
сечения эллипсоидоподобных фигур. Но сколько их будет?
Для задачи с 20 параметрами число таких сечений бу-
будет равно числу сочетаний из 20 по 2, т. е. 190, и по
каждому из них надо еще взять развертку.
Итак, мы видим, 'что в случае нелинейной парамет-
параметризации совсем не просто наглядным образом нредста-
'вить неопределенность, связанную только с ошибкой
эксперимента. Но это только один из трех источников!
неопределен ности.
Обратимся теперь ко второму источнику неопреде-
неопределенности — неоднозначности вычислительных процедур,
обусловленной их сложностью1. Необходимо иметь в
виду следующее: 1) возможность варьирования процедур-
линеаризации — отрезок ряда Тейлора—можно зада-
задавать различно, ограничиваясь один раз первой ороиз-
¦водной, в другой раз вводя вторые производные и т. д,
Можно линеаризацию делать, не прибегая к разложе-
разложению в ряд Тейлора, а выбирая для каждой модели инди-
1видуальное разложение по каким-то естественным для
нее функциям; 2) 'возможность получения расхождения
результатов при вычислении параметров в силу того,
1 Здесь мы сознательно ограничиваемся рассмотрением только
тех вычислительных процедур, которые приобрели некий канониче-
канонический статус. Рассмотрение всего многообразия работ, связанных с мо-
модификацией метода наименьших квадратов, построения алгоритмов
для наилучшего смещенного оценивания и т. п., увело бы нас толь-
только в сторону. В методологическом плане их использование — эта
дальнейшее расширение поля возможных моделей. Энциклопедиче
ское изле чсеиие различных методов оценивания параметров в лиией
ных моделях можно найти в книге [111].
110
что информационная матрица из-за сильной закорре-
лированности отдельных столбцов оказывается плохо
обусловленной, т. е. ее определитель близок 'к нулю; 3)
возможность расхождения в результатах вычислений
из-за произвольного выбора начальных оценок пара-
параметров. Все итерационные процедуры требуют выбора
исходной точки. Если, как это обычно бывает, сущест-
существует много минимумов в дополнении к абсолютному
минимуму, то плохие исходные значения могут приве-
привести к сходимости в нежелательной стационарной точ-
точке 'поверхности суммы квадратов или сходимости мо-
может вообще не >быть — результаты вычислений разма-
размажутся 1по 'поверхности, на которой ведется поиск ста-
стационарной точки.
Вот как в известном руководстве Дрейпера и Сми-
Смита [62] описываются неприятности, связанные с ис-
использованием линейного метода наименьших 'квадратов
(после линеаризации модели разложением в ряд Тейлора)
в последовательности стадий. Процедура вычислений,
'пишут они, может сходиться очень медленно; могут воз-
возникнуть сильные колебания с частыми увеличениями и
уменьшениями суммы квадратов, хотя, в конце концов,
решение может и сбалансироваться; процедура вообще
может не сходиться или даже расходиться так, что сумма
квадратов отклонений будет расти от итерации «итера-
«итерации, хотя можно показать, что теоретически этот метод
должен сходиться всегда (скорость сходимости зависит
от вида модели, для которой оцениваются параметры,
процесс сходимости может быть очень медленным и
сильно осциллирующим. Об этом см. также в 1[97]).
Если та или иная процедура вычисления, выбран-
выбранная для решения данной задачи, не сходится, то
¦исследователь, вообще говоря, знает, что ему дальше
делать. Он может изменить процедуру линеаризации1
1 Линеаризацией, вообще говоря, можно считать представление
функции полиномом. Это опять эквивалентно представлению функ-
функции отрезком ряда Тейлора, но разложение функции в <ряд здесь
производится уже не по параметрам, а по независимым переменным.
Коэффициенты регрессии полинома
оцениваются непосредственно по результатам эксперимента. Если
ограничиться приближением функции полиномом первого порядка,
то оценка всех коэффициентов регрессии может быть сделана с ко-
или даже, отказавшись от нее совсем, может изменить
процедуру вычислений; в рамках каждой вычислитель-
вычислительной процедуры можно варьировать начальные прибли-
приближения. Этот шроцесс можно даже в какой-то степени
формализовать, выбирая для этого комбинаторную сет-
сетку, исходя 'из идей планирования эксперимента. Так,
например, начальное приближение для каждого пара-
параметра можно проварьировать на двух уровнях и тогда
узлами решетки будут точки в фактором плане 2h (k —
число параметров) или в регулярной реплике от него.
В процедурах последовательного планирования, по-
видимому, роль первого приближения, полученного из
совсем грубого «затравочного» опыта, смягчается, но
вряд ли полностью элиминируется для поверхности сум-
суммы квадратов любого вида.
В некоторых случаях исследователь оказывается
вынужденным принять решительные меры — репара-
метризовать модель (об этом мы уже говорили выше)
или даже записать ее в нетрадиционной форме, так,
скажем, ка'к это сделано в работе [98]. Можно иногда
попробовать объединить два самых закоррелирован-
ных параметра в один, не очень сильно меняя вид мо-
модели с тем, чтобы не нарушить заложенный в ней
физический смысл. Во всяком случае замечено, что
медленная сходимость имеет место, когда .контурная
кривая для суммы квадратов отклонений имеет форму
вытянутых бананов.
Все это хорошо описано в различных книгах и в
том числе в упомянутой выше книге Дрейпера и Сми-
Смита [62]. При этом всегда предполагается, что исследо-
исследователь все же находит некое наилучшее и единственно
правильное решение. Но откуда эта возможность сле-
следует? Ответа на этот вопрос нет, более того —он просто
не ставится. Сейчас можно сформулировать следующее
утверждение: в задачах с нелинейной параметризацией
математическая статистика потеряла одно из своих са-
самых привлекательных достоинств. Она перестает быть
одновременно наукой, дающей правила для оценки
эффнциентами корреляции, равными нулю. Исчезают все рассмотрен-
рассмотренные выше трудности с оцениванием параметров и установлением для
иих доверительных границ. Но исчезают из рассмотрения и сами
исходные параметры модели — они заменяются псевдопараметрами—•
коэффициентами регрессии. Отюсда следует, что чем меньше мы хо*
тим узнать, тем определеннее (при одних и тех же эксперимен-
экспериментальных возможностях) становятся наши знания
112
параметров, и метанаукой, оценивающей надежность
своих вычислений. Во всяком случае доверительные эл-
эллипсоиды, если даже как-то наглядно их представить,
отражают только неопределенность, связанную со слу-
случайной ошибкой, и никак не отражают неопределен-
неопределенность, связанную с возможной нестандартностью вы-
вычислительных процедур. Ясно, что одна и та же нели-
нелинейная по параметрам задача в разных и притом
одинаково хороших вычислительных центрах может
дать существенно различные решения. Более того, при
достаточном критицизме и в одном центре, наверное,
можно получить разные результаты.
Неопределенность, связанную с возможной нестан-
нестандартностью вычислительных процедур, вообще говоря,
можно было бы (попытаться оценить и чисто статистиче-
статистически, используя для этого, скажем, дисперсионный ана-
л'из с иерархической классификацией. Где-то на самом
низком уровне была бы задана неопределенность, свя-
связанная с выбором начальных приближений, на самом
верхнем — неопределенность, связанная с выбором
моделей при их рапараметризации, на промежуточных
уровнях — другие нестандартные вычислительные про-
процедуры. Но все это будет выглядеть достаточно нелепо
уже в силу своей громоздкости. Видимо, разумнее огра-
ограничиваться просто тем, что результаты вычислений
представлять не в одном, а в нескольких возможных
вариантах, естественно, ограничиваясь при этом теми,
которые с позиций математика-вычислителя предста-
представляются естественными.
Если мы теперь обратимся к рассмотрению жур-
журнальных публикаций по построениям нелинейных по па-
параметрам моделей, то увидим здесь удивительное пре-
пренебрежение к оценкам неопределенности. Редко где при-
приводится целиком вся ковариационная матрица. Обычно
ограничиваются приведением ее диагональных элемен-
элементов, что, как мы уже говорили выше, было бы право-
правомерно только для случая полной ортогональности
информационной матрицы. О неопределенности, свя-
связанной с вычислительными процедурами, обычно гово-
говорить в публикациях не принято. Принятым исключе-
исключением является статья А. П. Короетелева и М. Б. Ма-
лютова [99], в которой, несмотря на весь свой кри-
критицизм, авторы все-таки ограничиваются представлением
результатов наблюдений одной моделью.
ш
Теперь обратимся, наконец, к рассмотрению треть-
третьего источника неопределенности — исходной химиче-
химической аксиоматики. Выше мы уже говорили, что список
дифференциальных уравнений, задающих механизмы
¦промежуточных реакций, вообще говоря, остается
термодинамически открытым. Химик-исследователь,
исходя из некой микропарадигмы той научной школы,
к которой он принадлежит, составляет какой-то свой
разумно ограниченный список возможных промежуто-
промежуточных реакций. Достаточно критически настроенный ис-
исследователь может предложить несколько таких спис-
списков. Отсюда — проблема дискриминации гипотез. Фор-
Формально хорошо разработанный аппарат дискримина-
дискриминационных процедур (совсем коротко мы о нем говорили
в гл. VII) в скрытой форме вносит в результаты иссле-
исследований новый 'источник неопределенности.
Прежде всего здесь хочется еще раз обратить вни-
внимание на то, что у нас нет (и принципиально не может
быть) уверенности в том, что в число конкурирующих
'моделей включена истинная модель. А без этой предпо-
предпосылки сама постановка дискриминационной задачи
оказывается просто несостоятельной. Дискриминацион-
Дискриминационные процедуры при различном наборе дискриминиру-
дискриминируемых гипотез будут приводить к различным результа-
результатам. Во всяком случае нельзя доказать утверждения о
том, что при отсутствии «истинной модели» дискрими-
дискриминационная процедура не будет практически сходиться
к какому-то решению.
Второе — это то, что процедура дискриминации
¦может целиком определяться той произвольностью в
оценке параметров, которая могла быть внесена на
стадии вычисления. Сейчас уже имеется опыт, показы-
показывающий, что далеко не все модели, отобранные на
стадии лабораторного исследования, оказываются в
дальнейшем пригодными для описания соответству-
соответствующих им процессов в заводских условиях, хотя фор-
формально для всех процессов были отобраны модели,
отвечающие одним и тем же требованиям строгости.
Третье •— неинвариантность модели в целом к не-
небольшим изменениям в исходной химической аксиома-
аксиоматике. Небольшое изменение в списке промежуточных
реакций может привести не только к появлению новых
параметров в модели, но также (вследствие внутренней
большой закоррелированности) и к изменению число-
числовых значений параметров тех реакций, которые оста-
114
лись неизменными. Перебрать все возможные варианты
набора промежуточных реакций практически невозмож-
невозможно. К тому же (опять-таки вследствие большой внутрен-
внутренней закоррелированности) большая перестройка в
числовых оценках параметров может приводить к
моделям, мало различающимся при сопоставлении их
с результатами эксперимента в некотором фиксирован-
фиксированном интервале значений независимых переменных.
Четвертое — неправомерность экстраполяции. По
самому -своему смыслу в химических задачах дискрими-
дискриминация гипотез проводится в некотором узком, легко
доступном интервале варьирования независимых пере-
переменных с тем, чтобы в дальнейшем можно было полу-
получить некоторые существенные сведения на основании
экстраполяции лучшей из отобранных моделей. Право-
Правомерность такого подхода весьма сомнительна, посколь-
поскольку из изложенного выше следует, что мы в процессе
дискриминации оцениваем только интерполяционную
силу модели, и ниоткуда не следует, что модель, веду-
ведущая себя хорошо в интерполяционном смысле на узком
участке, будет хороша и при экстраполяции. Имеются
примеры из практической работы, показывающие, что
при экстраполяции оказывалась лучшей та модель,
которая оценивалась как худшая в дискриминацион-
дискриминационном эксперименте, проведенном со всей возможной
формальной строгостью.
Пятое — если при дискриминации в малом интерва-
интервале та или иная модель ведет себя не как лучшая, то
есть ли это серьезное основание для отбрасывания мо-
модели? Некоторое небольшое изменение в исходной
химической аксиоматике могло ослабить интерполя-
интерполяционную силу модели, но это не значит, что модель
не вскрывает некоторых интересных для исследователя
изменений ,в оценках параметров (опять-таки в силу
их большой закоррелированности), что может проя-
проявиться в более широком, но практически труднодоступ-
труднодоступном для реализации интервале варьирования незави-
независимых переменных.
На этом, наверное, можно оборвать наш список
претензий к дискриминационным процедурам. Теперь
можно поставить вопрос в общефилософском смысле:
откуда вообще взялась вся идеология дискриминации?
Ответ оказывается простым — это, говоря словами
Куна [94], определяется существующей сейчас паради-
парадигмой, согласно которой мир, с одной стороны, устроен
115
так, что в нем все управляется некоторыми единст-
единственно возможными законами природы, а с другой — он
обладает еще и тем свойством, что научно поставлен-
поставленный эксперимент позволяет обнаруживать эти законы.
Что касается первого шарадигматического утвержде-
утверждения, то в современной физике оно начинает терять
своих приверженцев. Ему может быть противопостав-
противопоставлена философия «bootstrap»1 [100, 101], согласно кото-
которой природа — это некоторая (Взаимосогласованная
динамическая паутина, которая не может быть реду-
редуцирована ни к каким элементарным блокам вещества,
ни к фундаментальным законам, уравнениям или прин-
принципам. Сам термин «bootstrap» не может быть соотнесен
с какой-нибудь одной индивидуальной моделью — он
может быть применим только к комбинации внутрен-
внутренне согласованных моделей, ни одна из которых не.
может быть более фундаментальна чем другая2. Чта
касается второго парадигматического утверждения, то
после хорошо известных работ К. Полотера [92, 93] я
в чисто философском плане стало ясно, что роль экспе-
эксперимента в науке ограниченна: гипотеза никогда не мо-
может быть подтверждена экспериментально. Единствен-
Единственное, что можно сделать, — это показать, что экспери-
эксперимент не противоречит данной гипотезе.
А если гипотеза отвергается экспериментом — отбра-
отбрасывается ли она всегда и безоговорочно? Следуя
известному биологу Ж. Моно [104], можно привести
один исторический пример, показывающий, что отрица-
отрицательные результаты экспериментальной проверки смогу!
оказаться недостаточными для отбрасывания сильной
гипотезы. Хорошо известный во времена Дарвина фи-
физик Том-сон был одним из немногих тогда ученых,
умеющих считать. Он показал, что если положить, что
Солнце состоит из кучи угля — одного из самых кало-
калорийных видов топлива, известных в то время, то его
1 Дословно — это философия «стягивания» (по принципу шну-
шнуровки).
2 С проблемой множественности моделей столкнулась сейчас
физика элементарных частиц [102]. Ситуация такова: за последние
20 лет появилось множество теорий и моделей, некоторые из них
концептуально противоречат друг другу. Ни одна из них ие может
быть отброшена, поскольку каждая объясняет какую-то часть наб-,
людаемых явлений, и ни одна мз них не может быть принята как
единая, поскольку ни одна не объясняет всего. Проблеме множест-
множественности моделей в физике и космологии посвящена также интерес-
интересная статья [103].
116
энергии никоим образом не хватило бы для нужного
нагревания Земли в течение всего того времени, кото-
которое было необходимо для эволюционного развития
жизни на Земле. На Ч. Дарвина эти расчеты произвели
удручающее впечатление... Прямой эксперимент —
измерение тепла, получаемого Землей, измерение раз-
размеров Солнца и калорийности топлива — все это при-
пришло в противоречие с теорией. И все же теория не была
отброшена. Теперь, говорит Моно, мы можем сказать,
что теория эволюции Дарвина имплицитно содержала
представление о ядерной энергии Солнца, хотя в то
время н« у кого такой догадки возникнуть не могло.
Можно, конечно, привести и сколь угодно много про-
противоположных лримеров, показывающих, как негатив-
негативные результаты эксперимента оказывали рвшющее влия-
влияние на развитие науки. Один из них — это опыт
Майкельсона—Морли, послуживший толчком к возни-
возникновению навой эры в развитии физики.
Из всех этих исторических противопоставлений с
очевидностью следует одно — отрицательные результаты
эксперимента приобретают действенную силу только в
сочетании с некоторой системой содержательных рассу-
рассуждений. Статические методы дискриминации моделей в
том виде, как они сейчас излагаются в руководствах по
планированию эксперимента, оказываются слишком
формализованными; они исключают содержательное
обсуждение результатов эксперимента, с одной стороны,
а с другой — в своем формализме оказываются непос-
непоследовательными, поскольку не учитывают той неопре-
неопределенности, которая оказывается связанной с вычис-
вычислительными трудностями, порожденными структурными
особенностями самих моделей. Но об этом мы уже
много говорили выше.
Итак, видимо, надо что-то изменить в системе
наших исходных .представлений. Новая .парадигма
исследователя должна отказаться от поиска единствен-
единственной существенно верной модели, если даже речь идет
об изучении механизма явлений. Зачем постулировать
существование того, что в исследовательской перспек-
перспективе оказывается иллюзорным? Ведь отказалась же
физика от лапласовского детерминизма в квантовой
¦механике и даже от всех его смягченных форм, когда
выяснилась иллюзорность его возможной наблю-
наблюдаемости.
117
Надо признать, что результаты изучения механизма
явлений следует представлять не одной, а множеством
моделей. Множественность моделей может порождаться
как различием в исходной химической аксиоматике,
так и непреодолимой неоднозначностью в вычислитель-
вычислительных процедурах. Возможность постановки дискримина-
дискриминационных экспериментов, наверное, не нужно отри-
отрицать— они, несомненно, несут некую информацию, но
им надо придавать просто должное — ограниченное —
значение.
Если встать на такую точку зрения, то мы, конечно,
немедленно придем в противоречие с традиционным
пониманием роли математической статистики в иссле-
исследовательской деятельности. Следуя Р. Фишеру, мы
всегда считали, что задача статистики — это редукция
данных. Исследователь, знающий статистику, может
представлять в своих отчетах и публикациях резуль-
результаты исследования в значительно более компактной
форме, чем та форма, в которой данные опыта непос-
непосредственно регистрируются. При новой постановке
задачи математическая статистика будет использова-
использоваться не для свертки, а для развертки данных. Множе-
Множество нелинейных по параметрам моделей с их дове-
доверительными границами — разверткой двумерных (или
трехмерных) сечений эллипсоидоподобных фигур —
будет выглядеть более сложно и громоздко, чем не-
непосредственно наблюдаемые величины — матрицы
независимых переменных X и вектор результатов наб-
наблюдений Y.
Здесь возникает вопрос: окажется ли исследователь
способным воспринять информацию об изучаемом про-
процессе, 'представляемую столь громоздким образом?
Сейчас мысленно можно представить себе аудиторию,
где демонстрируется кинолента, на которой засняты все
графически представляемые данные, причем показ
сопровождается соответствующим комментарием. Перед
глазами исследователей будет проходить все многооб-
многообразие данных, извлекаемое из эксперимента при варь-
варьировании как вычислительных процедур, так и исход-
исходной химической аксиоматики. Можно все это предста-
представить и в форме диалога человека с ЭВМ. Важно при
этом следующее: возникает ли у исследователя какая-
то догадка, произойдет ли «озарение», позволяющее
как-то иначе, чем это было раньше, представить меха-
механизм явлений и наметить какие-то новые пути даль-
118
нейшего исследования? Короче, если раньше свертка
материала производилась на логическом уровне (в
процессе статистической обработки материала), то
теперь она переносится на интуитивный уровень. ЭВМ
развертывает во всем многообразии информацию,
заложенную в эксперименте: человек должен будет
свернуть ее в теоретическом осмысливании. Возможно-
Возможности вычислительных машин сталкиваются здесь с
неизведанными возможностями человека.
Может быть здесь уместна некоторая аналогия с
тем, что происходит в биологии с развитием ее перво-
первоосновы— теории эволюции. Сейчас существует некото-
некоторое множество теорий эволюции, трудно поддающихся
классификации. Можно считать, что в основе всех их
лежит некий список «факторов эволюции». Многообра-
Многообразие теорий создается заданием весов на множестве
этих факторов. Естественно при этом, что теории с
более или менее близким взвешиванием факторов
могут быть объединены в группы, которым дается не-
некоторое наименование. Сам механизм построения
эволюционных теорий может быть назван «логической
спектроскопией». Биолог, или, точнее, палеонтолог,
наблюдая отдаленные срезы прошлого, пытается разло-
разложить их по всему многообразию задающих их факторов
эволюции, приписывая этим факторам отдельные веса.
Интенсивное появление новых эволюционных теорий
наблюдалось в начале нашего века вплоть до 20-х го-
годов. Сейчас этот процесс замедлился или уже вовсе
прекратился. И вдумчивые 'биологи поступают следую-
следующим образом: знакомясь со всем многообразием
эволюционных взглядов, они строят некую собственную
теорию, т. е. как-то по-своему задают соотношение
весов на множестве эволюционных факторов. В
результате оказывается столько эволюционных теорий,
сколько есть думающих биологов. Это многообразие,
свертываемое уже индивидуально в некоторое компактно
представляемое однообразие, позволяет индивидуально
творчески работать1.
Закончить эту главу хочется следующим. Разложе-
Разложение результатов наблюдений по задающим их факторам
1 Эти высказывания о теории эволюции навеяны очень интерес-
интересным докладом С. В. Мейеиа «Классификация эволюционных тео-
теорий», прочитанным на школе молодых ученых по теоретической био-
биологии в Кондопоге в феврале 1977 г. (см. также его работу [105]).
119
(или механизмам) есть одна из основных задач науки.
Накопился уже большой материал, показывающий, что
эта задача в своей достаточно общей постановке не
может быть однозначно решена ни методами «числен-
«численной спектроскопии», ни методами «логической спектро-
спектроскопии». Подключение ЭВМ к решению этой задачи
только осложнило всю проблему. Теперь как будто
наметился новый путь ее решения — свертывание ин-
информации через ее развернутое представление. Может
быть это новая иллюзия?
И, наконец, последнее, важное для этой работы
замечание: признание права на существование веера
моделей ставит и новую задачу перед планированием
эксперимента — нужны робастные планы, т.е. планы,
малочувствительные к возможному 'изменению моде-
моделей хотя бы в пределах некоторого их класса.
ГЛАВА IX
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КАК ВОПРОС,
ЗАДАВАЕМЫЙ ИССЛЕДОВАТЕЛЕМ ПРИРОДЕ
Через всю книгу проходит мысль о том, что плани-
планирование эксперимента становится возможным только
после того, как задана математическая модель изуча-
изучаемого процесса. Изложение материала в книге все
время опирается на те или иные модели. Но мы почти
ничего не говорим о том, как выбрать подходящую
модель в некоторой реальной ситуации. Почему?
Ответ на этот вопрос) звучит очень просто: построение ма-
математических моделей— это искусство, планирование —
это главным образом уже просто техника. Легче говорить
о технике... Но что-то все же можно попытаться сказать
и об искусстве. Математическая модель в том смысле,
(как мы это здесь рассматриваем, — это вопрос, который
исследователь задает природе. И хМы начнем наше
изложение с анализа семантики вопроса. Проблеме
интеррогативной (эротетической) логики уделяется
большое внимание (см., например, работу [106] и
статью «Вопрос» ,в Логическом словаре [107]).
Всякий вопрос состоит непременно газ двух состав-
составляющих— утверждающей, т. е. вносящей некоторые
знания, делающие вопрос возможным (эту составляю-
120
щую можно считать предпосылкой вопроса), и собствен-
собственно вопрошающей составляющей; вопрошающая часть
вопроса не 'может быть ни истинной, ни ложной, она
может быть только уместной или неуместной. Пред-
Предпосылка вопроса может быть верной, ошибочной или
недостаточной для постановки данного вопроса, и это
можно установить, только привлекая какую-то другую,
внешнюю информацию, не содержащуюся ib самом
вопросе. Рассмотрим два примера.
1. Врач-психиатр задает вопрос пациенту-мальчику: «Если
американский петух снес яйцо на советской территории, то кому оно
будет принадлежать — нам или американцам?» Мальчик удивленно
отвечает: «Но как же петух...» Такой ответ устраивает врача —
пациент уловил ошибочность утверждающей части вопроса (хотя
она может быть интерпретирована как метафора, но это уже другой
разговор).
2. На докладах философской направленности часто задают воп-
вопрос: «Признаете ли вы существование абсолютной истины?» Пред-
Предпосылкой этого вопроса является невысказанное в явной форме
утверждение о том, что существует (или хотя бы может существо-
существовать) язык, семантически столь богатый, что на нем может быть
выражена абсолютная истина (если такого языка принципиально
быть не может, то чем это последнее утверждение отличается от
утверждения, отрицающего существование абсолютной истины?).
Но если вспомнить о теореме Геделя1, то скрытая предпосылка
вопроса будет представляться весьма сомнительной. Мы видим, как
вопрос порождает предвопрос, только после решения которого он
становится правомерным.
Итак, вопрос не может быть ни ложным, ни истин-
истинным, следовательно, строго говоря, он не есть утверж-
утверждение [107], хотя Сузанна Лангер i[109], следуя Коу-
эну [ПО], говорит, что вопрос есть уже двусмысленное
предложение, детерминантом которого является его
ответ. Отсюда ясно, что вопросы могут быть неумест-
неуместными или даже запрещенными. Развитие каждой куль-
культуры задается набором разрешенных и запрещенных
вопросов. В нашей науке, скажем, запрещены такие
вопросы: «Зачем существует закон Ома?» или «Откуда
взялся и когда появился закон Ома?», ибо любые, но
возможные для этих вопросов ответы будут выглядеть
как нелепость.
Наука, если говорить о науке наших дней, начинает-
начинается с постановки вопросов. Вообще говоря, конечно,
можно вести наблюдения и даже ставить эксперименты,
1 Гносеологические проблемы, порожденные теоремой Геделя,
хорошо изложены, например, в работе [108].
4 Зак. 138
121
не задавая вопроса, но вряд ли такую деятельность
можно назвать научной. По сведениям этнографов,
среди охотников в народностях с пантеистическим ми-
миропониманием можно встретить таких наблюдателей,
которые знают о природе все, что можно увидеть. Но
они наблюдают, не задавая вопросов, а вопросов они
не задают потому, что у них нет теорий для того, чтобы
сделать содержательной предпосылку вопроса.
Наверное, около 2000 лет просуществовала алхимия.
Она занималась как будто бы тем же, чем занимается
современная химия; в (процессе, -правда, очень медлен-
медленного развития была разработана аппаратура, исполь-
используемая и до наших дней, и сделано все же много откры-
открытий. Но это не была наука. Эксперимент ставился как
слепой поиск ради решения одной задачи — получения
золота; вопросов природе не задавалось—их нельзя
было задать .потому, что не было языка, на котором
можно было бы сформулировать теоретические пред-
представления, основанные на опыте прошлого. Впрочем,
нередко и сейчас, слушая отчетные научные доклады
или диссертации, задаешь вопрос: «Скажите, пожалуй-
пожалуйста, на какой вопрос ваша работа дает ответ?» И полу-
получаешь ответ: «Как иа какой вопрос — ни на какой, мы
просто так...»
Итак, характерной особенностью современной науки
все же является то, что ученый стремится .получить от-
ответ на четко поставленный вопрос, сформулированный
на основе прежних знаний. Но знания всегда условны
и .изменчивы — наука развивается диалектически, т.е. ре-
революционно ([94]. Отсюда следует, что осторожнее было
бы ограничиться такой формулировкой —ученый зада-
задает вопрос природе, исходя из существующих в настоя-
настоящее время .предрассудков.
Математика —это язык, который позволяет задавать
вопросы в удивительно компактной форме, используя
абстрактно-символическую форму записи. Допустим, что
исследователь сформулировал свою задачу, записав мо-
модель т]=тр(х, в), в которой он хочет экспериментально
оценить вектор параметров в . В такой постановке зада-
задачи приведенная выше модель — это просто хорошо по-
поставленный вопрос. Его предпосылка — это четкое разде-
разделение зависимых и независимых переменных, ответствен-
ответственных за лротекание изучаемого процесса, и аналитиче-
аналитическая запись самой модели, вопрошающая часть — задание
вектора параметров, подлежащего численному оценива-
122
нию. При недостатке априорных "знаний предпосылка
вопроса может быть ослаблена — вместо одной модели
можно задать несколько конкурирующих моделей или
вместо одного небольшого набора независимых перемен-
переменных можно задать большое их множество, из которого
путем отсеивающего эксперимента нужно отобрать дей-
действительно значимые.
Изменение предпосылки вопроса немедленно приво-
приводит к изменению его вопрошающей составляющей. В раз-
разделе 3 гл. I обращено внимание на то, что даже самая
простая задача — взвешивание трех объектов на весах —
может стать объектом планирования, если только зада-
задана модель. Эта модель обязательно содержит утверж-
утверждающую часть — в случае взвешивания это полиномиаль-
полиномиальная модель, не содержащая членов взаимодействия
(исходя из априорных сведений, исследователь утверж-
утверждает, что отсутствует взаимодействие — это предпосылка
вопроса). Исследователь априори может и ничего не
знать о механизме изучаемого явления, но вопрос все же
может задать, исходя, скажем, из некоторых знаний
о том, как может быть устроена логика некоего «слепо-
«слепого» обследования. Примером этого может служить мо-
модель для постановки отсеивающего эксперимента в за-
задачах фармакологического выделения терапевтически
активных или токсических /препаратов (подробнее об
этом см., например, раздел 2 гл. VI этой книги; там опять-
таки читатель легко выделит в модели утверждающую
¦и вопрошающую части).
Можно говорить и о иерархии вопрошающих состав-
составляющих, связанных с математической моделью как воп-
вопросом. Если на первую ©опрошающую составляющую
в написанной выше модели получен ответ — найдены
числовые оценки вектора параметров в, то немедленно
появляется вторая—иерархически выше стоящая вопро-
вопрошающая составляющая: нужно оценить, как модель
описывает изучаемый процесс (проверить ее адекватность
и пр.). При этом оценка параметров превращается уже
в утвердительную составляющую нового вопроса. Если
модель оказалась адекватной, то информация войдет
в утверждающую часть вопроса и появится новая вопро-
вопрошающая составляющая, которая в данном случае
может быть сформулирована так: где находится экстре-
экстремум? Как выглядит поверхность отклика в области
экстремума?
4* Зак. 138
123
Может быть каждую научную гипотезу, особенно,
если она записана математически, 'можно рассматривать
как вопрос. Один из авторов этой работы предложил
вероятностную модель семантики обыденного языка,
используя теорему Бейеса [112]:
где
Р Ш) = кр (ц) Р
—априорно заданная дифференциальная
функция распределения смысла слова ц;
— функция правдоподобия, задающая распре-
распределение смыслового содержания фразы у
три условии, что мы обращаем внимание в
ней на смысл слова ц;
— апостериорная вероятность, задающая рас-
распределение смысла слова р, в фразе у.
Сейчас заметим только, что в глубоком смысле пред-
предпосылкой этой модели, рассматриваемой как вопрос, яв-
является утверждение о дискретности нашего языка и не-
непрерывности сознания [ИЗ]. Вопрошающая составляю-
составляющая вопроса направлена на выявление того, как, исходя
из записанной модели, можно объяснить все многообра-
многообразие нашего речевого поведения.
Наверное, можно было бы построить вполне содер-
содержательную классификацию моделей, рассматривая их
как вопросы. Но мы к этому еще не готовы. Ограничим-
Ограничимся здесь отдельными беглыми замечаниями. Одним из
примечательных классов моделей являются классифи-
классификационные. Они естественным образом делятся на моде-
модели логических классификаций1 (примером этого явля-
является библиотечная классификация УДК) и модели чис-
численной таксономии (метод главных компонент, клас-
кластер-анализ...). Характерной особенностью этих моделей
является то, что они описывают наблюдаемые явления
вне причиннонследственных связей. Модели числовой
таксономии приятны своей «нищетой». Их предпосылки
предельно бедны; наблюдаемые переменные не делятся
на зависимые и независимые — -все ограничивается тем,
что они перечисляются и для них задается метрика, да-
далее выбирается (в некоторых моделях) оравило остано-
останова в самой процедуре классифицирования, вопрошаю-
вопрошающая часть свободна от больших претензий — все ограни-
ограничивается поиском иерархии таксонов в императивно
заданной метрике.
Любопытно отметить, что и вероятностные модели
задают вопрос лишь о размыто-поведенческом описании
мира, часто вне причинно-следственных связей. Когда
появляется необходимость задать вопрос в его причин-
причинно-следственной постановке, то сразу же появляются
дифференциальные уравнения. Интересна наметившаяся
сейчас попытка иоаеяъзования ЭВМ для построения мо-
моделей с бедной утверждающей частью и претендующей
на многое вопрошающей частью. Примером этого может
¦служить американская программа по комплексному изу-
изучению пяти экосистем тундры, степей, пустыни и лист-
лиственного и хвойного лесов. Строились всеохватывающие
модели, разбиваемые на блоки, включающие общее чис-
число параметров, доходящее до тысячи, при очень слабых
исходных теоретических предпосылках. Модели должны
были дать ответ на вопрос о том, как ведут себя изу-
изучаемые экосистемы. Что из этого получилось? Судить
об этом еще преждевременно. Недавно появился в печа-
печати резко критический анализ всей этой деятельности,
основанный на тщательном изучении материала по трем
из названных выше экосистем [115].
Можно, наверное, было бы сформулировать некие
критерии того, что есть хорошая модель. Но здесь мы
опять должны ограничиться фрагментарными замеча-
замечаниями. Левине [116] говорит, что в моделях происхо-
происходит обмен между их всеобщностью, точностью и реа-
реалистичностью1. Усиление одной из этих позиций немед-
немедленно ведет к ослаблению других. Мы могли бы здесь
добавить, что при заданной утвердительной части и не-
некоторых фиксированных экспериментальных возможнос-
возможностях ответ получается тем определеннее, чем слабее тре-
требования, задаваемые вопрошающей частью модели. От-
Отсюда следует, что может так оказаться, что при описа-
описании химических процессов простые полиномиальные мо-
модели могут нам дать больше, чем модели, налииейные
по параметрам, претендующие на адекватное описание
механизма явлений. О трудностях, возникающих при
построении моделей, нелинейных по параметрам, мы
уже много говорили в предыдущей главе.
Сейчас специалистов по планированию эксперимента
охватило некоторое разочарование. Все было очень хо-
1 Подробнее об этом см. в [114].
124
1 Ничего подобного не наблюдается для «законов природы»; в
в этом их отличие от моделей, описывающих диффузионные систе-
системы [8].
125
рошо, когда речь шла о планировании так называемых
экстремальных экспериментов. Здесь все представля-
представлялось ясным — модель, предложенная Боксом и Уилсоном
в 1951 г., оказалась типовой1 для очень многих ситуа-
ситуаций, особенно в технических областях знаний. Позднее
появилось еще несколько типовых моделей, скажем,
в задачах отсеивания. Усилия нужно было направить не
только и не столько на выбор и (построение модели
(хотя и в этом случае эта деятельность все же осталась
творческой2), сколько на всю последующую чисто тех-
техническую составляющую исследовательской деятельнос-
деятельности. Но все это научились делать многие эксперимента-
экспериментаторы сами, без /посторонней помощи. Специалисты яо
планированию эксперимента должны теперь превра-
превращаться в модельеров. В этом может быть успех и их
личной 'научной деятельности, и всего направления
в целом.
Можно ли учить моделированию, если это скорее
искусство, чем наука, и если можно, то чему учить? На-
Написать глубоко интимное письмо другу — это тоже ис-
искусство и все же в школах учат детей шеать и знают,
как учить, хотя и не всех могут этому научить. Готовить
модельеров — это учить тому, как компактно, в симво-
символической форме могут быть представлены прежние,
обычно расплывчато задаваемые знания и как записать
вопрошающую составляющую модели так, чтобы она
находилась в каком-то разумном соответствии с закла-
закладываемыми 'в нее предпосылками. Искусство модели-
моделирования в значительной степени определяется тем чувст-
чувством меры, которое (помотает уравновешивать знания
с тем, что хочется узнать.
1 Может быть математическая статистика и не пользуется боль-
большим признанием в науке только потому, что у многих профессиона-
профессионалов-статистиков есть тенденция сводить все многообразие реальных
задач к некоторым типовым моделям, таким как, скажем, модели
дисперсионного анализа.
2 Творческим процессом здесь является выбор одной из несколь-
нескольких типовых моделей, выбор зависимых и независимых переменных,
выбор той области пространства независимых переменных, где дол-
должен будет проводиться эксперимент, и т. д. Легко подсчитать, на-
например, что если погрешность прн выборе размаха варьирования
каждой независимой переменной составляет (—15в/о), то, например,
при оценке полиномиальных моделей второго порядка для пяти
факторов эффективность плана по О-критерню уменьшится пример-
примерно на 60% в пересчете на один параметр.
126
И все же исследователи, особенно исследователи
академических институтов, сравнительно редко прибе-
прибегают к построению моделей при проведении эксперимен-
экспериментальных работ. Это относится .и к физикам, несмотря
на глубокую математическую насыщенность теоретичес-
теоретической физики. Как можно это объяснить? Мы пытались
найти ответ на этот вопрос, проводя многочисленные бе-
беседы с экспериментаторами.
Некоторые физики говорят: нас модели сейчас не ин-
интересуют. У нас задача иная — пустить установку, кото-
которая бы породила новый мир явлений, дотоле не сущест-
существовавший на земле, и шосмотреть на то, что в этом мире
делается. Биологи иногда отвечают примерно так: мы
не задаем природе никаких вопросов, наша задача —
просто смотреть на то, что происходит в природе. Ис-
Исследователь, занимающийся выращиванием кристаллов,
говорит: модель отостроить трудно — невозможно осмыс-
осмыслить все многообразие факторов сразу, да и зачем это
делать — в лаборатории всегда чего-нибудь нет, надо
работать с тем, что есть, и смотреть, что получается.
Итак, все хотят просто посмотреть. Но что-то уви-
увидеть можно только тогда, когда на что-то направлено
внимание. Вопрос все-таки должен быть задан. И он,
конечно, всегда существует. Но он остается на глубоко
интуитивном, иногда даже невербализованном уровне.
Трудности, возникающие при попытке формализовать
вопрос, видимо, не связаны с уровнем математической
подготовленности. Физику это может быть так же труд-
трудно, как, скажем, врачу.
По-видимому, все дело в стиле мышления. И если
это так, то может оказаться, что все преимущества ма-
математической теории эксперимента практически окажут-
окажутся малоиснользуемыми.
ЗАКЛЮЧЕНИЕ
В этой небольшой книге мы попытались в едином,
логическом ракурсе шосмотреть на все существующее
сейчас многообразие идей и методов планирования экс-
эксперимента. Читатель видит, что здесь не удалось пост-
построить всеобъемлющей теории, хотя некоторые основные
идеи оптимальности эксперимента удается сформулиро-
сформулировать и проследить вполне отчетливо. Трудности построе-
127
ния общей всеохватывающей теории связаны с тем, что
в процессе экспериментальных исследований часто при-
приходится обращаться к таким приемам и такой поста-
постановке задач, которые не удается записать в виде отчет-
отчетливых математических моделей. Единственное, что уда-
удается в этом -случае,—.проводить обсуждение эксперимен-
экспериментальных процедур в системе хотя бы в какой-то степени
формализованных представлений. Сильная теория стро-
строится только для тех процедур экспериментального ис-
следовашя, которые удается представить математичес-
математическими моделями, исчерпывающим образом описывающи-
описывающими то, что предполагается изучить или сделать в про-
процессе этого исследования. Основная проблема состоит
в том, чтобы суметь глубоко формализовать, т. е. хоро-
хорошо осмыслить логически то, что мы хотим делать при
той или иной постановке задачи. Если это удается сде-
сделать, то дальше уже легко обсуждать вопрос об опти-
оптимальности. Планирование эксперимента-—это раздел
знаний, относящийся не только и не столько к матема-
математической статистике, сколько к логике.
Те, кто занимается методологией планирования эк-
эксперимента, конечно, никогда не пытаются формализо-
формализовать весь процесс экспериментального исследования.
Всегда неформализованными, должны оставаться таше
составляющие 'исследования, как постановка самой про-
проблемы и выбор математической модели. Последнее
включает, конечно, и выбор пространства независимых
переменных, -и выбор той его области, где должно будет
производиться экспериментальное исследование.
Одна из привлекательных особенностей математичес-
математической теории эксперимента — ее реалистичность. Теория
оказалась в состоянии встретиться с той неопределен-
неопределенностью в постановке задач, которая характерна для
человеческой деятельности даже в научных исследова-
исследованиях. Различная степень реальности в постановке задач
породила различную степень строгости теоретических
построений. Отсюда — фрагментарность этой теории. Ма-
Математическая теория эксперимента, как правило, не дает
однозначных, безусловно, оптимальных решений. К это-
этому, наверное, и не следует стремиться. Важно найти
разумное решение, т. е. решение, поддающееся логи-
логическому осмысливанию, и, егли оно найдено, оказыва-
оказывается возможным проводить обсуждение всей стратегии
исследования с учетом особенностей той или иной кон-
конкретной задачи.
128
Несмотря на всю фрагментарность математической
теории эксперимента, она получила очень широкий от-
отклик в своем практическом преломлении. Сейчас с ис-
использованием планирования эксперимента выполнено
во всем мире более 10 000 работ. Эти исследования ох-
охватывают самые разнообразные области эксперимен-
экспериментальной деятельности—почти все разделы точных и гу-
гуманитарных наук; все разделы инженерно-технических
исследований, включая и исследования, проводимые не-
непосредственно на действующих фабриках и заводах;
в медицине как непосредственно в процессе лечения
(это ведь также экспериментальная деятельность), так
и при отборе терапевтически активных препаратов;
в сельскохозяйственных исследованиях; в криминалис-
криминалистике; в педагогической деятельности и т. д.
В одних случаях с помощью планирования экспери-
эксперимента удалось избежать систематических ошибок, воз-
возникающих от скрытого влияния неконтролируемых пе-
переменных; в других случаях при решении экстремальных
задач удалось значительно повысить выход нужного
продукта, иногда даже в сотни раз (при этом экспери-
экспериментаторы не боялись включать в программу сразу до
15 независимых переменных, а иногда даже и больше).
Опыт показывает, что если при использовании традици-
традиционных методов исследования на решение экстремальных
задач обычно уходило около двух лет, то с помощью
планирования эксперимента эти задачи решаются за
несколько месяцев. Имеются многочисленные примеры
применения планирования эксперимента непосредственно
на заводах, когда эволюционное планирование или симп-
симплекс-процедуры используются в системе автоматического
регулирования [117]. В то же время имеется уже и зна-
значительный опыт применения планирования эксперимента
в чисто теоретических исследованиях, когда речь идет
о выборе одной из нескольких конкурирующих моделей
для описания механизма явлений, например механизма
химических реакций.
Чем вызван этот успех? На этот вопрос можно отве-
ответить буквально в нескольких словах: применение пла-
планирования эксперимента требует высокой степени
формализации — это заставляет исследователя стремить-
стремиться к четкому логическому осмысливанию всей процедуры
исследования даже в очень размытых ситуациях. Такое
осмысливание оказывается возможным сделать в системе
канонических представлений, задаваемых существую-
129
щей теорией эксперимента, которую мы попытались в
общих чертах изложить в этой книге. Далее следует
выбор оптимальных планов и процедур, что позволяет
значительно сократить время на само исследование.
Результаты исследования и их статистическая оценка
представляются в некоторой стандартной форме по
заранее готовым клише. Все это вместе взятое и прл-
водит к резкому повышению эффективности экспери-
экспериментальных исследований. Успех планирования экспе-
эксперимента во многом, возможно, определяется и тем, что
в исследованиях с четко выраженной прикладной
направленностью можно ограничиться построением
самых простых — полиномиальных моделей.
Теперь уместно поставить такой вопрос — что сейчас
является важнейшей задачей в дальнейшем развитии
идей теории эксперимента? Ответ будет таким: слож-
сложность природы бросает свой вызов планированию экспе-
эксперимента. Все обстоит вполне благополучно с построе-
построением сравнительно простых моделей. Но исследователь
стремится строить все более сложные—многопарамет-
рические, нелинейные по параметрам модели. Трудно-
Трудности, которые здесь возникли (см. гл. VIII), оказались
столь серьезными, что они заставляют радикально
изменить наше отношение к построению математических
моделей. Перед нами, как мы уже об этом говорили
выше, возникает совершенно новая задача — исполь-
использовать математическую статистику для множественной,
развернутой интерпретации результатов наблюдений. В
более широком плане эту проблему можно сформулиро-
сформулировать и так: имеется ли хорошая математическая мо-
модель? Развитие математической теории эксперимента
хначалось с вопроса — что есть хороший эксперимент?
Но зачем хорошо ставить эксперимент, если плохо выб-
выбрана модель? Обсуждению того, что есть хорошая
модель, посвящена целиком гл. IX. Но проблема,
конечно, остается нерешенной.
Попробуем теперь посмотреть на все сказанное
выше в очень широкой исторической перспективе.
Планирование эксперимента началось с того, что неко-
некоторые комбинаторные схемы, приятные своей симмет-
симметричностью, нашли применение 'как планы эксперимен-
эксперимента. К удивлению, мы узнаем, что некоторые из этих
схем уже необычайно давно применялись для совсем
иных задач. Вот один из примеров: знаменитая древне-
древнекитайская «Кинга перемен» начинается с 64 гексаграмм
180
такого типа, как приведенная на рисунке [118]. Гексо-
граммы построены в двоичной системе знаков и пред-
представляют собой транспонированные строки плана
эксперимента 2е.
Что заставило мыслителей древнего Китая обрати-
обратиться к симметричным построениям такого типа? Из
интерпретации гексограмм, приведенной в тексте «Кни-
«Книги перемен», прямой ответ на этот вопрос получить не
просто, хотя из общих положений
семантики следует, что смысл знака
раскрывается в тексте во взаимо-
взаимодействии с другими знаками [112].
В задачах планирования экспери-
эксперимента симметричные расположения
оказались в одном тексте вместе с
вектор-столбцами наблюдений, отяг-
отягченными ошибками наблюдений. В
этом тексте выявились особые свойства этих симметрич-
симметричных расположений, ранее неизвестных тем, кто занимал-
занимался комбинаторной математикой. Планирование экспери-
эксперимента на раннем этапе своего развития возникло просто
как особое осмысливание ранее хорошо известных зна-
знаковых расположений. В новых текстах оказался открыт
новый смысл для старых знаковых систем. Но и сейчас,
естественно, есть ситуации, в которых симметричные
знаковые1 расположения используются вне всякой связи с
теми критериями оптимальности, которые появляются
тогда, когда в текст включаются данные, отягченные
ошибками. Планирование эксперимента можно рассмат-
рассматривать как некую конструкцию, возникшую в результате
того, что вероятностные представления оказались спро-
спроектированными на комбинаторную математику.
В этой книге неуместно да и, пожалуй, просто
невозможно сделать обзор всего многообразия работ, в
которых использовалось планирование эксперимента.
Поскольку книга выходит в издательстве «Металлур-
«Металлургия», то мы ограничимся здесь хотя бы тем, что скажем
несколько слов о тех областях металлургии, где сейчас
успешно применяются эти методы. В упоминавшейся уже
библиографии [2] приводится 101 работа, относящаяся
к исследованиям в металлургии. Из них 51 работа
относится к вопросам металловедения и термической
обработки, а остальные — к металлургии цветных и
черных металлов. В этих публикациях рассматривались
такие задачи: исследование влияния термической обрэ-
m
ботки на структуру и свойства деформированного чугу-
чугуна; изучение диаграмм состояния трехкомпонентных
систем; оптимизация состава литейных сплавов ниобия;
влияние зерна на ползучесть платинородиевых сплавов;
выбор легирующего комплекса при разработке сталей;
синтез жаропрочных сплавов на никелевой основе; ис-
исследование влияния различных элементов на механи-
механические свойства медных сплавов; синтез сплавав на
медной основе; влияние раскисления на механические
свойства литейных сплавов; оптимизация режима
термоультразвукового отпуска; исследование влияния
легирующих элементов на свойства штамповых сталей;
выбор оптимального состава рельсовой стали; испыта-
испытание режимов мартеновских лечей; изучение кристалли-
кристаллизации примесей в теллуриде висмута; оптимизация
управления мартеновским производством; оптимизация
условий образования субхлоридов титана; исследование
плавки высокопрочных сталей для роторов асинхронных
двигателей; получение синтетического чугуна с заданны-
заданными свойствами; изучение влияния технологических фак-
факторов на угар марганца и хрома во время продувки ста-
стали кислородом в дуговой электропечи; изучение процесса
восстановления вольфрамового ангидрида водородом;
оптимизация агломерационного производства; получение
силицидов ниобия и тантала совместным восстановле-
восстановлением хлоридов водородом; изучение влияния различных
факторов на показатели доменного процесса; изучение
кристаллизации ванадия в бестагельной зонной плавке
и т. д.
Даже беглый просмотр списка говорит о большом
разнообразии тех металлургических и металловедческих
задач, в которых использовалось планирование экспери-
эксперимента. Напомним, что это —список задач только из
отечественных публикаций и всего за два года.
<3
з-
3
а;
1-4
К
о
§
о,
fc:
3
а
о
С
W
со
о
<
с
К
о
а
w
н
X
ооот^оюооюоооос^юсосоюоо
ooo>o>oooh-oooooot~ooooooo>h-
as as aS
I IS|:i|l-HiSl
133
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУВЕ (л = 3, ft =
Таблица 2
= 10)
Название плана
М
tr
?>-оптимальный*
А -^оптимальный* . . . ......
^-оптимальный*
Q-оптимальный*
Симметричный квази'-Д-оптимальный*
В»
Насыщенный точный ?>-оптнмальный .
Насыщенный точный Л-оптимальный .
Насыщенный точный /?-аптимальный .
Несимметричный квази-Д-оптимальный .
Хартли
Трехуровневый Бокса — Бенкена . . .
Насыщенный Рехтшафнера
Композиционный по отношению к пла-
планам главных эффектов
3"* '...".*'.'
Ротатабелышй Бокса** :....,
Ортогональный* : . . . .
Минимаксный план для проверки не-
неадекватности линейной модели* . . .
13
14
10
10
10
10
11
15
10
13
27
20
15
16
,45
,53
,82
,55
,62
¦ 47
,54
,54
,59
,58
,87
,65
,58
,47
,50
2,78
1,86
1,68
,59
,35
,47
,34
,62
,41
,56
,55
,56
,77
,92
,40
,94
,57
,42
2,27
1,54
1,40
1,93
1,73
1,95
1,74
2,11
1,79
1,96
1,93
2,02
2,28
2,41
1,85
2,42
1,93
1,78
3,30
2,18
1,84
3,80
2,65
2,24
2,42
4,81
2,90
3,70
3,51
3,14
4,80
3,54
3,03
5,06
3,73
3,33
4,47
3,67
2,73
1,00
0,95
0,80
0,94
0,90
0,99
0,94
0,94
0,91
0,92
0,78
0,88
0,92
0,99
0,97
0,52
0,78
0,86
0,84
0,99
0,91
1,00
0,83
0,95
0,86
0,86
0,86
0,76
0,70
0,96
0,69
0,85
0,94
0,59
0,87
0,96
0,90
1,00
0,89
0,99
0,82
0,97
0,88
0,90
0,86
0,76
0,72
0,94
0,72
0,90
0,97
0,52
0,79
0,94
0,59
0,84
1,00
0,93
0,47
0,77
0,60
0,64
0,72
0,47
0,63
0,74
0,44
0,60
0,67
0,50
0,61
0,82
0,67
0,78
0,08
0,22
0,76
1,09
2,58
2,56
0,26
0,78
1,00
0,49
0,00
0,68
0,41
1,14
1,17
1,18
1,45
1,12
1,28
1,72
,51
,10
2,47
,21
,17
,17
,17
1,14
Таблица 3
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУБЕ (и = 4. 6 = 15)
Название плана
м-
tr
Vna
е А
Д-опти'мальный*
Л-оптимальный*
?-оптим>альный*
Q-оптимальный*
Симметричный квази-О-оптимальный* .
54 :
Насыщенный точный D-оптимальный .
Насыщенный точный Л-оптимадьный .
Несимметричный квази-?>-оптимальный .
Несимметричный квази-В-оптимальный
Хартли
Трехуровневый Бокса — Бенкена** . .
Насыщенный Рехтшафнера
Композиционный по отношению к пла-
планам главных эффектов
Насыщенный ССП
3"* !
Ротатабельный Бокса**
Ортогональный*
42
24
15
15
15
16
17
27
15
17
16
81
31
25
1,43
1,52
1,76
1,54
1,46
1,48
1,52
1,54
1,53
1,53
1,85
1,99
1,60
1,54
2,26
1,52
3,61
2,28
1,71
1,38
1,58
1,37
1,67
1,50
1,79
1,71
1,93
1,91
2,12
1,69
1,81
1,85
2,56
1,46
3,10
1,86
1,95
1,71
2,01
1,72
1,90
1,96
2,07
2,01
2,36
2,30
2,53
2,29
2,34
2,22
3,03
1,76
4,32
2,66
4,46
2,83
2,24
2,51
4,72
3,46
4,85
4,45
4,60
4,75
4,26
4,31
4,15
4,38
4,58
3,63
5,57
4,57
1,00
0,94
0,84
0,93
0,98
0,97
0,94
0,93
0,94
0,94
0,77
0,72
0,89
0,93
0,63
0,94
0,40
0,63
0,80
0,99
0,87
1,00
0,82
0,91
0,76
0,80
0,71
0,72
0,65
0,81
0,76
0,74
0,54
0,94
0,44
0,74
0,88
1,00
0,85
0,99
0,90
0,87
0,83
0,85
0,72
0,74
0,68
0,75
0,73
0,77
0,56
0,97
0,40
0,64
0,50
0,79
1,00
0,89
0,48
0,65
0,46
0,50
0,49
0,47
0,53
0,52
0,54
0,51
0,49
0,62
0,40
0,49
1,10
1,14
0,08
0,65
1,66
0,81
2,01
1,83
3,58
0,00
1,25
1,83
1,71
0,62
0,00
1,07
1,09
1,15
1,15
1,15
1,07
0,23
1,28
1,28
1,39
1,32
1.48
1,52
1,50
1,12
1,14
1,12
Таблица 4
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУБЕ (л = 5, * = 21)
Название плана
N
50
42
26
28
30
27
26
40
46
21
23
22
22
243
52
32
43
27
32
1м-Ч
1,40
1,50
С
,95
1,52
1,42
,48
,51
,48
1,47
,53
1,48
1,43
2,44
,49
,95
2,61
2,63
1,52
4,79
3,91
2,74
2,68
1,49
d
,80
,40
,63
,39
,74
,72
,50
,95
,96
,51
,64
,72
2,09
,76
2,78
2,82
3,15
1,48
4,32
3,41
2,30
2,19
1,54
tr
1,97
1,68
2,05
1,70
1,88
2,31
1,96
2,14
2,15
1,99
2,06
1,94
2,79
2,37
3,36
3,40
3,80
1,74
5,78
4,57
3,26
2,99
1,92
^max
5,13
2,98
2,24
2,59
5,20
4,58
3,61
5,70
5,72
3,67
3,78
4,67
4,25
4,73
7,10
5,12
10,3
3,90
7,21
5,66
5,85
4,57
3,44
eD
1,00
0,93
0,72
0,92
0,99
0,95
0,93
0,95
0,95
0,92
0,95
0,98
0,57
0,94
0,72
0,54
0,53
0,92
0,29
0,36
0,51
0,52
0,94
JQ
0,77
0,99
0,85
1,00
0,80
0,81
0,93
0,71
0,68
0,92
0,85
0,81
0,66
0,79
0,50
0,49
0,44
0,94
0,32
0,41
0,60
0,64
0,90
'A
0,85
1,00
0,82
0,99
0,89
0,73
0,86
0,79
0,78
0,84
0,82
0,87
0,60
0,71
0,50
0,49
0,44
0,97
0,29
0,37
0,52
0,56
0,88
'E
0,44
0,75
1,00
0,86
0,43
0,49
0,62
0,39
0,39
0,61
0,59
0,48
0,53
0,47
0,32
0,44
0,22
0,57
0,31
0,40
0,38
0,49
0,65
д
1,20
1,43
0,08
0,83
2,72
2,34
1,47
1,56
1,46
—
1,39
0,50
2,64
9,89
2,80
3,83
0,57
0,00
0,00
1,90
1,20
1,36
^оптимальный*
Л-оптимальный*
?-оптимальный*
Q-оптимальный*
Симметричный квази-?)-оптимальный*
* Б*
Вь с полурепликой*
Несимметричный квази-П-оптимдльный
Несимметричный квази-D-оптимальный
Хартли*
Хоука
Несимметричный квази-?>-оитим,альный
Трехуровневый Бокса — Бенкена*
Насыщенный Рехтшафнера . . .
Вестлейка
Насыщенный ССП (а)
Насыщенный ССП (б)
3"*
Ротатабельный Бокса** ....
Ротатабельный с полурепликой** .
Ортогональный*
Ортогональный с полурепликой* .
Композиционный по отношению к пла-
планам главных эффектов
1,06
1,08
1,13
1,09
1,05
1,08
1,32
1,29
1,06
1,15
1,24
1,09
2,67
1,61
1,29
1,08
1,11
1,11
1,08
1,09
1,15
Таблица 5
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУБЕ (л = 6, 4 = 28)
Название плана
tr
D-оптимальный*
/4-ОПТИМЙЛЬНЫЙ*
?-оптимальный*
Q-оптимальный* .
Симметричный квази-?>-оптимал1.ный*
Bl •
Be с полурепликой*
Несимметричный квази-?>-оптимальный
Несимметричный квави-?)-оптимальный
Хартли
Трехуровневый Бокса — Беикена* . .
Насыщенный Рехтшафнера
Насыщенный ССП (б)
3"* :
Ротатабельный Бокса**
Ротатабельный Бокса с полурепликой**
Ортогональный*
Ортогональный с полурепликой* . . .
66
76
44
29
35
29
54
28
29
729
91
53
77
45
,38
,48
,99
,50
,38
,53
,48
,60
,51
,98
,07
,53
,61
52
1,88
1,41
1,80
6,42
3,14
6,07
4,65
2,86
2,65
98
66
07
67
91
84
28
83
39
15
28
59
31
72
83
02
3,99
3,56
5,81
3,14
2,24
2,67
5,74
6,16
4,69
7,66
6,58
5,47
3,91
5,44
4,92
15
,54
,28
,68
5,80
1,00
0,93
0,69
0,92
1,00
0,90
0,93
0,86
0,91
0,70
0,67
0,90
0,53
0,91
0,21
0,27
0,42
0,44
0,74
0,99
0,83
1,00
0,77
0,67
0,82
0,59
0,64
0,48
0,78
0,72
0,48
0,93
0,16
0,30
0,49
0,53
0,84
1,00
0,80
0,99
0,87
0,58
0,73
0,59
0,70
0,53
0,73
0,64
0,50
0,96
0,21
0,28
0,42
0,47
0,39
0,71
1,00
0,84
0,39
0,36
0,48
0,29
0,34
0,41
0,57
0,41
0,46
0,54
0,23
0,31
0,29
0,39
1,49
1,81
0,07
1,24
4,77
3,36
4,74
2,59
4,03
0,61
4,32
1,59
0,64
0,00
0,00
2,84
1,56
1,05
1,17
1,12
1,06
1,04
1,04
>,64
1,57
1,42
1,10
1,14
1,42
1,06
1,08
1,08
1,07
1,07
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА КУБЕ (л=7, fe=36)
Таблица &
Название плана
М
?)-оггпшальный*
.Д-оптимальный*
/•-оптимальный*
Q-оптимальный*
Симметричный квази-?)-опти'мальный*
в;
В7 с полурепликой*
Хартли
Трехуровневый Бокса — Бенкена** .
Насыщенный Рехтшафнера __
Вестлейка
Насыщенный ССП
Зп*
Ротатабельяый Бокса** . . .
Ротатабельный с полурепликой**
Ортогональный*
Ортогональный с полурепликой*
—
—
—
116
142
78
47
62
36
41
37
2187
163
92
143
79
1,35
1,46
2,02
1,48
1,37
1,50
1,47
1,90
2,30
1,61
2,00
2,23
1,53
8,58
6,77
3,80
3,64
1
1
1
1
1
2
2
3
2
2
3
2
1
8
6
3
3
,94
,42
,74
,40
,75
,64
,С6
,39
,00
,13
,15
,44
,51
.42
,42
,61
,21
1
1
2
1
1
3
2
3
2
2
3
2
1
,98
,63
,09
,65
,80
,62
,77
,58
,49
,83
,60
,70
,70
10,5
8
4
4
,07
,94
,25
6,50
3,29
2,24
2,76
5,89
8,43
6,24
6,91
4,33
6,17
10,3
3,61
4,39
12,5
9,59
10,3
7,59
1,00
0,92
0,67
0,91
0,98
0,90
0,92
0,71
0,59
0,84
0,68
0,60
0,88
0,16
0,20
0,36
0,37
0,72
0,99
0,80
1,00
0,80
0,53
0,68
0,41
0,70
0,66
0,44
0,57
0,93
0,17
0,22
0,39
0,44
0,82
1,00
0,78
0,99
0,91
0,45
0,59
0,46
0,65
0,58
0,45
0,60
0,96
0,16
0,20
0,33
0,38
0,34
0,68
1,00
0,81
0,38
0,27
0,36
0,32
0,52
0,36
0,22
0,62
0,51
0,18
0,23
0,22
0,30
1,70
2,18
0,06
1,21
4,97
7,98
0,00
5,56
5,90
4.98
0,81
0,00
0,00
—
2,91
1,04
1,10
1,11
1,05
1,03
1,03
1,35
1,12
1,18
3,06
1,27
1,05
1,07
1,07
1,05
1,05
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА ШАРЕ (л=2, fe=6)
Таблица 7
Название плана
N
1м
tr
-О-оптимальный** . .
А -оптимальный* . . .
/^-оптимальный* . .
Ротатабельный Бокса**
Ортогональный* . .
Хартли
Насыщенный ССП** .
13
9
7
7
99
04
14
10
33
10
2,00
1,57
1,49
1,55
1,52
1,73
1,74
1,61
2,57
2,42
2,50
2,48
3,06
3,01
2,65
4,43
3,51
3,16
3,61
4,71
5,17
4,77
1,00
0,98
0,93
0,95
0,85
0,95
1,00
0,94
1,00
0,97
0,98
0,79
0,80
0,91
0,71
0,9Э
1,00
0,88
0,67
0,61
0,66
0,00
0,00
1,06
0,15
0,00
1,49
1,23
1,26
1,67
1.54
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА ШАРЕ (л=3, fc = 10)
Таблица 8
Название плана
0-оптимальиый**
Л-оптимальный* . . .
?-оптимальный* ...
"Симметричный квази-?)-оптимальный* .
Ротатабельный Бокса** . .
Трехуровневый Бокса — Беикена**
Ортогональный* ....
Хартли . .
Насыщенный ССП* . . .
3"» . . . .....
N
13
20
15
15
11
11
27
1м-1 |
2,69
2,74
2,88
2,73
2,90
2,78
3,16
2,97
2,96
3,43
d
1,92
1,85
1,94
2,03
1,93
1,89
2,19
2,32
2,32
2,38
tr
3,46
3,29
3,40
3,60
3,49
3,32
4,03
4,46
4,15
4,50
Ятах
6,52
4,87
4,12
7,38
4,74
4,79
6,05
6,82
6,80
6,83
1,00
0,98
0,93
0,98
0,93
0,97
0,85
0,91
0,91
0,78
'А
0,95
1,00
0,97
0,91
0,94
0,99
0,82
0,74
0,79
0,73
'в
0,63
0,85
1,00
0,56
0,87
0,86
0,68
0,60
0,61
0,60
д
0,00
0,69
0,00
0,66
1,74
0,77
0.77
2,01
V
1,51
1,45
1,24
1,19
1,17
1,91
1,70
1,16
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА ШАРЕ (л=4. *=15)
Таблица 9
Название плана
jD-оптимальиый*
Л-оптимальный*
^-оптимальный* . . ...
Симметричный кваэн-?>-оптимальиый* .
Ротатабельный Бокса** . . . .
Ротатабельный симплексно-суммируе-
мый** . .
Симплексио-суммнруемый НССП 112 а**
Симплексно-суммируемый НССП 112 6**
Трехуровневый Бакса — Бенкена** . .
Ортогональный*
Хартли
Насыщенный ССП . ...
3"* !
N
26
31
39
25
25
27
25
17
16
81
|ягЧ
3,45
3,50
3,67
3,45
3,61
3,89
3,83
3,83
3,47
3,97
3,76
4,04
4,60
d
2,29
2,24
2,36
2,27
2,28
2,44
2,41
2,41
2,23
2,68
2,78
3,35
3,09
tr
4,39
4,19
4,33
4,33
4,32
4,72
4,64
4,64
4,24
5,03
5,48
5,88
5,98
max
8,86
6,33
5,10
8,28
5,57
6,12
6,00
6,00
6,97
7,62
9,40
10,3
8,95
1,00
0,99
0,94
1,00
0,96
0,89
0,90
0,90
0,99
0,87
0,92
0,85
0,75
еА
0,95
1,00
0,97
0,99
0,97
0,89
0,90
0,90
0,99
0,83
0,76
0,71
0,70
'е
0,58
0,81
1,00
0,62
0,92
0,83
0,85
0,85
0,73
J0,67
0,54
0,50
0,70
д
0,00
0,00
0,00
0,00
0,00
0,00
0,00
2,59
1,77
5,75
3,10
1,50
1,46
1,14
1 14
1,14
1,14
1,33
1,12
1,91
2,47
1,11
Таблица 10
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО ПОРЯДКА НА ШАРЕ (л =8. 4=21)
Название плана
N
I—.—Ч
2
2
2
2
2
2
3
2
3
3
2
3
3
4
4
d
68
,64
,78
,90
,86
,74
,01
,66
,24
,11
,76
,62
,52
,50
,27
5,
5
5
5
5
5
6
5
6
6
5
7
7
7
7
г
34
12
29
78
67
39
03
35
15
00
,65
,48
,33
,60
.48
11
7
6
7
7
6
7
7
9
8
12
13
13
14
11
пах
4
,89
,09
,21
,07
,74
,54
,13
.74
,13
,9
,1
,2
,1
,1
t
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
D
00
99
94
88
90
94
,85
,98
,88
,86
,99
,87
,88
,82
.73
t
0,
1,
0,
0
0
0
0
0
0
0
0
0
0
0
0
A
96
00
97
89
90
95
85
96
83
,85
.91
,68
.70
.67
,68
t
0,
0,
1,
0
0
0
0
0
0
0
0
0
0
0
0
E
53
77
00
84
86
90
81
,85
,62
,75
,47
,46
,46
,43
,55
L
0,
0,
0
0
0
0
9
2
0
1
5
7
4
V
00
00
00
00
00
61
99
,41
,70
,76
,40
,84
,16
D-оптимальный**
Л-оптимальный*
Е-оптимальный*
Ротатабельный Бокса**
Ротатабельный Бокса с полурепликой**
Ротатабельный симплексно-суммируе-
мый**
Снмплексно-суммируемый НССП 112**
Трехуровневый Бокса — Бенкена* . . .
Ортогональный*
¦Ортогональный с полурепликой* . . .
Хартли*
Вестлейка A)
Вестлейка B)
Насыщенный ССП
Зп* »
52
32
40
32
46
43
27
27
23
23
22
243
4,24
4,30
4,50
4,79
4,71
4,51
4,97
4,35
4,82
4,95
4,28
4,89
4.81
5,18
5,82
1,51
1,11
1,11
1,11
1.Н
1,24
1,08
1,08
1,74
2,27
2,07
2,10
1,08
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО
Название плана
ПОРЯДКА НА ШАРЕ (л=
Таблица И
..D-оптнмальный**
Л-оптимальный*
^-оптимальный*
Ротатабельный Бокса**
Ротатабельяый Бокса с полурепликой**
Ротатабельный
мый** . .
снмплекено-суммируе-
Снмплексно-суммнруемый 122** . .
Трехуровневый Бокса — Бенкена* . .
Ортогональный*
Ортогональный с полурепликой*
Хартли
Насыщенный ССП
3«*
91
53
65
57
54
77
45
29
29
729
5,06
5,12
5,34
6,42
5,36
5,62
6,09
5,30
5,73
5,73
5,69
6,36
3,08
3,05
3,21
3,79
3,17
3,32
3,59
3,22
3,95
3,60
4,02
5,70
6,30
6,06
6,25
7,83
6,37
6,73
7,37
6,42
7,51
6,98
8,18
9,27
8,97
14,20
9,52
7,07
9,54
7,72
8,29
9,00
8,30
12,8
10,1
14,4
17,9
13,2
1,00
0,99
0,95
0,79
0,94
0,90
0,83
0,96
0,88
0,88
0,89
0,80
0,71
0,96
1,00
0,97
0.77
0,95
0,90
0,82
0,94
0,81
0,87
0,74
0,65
0,68
0,50
0,74
1,00
0,74
0,92
0,85
0,79
0,85
0,55
0,70
0,49
0,40
0,54
0,00
0,00
0,00
0,00
0,00
0,93
5,27
3,83
2,41
10,80
5,04
1,50
1,08
1,08
1,08
1,08
1,12
1,07
1,07
2,00
1,99
1.06
Таблица 12
ХАРАКТЕРИСТИКИ ПЛАНОВ ВТОРОГО
Название плана
D- оптимальный** ... ....
Л-оптимальный* .
f-оптнмальный*
Ротатабельный Бокса**
5 Ротатабельный Бокса с полуреплнкой**
Ротатабельный симплексно-суммируе-
мый** .
Симплексно-сумМ'Нруемый 113а** . . .
Трехуровневый Бокса — Бенкена* . . .
Ортогональный*
Ортогональный с полурепликой* . . .
Хартли
3"* :
N
163
92
66
77
62
143
79
47
41
37
2187
1м-Ч
5 90
5,97
6,19
8,69
6,77
5,93
7,91
6,01
6,61
6,59
6,56
7,06
7 56
8,37
d
3 49
3,47
3,64
5,05
3,90
3,56
4,57
3,47
4,89
4,24
4,72
5,76
6,94
5,25
ПОРЯДКА
tr
7 27
7,02
7,21
10,7
. 8,07
7,27
9,62
7,11
9,25
8,19
9,39
12,7
10,9
10,5
НА ШАРЕ
^тах
17 2
11,21
8,06
12,7
9,59
8,62
11,5
9,46
17,3
13,1
19,6
41,8
21 7
15,3
(л=7, t
eD
1 00
0 99
0 95
0 68
0,87
0,99
0,75
0,98
0,89
0,90
0,90
0,84
0,78
0,70
8 = 36)
еА
0 97
1 00
0 97
0 66
0,87
0 97
0,73
0,99
0,76
0,86
0,75
0,55
0,64
0,67
еЕ
0 47
0 72
1 00
0 63
0,84
0,94
0,70
0,85
0,47
0,62
0.41
0,19
0,37
0,53
Л
0 00
0 00
0,00
0 00
0,00
0,00
0 00
5,85
2 06
6,24
13,36
6,27
V
1 50
1,05
1,05
1,07
1,07
1,13
1,05
1,05
2,02
2,93
1,98
1,05
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
V'l. Адлер Ю. П., Грановский Ю. В. Обзор прикладных работ по
планированию эксперимента. М., Изд-во МГУ, 1967. 96 с.
2. Симонова Е. Г. Планирование эксперимента. Указатель лите-
литературы на русском и украинском языках за 1970—1971 гг. М.,
Бнбл. им. В. И. Ленина, 1972. 223 с.
3. Шлыкова В. П., Сергеева В. Ф. Планирование эксперимента.
Указатель литературы A969—1973 гг.). Ч. 1. М., МЭИ, 1973.
113 с.
4. Планирование эксперимента. Библиография прикладных работ
за 1966—1968 гг. М., Изд-во МГУ, 1971. 190 с. Авт.: Ю. В. Гра-
Грановский, Т. И. Мурашова, А. Б. Страхов, Ю. П. Адлер.
5. Планирование эксперимента. Библиография прикладных работ
за 1969—1970 гг. М., Изд-во МГУ, 1974. 194 с. Авт.: Ю. В. Гра-
Грановский, Т. Н. Любимова, Т. И. Мурашова, А. Б. Страхов.
6. Бурбаки. Архитектура математики, приложение к книге «Очер-
«Очерки по истории математики». Пер. с франц. М., ИЛ, 1963. 245 с.
7. Налимов В. В. Логические основания прикладной математики.
М., Изд-во МГУ, 1971. 57 с.
V8. Налимов В. В. Теория эксперимента. М., «Наука», 1971. 207 с.
^9. Налимов В. В. Применение математической статистики при
анализе вещества. М., Физматгиз, 1960. 430 с. с ил.
МО. Хикс Ч. Основные принципы планирования эксперимента. Пер.
с англ. М., «Мир», 1967. 406 с. с ил.
11. Anderson V. L., McLean R. A. Design of Experiments. A Rea-
Realistic Approach. N. Y., Marcel Dekker Inc., 1974. 250 p.
12. Химмельблау Д. Анализ процессов статистическими метода-
методами. Пер. с англ. М., «Мир», 1973. 957 с. с ил.
13. Снаговский Ю. С, Островский Г. М., Малкин И. Я.— «Тео-
«Теоретическая и экспериментальная химия», 1972, т. 8, № 2,
с. 189—195.
14. Линник Ю. В. Метод наименьших квадратов и основы тео-
теории обработки наблюдений. М., Физматгиз, 1962. 352 с. с ил.
15. Kiefer I. Optimum Experimental Desings. — «J. of the Royal
Statistical Soc», Ser. B, 1959, v. 21, № 2, p. 272—319.
16. Kiefer I., Wolfowitz J. Optimum designs in regression problems.—
«Ann. of Mathematical Statist.», 1959, v. 30, № 2, p. 271—294.
17. Kiefer J., Wolfowitz I. The equivalence of two extremum prob-
problems. «Canad. J. of Mathematics», 1960, v. 12, № 3, p. 363—
366.
18. Kiefer J. Optimum designs in regression problems, II. «Ann. of
Mathematical Statist.», 1961, v. 32, № 1, p. 298—325.
19. Kiefer J. Optimum experimental designs. V. with applications to
systematic and rotatable desings. Proc. of the 4-th Berkeley
Symp. Math. Stat. and Prob., 1961, v. 1, p. 381—405.
20. Kiefer J. On the nonrandomized optimality and randomized
nonoptimality of symmetrical designs. — «Ann. of Mathematical
Statist.», 1958, v. 29, № 3, p. 675—699.
21. Farrell R., Kiefer J., Walbran A. Optimum multivariate desings.
Proc. of the 5-th Berkeley Symp. Math. Stat. and Prob., Univer-
University of California Press, 1967, v. 1, p. 113—138.
22. Kiefer^ I. General equivalence theory for optimum designs (ap-
(approximate theory. — «Ann. of Statist», 1974, v. 2, i№ 5, p. 849—
879.
23. Kiefer J. Optimal design: variation in structure and performance
under change of criterion. — «Biometrika», 1975, v. 62, № 2,
p. 277-^288.
24. Чемлева Т. А., Адлер Ю. П. Планирование эксперимента при
построении диаграмм состав — свойства (обзор) — В кн.: Приме-
Применение математических методов для исследования многокомпо-
многокомпонентных систем. М., «Металлургия», 1974, с. 11—42.
25. Box G. E. P. International Encyclop. of the Social Science, 1968,
v. 5, p. 245—263.
26. Федоров В. В. Теория оптимального эксперимента. М., «Нау-
«Наука», 1971. 312 с. с ил.
27. Fedorov V. V., Malyutov M. В. Optimal Designs in Regression.
Problems». — «Math. Operationsforsch. und Statist.», 1972 v. 3,
Heft 4, S. 381—308.
28. Андрукович П. Ф., Голикова Т. И., Костина С Г. Планы вто-
второго порядка на гиперкубе, близкие по свойствам к Z)-oirra-
малъным. — В кн.: Новые идеи в планировании эксперимента.
М., «Наука», 1969, с. 140—153.
29. Лецкий Э. К-, Никифорова Е. С. Об использовании спектров
непрерывных ?>-оптимальных планов при построении точных
планов. — «Заводская лаборатория», 1974, № 5, с. 562—565.
30. Дубова И. С, Федоров В. В. Таблицы оптимальных планов
(II). Насыщенные D-оптимальные планы на кубе. М., Изд-во
МГУ, 1972. 42 с.
31. Box G. E. P., Draper N. R. The choice of a second order rota-
rotatable design. — «Biometrika», 1963, v. 50, № 3, p. 335—352.
32. Draper N. R., Lowrence W. E. Designs with minimize model in-
inadequacies: Cuboidal regions of interest. — «Biometrika», 1965,
v. 52, №2, p. 111—118.
33. Ермаков С. М. Об оптимальных несмещенных планах регрес-
регрессионных экспериментов. —• «Труды (Математического института
АН СССР», вып. III, 1970, с. 252—257.
34. Седунов Е. В. Обобщение задачи Бокса—Днейпера в планиро-
планировании регрессионных экспериментов. — «Заводская лаборато-
лаборатория», 1973, № 3, с 308—313.
35. John R. С. St., Draper N. R. D-Optimality for Regression Designs:
a Review. — «Technometrics», 1975, v. 17, № 1, p. 15—23.
36. Налимов В. В., Чернова Н. А. Статистические методы пла-
планирования экстремальных экспериментов. М. «Наука», 1965.
340 с. с ил.
37. Nalimov V. V., Golikova Т. /.. Mikeshina N. G. On the prac-
practical use of the concept of D-optimality» — «Technometrics»,
1970, v. 12, № 4, p. 799—812.
38. Box G. E. P., Wilson К В. — On the Experimental Attainement
of Optimum Conditions. — «J. of the Roxal Statist. Soc», Ser.
B, 1951, v. 13, № 1, p. 1—45.
39. Box G. E. P., Hunter I. S. Multi—factor experimental designs
for exploring response surfaces. — «Ann. of Mathematical Sta-
Statist.», 1957, v. 28, № 1, p. 195—241.
40. Голикова Т. И., Панченко Л. А. Систематизация планов для
оценки полиномиальных моделей второго порядка. — В кн.:
Планирование оптимальных экспериментов. М., Изд-во МГУ,
1975, с. 106—149.
41. Голикова Т. И., Панченко О. А.. Фридман М. 3. Каталог пла-
планов второго порядка. М., Изд-во МГУ, 1975, ч. 1. 387 с. с ил.;
ч. II. 384 с. с ил.
144
145
42. Малютов М. Б. Планирование и анализ в линейной регрес-
регрессионной модели.— В кн.: Планирование оптимальных экспе-
экспериментов. М., Изд-во МГУ, 1975, с. 9—50.
43. Горский В. Г., Бродский В. 3. О симплекс-планах первого по-
порядка и связанных с ними планах второго порядка. — В кн.:
Новые идеи в планировании эксперимента. М., «Наука», 1969,
с. 59-117.
44. Голикова Т. И., Панченко Л. А. Непрерывные А- и ?>-опти-
мальные планы второго порядка на кубе. — В кн.: Регрессион-
Регрессионный эксперимент (планирование и анализ). М., Изд-во МГУ,
1977, с. 71-83.
45. Kono Kazumaza. Optimum Design for Quadratic Regression
on the K-cube. — «Memories of the Faculty of Science Kyushu
University», 1962, A 16, p. 116—122.
46. Песочинский Л. Д. .D-оптимальные и близкие к ним точные
планы для квадратичной регрессии на кубе н шаре. М., Изд-во
МГУ, 1972. 36 с.
47. Galil Z., Kiefer I. Comparison of Simplex Designs for Quadra-
Quadratic Mixture Models. — «Technometrics», 1977, v. 19, № 4,
p. 445—453.
48. Galil Z., Kiefer I. Comparison of rotatable designs for regres-
regression on balls, I (Quadratic. — «J. of Statist. Plan, and Infer.»,
1977, № 1 A), p. 27^M).
49 Galil Z., Kiejer J. Comparison of design for quadratic regres-
regression on cubes,. — «J. of Statist. Plan, and Inter.», 1977, N 1 B),
p. -12,1—' 132.
50. Lucas. M. Which Responce Surface Design is Best. — «Techno-
«Technometrics», 1976, v. 18, № 4, p. 411—417.
51. Денисов В. И. Попов А. А. А-, ?-оптимальные и ортогональ-
ортогональные планы регрессионных экспериментов для полиномиаль-
полиномиальных моделей. М., Научный Совет по комплексной проблеме
<аКнбериетика», 1976. 44 с.
52. Pesotchinsky L. Ф-Optimal second order designs for symmetri-
symmetrical regions. —«J. of Statist. Plan, and Infor.», 1978, № 2A),
p. 173—188.
53 Hartley H. O. Smallest composite designs for quadratic responce
surface. — «Biometrics», 1959, v. 15, № 4, p. 611—624.
54. Westlake W. I. Composite designs based on irregular fractions
of factorials. — «Biometrics», 1965, v. 21, № 2, p. 324—336.
55. Rechtshaffner R. L. Saturated Fractions of 2n and 3n Factorial
Designs. — «Technometrics», 1967, v. 9, № 4, p. 569—576.
56. Box G. E. P., Behnken D. W. Some New Three Level Designs
for the Study of Quantitative Variables. — «Technometrics»,
1960, v. 2, № 4, p. 455—475.
57. Box G. E. P., Behnken D. W. Simplex Sum designs: a class of
second order rotatable designs deribable from those of first or-
order. — «Ann. of Mathematical Statist.», 1960, v. 31, № 4,
p. 838—864.
58. Spendley W., Hext G. R., Himsworth F. R. — Sequential Appli-
Application of Simplex Resigns in Optimisation and Evolutionary Ope-
Operation. — «Technometrics», 1962, v. 4, № 4, p. 441—462.
59. Малютов M. Б., Мятлев В. Д. Минимаксные планы проверки
адекватности линейной модели на кубе н шаре. М., Изд-во
МГУ, 1971. 18 с.
60. Бродский В. 3. Введение в факторное планирование экспери-
эксперимента. М., «Наука», 1976. 225 с.
146
61. Myers R. Response Surface Methodology. Allon and Bacon Inc.,
Boston, 1971. 480 p.
62. Дрейпер H., Смит Г. Прикладной регрессионный анализ. Пер.
с англ. М., «Статистика», 1973. 392 с. с ил.
63. Маркова Е. В., Лисенков А. Н. Планирование эксперимента в
условиях неоднородностей. М., «Наука», 1973. 219 с. с нл.
64. Fisher R. A. The Design of Experiments. L., Oliver a. Boyd,
1960. 248 p.
65. Yates R. Complex experiments. — «J. of Royal Statist. Soc»,
Supplement, 1935, v. 2, p. 181—185.
66. Hotteling H. Some Improvements in Weighing and other Ex-
Experimental Techniques. — «Ann. of Mathematical Statist.», 1944,
v. 15, Ш 3. p. 297—306.
67. Mood A. M. On Hotelling's weighing problem. — «Ann. of Ma-
Mathematical Statist.», 1946, v. 17, № 4, p. 432—446.
68. Kishen K. On the design of experiments for weighing and
makling other rypes of measurements.—«Ann. of Mathemati-
Mathematical Statist.», 1945, v. 16, № 3, p. 294—300.
69. Ehrenfeld S. On the efficiency of experimental designs.—
«Ann. of Mathematical Statist.», 1955, v. 26, № 2, p. 247—255.
70. Raghavarao D. Some optimum weighing designs. — «Ann. of
Mathematical Statist.», 1959, v. 30, № 2, p. 295—303.
71. Raghavarao D. Some aspects of weighing designs. — «Ann. of
Mathematical Statist.», 1960, v. 31, '№ 4, p. 878—в84.
72. Rao M. B. Weighing designs when n is odd.— «Ann. of Mathe-
Mathematical Statist.», 1966, v. 37, № 5, p. 1371 — 1381.
73. Williamson J. Determinants whose Elements are О and I.—
«J. American Mathematical Monthly», 1946, v. 53, № 8, p. 427—
434. У Н
74. Ehlisch H. Determinantenabschatzungen fur binare Matrizen.
—«Mathematische Zeitschrift», 1964, Bd 33, № 2, S. 27—31.
75. Бродский В. 3., Голикова Т. И. Построение D-оптимальных
планов взвешивания с минимальным числом наблюдений.—
«Теория вероятностей и ее применение», 1972, т. XVII, № 3,
с. 578—582.
76. Бродский Л. И., Бродский В. 3. Свойства геометрических
планов — В кн.: Регрессионные эксперименты. М., Изд-во МГУ,
1977, с. 85-102.
77. Бродский В. X., Бродский Л. И., Малолеткин Г. Н. и др; О
каталоге факторных планов на ЭВМ.—В кн.: Математико-
статнстическне методы анализа н планирования эксперимента.
М., ВИНИТИ, 1978, с. 6—24.
78. Мержанова Р. Ф., Никитина Е. П. Анализ статистических ха-
характеристик планов третьего порядка. — В кн.: Математико-
статнстнческие методы анализа и планирования эксперимента.
М., ВИНИТИ, 1978, с. 33—63.
79. Box G. E. P., Cox D. R. — The analysis of transformations. —
«J. of the Royal Statist. Soc», 1964, v. 26, № 2, p. 211—243.
80. Растригин Л. А. О критериях сопоставления методов поиска
экстремума. — «Заводская лаборатория», 1966, № 10, с. 1248—
1252.
81. Satterthwaite F. Е. — Random Balance Experimentation. —
«Techometrics», 1959, v. 1, № 2, p. 111—137.
82. Мешалкин Л. Д. К обоснованию метода случайного баланса.—
«Заводская лаборатория», 1970, № 3, с. 316—318.
147
83. Малютов М. Б., Фрейдлина В. J1. О применении теории ни-
формации к одной задаче выделения значимых факторов. —
«Теория вероятностей и ее применения», 1973, т. XVIII, № 2,
с. 438—440.
84. Малютов М. Б. О рандомизированном планировании в одной
модели отсеивающих экспериментов. — В кн.: Планирование
оптимальных экспериментов. М., Изд-во МГУ, 1975, с. 181—
185.
85. Фрейдлина В. JI. Об одной задаче планирования отсеивающих
экспериментов — «Теория вероятностей и ее применения», 1975,
т. XX, № 1, с. 100-114.
86. Малютов М. Б. Математические модели и результаты в тео-
теории отсеивающих экспериментов. — В кн.: Теоретические проб-
лемы планирования эксперимента. М., «Советское радио», 1977,
с. 5—69.
87. Мятлев В. Д. Теоремы и алгоритмы об одной схеме последо-
последовательного поиска дефектных элементов. — В кн.: Теоретнче-
саде проблемы планирования эксперимента. М., «Советское
радио», 1977, с. 70—109.
88. Dunnet G. N. Quantitative Methods in Pharmacology. Amster-
Amsterdam, North — Holland, 1961, p. 10—25.
89. Federer W. T. Procedures and designs useful for screening ma-
terials in selection and alocation, with a bibliography. «Biomet-
rics», 1963, v. 19, № 4, p. 553—587.
90. Moran M. A. The analysis of imcomplete bloocks designs as
used in the group screening of srugs. — «Biometrics», 1973,
v. 29, № 1, p. 131—142.
91. Schultz J. R., Nichol F. R., Elf ring G. L. Multiple—stage pro-
cedures for drug sereening. — «Biometrics», 1973, v. 29, № 2,
p. 293—300.
92. Popper K- R- The Logic of Scientific Discovery. L., Hutchinson,
1965. 480 p.
93. Popper K. R. Conjectures and Refutations, the Grows of Know-
ledge N. Y. -L., Basic Books Publicher, 1963. 412 p.
94. Кун Т. Структура научных революций. М., «Прогресс», 1975.
288 с.
95. Ланцош К- Практические методы прикладного анализа. Спра-
вочное руководство. Пер. с англ. М., Физматгиз, 1961. 522 с.
96. Васильев А. Ф. Теоретические основы современных методов
количественного анализа многокомпонентных систем по спект-
спектрам поглощения. Докторская диссертация. М., 1976.
97. Бард И. Нелинейное оценивание параметров. Пер. с англ. М.,
«Статистика», 1979. 349 с.
98. Гонтарь В. Г. Моделирование кинетики химических процес-
процессов. — ЖФХ, 4, № 8, 2154—2155.
99. Коростылев А. П., Малютов М. Б. Об оценке коэффициентов
приспособленности генотипов с помощью оценки стационар-
стационарного распределения частот генов. В кн.: Применение статисти-
статистических методов в задачах популяционной генетики. М., Изд-во
МГУ, 1975, с. 45—51.
100. Chew G. F. Bootstrap: A Scientific Idea. — «Science», 161,
1968, № 3843, p. 762—765.
101. Capra F. Modern Physics anl Eastern Mysticism. — «The Trans-
personal Psychnology», 1976, 8, № 1, p. 20—39.
107
10о
по.
Ml.
112.
,,,,
,, ,-
2. Moravcsik M. J. The Crisis in Particle Physics. — «Research
Policy», 6, 78—107, Jan. 1972.
J. Смирнов С. От кроманьонца до Кеплера, от Кеплера до на-
наших дней... Что дальше? — «Знание-сила», 1977, № 6, с. 39—41;
№ 7, с. 43—46.
1. Monod J. L. — «On the Molecular Theory of Evolution» in
«Problems of Scientific Revolution. Progress and Obstacles to
Progress», The Herbert Spencer Lectures. Oxford, Ed. by
R. Harr, Clarendon Press, 1975, p. 11—24.
i. Мейен С. В. Проблема направленности эволюции. Итоги нау-
науки и техники. Вып. «Зоология позвоночных». Т. 7. М., ВИНИТИ,
1975, с. 66—117.
I. Хинтикка И. Вопросы о вопросах. — В кн.: Философия в сов-
современном мире. Пер. с англ. М., «Наука», 1974, с. 303—362.
'. Логический словарь. М., «Наука», 1971, с. 79 (статья «Воп-
«Вопрос». Авт.: Н. И. Кондаков).
Нагель Э., Ньюмен Д. Теорема Геделя. Пер. с англ. М., «Зна-
«Знание», 1970. 62 с.
hanger S. К. Philosophy in a New Key. A Study in the Sym-
Symbolism of Reason, Rite and Art. Cambridge. Massachusetts,
Harvard University Press, 1951. 243 p.
Cohen F. What is Question? «The Monist», 39, № 3, p. 350—364.
Humak К. М. S. Statistische Methoden der Modelbildung, Band
I, Academie Verlag, Berlin, 1977. 516 s.
Налимов В. В. Вероятностная модель языка. — 2-е изд. пере-
рабк н доп. — М., «Наука», 1979. 303 с.
Налимов В. В. Непрерывность против дискретности в языке
и мышлении. Тбилиси. Изд-во Тбилисского университета, 1978.
84 с. с ил.
Мейн С. В., Шредер Ю. А. Методологические вопросы теории
классификаций. — «Вопросы философии», 1976, № 12, с. 67—
79.
Michell R., Mager R. A., Downhower J. An Evolution of Three
Biomo Programs. — «Science», 1976, № 4242, p. 859^865.
Levins R. The Strategy of Model Building in Population Bio-
Biology. — «American Scienist», 1966, 54, № 4, p. 421—431.
Горский В. Г., Адлер Ю. П. Планирование промышленных экс-
экспериментов. М., «Металлургия», 1974. 264 с. с ил.
Capra F. The Tao of Physics. L. and Berkely Shambhala, 1975.
330 p.
148
ОГЛАВЛЕНИЕ
Введение » '• 3
Глава I. ЧТО ЕСТЬ ХОРОШИЙ ЭКСПЕРИМЕНТ ... 10
1. Анализ понятия «эксперимент» 10
2. Примеры хороших и плохих экспериментов 12
3. Как могут быть формализованы некоторые наши представ-
представления о хорошем эксперименте 24
Глава П. КРИТЕРИИ ОПТИМАЛЬНОСТИ ПЛАНОВ . . 34
1. Введение ::..-. : . 34
2. Список критериев 38
3. Связь между критериями, общие методы построения опти-
оптимальных планов 45
Глава III. ВЫБОР ОПТИМАЛЬНЫХ ПЛАНОВ ДЛЯ ПО-
ПОЛИНОМИАЛЬНЫХ МОДЕЛЕЙ : ; : ; 50
1. Введение ¦• 50
2. Планы первого порядка 52
3. Планы второго порядка 54
4. Планы для полиномиальных моделей на симплексе ... 64
Глава IV. ОПТИМАЛЬНОСТЬ В ПЛАНИРОВАНИИ ЭКС-
ЭКСПЕРИМЕНТА ДЛЯ ДИСКРЕТНЫХ ПЕРЕМЕН-
ПЕРЕМЕННЫХ 66
1. Введение % : 66
2. Классификация планов для дискретных независимых пере-
переменных ¦. 69
3. Планы взвешивания •. 78
4. Постановка задачи об оптимальности планов с дискретны-
дискретными иезависимымн переменными . . . . * 80
5. О каталоге факторных планов 83
Глава V. ВЫБОР ОПТИМАЛЬНОЙ СТРАТЕГИИ В ДИ-
ДИНАМИЧЕСКИХ ЗАДАЧАХ 84
1. Движение в направлении к экстремуму 85
2. Сужение области в пространстве независимых переменных
ради упрощения модели ¦. 86
3. Движение в пространстве независимых переменных при
прослеживании за временным дрейфом технологического
процесса ::..-. 87
Глава VI. КРИТЕРИИ ОПТИМАЛЬНОСТИ В ОТСЕИВАЮ-
ОТСЕИВАЮЩИХ ЭКСПЕРИМЕНТАХ 89
1. Уменьшение размерности пространства независимых пере-
переменных в задачах отсеивания •. 89
2. Планирование эксперимента при последовательном отсен-
ванни : . ; . 96
150
Глава VII. КРИТЕРИИ ОПТИМАЛЬНОСТИ ПЛАНОВ ДИ-
ДИСКРИМИНИРУЮЩИХ ЭКСПЕРИМЕНТОВ id
Глава VIII. ВЫЧИСЛИТЕЛЬНЫЕ ТРУДНОСТИ ВОЗНИКА-
ВОЗНИКАЮЩИЕ ПРИ, ПОСТРОЕНИИ МОДЕЛЕЙ, НЕ-
НЕЛИНЕЙНЫХ ПО ПАРАМЕТРАМ . 105
Глава IX. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КАК ВОПРОС
ЗАДАВАЕМЫЙ ИССЛЕДОВАТЕЛЕМ ПРИРО-
ДЕ ; . 120
.заключение ;...-... 127
Приложение ..::•••• 133
Библиографический список ¦.'.'.".'.'.!.' 144
ИБ № 1588
ВАСИЛИЙ ВАСИЛЬЕВИЧ НАЛИМОВ
ТАТЬЯНА ИГОРЕВНА ГОЛИКОВА
ЛОГИЧЕСКИЕ ОСНОВАНИЯ
ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Редактор издательства Л. М. Цесарская
Художественный редактор В. В. Баталова
Технический редактор Э. А. Кулакова
Корректоры С. Н. Степанова, О. В. Щербакова
Обложка художника В. 3. Казакевича
Сдаио в набор 27.02.80
Формат бумаги 84ХЮ8'/зг
Гарнитура литературная
Усл. печ. л. 7,98
Тираж 13600 экз.
Подписано в печать 15.10.80 Т-18902
Бумага типографская № 1
Печать высокая
Уч.-нзд. л. 8,38
Заказ 138 Цена 80 к. Изд. № 0055
Издательство «Металлургия», 119034, Москва, Г-34,
2-й Обыденский пер., д. 14
Подольский филиал ПО «Периодика» Союзполиграфпрома
при Государственном комитете СССР по делам издательств,
полиграфии и книжной торговли
г. Подольск, ул. Кирова, д. 25