Текст
                    Ж!27*8".:. M..?.?..
Научный редактор — канд. техн. наук С. Б. Барон
Монтгомери Д. К.
М 77 Планирование эксперимента и анализ данных: Пер.
с англ.—Л.: Судостроение, 1980.—384 с, ил.
Книга посвящена планированию эксперимента и методам статистического
анализа данных. Рассмотрено планирование однофакторных, факторных, гне-
гнездовых (иерархических) и оптимизационных экспериментов. Изложены методы
дисперсного, регрессивного и ковариационного анализа. Книга снабжена мно-
многочисленными примерами, таблицами и графиками, необходимыми для ре-
решения практических задач.
Книга предназначена для инженерно-технических работников предприя-
предприятий и отраслевых НИИ, а также студентов вузов и аспирантов.
Табл. 169. Ил. 61. Библиогр. 71.
м
31805—072
048@1)—80
2—80 3605030000
22.18
© Tohn Wiley & Son*
© Перевод на русский яз.
Издательство «Судостроение», 1980 г,
ПРЕДИСЛОВИЕ
В этой книге представлены основы планирования экспери-
эксперимента и анализа получаемых данных. Она написана в расчете
на читательскую аудиторию, имеющую минимальные знания
в области математики и статистики. Как только книга была
опубликована, она стала использоваться в нескольких универ-
университетах и на многочисленных курсах при промышленных пред-
предприятиях как пособие по экспериментальному проектированию.
Работая в Технологическом институте Джорджии, я использую
эту книгу в качестве учебника по основам планирования экспе-
эксперимента и анализу данных для аспирантов первого года обуче-
обучения, специализирующихся в области технического конструиро-
конструирования, эксплуатации, а также математики и физики. Я надеюсь,
Что книга содержит достаточное количество сведений по плани-
планированию и анализу, которые дадут возможность читателю, не
Особенно искушенному в области статистических исследований,
С успехом ее использовать. Мне очень приятно, что книга пере-
переведена на русский язык, и я надеюсь, что она будет полезна
советским научным работникам и студентам. Мне бы хотелось
Шразить свою признательность переводчику и издателю за под-
подготовку книги к публикации.
Дуглас К. Монтгомери, проф. отделения промышленного и
Системного конструирования Технологического института, Ат-
Атланта, Джорджия, США.


ГЛАВА ПЕРВАЯ ВВЕДЕНИЕ 1.1. НЕОБХОДИМОСТЬ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ Экспериментальные исследования ведутся во всех областях науки и техники. Цель этих экспериментов — либо установить новые факты об исследуемом явлении, либо сравнить влияния различных условий на рассматриваемый процесс. Предположим, например, что инженера-металлурга интересуют эффекты двух различных процессов закалки алюминиевого сплава: в масле и соленой воде. Целью эксперимента в данном случае является определение охлаждающей среды, которая обеспечивает наи- наибольшую твердость данного сплава. Инженер принимает реше- решение подвергнуть несколько образцов сплава закалке в каждой из жидкостей и измерить твердость образцов после закалки. Средняя твердость образцов, обработанных в каждой из охлаж- охлаждающих сред, будет использована для определения лучшей из них. Если задуматься над этим экспериментом, то возникает ряд важных вопросов: 1. Являются ли эти две жидкости единственными охлаждаю- охлаждающими средами, представляющими интерес? 2. Существуют ли другие факторы, которые могут влиять на твердость и должны исследоваться или контролироваться в этом эксперименте? 3. Сколько образцов сплава нужно обработать в каждой из охлаждающих жидкостей? 4. Как нужно распределять образцы по охлаждающим жид- жидкостям и в каком порядке собирать данные? 5. Какой метод анализа данных должен быть применен? 6. Какая разность между средними наблюденными твердо- стями для двух охлаждающих сред будет считаться важной? На все эти вопросы нужно дать удовлетворительный ответ еще до того, как будет проведен эксперимент. Результаты любого эксперимента и выводы, которые из них можно сделать, зависят в большой степени от того, каким обра- образом собираются данные. Для иллюстрации этого положения до- допустим, что инженер-металлург в описанном выше экспери- эксперименте использовал образцы из одной партии нагрева для обра- обработки в масле, а из другой партии — в соленой воде. Теперь при сравнении средней твердости инженер не может сказать, в какой степени наблюденная разница обусловлена охлаждаю- охлаждающей средой, а в какой — различиями, присущими партиям на- нагрева '. Таким образом, метод сбора данных неблагоприятно повлиял на выводы, которые можно сделать из этого экспери- эксперимента. 1.2. ОСНОВНЫЕ ПРИНЦИПЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА Если мы хотим провести эксперимент наиболее эффективно, то необходим научный подход к его планированию. Под стати- статистическим планированием эксперимента мы понимаем такую организацию экспериментального исследования, которая позво- позволит собрать необходимые данные, применить для их анализа статистические методы и сделать правильные и объективные выводы. Без статистического подхода к планированию экспери- эксперимента не обойтись, если мы не хотим, чтобы выводы, получен- полученные на основе его данных, оказались лишенными смысла. Если данные эксперимента содержат ошибки, то статистические ме- годы являются единственным объективным подходом к их ана- анализу. Таким образом, в любой экспериментальной задаче два аспекта: планирование эксперимента и статистический анализ данных, причем эти два аспекта тесно взаимосвязаны, так как метод анализа непосредственно зависит от использованного плана. В основе планирования эксперимента лежат два основных принципа — репликация и рандомизация. Под репликацией мы понимаем повторение основного эксперимента. В описанном выше металлургическом эксперименте реплика состояла бы из образца, обработанного закалкой в масле, и образца, обрабо- обработанного закалкой в соленой воде. Таким образом, если в каж- каждой охлаждающей среде обработано по пять образцов, то мы говорим, что получено пять реплик. Повторные опыты обладают Двумя важными свойствами. Во-первых, они позволяют экспери- экспериментатору получить оценку ошибки эксперимента (случайной ^погрешности). Эта оценка становится основной «мерой» при Определении того, являются ли наблюденные различия в дан- рых в действительности статистически^ различными. Во-вторых, сли выборочное среднее (например, у) используется для оцени- оценивания эффекта фактора в эксперименте, то повторные наблюде- рия позволяют исследователю получить более точную оценку Цгого эффекта. Если о2 — дисперсия данных, а п — число реп- й, то дисперсия выборочного среднего 1 Статистик сказал бы, что "эффекты охлаждающей среды и партии на- грева смешаны, т. е. эти два эффекта разделить нельзя.
Таким образом, если реплик га=1 и наблюдалось «/[=145 (закалка в масле) и г/2=147 (закалка в соленой воде), то мы, вероятно, не сможем сделать удовлетворительного вывода отно- относительно эффекта охлаждающей среды. Другими словами, на- наблюденная разность может быть обусловлена случайной экспе- экспериментальной ошибкой. Наоборот, если п достаточно велико, а экспериментальная ошибка достаточно мала, то при у\<у% мы могли бы сделать вывод, что закалка в соленой воде приво- приводит к более высокой твердости данного алюминиевого сплава по сравнению с закалкой в масле. Рандомизация — краеугольный камень, на котором основано применение статистических методов в планировании экспери- эксперимента. Рандомизация означает, что распределение эксперимен- экспериментального материала и порядок, в котором должны проводиться отдельные опыты или прогоны эксперимента, устанавливаются случайным образом. Для применения статистических методов требуется, чтобы наблюдения (или ошибки) были независимыми случайными переменными. Рандомизация, как правило, обеспе- обеспечивает справедливость этого допущения. При соответствующей рандомизации эксперимента мы также «усредняем» возможные эффекты внешних факторов. Предположим, что в описанном выше эксперименте образцы, например, несколько различаются по толщине и эффективность охлаждающей среды может зави- зависеть от толщины образца. Если все образцы, подвергнутые обра- обработке в масле, толще образцов, закаливавшихся в соленой воде, то мы будем постоянно ставить одну охлаждающую среду в лучшие условия по сравнению с другой. При случайном рас- распределении образцов по охлаждающим средам такой ситуации не возникает. При использовании статистического подхода к планированию экспериментов и анализу данных необходимо, чтобы все участ- участники эксперимента еще до его начала ясно понимали, что именно предстоит исследовать и каким образом нужно собирать данные или хотя бы имели представление о том, как эти данные нужно анализировать. Можно рекомендовать следующую схему: 1. Признание факта существования задачи и ее формули- формулировка. Это положение может показаться довольно тривиальным, но на практике часто бывает непросто понять, что существует проблема, требующая экспериментальных исследований, и вы- выработать ясную и общепринятую формулировку этой проблемы. Необходимо уточнить все представления о целях эксперимента. Ясная формулировка задачи во многих случаях оказывается существенной для лучшего понимания явлений и решения задачи. 2. Выбор факторов и уровней. Экспериментатор должен ото- отобрать независимые переменные, или факторы, которые будут исследоваться в эксперименте. Например, в описанном выше эксперименте по проверке твердости один фактор — охлаждаю- 8 щая среда. Факторы в эксперименте могут быть количествен- количественными или качественными. При исследовании количественных факторов нужно продумать то, как поддерживать желаемые зна- значения этих факторов и как их измерять. Мы должны также выбрать значения, или уровни, факторов, которые будут исполь- использованы в эксперименте. Эти уровни могут быть заданы или выбраны случайным образом из множества всех возможных уровней фактора. 3. Выбор переменной отклика. При выборе отклика, или за- зависимой переменной, экспериментатор должен быть уверен в том, что отклик, который предстоит измерять, действительно содержит информацию об исследуемой проблеме. Нужно поду- подумать также и о том, как будет измеряться отклик и какова ве- вероятная точность этих измерений. 4. Выбор плана эксперимента. Этот этап является наиболее важным в процессе экспериментирования. Исследователь дол- должен задать величину отличия от истинного отклика, которое он хочет обнаружить, и величину риска, на который он может пойти, с тем чтобы выбрать соответствующий объем выборки (число реплик). Он должен также определить, в каком порядке будут собираться данные и какой метод рандомизации будет применен. Необходимо всегда согласовывать между собой ста- статистическую точность и стоимость эксперимента 1. Большинство рекомендуемых планов экспериментов и статистически эффек- эффективны, и экономичны, поэтому усилия экспериментатора по обеспечению статистической точности обычно приводят и к эко- экономической эффективности. Должна быть предложена математическая модель экспери- эксперимента, что позволит провести статистический анализ данных. 5. Проведение эксперимента. В ходе эксперимента, т. е. ре- реального процесса сбора данных, исследователь должен внима- внимательно следить за тем, чтобы все проходило в соответствии с планом. Особое внимание нужно обращать на рандомизацию, точность измерений и поддержание как можно большей одно- однородности внешних условий эксперимента. 6. Анализ данных. Для анализа данных эксперимента должны применяться статистические методы. При этом важно не забывать и о точности вычислений. Современные средства вычислительной техники во многом облегчили экспериментатору эту задачу, одновременно сократив трудоемкость вычислений. В процессе анализа данных часто оказываются полезными и графические методы. 1 С методами введения экономических показателей в планирование экс- эксперимента можно ознакомиться, например, в работах Д. Финни. Введение в теорию планирования экспериментов. Пер. с англ. под ред. Ю. В. Линника. М., Наука, 1970; Федоров В. В. Теория оптимального эксперимента. М., Наука, 1971. {Прим. ред.).
7. Выводы и рекомендации. По завершений анализа данных экспериментатор может сделать выводы относительно своих ре- результатов. Нужно дать физическую интерпретацию статистиче- статистических выводов и оценить их практическое значение, а затем вы- вынести рекомендации об использовании результатов. Эти реко- рекомендации могут включать и проведение дальнейших экспери- экспериментов, поскольку исследование обычно является итеративным процессом, когда отдельный эксперимент, отвечая на некоторые вопросы, одновременно ставит новые. Представляя свои резуль- результаты и выводы, экспериментатор должен стараться использо- использовать как можно меньше специальной статистической терминоло- терминологии и формулировать свое сообщение по возможности проще. Использование рисунков и графиков — очень эффективный спо- способ представления важных результатов эксперимента. В настоящей книге основное внимание уделено этапам вы- выбора плана эксперимента и статистического анализа данных, однако подчеркивается важность всех семи этапов процесса. 1.3. ИСТОРИЧЕСКИЙ ОБЗОР Инициатором применения статистических методов в планиро- планировании экспериментов является Рональд А. Фишер. В течение нескольких лет он был ответственным за статистическую обра- обработку и анализ данных на Ротэмстедской сельскохозяйственной опытной станции в Лондоне. Фишер разработал и впервые при- применил дисперсионный анализ в качестве важнейшего метода статистического анализа в планировании экспериментов. Дру- Другим известным автором работ по планированию экспериментов был Фрэнк Иейтс. Методы планирования эксперимента впервые начали исполь- использовать в сельскохозяйственных и биологических науках. Это определило основную терминологию. Например, ученый-агроном может посеять некоторый сорт зерна на нескольких делянках, применить на этих делянках различные удобрения, или обра- обработки, и наблюдать эффект воздействия, удобрений на урожай зерна. Каждая делянка дает одно наблюдение урожайности. Инженер или физик, однако, представляет себе, что на отклик влияет независимая переменная, или фактор (а не обработка), и использует термин опыт (прогон) для характеристики одного наблюдения. Тем не менее большинство терминов в планирова- планировании экспериментов потеряло свой строго агрономический смысл (например, обработка, делянка, блок) и широко используются во многих науках. Мы будем пользоваться терминами уровни фактора и обработка поочередно. Иногда для обозначения неко- некоторого сочетания уровней фактора, при котором проводится на- наблюдение, будет использоваться термин комбинация обработок. Современные методы планирования экспериментов широко применяются во всех областях исследований: агрономии, меди- 10 цине, биологии, прикладных, естественных и общественных нау- науках,— это все отрасли знания, в которых принят на вооружение статистический подход к планированию экспериментов и ана- анализу данных. \А. ПРИМЕР ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА Для иллюстрации вышесказанного рассмотрим планирование следующего эксперимента. В установке для определения твер- твердости в образец металла с известной силой вдавливается заост- заостренный стержень. Твердость образца определяется по глубине отпечатка острия. В рассматриваемой установке могут использо- использоваться два острия, и, хотя точность определения твердости (из- (изменчивость) с их помощью кажется одинаковой, создается впе- впечатление, что одно острие дает отсчеты, отличные от другого. Эксперимент можно провести так. Отобрать ряд образцов металла (скажем, 10). Одну половину этих образцов проверить, используя острие 1, а другую — применяя острие 2. Конкретное распределение образцов по остриям определяется случайным об- образом. После того как данные по твердости собраны, необхо- необходимо сравнить средние твердости двух выборок с помощью f-критерия. А именно: если пх образцов проверены острием 1 и п2 образцов — острием 2, а у\ и у2 — средние выборочные зна- значения твердости для острия 1 и острия 2 соответственно, то при Допущении, что данные по твердости являются нормальными случайными переменными, статистика для проверки имеет вид У1 — У2 0.1) Sol/ — л- — где -и/ A.2) есть объединенная оценка изменчивости (экспериментальной ошибки). Представим наши действия в формализованном виде. Мы проверяем гипотезы где ц,[ и ц2 — истинные средние распределений отсчетов твер- твердости, получаемых при остриях 1 и 2 соответственно. Мы откло- отклоним нулевую гипотезу Но: Ц1 = Ц2, если li+n2-2 —верхняя а/2-процентная точка ^-распределения + п2 — 2 степенями свободы. И
Таблица 1.1 Данные эксперимента по проверке твердости После некоторого размышления нетрудно обнаружить серьез- серьезный недостаток этого плана. Предположим, что образцы ме- металла были изготовлены из различных резервных запасов, по- полученных при различных температурах или не совсем однород- однородных в каком-либо ином отношении, и это может повлиять на твердость. Из-за неоднородности образцов изменятся наблюде- наблюдения твердости, завысится экспериментальная ошибка, затруд- затрудняющая обнаружение истин- истинных различий между остри- остриями. Попробуем избежать воз- возникновения такой ситуации и рассмотрим другой план. До- Допустим, что размеры образца достаточно велики для того, чтобы на нем можно было провести два определения твердости. Тогда при альтер- альтернативном плане каждый обра- образец делится на две части и за- затем два острия случайным образом распределяются по двум его половинам. Порядок, в котором острия проверяются на данном образце, также оп- определяется случайным образом. Эксперимент, проведенный в соответствии с этим планом с десятью образцами, дал сле- следующие результаты (табл. 1.1). Статистическую модель, описывающую данные этого экспе- эксперимента, можем записать в виде Уи = Щ+Р}+ец, « = 1, 2; ]=\, 2,..., 10, A.3) где уц — наблюдение для t-ro острия на /-м образце; \ц — истинная средняя твердость для t-ro острия; р^ — эффект, ока- оказываемый на твердость /-м образцом; гц — случайная ошибка эксперимента. Если мы вычислим }-ю парную разность наблю- наблюдений, например, Л}=Уц—Уц, /=1,2 Ю, A.4) то для математического ожидания этой разности получим V-d = Образец 1 2 3 4 5 6 7 8 9 10 Острые 1 7 3 3 4 8 3 2 9 5 4 Острие 2 6 3 5 3 8 2 4 9 4 5 Следовательно, мы можем делать выводы о разности сред- средних при использовании острия 1 и 2, щ—JX2, делая выводы о среднем или разности [id- Отметим, что аддитивный эффект образцов Ej исключается, когда наблюдения сводятся в пары указанным образом. 12 Проверка Яо: Ц1 = Ц2 эквивалентна проверке Статистика для проверки этой гипотезы имеет вид 1 *0 = где выборочное среднее разностей, а />=i A.5) A.6) выборочное стандартное (среднеквадратическое) отклонение разностей. Гипотеза Яо:цй = 0 отклоняется, если |fo|>fe,2-n-i. Для данных табл. 1.1 находим 4 = 7—6=1; 4 = 3—2 = 1; 4 = 3—3 = 0; 4 = 2—4=—2; 4=3—5 = —2; 4 = 9—9 = 0; 4 = 4—13=1; 4 = 5—4=1; Таким образом, ¦[- 7 У, d ai 10 7, п-1 13- 1 10 -,, ,, =1А 10—1 Статистика для проверки гипотезы принимает значение *. = —?¦=-= -°^ = -0,26 SdlVn 1,2/yiO и, поскольку ^о,о5; 9=1,833, то мы не можем отклонить гипотезу #0:цй = 0, т. е. полученные данные не дают оснований полагать, что два острия приводят к различным отсчетам твердости. Первоначальный план этого эксперимента называется объ- объединенным или независимым f-критерием, поскольку экспери- экспериментальные объекты (образцы металла) случайным образом со- соотносятся с двумя остриями. Он является примером полностью 13
рандомизированного плана для одного фактора (острия). В гл. 3 мы будем обсуждать планы этого типа более подробно, укажем ситуации, в которых они применяются, и предложим метод ана^ лиза, являющийся обобщением объединенного ^-критерия. План, в действительности использованный для рассматривае- рассматриваемого эксперимента, называется парным ^-критерием и является на самом деле частным случаем плана более общего типа — плана с рандомизированными блоками. Термин блок относится к сравнительно однородному экспериментальному объекту (в на- нашем случае блоками являются образцы металла); блоки пред- представляют собой ограничение на рандомизацию, поскольку ком- комбинации обработок рандомизируются только внутри блока. Мы будем заниматься планами этого типа в гл. 4 и 5. В заключение мы должны сделать несколько замечаний. Хотя число наблюдений составляет 2п=2-10=20, лишь п— 1 = = 9 степеней свободы соответствует ^-статистике A.5) (нам известно, что с ростом числа степеней свободы увеличивается чувствительность ^-критерия). При сведении наблюдений в пары мы «потеряли» в результате п — 1 степень свободы, но надеемся добиться лучшего понимания ситуации благодаря исключению дополнительного источника изменчивости (различий между об- образцами). Мы можем оценить качество информации, полученной при плане с парными наблюдениями, сравнив стандартное от- отклонение разностей S<j с объединенным стандартным отклоне- отклонением Sp, которое получилось бы, если данные табл. 1.1 собрать в эксперименте с полной рандомизацией. Рассматривая данные табл. 1.1 как две независимые выборки, мы можем с помощью выражения A.2) найти объединенное стандартное отклонение Sp = 2,32. Сравнивая это значение с Sd=l,2, видим, что группи- группирование в блоки или взятие парных наблюдений уменьшило оценку изменчивости почти наполовину. Мы можем также выра- выразить эту информацию в терминах доверительного интервала для 1-И—Ц2- Если использовать данные парных наблюдений, то в ка- качестве 95-процентного доверительного интервала для hi—цг по- получаем d± /0.025.9 -0, Ю ±2,262-1,2/j/То"; -0,10±0,86, а при использовании данных независимого анализа Ух—Уг ± ^0,025; is Spl/_L+JL ! 4,80-4,90 ± ±2,101-2,32 i/_L , _L;-0,l0±2,18. Доверительный интервал, основанный на парных наблюде- наблюдениях, оказывается намного более узким по сравнению с интер- интервалом, построенным по данным независимого анализа. 14 Группирование в блоки не всегда является лучшей страте- стратегией планирования. Если изменчивость внутри блока такая же, как и изменчивость между блоками, то дисперсия ух—у2 ока- окажется той же самой независимо от использованного плана. На самом деле в такой ситуации группирование в блоки — пример неудачного выбора плана, так как это приводит к потере п — 1 степеней свободы и практически к увеличению доверительного интервала для щ—ц2- ГЛАВА ВТОРАЯ ОСНОВНЫЕ ПОНЯТИЯ СТАТИСТИКИ 2.1. ВВЕДЕНИЕ В этой главе дан обзор некоторых элементарных методов статистики в аспекте планирования простых сравнительных экспериментов, т. е. таких, в которых параметр распределения (среднее или дисперсия) сравнивается с заданной величиной или соответствующим параметром другого распределения. Математической основой теории статистических выводов яв- является теория вероятностей. Пусть у — случайная переменная, исследуемая в эксперименте. Предположим, что вероятностная структура у описывается распределением вероятности. Напри- Например, в эксперименте по исследованию скорости сгорания опре- определенного вида твердого ракетного топлива случайная величина, представляющая интерес,— наблюдаемая скорость сгорания. Случайные переменные могут быть дискретными или непрерыв- непрерывными. Если множество значений случайной переменной у ко- конечно или бесконечно, но счетно, то случайная переменная дискретна и ее вероятностная структура описывается распреде- распределением вероятностей р(у). Если же множество всех возможных значений у заполняет собой интервал (или несколько интерва- интервалов.— Прим. ред.), то случайная переменная непрерывна и ее вероятностная структура характеризуется плотностью распреде- распределения вероятностей f(y). Среднее случайной величины служит мерой положения Центра ее распределения на оси. Математически среднее, на- например, определяется как J *yf (У) dy, у непрерывна ; 2 УР (У), У дискретна. всем у B.1) 15
Среднее можно также выразить и в терминах математиче- математического ожидания или результата усреднения по достаточно боль- большому интервалу значений переменной у: J i/f(y)dy, у непрерывна; — оо 2 УР (У)> У дискретна, B.2) всем у где Е — оператор математического ожидания. Широта распределения вероятностей или рассеивание слу- случайной величины может характеризоваться дисперсией, которая определяется как J (y—n)*f(y)dy, у непрерывна; 2 (У— цJР(#). У дискретна. всем у B.3) Отметим, что дисперсия может быть выражена через матема- математическое ожидание о« = ?[(у—i*I]. B.4) Понятие дисперсии используется настолько широко, что удобно ввести оператор дисперсии У(у) = Е}(у-ц)*] = о\ B-5) Операторы математического ожидания и дисперсии будут очень часто встречаться в книге, поэтому может оказаться по- полезной сводка элементарных свойств этих операторов. Если у — случайная переменная, ас — постоянная, то 1) Е(с)=с; 2) E(y) = v; 3) Е(су) = сЕ(у) = сц; 4) V(c) = O; 5) V(y) = o*; 6) V(cy) = c2V(iy) = c*o2. Если есть две случайные переменные, например, у\ с Е(ух) = = цх и V(jfi) = ci и уг с ?(</2) = Ц2 и УЫ = С2, то 7) ? (г/i+ f/2) = ?(«/i)+ ?(&) = Hi+ И2- Можно показать, что 8) V(yi +y2) = V(yi) + V(y2) +2 Cov (уь Уъ)> 16 где Cov (ylt y2) = Е[(У1-ii,) {уг— ц2)] B.6) называется ковариацией случайных переменных ух и у%. Кова- риация является мерой независимости, а именно, если ух и у% независимы, то Cov (y\, г/2)=0'. Можно также показать, что 9) V Шг-у^ = У (Уг) +V (y2)-2Cw (у,, у2). Если ух и у2 независимы, то Ю) V (У1 ±y,) = V (у,) + V Ы = о\ + о|; 11) ? (ум) = E(t/JE (у2) = ц1}г2. Отметим, однако, что в общем случае 12) ЕШу^фЕ^ШЫ- зависимы переменные У\ и у2 или нет. 2.2. ВЫБОРКИ И ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ Цель теории статистических выводов — сделать заключения о некоторой совокупности, используя выборку из нее. Большин- Большинство методов, которые мы будем изучать, основаны на предпо- предположении, что используются случайные выборки. Точнее, если совокупность состоит из N элементов и берется выборка объе- объемом п элементов, то каждая из N\/(N — n)\n\ возможных выбо- выборок может быть извлечена с равной вероятностью. Такая про- процедура называется взятием случайной выборки. На практике при получении случайных выборок иногда встречаются труд- трудности, и в этих случаях могут оказаться полезными таблицы случайных чисел. В теории статистических выводов широко используются ве- величины, рассчитанные по наблюдениям в выборке. Определим статистику как любую функцию от множества результатов на- наблюдений в выборке, не содержащую неизвестных параметров2. Предположим, например, что уи у2, ¦ ¦ ¦, Уп представляют собой выборку. Тогда выборочное среднее и выборочная дисперсия И —1 B-7) B.8) являются статистиками. Эти величины характеризуют положе- положение центра и рассеивание выборки соответственно. Иногда в ка- 1 Отметим, что обратное не всегда справедливо, а именно, из Cov {y\, «/г)=0 не следует независимость; см., например, Хайнс и Монтгомери [42, с. 103—104]. 2 Статистикой называется и правило вычислений — функция — и значе- значение, полученное на его основе. (Прим. ред.) 17
честве меры рассеивания используется S= \^S2 — выборочное стандартное (среднее квадратическое) отклонение. Часто оказывается возможным найти распределение вероят- вероятностей данной статистики, если известно распределение для сово- совокупности, из которой была взята выборка. Распределение вероят- вероятностей статистики называется выборочным распределением. Рас- Рассмотрим в общих чертах некоторые выборочные распределения. Одним из наиболее важных выборочных распределений яв- является нормальное. Если у — нормальная случайная величина, то ее плотность распределения вероятностей имеет вид а/2п~ где — oo<jx<oo — среднее и а2>0 — дисперсия. Кривая нор- нормального распределения приведена на рис. 2.1. Мы часто будем пользоваться сокращенным обозначением г/~А/(ц, о2), т. е. пе- переменная у распределена по нормальному закону со средним ц и дисперсией о2. Нормальное распределение играет централь- центральную роль в статистической теории; многие важные выборочные распределения могут быть определены через нормальные слу- случайные переменные. Важным частным случаем нормального распределения яв- является стандартизованное нормальное распределение, а именно, при ц = 0 и о2=1. Очевидно, что если y~N(\x, о2), то случайная переменная г = ±=^ B.10) а подчиняется стандартизованному нормальному распределению, т. е. z~N @,1). Преобразование B.10) часто называется стан- стандартизацией нормальной переменной у. Таблица кумулятивной функции стандартизованного нормального распределения 1 при- приведена в приложении I. Для многих методов статистики исходным является допуще- допущение, что случайная переменная распределена по нормальному закону. Обоснованием такого допущения часто служит цен- центральная предельная теорема. Теорема 2.1. Если уи у2, ..., уп — последовательность га неза- независимых случайных переменных с конечными средними Е(уг) = = Hi и дисперсиями У(у{) = Oi2, х = ух+у2+ ... +уп, то величина п X — ^, IX/ 1 В отечественной литературе стандартизованное нормальное распределе- распределение часто называется нормированным, а кумулятивная функция распреде- распределения — интегральной или просто функцией распределения. {Прим. ред.) 18 распределена приближенно по закону N @,1) в том смысле, что если Fn (z) — функция распределения zn, а Ф (z) — функция распределения стандартизованной нормальной переменной, то lim[Fn(z)/O(z)]=l. П-*°о Утверждение этой теоремы состоит, в сущности, в том, что сумма п независимых случайных переменных распределена при- приближенно по нормальному закону. Во многих случаях прибли- приближение оказывается хорошим при небольших п, скажем, га<10, в некоторых же случаях необходимы большие п, например, п>100. Мы часто считаем, что погрешность эксперимента обра- образуется аддитивным образом из нескольких независимых источ- источников, и, следовательно, нормаль- нормальное распределение является при- приемлемой моделью суммарной по- погрешности. К важным выборочным рас- распределениям, которые могут быть определены через нормаль- нормальные случайные переменные, от- относится распределение хи-квад- рат, или х2"Распределение. Если zu z2, ..., Zk—независимые слу- случайные переменные, распределенные по нормальному закону с нулевым средним и единичной дисперсией, что обозначается аббревиатурой NID @,1), то случайная переменная Рис. 2.1. Кривая нормального рас- распределения. подчиняется х2-распределению с k степенями свободы. Плот- Плотность вероятностей этого распределения имеет вид /(Х2) = ¦ (х2) Несколько кривых х2"Распределения приведено на рис. 2.2. Распределение хи-квадрат асимметрично со средним и диспер- дисперсией соответственно. Рассмотрим пример случайной величины с х2'РаспРеДеле- иием. Пусть уи у2, ..., уп — случайная выборка из распределе- распределения N([i, о2). Тогда 'С? 1 " B.12) '%1-U t=l т. е. величина SS/a2 подчиняется распределению хи-квадрат era — 1 степенями свободы. 19
n Величина S5= 2 (У«—iff в числителе выражения B.12) называется скорректированной суммой квадратов1. Во многих методах, рассматриваемых в книге, встречается вычисление сумм квадратов и дальнейшие выкладки с ними. Результат, вы- выражаемый соотношением B.12), чрезвычайно важен и будет неоднократно использоваться: сумма квадратов нормальных слу- случайных величин, деленная на о2, подчиняется х2-Распределению. Из уравнения B.8) следует, что выборочная дисперсия может быть записана в виде S2 = —— SS. B.13) Если наблюдения в выборке являются NID (ц, о2), то вели- величина S2 распределена как [о2/га—1)]х2п-ь Таким образом, при условии, что исходная сово- совокупность подчиняется нор- нормальному закону, распределе- распределение выборочной дисперсии от- отличается от распределения хи-квадрат лишь постоянным множителем. Если z и Xft2 — независимые случайные переменные со стандартизованным нормаль- нормальным и х2'РаспРеДелением с0~ то случайная B.14) ответственно, величина Рис. 2.2. Кривые /«-распределения. подчиняется ^-распределению (распределению Стьюдента) с k степенями свободы и обозначается th- Плотность вероятности t имеет вид причем среднее и дисперсия t соответственно ц = 0 и о2 = = k/(k —2) при fe>2. Несколько кривых ^-распределения приве- приведено на рис. 2.3. Отметим, что при k = <x> ^-распределение пере- переходит в стандартизованное нормальное распределение. Таблица процентных точек распределения Стьюдента приведена в прило- приложении II. Если уи у2, . •., уп — случайная выборка из распреде- 1 В статистике эта сумма обычно называется суммой квадратов откло- отклонений от (или относительно) среднего; в дисперсионном анализе из-за приме- применяемой схемы вычислений удобнее пользоваться термином автора. (Прим. ред.) 20 ления N(\x, о2), то величина t= ^""^ B.16) S/V7T подчиняется ^-распределению era — 1 степенями свободы. Последнее выборочное распределение, которое мы рассмот- рассмотрим, это /^-распределение (называемое также распределением Фишера. — Прим. ред.). Если %и2 и %v2 — независимые слу- случайные переменные распреде- распределения хи-квадрат с числом степеней свободы и и v соот- соответственно, то отношение к= °° (н орма льное) к=10 ¦к=1 г и, v — B.17) подчиняется /^-распределению Рис. 2.3. Кривые /-распределения. с и степенями свободы числи- числителя и v степенями свободы знаменателя. Плотность вероят- вероятности ^-распределения имеет вид * (*=) = ¦ и-\- v _М"'2 (ВД)_, г4-г11 -,0<F< oo. B.18) Кривые /^распределения приве- приведены на рис. 2.4. Это распределе- распределение играет очень важную роль в статистическом анализе данных планируемых экспериментов. Таб- Таблица процентных точек /^распре- /^распределения приведена в приложе- приложении III. Рассмотрим пример статистики, подчиняющейся ^-распределению. Предположим, что есть две нор- нормальные совокупности с одинако- одинаковой дисперсией а2. Если г/ц. У\2, ¦ ¦ ¦, ffin [—случайная выборка объема га; наблюдений из первой Совокупности, а у2\, У22, ¦¦¦, У2п2—случайная выборка объема Й2 наблюдений из второй совокупности, то 4~/Ч->,*,-ь B.19) S2 Где S[2 и S22 — выборочные дисперсии. Этот результат следует Непосредственно из соотношений B.12) и B.17). 2) Рис. 2.4. Кривые /^-распреде- ления.
2.3. ОЦЕНИВАНИЕ Случайная переменная характеризуется, или описывается, своим распределением вероятностей. Это распределение за- задается одним или несколькими параметрами. Например, ц — среднее и 02 — дисперсия являются параметрами нормального распределения [уравнение B.9)], a k — число степеней сво- свободы— параметр х2~РаспРеДеления [уравнение B.11)]. По- Поскольку распределение задается параметрами, часто представ- представляет интерес сделать определенные заключения о величине этих параметров и, например, оценить их. Оценкой неизвестного параметра является некоторая стати- статистика, соответствующая этому параметру. Численное значение оценки, найденное по выборочным данным, также называется оценкой1. Различают точечные и интервальные оценки. Точеч- Точечная оценка дает одно численное значение, оценивающее неиз- неизвестный параметр. Интервальная оценка представляет собой случайный интервал, которому с определенной вероятностью принадлежит истинное значение оцениваемого параметра. Такие интервалы обычно называют доверительными интервалами. 2.3.1. Точечное оценивание Рассмотрим случайную переменную у с плотностью вероят- вероятности f(y). Предположим, что \х — среднее и а2 — дисперсия этого распределения неизвестны. Если У\, г/г, • • •, Уп — случай- случайная выборка объема п наблюдений случайной переменной у, то выборочное среднее у является точечной оценкой \i — среднего совокупности, a 52 — выборочная дисперсия точечной оценкой о2 — дисперсии совокупности. Например, мы хотим оценить среднее и дисперсию прочности на разрыв данного вида тек- текстильного волокна. Исследовалась выборка объема п=2Б образ- образцов волокна, и для каждого из них получены данные по проч- прочности на разрыв. Выборочные среднее и дисперсия находились по формулам B.7) и B.8) соответственно: г/=18,6 и 52=1,20. Следовательно, г/= 18,6 — оценка |х и 52=1,20— оценка а2. «Хо- «Хорошие» точечные оценки должны обладать рядом свойств, наи- наиболее важны из которых следующие: 1. Точечная оценка должна быть несмещенной, а именно, среднее по достаточно большому интервалу или математическое ожидание точечной оценки должно совпадать со значением оце- оцениваемого параметра. 2. Точечная оценка должна обладать минимальной диспер- дисперсией (это свойство характеризует эффективность оценки.— Прим. ред.). Поскольку точечная оценка — статистика, она яв- 1 Следует различать эти два понятия: в первом случае речь идет о неко- некотором правиле оценивания («оценочной» функции), во втором — о фиксиро- фиксированном значении, полученном для конкретной выборки. (Прим. ред.) 22 ляется случайной величиной. Данное свойство означает, что дис- дисперсия оценки с минимальной дисперсией меньше, чем диспер- дисперсия любой другой оценки того же параметра. Легко показать, что у и S2 — несмещенные оценки \х и о2 со- соответственно. Рассмотрим сначала у. Используя свойства опера- оператора математического ожидания, получаем поскольку математическое ожидание каждого наблюдения г/,- есть \х. Таким образом, у — несмещенная оценка ц. Для выборочной дисперсии получаем Е (S2) = Е [I, 2 (у—уУ где 55 — скорректированная сумма квадратов наблюдений у и Далее B.20) B.21) 2 1=1 Следовательно, + СТ2) -П (у? + О2/П) - (rt- 1) 02. E5) = 02. n —i -Величина п—1 в выражении B.21) называется числом сте- степеней свободы суммы квадратов 55. Этот результат является общим, а именно, если у — случайная переменная с диспер- п сией о2, a v — число степеней свободы величины 55 = ^ (г/г — (=1 —г/J, то Е (—) = о2. B.22) Число степеней свободы суммы квадратов равно числу ее неза- висимых элементов. Например, сумма 55 = 2 ^>—У? из вы" i=i ражения B.20) представляет собой сумму квадратов п элемен- элементов ух—у, г/г — У, ¦ ¦ ¦, Уп — У- Эти элементы не являются неза- висимыми, поскольку 2 (У1—У) = ®> следовательно независимы i=i только п — 1 из них, т. е. число степеней свободы 55 состав- составляет п — 1. 23
2.3.2. Интервальное оценивание Интервальное оценивание некоторого параметра — это ин- интервал между двумя статистиками, содержащий с определенной вероятностью истинное значение оцениваемого параметра. Та- Таким образом, для построения интервальной оценки параметра (например, 8) необходимо найти две статистики L и U такие, при которых справедливо вероятностное утверждение ) = 1— а. B.23) Интервал B.24) называется 100A — а)-процентным доверительным интервалом для параметра Э. Этому интервалу можно дать следующую ин- интерпретацию: если при повторении случайных выборок-построить достаточно большое число таких интервалов, то 100 A — а) из них будут содержать истинное значение параметра Э. Стати- Статистики L и U называются нижней и верхней доверительными гра- границами соответственно, а величина 1 — а — доверительным уровнем или доверительной вероятностью. Если а = 0,05, то ин- интервал B.24) называется 95-процентным доверительным интер- интервалом для 0. Рассмотрим пример доверительного интервала. Пусть у — нормальная случайная переменная с неизвестным средним \л и известной дисперсией а2. Если взять случайную выборку объема п наблюдений и вычислить у, то ¦N @,1). В терминах теории вероятностей можно написать p(-za/2^^-^z = 1—о, B.25) где Zа/2—верхняя процентная точка стандартизованного нор- нормального распределения, такая, при которой вероятность зна- значений, превосходящих Za/2, равна а/2. Выражение B.25) можно переписать в виде Р [у—Za;2clVn ===; ц г=с у + Za/2a/Vn) = 1 — a. B.26) Сравнивая выражения B.26) и B.23), видим, что интервал У ± Zatfjlyb B.27) является 100A — а)-процентным доверительным интервалом для ц. 24 Если дисперсия распределения неизвестна, то для оценки можно использовать выборочную дисперсию S2, тогда величина у —ц подчиняется ^-распределению с п—1 степенями свободы, и 100A — а)процентный доверительный интервал для ц, прини- принимает вид - qia/Z /о 9Я\ У ± Га/2; n-io/ у П, (Z.ZO) где ta/2; n-i— верхняя процентная точка ^-распределения с п— 1 степенями свободы, такая, при которой вероятность значений, превосходящих tair,n-u равна а/2. 2.4. ПРОВЕРКА ГИПОТЕЗ Гипотеза — это утверждение о значениях параметров рас- распределения вероятностей (статистическая гипотеза в общем случае — суждение, относящееся к , распределению случайной величины.— Прим. ред.). Допустим, мы полагаем, что средний выход продукта химического процесса составляет 94,5%. Такое утверждение можно представить в формализованном виде как Яо: ц = 94,5; 1 Нг: р Ф 94,5. j Утверждение #0:ц = 94,5 называется нулевой гипотезой, а Н\.\х. =^94,5 — альтернативной гипотезой, или альтернативой. Поскольку "#! определяет значения ц,, которые либо больше, либо меньше 94,5, она называется двусторонней альтернативой. Значение среднего, задаваемое нулевой гипотезой, определяется одним из трех способов. Оно может быть известно из результа- результатов ранее проводившихся экспериментов; может вытекать из теории или модели исследуемого процесса или, наконец, зада- задаваться техническими условиями на него. Проверка гипотезы состоит в следующем. Берется случайная выборка, по которой находится значение некоторой статистики, и принимается решение, отклонить или принять нулевую гипо- гипотезу. Для этого необходимо знать распределение статистики, используемой для проверки, в предположении истинности нуле- нулевой гипотезы, а также множество значений статистики, которые приводят к отклонению гипотезы. Такое множество значений статистики называется критической областью, или областью от- отклонения гипотезы. При проверке гипотез встречаются ошибки двух родов. Если нулевая гипотеза отклоняется, когда она истинна, то совер- совершается ошибка I рода. Если нулевая гипотеза не отклоняется, когда она ложна, то совершается ошибка II рода. Вероятностям этих ошибок присвоены специальные обозначения: а=Р (совер- (совершить ошибку I рода)=Р (отклонить Я0|Я0 истинна); р = Р (со- (совершить ошибку II рода)=Р (не отклонить Н0\Н0 ложна). 25
B.30) Иногда удобнее пользоваться мощностью критерия, которая оп- определяется как Мощность = 1 — $ = Р (отклонить Яо|#о ложна). При проверке гипотез в общем случае задается величина а — вероятность ошибки I рода, которая часто называется уров- уровнем значимости критерия, и выбирается процедура проверки, обеспечивающая приемлемо малую величину ошибки II рода р. Рассмотрим вкратце несколько часто встречающихся задач на проверку гипотез: 1. Сравнение средних при известной дисперсии. 2. Сравнение средних при неизвестной дисперсии. 3. Сравнение дисперсий. Полный вывод этих и других процедур проверки гипотез можно найти в [11, 42]. 2.4.1. Проверка гипотез относительно средних Предположим, что у — случайная переменная с неизвестным средним ц, и известной дисперсией а2. Мы хотим проверить ги- гипотезы о ..._... п0. ц, — ц,0, Н1:у,Ф ц0, где цо — заданная постоянная. Для проверки нулевой гипотезы необходимо на основе выборки из п наблюдений у найти чис- численное значение статистики ZQ = y-=^, B.31) лежащей в основе критерия. Гипотеза Яо отклоняется, если |Zo|>Za/2, где Za/2 — верхняя a/2-процентная точка стандарти- стандартизованного нормального распределения. Такая процедура про- проверки может быть обоснована следующим образом. Из цен- центральной предельной теоремы известно, что выборочное среднее y~N {ц, а2/п). Поэтому, если Яо истинна, то величина Zo из со- соотношения B.31) подчиняется закону N @,1) и, значит, можно ожидать, что 100A — а) процентов значений Zo попадут в ин- интервал между —Za/2 и Za/2- Появление выборки, для которой Zo лежит вне этого интервала, было бы при условии истин- истинности Яо чем-то необычным и дало бы основания для отклоне- отклонения нулевой гипотезы. Отметим, что а равно вероятности ошибки I рода при использовании такого критерия. При решении некоторых задач может оказаться желатель- желательным отклонять гипотезу Яо только при условии, что истинное значение среднего ц, превосходит [хо- Таким образом формули- формулируется односторонняя альтернатива Н\ : ц> \i0, и Яо отклоняется при Zo>Za. Если же необходимо отклонять Яо только при ц,, меньшем цо, то в качестве альтернативной гипотезы берется Н\ : ц,<цю, и Яо отклоняется, если Zo<—Za. 26 Предположим теперь, что для двух совокупностей с извест- известными дисперсиями а<2 и а22 мы хотим проверить такую гипо- гипотезу: средние этих двух совокупностей, уц и \ц отличаются на постоянную величину у, или в формализованном виде я°: ^~ = т; B 32) В этом случае для проверки гипотезы берется случайная вы- выборка из щ наблюдений из первой совокупности и п2 наблюде- наблюдений из второй совокупности, после чего находится численное значение статистики Т.„= »¦-».-? B.33) 1 2 причем Яо отклоняется, если |Zo|>Za/2- При односторонней альтернативе Н^: \i\ — ^2>Y гипотеза Яо отклоняется, если Zo> >Za. При другой односторонней альтернативе Я:: цг — M-2<Y нулевая гипотеза отклоняется, если Zo<—Za. Сводка процедур проверки рассмотренных гипотез приведена в табл. 2.1. Таблица 2.1 Проверка гипотез относительно средних при изаестиой дисперсии Гипотеза Яо : [i = Ио Н\ ¦¦ и ф Мо Яо : М- = Мо Я1: [i < Цо Яо : Ц = (i0 Нх : у. > ц0 я„ Я! Яо Я! Яо Нг Mi — Мг = Т Mi — РгФУ Mi — M2 = V Mi — Иг<Т Mi —Мг = ? Mi — Иг > Y Статистика для проверки 7 У — Mo /jo — oYn 7 Qi—y^ — y Критерии отклонения > Za,2 Z0<-Za Z0>Za 7 1 ~ъ- 7 Л0 1 "^ a/2 Zo< :-za zu>za 27
Пример 2.1. Изготовитель текстиля получает от поставщика партии во- волокна. Его интересует, превосходит ли средняя по партии прочность на раз- разрыв 200 фунт/кв. дюйм A фунт/кв. дюйма=7-103 н/м2). Из прошлого опыта ему известно, что стандартное отклонение прочности на разрыв равно 10 фунт/кв. дюйм. Требуется проверить гипотезу Я0:и=200; Я, : |х>200. Выбираются случайным образом четыре образца; выборочное среднее проч- прочности на разрыв (/=214 фунт/кв. дюйм. Численное значение статистики, ис- используемой для проверки гипотезы Яо, „ ~y-Vo 214-200_ойп Если задается величина ошибки I рода а=0,05, то из приложения I нахо- находим Za = Zo,o5= 1,645. Таким образом, гипотеза Яо отклоняется, и мы при- приходим к выводу, что средняя по партии прочность на разрыв превосхо- превосходит 200. Если дисперсия распределения совокупности неизвестна, то приходится делать дополнительное предположение, что это рас- распределение нормально, хотя небольшие отклонения от нормаль- нормальности не приводят к существенному искажению результатов. При проверке гипотезы B.30) в случае неизвестной диспер- дисперсии для оценки а2 используется выборочная дисперсия S2. За- Заменяя в выражении B.31) а на 5, получаем статистику для проверки гипотезы Но B.34) Нулевая гипотеза Яо: ц- = ц,0 отклоняется, если |^0| >'о/2; л—1> где tan; л-i — верхняя a/2-процентная точка ^-распределения сп— 1 степенью свободы. Критические области для односторон- односторонних альтернатив приведены в табл. 2.2. Предположим, что есть две совокупности, распределенные нормально с неизвестными средними (ij и цг и неизвестными дисперсиями Oi2 и сг22- Процедура проверки гипотезы B.32) для таких совокупностей зависит от выполнения условия ai2 = a22. Рассмотрим сначала случай, когда это допущение справедливо. Для проверки Яо берутся две случайные выборки объема П\ и п2 из первой и второй совокупностей соответственно; далее нахо- находятся объединенная оценка дисперсии s2=("i-Qsf+h-i)^ j B 35) «2 — 2 где S,2 и 522- статистики выборочные дисперсии, * — У1—~У2 — У и численное значение B.36) Таблица 2.2 Проверка гипотез относительно средних нормально распределенных совокупностей при неизвестной дисперсии н Гипотеза Яо : ,u = Но Я! : [i ф Но Яо: н = Но Я! : ц < Цо Яо : и = Но Я! : |х > Цо Яо : Hi — Иг = Y Я! : Hi — На Ф У Но ¦ Hi — Иг = Y Я1: Hi - Из < Y Яо : Hi — Иг = Y Hi: Hi - Иг > Y Статистика для проверки у У — Но S/fn t У1—У2 — У V «j rt2 v = nt +л, —2, или , У1 — У 2 — Y f "l «2 \ «i ' «2 / 0 v- (s?/«,J (s224J «1 + 1 «2+1 Критерии отклонения 'о > 'а2; л-1 'о > (а; п-\ 'о > 'а/2! V *о < "'ев v 'о ^ a; v используемой для проверки. Гипотеза Яо отклоняется, если Mo |>^a/2; п,+п2-2- Такую процедуру иногда называют объединен- объединенным ^-критерием, так как обе выборки объединяются для полу- получения оценки общей дисперсии. Если нет оснований предполагать, что Oi2 = O22, то необхо- необходимо несколько изменить процедуру проверки. Статистика для проверки гипотезы принимает вид s0 I/ —1— [  / У1—У2 — «1 «2 B.37) 28 29
при числе степеней свободы ^-распределения V = — 2. B.38) «1+1 «2+1 Такая процедура проверки гипотез является приближенной. Статистика для проверки и критические области для односто- односторонних альтернатив приведены в табл. 2.2. В некоторых случаях при сравнении двух средних оказы- оказывается, что наблюдения должны сводиться в пары, поскольку экспериментальные образцы, используемые при этом, не явля- являются однородными. Пример такого парного ^-критерия приведен в параграфе 1.4. 2.4.2. Проверка гипотез относительно дисперсий Рассмотрим проверку гипотез относительно дисперсии сово- совокупности, подчиняющейся нормальному распределению. В отли- отличие от процедур сравнения средних процедуры сравнения дис- дисперсий довольно чувствительны к допущению о нормальности. Этот вопрос хорошо освещен в [24, приложение 2А]. Пусть мы хотим проверить гипотезу: дисперсия совокуп- совокупности, распределенной нормально, равна некоторой постоянной, скажем, сг02- В формализованном виде "'"'-* B.39) "• :02 = a2o; : а2Фа2 Для проверки этой гипотезы используется статистика B.40) где SS= V (yi—уJ— скорректированная сумма квадратов вы- борочных данных. Нулевая гипотеза отклоняется, если %2> >X2a/2;n-i или Х20<Х2_а2;„_р где Х2а,2;„_1 и Х?_в,.2;п_, соответ- соответственно верхняя а/2-процентная и нижняя A—а/2)-процентная точки распределения хи-квадрат, с п—1 степенью свободы. Критические области для односторонних альтернатив приведены в табл. 2.3. Рассмотрим теперь сравнение дисперсий двух нормально распределенных совокупностей. Если взять случайные выборки объема п.\ и п% из первой и второй совокупностей соответственно, то статистика для проверки гипотезы "•Ч-М B.4,) определяется отношением выборочных дисперсий Л B.42) Нулевая гипотеза отклоняется, если Fo > Fa2- ni_1; „2_i или f0<jFl_o;2;ni-lin2-l, ГДе Fa:2;ni-\;n,-l И Fi_a 2; n,-l; n,-\ COOTBeTCT- венно верхняя а/2-процентная и нижняя A — а/2)-процентная точки F-распределения с П\ — 1 и п2 — 1 степенями свободы. В приложении III приведены только верхние процентные точки /^-распределений, так как нижние процентные точки связаны с верхними соотношением ' 1—a; v,; va = .Таблица 2.3 a; v2; v. B.43) Проверка гипотез относительно дисперсий нормально распределенных совокупностей Гипотеза н0:о2 = о2 Н1\о2фо1 н0:о2 = о20 нх-.о2<о2 н0:о2 = о2 н1:о2>о2 Я0:о?=а| Н1:а2фа2 Я0:а2 = of Нх:в\<о22 нй:о2 = о\ Статистика для проверки 2 SS Хо ~ „ si ^2 S22 го = S2 Критерии отклонения 2 2 5Со>Ха,2; п-1 или 2 2 %о< Xi— а 2; п—\ Хо < Xl-а; п-1 Хо > Ха; п—\ F0 ^ ^2; п,—1, Па—1 ИЛИ 'о<-'1—«,'2; щ—I, п2—1 •^0 -^ ^а; па—1, п,—1 F0 > f о; П,-1. Па-1 30 31
Процедуры сравнения более чем двух дисперсий рассматрива- рассматриваются в 3.9. Пример 2.2. Допустим, мы хотим проверить гипотезы Яо:(т,2=а22; Н, : <Ti2>or22. Берутся две случайные выборки из fti = 12 и П2=Ю наблюдений; выборочные дисперсии Si2=14,5 и S22=10,8. Численное значение статистики для проверки гипотезы J>0 = ?L 1^=1.34. S2 10,5 Из приложения III находим Fo.os-, и; 9=3,10; следовательно, нулевая ги- гипотеза не может быть отклонена. Другими словами, наших статистических данных недостаточно для вывода о том, что O"i2>a22. 2.4.3. Вероятность ошибки II рода При проверке гипотез в каждом случае важно знать веро- вероятность ошибки II рода или, что эквивалентно, мощность крите- критерия. Рассмотрим, например, вероятность ошибки II рода для проверки гипотезы Но: \1=ц,0; Hi: цфцо при известной дисперсии о2. Статистика для проверки этой ги- гипотезы определяется уравнением B.31). Для нахождения При Рис. 2.5. Распре- Распределение статисти- статистики Zo при гипо- гипотезах Но и Н\. ошибки II рода необходимо предположить, что нулевая гипо- гипотеза Яо:ц=[хо — ложна. Пусть истинное значение среднего М4 = Мю+б, где б>0. Отсюда следует, что справедлива альтерна- альтернативная гипотеза Я^ц^цо, причем статистика для проверки B.44) Распределение статистики Zo, отвечающее каждой из гипо- гипотез #о и Н\, приведено на рис. 2.5. Непосредственно видно, что вероятность ошибки II рода — это вероятность попадания вели- 32 чины Zq в интервал между —Zai u Za2 при условии истинности гипотезы #i (эта вероятность равна площади заштрихованной фигуры); математически эта вероятность определяется выра- выражением = Ф Za2- bVn — Ф — Z»,— B.45) где Ф(?)—вероятность того, что стандартизованная нормаль- нормальная переменная не превосходит г. Отметим, что выражение B.45) определяет вероятность выполнения неравенства —Za,2 =?1 ?SZo<Za/2, когда истинна гипотеза Н\. Крайние точки интер- интервала были приведены к стандартизованному виду для того, чтобы можно было использовать при нахождении р таблицу функции распределения стандартизованного нормального закона (приложение I). Пример 2.3. Исследуется скорость сгорания ракетного топлива. По тех- техническим условиям средняя скорость сгорания должна быть 40 дюйм/с A м/с), а из прошлого опыта известно, что стандартное отклонение скорости сгорания составляет 2 дюйм/с @,05 м/с). Соответствующие гипотезы имеют вид Я„:ц,=40; Я, :ц=И=40. Экспериментатор использует выборку из и=25 наблюдений при а=0,05. Таким образом, статистика для проверки гипотезы имеет вид _у-40 ?ъ ~ > 2/25 причем На отклоняется, если \Za\ >Zo,o25=l,96. Допустим теперь, что экспе- экспериментатор хотел бы знать вероятность ошибки II рода, если истинное сред- среднее скорости сгорания fxi =41. Поскольку 6 = |j,i — |ло=41—40=1, то Р = Ф Z. Ja/2 — Ф —1,96 — 6/л ¦Ф 6/л = ФA,96—\±\- 1-5 = Ф D,46) — Ф @,54) = 1,000 0 — 0,705 4 = 0,2946, т. е. вероятность ошибочно принять гипотезу Но, если истинное среднее ско- скорости сгорания равно 41, составляет 0,2946. Этому эквивалентно утвержде- утверждение, что мощность критерия 1 — f$=l—0,294 6=0,705 4. Из рассмотрения соотношения B.45) и рис. 2.5 вытекает сле- следующее: 1) чем дальше отстоит истинное среднее pi от вели- величины [io, определяемой нулевой гипотезой, тем меньше вероят- вероятность ошибки II рода при фиксированных п и а; другими словами, при заданных объеме выборки и доверительной вероят- вероятности большие разности обнаруживаются легче, чем малые; 2) с ростом п — объема выборки — при заданных б и а вероят- вероятность ошибки II рода уменьшается; другими словами, мощность критерия для обнаружения некоторой разности б можно повы- повысить, увеличивая объем выборки. * Д. К. Монтгомери 33
Весьма полезно строить графики зависимости вероятности ошибки II рода для различных п. На рис. 2.6 приведен такой график для уровня значимости « = 0,05; на горизонтальной оси отложен параметр d=\8\/a. Кривые, подобные приведенным на графике, обычно называются оперативными характеристиками. Оперативные характеристики можно использовать для опре- определения объема выборки, необходимой для обнаружения задан- заданной разности средних с заданной вероятностью. Для иллюстра- иллюстрации их применения предположим, что в примере 2.3 истинная скорость сгорания равна 42, и гипотеза #0:(х0 = 40 отклоняется Рис. 2.6. Оперативные характеристики для двустороннего нор- нормального критерия при а=0,05. с вероятностью 0,90, т. е. мы хотим, чтобы мощность критерия составляла 0,90 или 0 = 0,10. Поскольку 6 = 42 — 40=2, то d= = |6|/o= |2|/2=l,0, и из рис. 2.6 находим, что для р = 0,10 и а=1,0 требуемый объем выборки п=10. Использование оперативных- характеристик при проверке ги- гипотез (см. табл. 2.1, 2.2 и 2.3) описывается в [11, 42]. Оператив- Оперативные характеристики играют важную роль в планировании экспе- экспериментов, и их использование в этом аспекте будет рассмотрено ниже. 2.5. ЗАДАЧИ 2.1. Диаметры стальных стержней, изготавливаемых по некоторой техно- технологии, обладают стандартным отклонением а=0,002 мм. Средний диаметр случайной выборки из 10 стержней составляет 5,09 мм. Проверьте гипотезу: истинный средний диаметр равен 5,10 мм при а=0,05. Постройте 95-процент- 95-процентный доверительный интервал для среднего диаметра. 2.2. Для нормальной случайной переменной с неизвестным средним н известной дисперсией а2=9 найдите объем выборки, обеспечивающий вели- величину 95-процентного доверительного интервала для среднего, равную 1,0. 2.3. Время ремонта радиоэлектронного прибора считается нормальной 34 случайной переменной, измеряемой в часах. Для" 16 таких приборов, выбран- выбранных случайным образом, получены следующие результаты: Время ремонта, ч 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 Разумно ли считать, что среднее время ремонта превосходит 225 часов? Оп- Определите доверительный интервал для истинного среднего времени ремонта. 2.4. Для разлива в пятилитровые канистры используются две установки. Чистый объем можно считать нормальной величиной со стандартными от- отклонениями 04 = 0,015 и аг=0,018. Отдел контроля качества предполагает, что обе установки обеспечивают один и тот же чистый объем. Взяты слу- случайные выборки продукции обеих установок: 5, 4, 03 98 5, 5, Установка 01 05 5, 5, 04 02 l 4, 5, 96 02 5, 4, 05 99 5, 5, 02 02 5 5 Установка ,03 ,01 4 5 97 01 2 5, 4, 04 99 4 5 ,96 ,00 Как вы думаете, справедливо ли мнение отдела контроля качества? 2.5. Результаты измерений времени горения сигнальных ракет двух типов оказались следующими: Тип Тип 1 2 65 64 82 56 81 71 67 69 57 83 59 74 66 59 75 82 82 65 70 79 а) Проверьте гипотезу о равенстве двух дисперсий при а=0,05. б) Используя результаты п. а) проверьте гипотезу о равенстве средних. 2.6. Диаметр шарикоподшипника (в миллиметрах) измеряется 12 рабо- рабочими при помощи двух микрометров. Получены следующие результаты: Микрометр Микрометр 1 2 2,65 2,67 2,64 2,64 2,65 2,67 2,65 2,65 2,66 2,65 2,64 2,65 2,67 2,68 2,66 2,67 2,67 2,68 2,67 2,68 2,65 1,65 2,68 2,69 Является ли значимой разность средних значений генеральных совокуп- совокупностей измерений, представленных двумя выборками? Возьмите а=0,05. 35
ГЛАВА ТРЕТЬЯ ОДНОФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ 3.1. ВВЕДЕНИЕ В этой главе мы рассмотрим однофакторные эксперименты. Например, экспериментатору требуется сравнить прочность волокон, получаемых с использованием различных технологий. Каждая технология обеспечивает какую-то свою среднюю проч- прочность, поэтому экспериментатор должен проверить гипотезу о равенстве нескольких средних. Может показаться, что такая задача решается применением ^-критерия ко всем возможным парам средних. Однако это решение неправильно, так как оно приводит к существенному завышению ошибки I рода. Пусть, например, мы хотим проверить гипотезу о равенстве пяти средних, используя попарные сравнения. Всех возможных пар десять, и если для каждой отдельной проверки вероятность правильного принятия нулевой гипотезы составляет 1—а = 0,95, то вероятность правильного принятия нулевой гипотезы для всех десяти проверок оказывается равной @,95) 10 = 0,60 (если проверки независимы). Таким образом, ошибка I рода суще- существенно возросла. Подходящей процедурой проверки равенства нескольких средних является дисперсионный анализ1. Однако этот метод применяется и при решении многих других задач; он представ- представляет собой один из самых важных методов теории статисти- статистических выводов. 3.2. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (КЛАССИФИКАЦИЯ ПО ОДНОМУ ПРИЗНАКУ] Предположим, мы хотим сравнить а различных уровней одного фактора. Различные уровни фактора называют обработ- обработками. Наблюдаемый отклик на каждую из а обработок пред- представляет собой случайную величину. Данные эксперимента сводятся в таблицу, подобную табл. 3.1. Число в этой таблице, например, ytj— суть /-е наблюдение при i-й обработке. Для нас окажется полезным описывать наблюдения линей- линейной статистической моделью yt; = \i +т; + е;/> 1=1. 2,..., а; /=1, 2,..., п, C.1) где уц—(i/)-e наблюдение; \i— параметр, общий для всех об- обработок, представляющий собой математическое ожидание об- 1 Наряду с полным наименованием далее будем использовать сокраще- сокращение ДА. (Прим. ред.) 36 щего среднего (строго говоря, ц, есть среднее математических ожиданий средних по всем совокупностям.— Прим. ред.); т, — параметр, характеризующий j-ю обработку, называемый эф- эффектом t'-й обработки; ец— случайная ошибка. Наша цель — проверить соответствующие гипотезы относительно эффектов обработок и оценить эти эффекты. При проверке гипотез ошибки модели считаются независимо распределенными нор- нормальными переменными с нулевым средним и дисперсией о2, причем эта дисперсия одна и та же для всех уровней факторов. Такая модель соответствует однофакторному ДА (класси- (классификации по одному признаку), поскольку исследуется только один фактор. Потребуем далее, чтобы эксперимент проводился в случайном порядке, с тем чтобы обеспечить как можно боль- большую однородность внешних условий (экспериментальных объ- объектов), при которых применяются обработки. Такой план экс- эксперимента называется полностью рандомизированным. Таблица 3.1 Данные для однофакторного дисперсионного анализа Обработка Наблюдение 1 2 , а Уи Ул ¦ Уа\ Уи #22 • Уаг У in Уы . Уап В действительности рассматриваемая статистическая мо- модель, определяемая выражением C.1), описывает, как нетрудно видеть, две различные ситуации относительно эффектов обра- обработок. С одной стороны, эти а обработок могут быть непосред- непосредственно заданы экспериментатором. В такой ситуации мы хотим проверить гипотезы относительно п и выводы будут при- применимы только к уровням фактора, рассмотренным при ана- анализе. Эти выводы нельзя распространить на похожие обра- обработки, не исследованные в эксперименте. Кроме того, может потребоваться оценить т*. Такая модель носит название модели постоянных эффектов, или модели с фиксированными уровнями факторов (по классификации, предложенной Эйзенхартом [30], модель I.— Прим. ред.). С другой стороны, а обработок могут 37
быть случайной выборкой из большой совокупности обработок. В этой ситуации мы хотели бы распространить выводы, осно- основанные на выборке, на все обработки в совокупности, незави- независимо от того, исследовались ли они в эксперименте или нет. Здесь Тг — случайные переменные, и информация о конкрет- конкретных значениях, которые были исследованы, относительно бес- бесполезна. Вместо этого мы проверяем гипотезу об изменчивости т; и пытаемся оценить эту изменчивость. Такая модель носит название модели случайных эффектов или модели компонен- компонентов дисперсии (согласно Эйзенхарту [30] — модель II.— Прим. ред.). 3.3. МОДЕЛЬ ПОСТОЯННЫХ ЭФФЕКТОВ 3.3.1. Статистический анализ В этом параграфе мы рассмотрим однофакторный ДА для модели постоянных эффектов. Здесь х%—-эффекты обработок — обычно определяются как отклонения от математического об- общего среднего, так что 2т,= 0. C.2) Обозначим г/;. — сумму наблюдений, полученных при t-й обработке; г/г.— среднее арифметическое наблюдений для t-й обработки. Аналогичным образом обозначим у.. — общую сумму всех наблюдений и у.. — общее среднее (оценку) всех наблю- наблюдений. Соответствующие формулы имеют вид <• = #<•/«> i = 1' 2,..., а; у- = 2 2 уц\ у.. = у-.ш, 1=1 /=1 C.3) где N — an — общее число наблюдений. Точка вместо нижнего индекса обозначает суммирование по индексу, который она заменяет. Нас интересует проверка равенства а эффектов обработок; с учетом соотношения C.2) соответствующие гипотезы имеют вид Но' Х\—%2= ...= та = 0; Нх: г; Ф 0 хотя бы для одного t. Таким образом, если справедлива нулевая гипотеза, то каж- каждое наблюдение складывается из математического ожидания общего среднего и реализации случайной ошибки, т. е. из \i 38 и etj. Соответствующая процедура проверки и есть дисперсион- дисперсионный анализ. Возникновение термина «дисперсионный анализ» объясня- объясняется тем, что общая изменчивость разбивается на составные части. Общая скорректированная сумма квадратов (отклоне- (отклонений от общего среднего) может быть записана в виде 2 2 i --)г =2 2 ldfi- 2 {уи-у. ¦? = п 2 (Уг - у- -Г + 2 2 &/ - уЛ /=1 1 = 1 1 = 1 /--=1 я л _ _ _ C.5) Слагаемое со смешанными произведениями оказывается, од- однако, равным нулю, поскольку я _ _ 2 (Уц—Уг)==У1- — Щ-=У1- — пУ1-/п = 0< / следовательно, 2 2 (уц-~у-J=п1 (yi-y- i /i 2 (Уа-~У1J Это соотношение показывает, что общую изменчивость данных, характеризуемую общей скорректированной суммой квадратов, можно разбить на сумму квадратов отклонений средних по об- обработкам от общего среднего и сумму квадратов отклонений наблюдений при каждой обработке от своего среднего. При этом отклонения средних по обработкам от общего среднего характеризуют различия между обработками, в то время как отклонения наблюдений внутри обработки от своего среднего могут быть обусловлены только случайной ошибкой. Таким образом, соотношение C.6) можно записать в символическом виде: "J»J Общ == <J«J Обр "Г «J >-> ОШ) где SSo6m, — общая сумма квадратов; 55Обр называется суммой квадратов, обусловленной обработками (т. е. различиями между обработками); 55Ош называется суммой квадратов, обусловлен- обусловленной ошибкой (т. е. различиями внутри обработок). Общее число наблюдений N = an, поэтому 550бщ обладает N—1 сте- степенью свободы; число уровней (и число средних по обработ- обработкам) равно а и 55Обр обладает а—1 степенью свободы. Нако- Наконец, п реплик внутри одного уровня дают п—1 степень свободы для оценки случайной ошибки эксперимента. Поскольку число обработок равно а, то сумма квадратов, обусловленная ошиб- ошибкой, обладает а(п—\)=ап—a=N—а степенями свободы. 39
Рассмотрим теперь свойства распределений введенных сумм квадратов. Мы предположили, что Eij~NID@,a2), поэтому наблюдения y^^NID(\i + Xi, а2). Таким образом 55Общ/о2 как сумма квадратов нормальных случайных переменных подчиня- подчиняется ^-распределению с N—1 степенью свободы. Можно также показать, что SSom/a2 является переменной распределения хи- квадрат с N—а степенями свободы, а 550бр/о2 при условии истинности гипотезы Но— переменной хи-квадрат с а—1 сте- степенью свободы. Однако эти три суммы не являются независи- независимыми: две из них при сложении дают третью. Полезна следую- следующая теорема (специальный вид теоремы Кокрена). Теорема 3.1. Пусть Zi~NID @,1) при i=\, 2, ...,v и где s^v, a Q; обладает v степенями свободы (i=l, 2, ..., s). Тогда Qb Q2,..., Qs — независимые случайные переменные хи- квадрат с \>ь v2 ..., vs степенями свободы соответственно в том и только том случае, если Суммы степеней свободы квадратов 550бр и SS05w, равны N—1, поэтому из теоремы Кокрена вытекает, что 55Обр/о2 и SSom/o2 — независимые случайные переменные, подчиняющиеся %2-распределению. Поэтому при истинности нулевой гипотезы статистика р — SSo6p/(a—\) _MSo6p °~ SS0Vi/(N -a) ~ MS C.7) подчиняется F-распределению с а—1 и N—а степенями сво- свободы. Величины MSoqp и MSom называются средними квадра- квадратами. Покажем с помощью выражений для математических ожи- ожиданий средних квадратов, что статистика Fo, определяемая соот- соотношением C.7), может использоваться для проверки гипотезы Яо: Тг = 0. Рассмотрим —a 40 Подставив в это соотношение выражение C.1) для статисти- статистической модели, получим E(MSom) = —а n i= X 2 .)•]. ± i=l Раскроем скобки и возьмем математическое ожидание, тогда, очевидно, слагаемые, обусловленные ъ2ц и е2,., заменятся соот- соответственно на о2 и па2, поскольку E(eij)=0. Кроме того, мате- математическое ожидание всех смешанных произведений, в которые входит e,j, оказывается равным нулю. Следовательно, послед- последнее соотношение принимает вид E(MS0[U) = —! -n^ т?-О02] f=l J ИЛИ Действуя аналогично, можно показать, что Из выражений для математических ожиданий средних квад- квадратов видно, что MSom является несмещенной оценкой а2 в об- общем случае, a MS06p — только при условии истинности гипо- гипотезы #о. Если нулевая гипотеза ложна, то математическое ожидание MS06p превосходит а2. Следовательно, при истинности альтернативной гипотезы математическое ожидание числителя выражения C.7) для статистики, используемой при проверке гипотезы, больше математического ожидания знаменателя, и мы должны отклонить гипотезу Яо, когда значения статистики Fo слишком велики. Таким образом, критическая область ле- лежит в верхнем шлейфе ^-распределения, т. е. Но отклоняется если где Fo находится по уравнению C.7). Преобразовав выражение C.6), являющееся определением сумм квадратов S506p и 550бЩ, можно получить для них упро- упрощенные расчетные формулы, а именно, 2 2 1=1 /=1 C.8) 41
и ss^^ — yyf.—-у2- C.9) 1=1 Сумма квадратов, обусловленная ошибкой, находится вычита- нием: SSom = SSo6ax-SSo6p. (ЗЛО) Процедура проверки гипотезы приведена в табл. 3.2, нося- носящей название таблицы ДА. Таблица 3.2 Таблица одиофакториого дисперсионного анализа для модели Пример 3.1. Для изготовителя представляет интерес предел прочности на растяжение синтетического волокна, идущего на ткань для мужских руба- рубашек. По его мнению, предел прочности зависит от процентного содержания хлопка в волокне. Рассматриваются пять уровней содержания хлопка—15, 20, 25, 30 и 35%. Для каждого уровня содержания хлопка нужно сделать по пять наблюдений, причем все двадцать пять наблюдений необходимо про- провести в случайном порядке. Для иллюстрации того, как осуществляется рандомизация порядка про- проведения эксперимента, пронумеруем наблюдения, допустим, следующим об- образом: Содержание хлопка, 15 20 25 30 6 И 16 7 12 17 8 13 18 9 14 19 1 2 3 4 5 10 14 15 20 35 21 22 23 24 25 Выберем теперь случайное число от 1 до 25, скажем, 8. Тогда первым проводится наблюдение с номером 8 B0% хлопка). Этот процесс продол- продолжается до тех пор, пока все 25 наблюдений не получат своего номера в по- последовательности испытаний'. Допустим, эта последовательность оказалась следующей: 1 При этом единственное ограничение на рандомизацию состоит в том, что, если выбирается уже встречавшееся число (например, 8), то оно от- отбрасывается. Такое ограничение несущественно, н им можно пренебречь. 42 Последова- Последовательность испытания 1 2 3 4 5 6 7 8 9 10 11 12 13 Номер наблюдения 8 18 10 23 17 5 14 6 15 20 9 4 12 Содержание хлопка, % 20 30 20 35 30 15 25 20 25 30 20 15 25 Последова- Последовательность испытаний 14 15 16 17 18 19 20 21 22 23 24 25 Номер наблюдения 7 1 24 21 11 2 13 22 16 25 19 3 Содержание хлопка, % 20 15 35 35 25 15 25 35 30 35 30 15 В соответствии с этой последовательностью производятся двадцать пять на- наблюдений; их результаты приведены в табл. 3.3. Суммы квадратов нахо- находятся следующим образом: 5 5 1 N И2 -3762 = 636,96; SSo6p = — So6p п ?Т У), --j- /.=-[- 1=1 ... + 542) — 3762 = 475,76; 25 SS0Vi = SSo6]]± — SSo6p = 636,96 — 475,76 = 161,20. Основные результаты ДА приведены в табл. 3.4. Поскольку /o.oi; 4; 20=^ =4,43, то мы отклоняем гипотезу На и приходим к выводу, что процентное Таблица 3.3 Предел прочности на растяжение синтетического волокна (фунт/кв. дюйм) Процентное волокна 15 20 25 30 35 Наблюдения 1 7 12 14 19 7 2 7 17 18 25 10 3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11 У{. 49 77 88 108 54 376 = у.. 43
содержание хлопка оказывает значимое влияние на предел прочности во- волокна. Таблица 3.4 Дисперсионный анализ данных по прочности на разрыв Источник изменчивости Сумма квадратов Степени свободы Средний ¦квадрат Обработки Ошибка Сумма 475,76 161,20 636,96 4 20 24 118,94 8,06 14,76 Пример 3.2. Кодирование данных. Для упрощения вычислений, прово- проводимых при ДА, можно использовать кодирование данных. Рассмотрим дан- данные наблюдений предела прочности из примера 3.1. Предположим, что мы вычли 15 из каждого наблюдения; кодированные данные приведены в табл. 3.5. Легко проверить, что SSo6p = ^-K-26J О .J_ = 475,76 25 SS0m= 161,20. Таблица 3.5 Кодированные Процентное содержание хлопка 15 20 25 30 35 данные г 1 —3 —1 4 —8 НаблюДени? 2 8 2 3 10 -5 3 0 —3 3 7 —4 —4 3 4 4 0 -6 3 4 8 —4 -26 2 13 33 -21 У.. = 1 Сравнивая эти суммы квадратов с полученными в примере 3.1, видим, что вычитание постоянной из исходных данных не изменяет суммы квадратов. Когда данные представляют собой очень большие числа, такое упрощение оказывается полезным при вычислениях. Теперь предположим, что мы умножили каждое наблюдение в при- примере 3.1 на 2. Легко проверить, что преобразованные данные приводят к сум- суммам квадратов SSaбщ=>2547,84, SS06p= 1903,04 и SSOm=644,80. Эти резуль- результаты кажутся существенно отличными от результатов примера 3.1; на самом 44 деле они просто превосходят их в 4 раза. Например, 550вр= 1903,04/4 = 475,76. Для кодированных данных статистика Fo совпадает со статистикой исход- исходных данных, /=¦<>= A903,04/4)/F44,80/20) = 14,76. Таким образом, оба анализа эквивалентны. 3.3.2. Оценивание параметров модели Построим теперь оценки параметров статистической модели однофакторного эксперимента используя метод наименьших квадратов (МНК). При таком оценивании ц и т, предположение о нормальности распределе- распределения ошибки ец не является необходимым. Для построения МНК — оценок составим сумму квадратов ошибок l = 2 2 4 = 2 2 0//,—ц-т,)8 (з.П) f=i /=i i=i /=i и выберем значения ц и тг-, скажем, \х и тг-, минимизирующие L. Эти значения являются, очевидно, решением системы а+\ уравнений dL dL = 0: = 0, г = 1, 2,..., а. Продифференцировав выражение C.11) по няв производные нулю, получаем и т, и прирав- прирав-22 {у ;=i или после упрощений = 0, i = l, 2 а Щ + пх1 Щ1 = г/i.; C.12) Эти а+1 уравнений для а + l неизвестных называются нор- нормальными МНК-уравнениями. Заметим, что, сложив последние а нормальных уравнений, мы получим первое, следовательно, 45
нормальные уравнения не являются независимыми, и решение системы уравнений C.12) не единственно. Эту трудность можно преодолеть несколькими способами. Поскольку мы определили эффекты обработок как отклонения от математического ожи- ожидания общего среднего, то кажется вполне разумным наложить ограничение вида 2т, = о. C.13) 1=1 При таком ограничении системе нормальных уравнений удов- удовлетворяет решение ^ = У_-' _ | C.14) ti=yi. — y.., t = l, 2,..., а.) Это решение весьма привлекательно своим соответствием на- нашим интуитивным представлениям. Действительно, «истинное» общее среднее оценивается общим средним наблюдений, а эф- эффект каждой обработки — разностью среднего для данной об- обработки и общим средним. Решение C.14) не является единственно возможным; оно определяется наложенным нами ограничением C.13), поэтому два экспериментатора при анализе одних и тех же данных мо- могут прийти к различным результатам, накладывая различные ограничения. Тем не менее некоторые функции параметров мо- модели определяются однозначно, независимо от ограничений. Например, разность т*—т3-, которая оценивается разностью я—т3- = г/г.—уз., и сумма [х + Тг, оценка которой ц+Тг = г/г. легко находится из уравнений C.12). Обычно нас интересуют скорее разности между эффектами обработок, а не их абсолютные зна- значения; поэтому не так уж важно, что т* нельзя оценить одно- однозначным образом. В общем случае любая функция параметров модели, представляющая собой линейную комбинацию левых частей нормальных уравнений C.12), может быть оценена однозначным образом. Функции, которые оцениваются одно- однозначно независимо от используемых ограничений, называются функциями, допускающими оценку. Нетрудно получить и интервальную оценку среднего t-й обработки. Точечной оценкой среднего t-й обработки является \n = \i + Xi = y%. Тогда, если предположить, что ошибки распределены по нормальному закону, то у{ъ~ЫЮХ(ци а2/п). Таким образом, если известна дисперсия о2, то для построения доверительного интервала мы могли бы воспользоваться нор- нормальным распределением. Если в качестве оценки о2 берется MSom, то доверительный интервал строится на основе t-pac- 46 пределения. Следовательно, 100A—а)-процентный доверитель- доверительный интервал для среднего t-й обработки Цг есть {. ± tan; N-a VMS0Jtl, C.15) а 100A—а)-процентный доверительный интервал для разности средних по обработкам, скажем, \ц—щ, имеет вид У,. — У,: ± tax N-a V2MS0Jn. C.16) Пример 3.3. С помощью данных примера 3.1 мы можем найтн оценки общего среднего и эффектов обработок, а именно, |Г= 376/25 =15,04 xi=yi. —у.. = 9,80— 15,04 = — 5,24; г2=у1. — ]л. = 15,40— 15,04=0,36; т3 = у~ъ. —~~у~.. = 17,60 — 15,04 = 2,56; т4=(/Г. — ]Г. = 21,60 — 15,04=6,56; т =у~ъ,—~у~..= 10,80— 15,04 = —4,24, причем 95-процентный доверительный интервал для среднего, скажем, обра- обработки 4 находится из уравнения C.15) или 21,06±2,08бУ8,06/5 21,06+2,65. Таким образом, искомый доверительный интервал имеет вид 3.3.3. Несбалансированный случай В некоторых однофакторных экспериментах число наблю- наблюдений для разных обработок может оказаться различным. Мы тогда говорим, что план несбалансирован. И в этом случае можно применить ДА, если внести небольшие изменения в фор- формулы для сумм квадратов. Пусть щ— число наблюдений для а 1-й обработки, t = l, 2,...,а и iV = 2n,-. Для расчета 55ОбЩ и i=i 55Обр тогда должны использоваться формулы 2, - N у- 47
При решении нормальных уравнений накладывается ограни- а л чение 2ттг = 0. В остальном ДА проводится без изменений. Заметим, однако, что выбор сбалансированного плана об- обладает двумя преимуществами. Во-первых, при равных объ- объемах выборок статистика для проверки гипотезы относительно нечувствительна к малым отклонениям от предположения о ра- равенстве дисперсий для а обработок; при различных объемах выборок это уже не так. Во-вторых, при одинаковых объемах выборок мощность критерия оказывается максимальной. 3.4. СРАВНЕНИЕ ОТДЕЛЬНЫХ СРЕДНИХ ПО ОБРАБОТКАМ Предположим, что при проведении ДА для модели постоян- постоянных эффектов нулевая гипотеза отклоняется. Этим самым ут- утверждается, что различия между обработками существуют, но не устанавливается, какие именно обработки отличаются одна от другой. В такой ситуации могут оказаться полезными даль- дальнейшие сравнения групп обработок. Среднее по t-й обработке определяется как рч = ц + п, причем рц оценивается величиной ~Уг.- Сравнения средних по обработкам проводятся в терминах сумм по обработкам {уг}. Рассмотрим задачу об испытании синтетического волокна в примере 3.1. Гипотеза #о:г/г = О была отклонена, поэтому проч- прочность волокна на растяжение оказалась различной для неко- некоторых уровней процентного содержания хлопка, но для каких именно — неизвестно. До начала эксперимента мы могли бы предположить, что для уровней 4- и 5-процентного содержания хлопка величина предела прочности одна и та же, т. е. потре- потребовалось бы проверить гипотезу Эту гипотезу можно проверить, исследовав подходящую линей- линейную комбинацию сумм по обработкам, скажем, г/4— г/5. = 0. Если бы мы предположили, что среднее арифметическое уровней 1 и 3 не отличается от среднего арифметического уровней 4 и 5, то проверялась бы гипотеза исследованием линейной комбинации Уи + Уз.—г/4.—г/5. = 48 Сравнение средних по обработкам, представляющим инте- интерес, приводит в общем случае к линейной комбинации а с наложением ограничения 2Cj = 0. Линейные комбинации сумм по обработкам такого вида называются контрастами. Сумма квадратов для контраста определяется как со _ О О Г 2 1=\ C.17) 1=1 она обладает одной степенью свободы. Если план несбаланси- а рован, то используется ограничение 2 "А = 0 и выражение i=i C.17) принимает вид i=i C.18) Для проверки контраста его сумма квадратов сравнивается со средним квадратом ошибки. Статистика, которая при этом получается, подчиняется ^-распределению с одной и N—a сте- степенями свободы. Весьма важным частным случаем описанной процедуры яв- является использование ортогональных контрастов. Два контраста с коэффициентами {сг} и {di} ортогональны, если а для несбалансированного плана, если При а обработках с помощью набора а—1 ортогональных контрастов сумма квадратов, обусловленная обработками, раз- разбивается на а—1 независимую составляющую с одной степенью свободы каждая. Таким образом, проверки гипотез о контра- контрастах являются независимыми. Коэффициенты ортогональных контрастов для группы обрабо- обработок можно выбрать многими способами. Обычно особенности 49
самого эксперимента определяют, какие именно сравнения наи- наиболее интересны. Например, если а = 3, причем первая обра- обработка — контрольная, а две другие представляют собой интере- интересующие нас уровни фактора, то соответствующие ортогональ- ортогональные контрасты можно выбрать такими: Обработка 1 (контрольная) 2 (уровень 1) 3 (уровень 2) Коэффициенты ортогональных контрастов -2 0 1 —1 1 1 Отметим, что контраст 1 с Сг = —2, 1, 1 служит для сравнения среднего эффекта фактора с контрольной обработкой, а конт- контраст 2 с di = 0, —1, 1—для сравнения между собой двух уров- уровней фактора, представляющих интерес. Коэффициенты контрастов должны выбираться до начала эксперимента и ознакомления с данными. Это объясняется тем, что при выборе обработок для сравнения после ознакомления с данными многие экспериментаторы строят гипотезы, соответ- соответствующие большим наблюденным разностям средних. Эти боль- большие разности могут быть обусловлены, с одной стороны, реаль- реальными эффектами, а с другой — присутствием случайных оши- ошибок. Если экспериментатор последовательно выбирает для сравнения наибольшие разности, то он тем самым резко повы- повышает вероятность ошибки I рода, поскольку вполне может быть, что в необычно высокой доле выбранных сравнений на- наблюденные разности окажутся обусловленными случайными ошибками. Пример 3.4. Рассмотрим данные примера 3.1. Пяти средним по обра- обработкам соответствуют четыре степени свободы. Построим один из вариантов сравнений этих средних и соответствующие контрасты: Гипотеза На : (ii = ( #!; 4(i2= i С2 t/i, Сз=(/.. Контраст У У + 1/3. —04. — 05. — Уз. С4 = — 01.+ 402. — 03. — 04. — 05. Заметим, что коэффициенты этих контрастов ортогональны. Используя данные табл. 3.3, найдем численные значения контрастов н сумм квадратов: ^=-1-108+1.54= -54; SSCl= Щ^ =291,60; C2= 1-49+1-88—1-108 —1-54= —25; = 31,25; 50 . = 1-49 — 1-88 = —39; ^ 5-2 = 152,10; C4 = — 1- 49 + 4-77— 1-88— 1-108 — 1-54 = 9; Эти суммы квадратов для контрастов образуют полное разбиение суммы квадратов, обусловленной обработками. Проверки контрастов обычно вклю- включаются в ДА (табл. 3.6). Из данных этой таблицы можно сделать вывод, что значимыми являются разности между уровнями 4 и 5 процентного содержа- содержания хлопка и между уровнями 1 и 3, но среднее уровней 1 н 3 не отличается от среднего уровней 4 и 5, как и уровень 2 не отличается от среднего осталь- остальных четырех. Таблица 3.6 Дисперсионный анализ для данных по прочности Источник изменчивости Процентное содержание хлопка ортогональные кон- контрасты Ci: Ц4 = V-ъ С2 : Ц! + A3 = ц4 + V-ь С3 '¦ Hi = Из С4: 4ц2=ц1+ц3 + ц4+Ц5 Ошибка Сумма Сумма квадратов 475,76 A91,60) C1,25) A52,10) @,81) 161,20 636,96 Степени свободы 4 1 1 1 1 20 24 Средний квадрат 118,94 191,60 31,25 152,10 0,81 8,06 14,76* 36,18* 3,88 18,87* 1,10 • Значимо при 1 проценте. Во многих экспериментальных ситуациях исследователю мо- может быть неизвестно заранее, какие ортогональные контрасты выбрать, или ему может понадобиться провести более чем а—1 сравнение с помощью одних и тех же данных. Пусть, на- например, требуется сравнить все возможные пары средних. Тогда нулевая гипотеза имеет вид Я0:|Лг = ц3- при_всех_1#/ и, если мы используем ^-критерий, то статистика to= (t/i.—yj.)/BMSOm/n)i/2 подчиняется ^-распределению с N—а степенями свободы. Таким образом, при двусторонней альтернативе разность любых двух средних является значимой, если] yt.—у}. \>ta>2\ N-a{2MSoai/n)li2- Величина taj2-, jv_aBAlSoni/nI/2 называется наименьшей значимой разностью (соответствующая процедура проверки называется иногда критерием минимальной значимой разности.— Прим. ред.). Когда все возможные пары средних проверяются по этому методу, то, как отмечалось в § 3.1, вероятность ошибки I рода может значительно возрасти. Существует целый ряд критериев, 51
лишенных этого недостатка; среди них наиболее популярны критерии Ньюмена [54], Тьюки [68] и Дункана [29]. Новый ин- интерес к критерию Ньюмена пробудила работа Кейлса [49], ко- который часто называется критерием Ньюмена—Кейлса. Крите- Критерий Тьюки консервативен в том смысле, что вероятность ошибки I рода в одном эксперименте в действительности меньше а; в критериях Ньюмена—Кейлса и Дункана этого не наблюда- наблюдается. Кармер и Суонсон [18] в сравнительном исследовании как упомянутых, так и иных процедур показали, что критерий Дун- Дункана превосходит критерий Ньюмена—Кейлса при обнаружении истинных разностей между парами средних. Мы рассмотрим ме- метод Дункана, который обычно называется множественным кри- критерием размахов Дункана. Для применения множественного критерия размахов Дун- Дункана в случае выборок одинакового объема а средние по обра- обработкам располагаются в возрастающем порядке, и для каждого среднего определяется стандарт ошибки C.19) Из таблицы значимых размахов Дункана (приложение VI) находятся величины га(р, /), р = 2, 3, ..., а где а — уровень зна- значимости и / — число степеней свободы ошибки. Эти размахи преобразуются в набор а—1 наименьших значимых размахов (скажем, Rp) по формуле RP = ra(p, /)S-; p = 2, 3,..., а. Затем проверяются наблюденные размахи между средними, на- начиная со сравнения разности наибольшего и наименьшего сред- средних с наименьшим значимым размахом Ra. Далее находится размах между наибольшим и следующим за наименьшим сред- средним и сравнивается с наименьшим значимым размахом Ra-i- Эти сравнения продолжаются до тех пор, пока все средние не будут сравнены с наибольшим из них. Затем находится размах между вторым по величине средним и наименьшим и сравни- сравнивается с наименьшим значимым размахом Ra-i- Этот процесс продолжается до тех пор, пока не будут рассмотрены все воз- возможные а (а—1)/2 пар средних. Если наблюденный размах пре- превосходит соответствующий наименьший значимый размах, то делается вывод, что разность сравниваемых средних является значимой. Для того чтобы избежать возможных противоречий, не рассматриваются средние, попадающие в интервал между двумя средними, разность которых не является значимой. Пример 3.5. Применим множественный критерий размахов Дункана к дан- данным примера 3.1. Вспомним, что AfSOm = 8,06, N=25, п=Ъ, и что ошибке со- 52 ответствует 20 степеней свободы. Упорядочив средние по обработкам, по- получим 2/5.= 2/2.= 9,8; 10,8; 15,4; №.= 17,6; jT4. = 21,6. Стандарт ошибки каждого среднего S-="^'8,06/5= 1,27. Из таблицы значимых размеров (приложение VI) для 20 степеней свободы и а = 0,05 на- находим ro,osB; 20) =2,95, го,о5C; 20) =3,10, г0,о5D; 20) =3,18 и ro,osE; 20) =3,25. Таким образом, наименьшие значимые размахи «2=го,о5B; 20)S-. -2,95-1,27=3,75; Яз=/-о,о5C; 20M- =3,10-1,27=3,94; Й4 = го,о5D; 20)S-. =3,18-1,27 = 4,04; Й5 = '-о,о5E; 20)S- =3,25-1,27=4,13. Сравнения средних дают следующие результаты: 4 с 1: 21,6— 9,8=11,8>4,13 (Rb); 4 с 5: 21,6—10,8= 10,8>4,04 (Я4); 4 с 2 21,6— 15,4 = 6,2>3,94 (#3); 4 с 3: 21,6— 17,6 = 4,0>3,75 (R2); 3 с 1: 17,6— 9,8 = 7,8>4,04 (#4); 3 с 5: 17,6— 10,8 = 6,8>3,94 (R3); 3 с 2: 17,6— 15,4 = 2,2<3,75 (R2); 2 с 1 15,4 —9,8=5,6>3,94 (fl3); 2 с 5: 15,4-10,8 = 4,6>3,75 (R2); 5 с 1: 10,8 —9,8=1,0<3,75 (fo). Из проведенного анализа следует, что значимыми являются разности между всеми парами средних, исключая 3 и 2, а также 5 и 1. Бывает по- полезно записать все средние в ряд и подчеркнуть те из них, разность между которыми не является значимой (рис. 3.1). Из такого графического представ- представления непосредственно видно, что четвертая обработка приводит к большей на данном уровне значимости прочности волокна на растяжение. Уи Уъ. Уз. 9,8 10,8 15,4 17,6 У* 21,6 Рис. 3.1. Результаты применения множественного критерия размахов Дункана. Кармер и Суонсон [18] показали также, что метод наимень- наименьших значимых разностей, описанный выше, является весьма эффективным критерием для обнаружения истинных разностей средних, если он применен после того, как ^-статистика в ДА оказалась значимой на уровне 0,05. Хотя эта процедура приво- приводит к большему значению ошибки I рода, чем множественный критерий размахов Дункана, некоторые исследователи пред- предпочитают использовать именно ее, так как критическая величина зависит от значения ^-статистики, полученного в ДА, а не от числа средних в эксперименте. 53
Разность двух средних, очевидно, является контрастом. В не- некоторых экспериментах после ознакомления с данными может оказаться желательным проверить более сложные контрасты, включающие в себя несколько средних. Шеффе [59] предложил метод проведения таких сравнений, а именно, его критерий дает возможность экспериментатору, ознакомившись с данными, проверить любую представляющую для него интерес функцию, допускающую оценку. Однако Кармер и Суонсон [18] отметили, что критерий Шеффе недостаточно хорош при обнаружении истинных разностей средних, и следует избегать его применения при проведении множественных парных сравнений. 3.5. МОДЕЛЬ СЛУЧАЙНЫХ ЭФФЕКТОВ Экспериментаторам часто приходится исследовать факторы с большим числом возможных уровней. Если при этом из сово- совокупности уровней фактора выбираются случайным образом а уровней, то говорят, что такой фактор случаен. Поскольку уровни фактора, исследованные в эксперименте, выбраны слу- случайным образом, то полученные выводы должны относиться ко всей совокупности уровней фактора. Мы будем считать, что со- совокупность уровней фактора бесконечна или достаточно велика, так что ее можно считать бесконечной. Ситуации, когда сово- совокупность уровней фактора настолько мала, что необходимо учи- учитывать ее конечность, встречаются не так уж часто; случай ко- конечной совокупности уровней фактора рассмотрен, например, у Беннета и Франклина [5], Сёрла и Фосетта [65]. Линейная статистическая модель имеет вид tf /f i = l, 2,..., а; /= 1, 2,. . . ,п, C.20) где как %\ так и гц — случайные переменные. Если егз- и тг- зави- зависимы, а дисперсия тг- равна ах, то для дисперсии любого из на- наблюдений получаем ? 2 Дисперсии а2, и а2 называются компонентами дисперсии, а модель, определяемая выражением C.20),— моделью компо- компонентов дисперсии или моделью случайных эффектов. Для проверки гипотез при такой модели потребуем, чтобы {ец} ~ &NID @, a2), a {%i}~NID @, о2), причем т.; и ец незави- независимы Тождество для сумм квадратов •^общ = SSo6p + SSom C.21) остается справедливым и в этом случае, т. е. мы разбиваем об- 1 Из предположения о независимости случайных величин {т,} следует, а что ограничение 2т*=0, принятое для модели постоянных эффектов, в модели случайных эффектов неприменимо. 54 щую изменчивость наблюдений на два компонента, один из ко- которых характеризует изменчивость SS06p, обусловленную обра- обработками, а другой — изменчивость внутри обработок SSom. Про- Проверка гипотез об эффектах отдельных обработок не имеет смысла, поэтому проверяется гипотеза Ях:а?>0. Если 62=О, то эффекты всех обработок одинаковы; если же ат>0, то между ними существуют различия. Как и ранее, величина SSomfa2 является переменной хи-квадрат с N—а сте- степенями свободы, а 55Обр/а2 — переменной хи-квадрат с а—1 степенью свободы только при условии истинности нулевой ги- гипотезы. Обе эти случайные величины независимы. Таким обра- образом, если истинна нулевая гипотеза, то отношение q. SS06p/@ 1) MS06p °~ SS0lu/(N — a) ~ MSom C.22) подчиняется ^-распределению с а—1 и N—а степенями сво- свободы. Для полного описания процедуры проверки гипотезы нам, однако, нужно исследовать математические ожидания средних квадратов. Рассмотрим ) _ _L_ Е (SSo6p, = _L_ Е [JL | i. __L fi ] _ i Г i a / n Раскроем скобки и возьмем математическое ожидание, тогда, очевидно, слагаемые, определяемые п2, заменятся на а2 !, так как E(xi)=O. Слагаемые, определяемые е2г-., е2.. и 2 т'' / i=i /=i заменятся на да2, а/га2 и ап2ах соответственно. Кроме того, математическое ожидание всех смешанных произведений, в ко- которые входят Тг и ец, оказывается равным нулю. Итак, рас- рассматриваемое выражение принимает вид Е (MSo6p) = -^ [N% + No2, + ас2-Ny?-no\-o2}; C.23) C.24) Из выражений для математических ожиданий средних квад- квадратов видно, что при истинности гипотезы #о как числитель, 55 Аналогичным образом можно показать, что
так и знаменатель выражения C.22) для статистики, исполь- используемой при проверке, являются несмещенными оценками о2, но, если гипотеза Но ложна, то математическое ожидание числи- числителя превосходит математическое ожидание знаменателя. Сле- Следовательно, гипотеза Но отклоняется при слишком больших зна- значениях Fq. Этим определяется критическая область, лежащая в верхнем шлейфе /^-распределения, т. е. Яо отклоняется, если Fo>Fa-t a-U N-a- Численные расчеты и заполнение таблицы ДА для модели случайных эффектов проводятся так же, как и для модели по- постоянных эффектов. Однако выводы, получаемые на основе ре- результатов анализа, совершенно различны, поскольку в модели случайных эффектов они относятся ко всей совокупности обра- обработок. В модели случайных эффектов нас могут интересовать оценки компонентов дисперсии а2 и о2. Получим их, используя процедуру ДА, т. е. строки таблицы ДА. Для построения оце- оценок приравняем наблюденные значения средних квадратов из таблицы ДА их математическим ожиданиям и решим получен- полученные уравнения относительно компонентов дисперсии. Для одно- факторной модели случайных эффектов эти уравнения имеют вид MSош= О2, следовательно, для оценок компонентов дисперсии получаем выражения o* = MSom C.25) и C.26) = — (MSo6p-MSoJ. Если объемы выборок различны, то величину п в выраже- выражении C.26) нужно заменить на а — \ Применение процедуры ДА для оценивания компонентов дисперсии не требует предположения о нормальности. Рассмот- Рассмотренная процедура позволяет получить несмещенные оценки о2 и а? с минимальной дисперсией (точнее, эти оценки имеют наи- 56 меньшую дисперсию среди всех квадратичных несмещенных функций наблюдений). В некоторых случаях процедура ДА приводит к отрицатель- отрицательной оценке компонента дисперсии. Очевидно, что компоненты дисперсии неотрицательны по определению, поэтому отрица- отрицательная оценка компонента дисперсии вызывает некоторое сом- сомнение. В этом случае можно поступить, скажем, так: принять получившуюся оценку как свидетельство того, что истинное зна- значение компонента дисперсии равно нулю, т. е. предположить, что к отрицательности оценки привели какие-то выборочные вариации. Такой подход привлекателен с интуитивной точки зрения, но приводит к определенным теоретическим трудностям, например, использование нуля вместо отрицательной величины оценки может изменить статистические свойства других оце- оценок. Далее, можно получить новую оценку отрицательного ком- компонента дисперсии методом, всегда дающим только неотрица- неотрицательные оценки. Наконец, можно рассматривать отрицательную оценку как свидетельство некорректности принятой линейной модели и решать задачу заново. Хорошо описаны вопросы оценки компонентов дисперсии у Сёрла [63, 64]. Пример 3.6. Текстильная компания изготавливает волокно на большом числе станков. Желательно, чтобы станки не отличались друг от друга, т. е. чтобы изготавливаемое волокно обладало одинаковой прочностью. Инженер- технолог предполагает, что помимо обычной изменчивости прочности среди образцов волокна с одного и того же станка могут существовать и значимые различия между станками. Для проверки этого предположения он выбирает случайным образом четыре станка и делает четыре измерения прочности волокна, изготавливаемого на каждом станке. Эксперимент проводится в слу- случайном порядке; его данные приведены в табл. 3.7. Результаты ДА приве- приведены в табл. 3.8, из них можно сделать вывод, что станки на фабрике обла- обладают значимыми различиями. Таблица 3.7 Данные по прочности для примера 3.6 Станки 1 2 3 4 Наблюдения 1 98 91 96 95 ! 2 97 90 95 96 3 99 93 97 99 96 92 95 98 Ус. 390 366 383 388 1527 = у.. Оценивание компонентов дисперсии дает о=2,15 и S? = -i- B9,73 — 2,15) = 6,90, следовательно, дисперсия любого наблюдения прочности оценивается величи- величиной a -f-a2=2,l5+6,90 = 9,05, причем большая часть этой изменчивости объ- объясняется различиями между станками. 57
Таблица 3.8 Дисперсионный анализ данных по прочности Источник изменчивости Станки Ошибка Сумма Сумма квадратов 89,19 25,75 114,94 Степени свободы 3 12 15 Средний квадрат 29,73 2,15 13,82 = * Значимо при 5 процентах. Можно легко найти доверительный интервал для компонента дисперсии а2. Если наблюдения являются независимыми нор- нормальными случайными величинами, то (N—a) MSomfa2 подчи- подчиняется ^-распределению с N—а степенями свободы. Тогда )MS \ п / 2 Р Xl-a'2; N-a — a)MSom ' — 2 \ , Xa/2; N-a = 1 — ОС ] и 100A—a)-процентный доверительный интервал для а2 имеет вид (N~a)MSom ^.^^ (N-a)MSova 2 2 У-а.2; N—a Xl—a'2; W—a Рассмотрим теперь компонент дисперсии от2; его точечная оценка имеет вид Случайная переменная (а—1) М50бр/(а2 + ио?) является переменной хи-квадрат с а—1 степенями свободы, а (N—а) X XMSom/cr2 — хи-квадрат с N—а степенями свободы. Следова- Следовательно, распределение вероятностей величины ат есть распре- распределение линейной комбинации двух переменных хи-квадрат, скажем где ы,= n(a-l) n(N — а) К сожалению, распределение вероятностей этой линейной комбинации переменных хи-квадрат не может быть найдено в явном виде; следовательно, точный доверительный интер- интервал для а\ построен быть не может. Описание приближенных процедур дано у Грейбилла [39] и Сёрла [63]. 58 3.6. ПОДБОР КРИВОЙ ОТКЛИКА ПРИ ОДНОФАКТОРНОМ АНАЛИЗЕ Единственный фактор, исследуемый при однофакторном ДА, может носить либо количественный, либо качественный характер. Уровни количественного фактора (например, темпе- температуры, давления, времени) могут быть соотнесены с точками на числовой оси. Уровни же качественного фактора, наоборот, не могут быть упорядочены по величине. Операторы, партии сырья, смены работы — типичные качественные факторы, по- потому что им нельзя приписать числовые значения и тем самым упорядочить. При составлении плана эксперимента и анализе его данных факторы обоих типов трактуются одинаково. Эксперимента- Экспериментатора интересует, существуют ли различия между уровнями факторов. Если фактор — качественный, например, операторы, бессмысленно рассматривать отклик при последующем испыта- испытании на промежуточном уровне фактора. Однако при исследова- исследовании количественного фактора, например времени, эксперимен- экспериментатора обычно интересует весь диапазон использованных зна- значений, в особенности отклик при последующем испытании на промежуточном уровне фактора. Скажем, в эксперименте ис- используются уровни 1,0, 2,0 и 3,0 ч и мы хотим предсказать отклик при 2,5 ч. В общем случае такая задача для количественного фактора решается установлением математической связи между незави- независимой переменной (фактором) и откликом. Общий метод ре- решения этой задачи, носящий название регрессионного анализа, обсуждается в гл. 13. Однако при равноотстоящих уровнях фактора может быть применена простая процедура с исполь- использованием таблицы коэффициентов ортогональных контрастов (приложение VII). Эта процедура позволяет найти линейный, квадратический, кубический и т. д. эффекты и сумму квадратов для фактора. Каждый эффект представляет собой контраст с одной степенью свободы, который находится по суммам для обработок при а уровнях фактора (как в параграфе 3.4). Соответствующая сумма квадратов определяется выражением C.17). Если в эк- эксперименте используются а уровней фактора, то оказывается возможным выделить полиномиальные эффекты до (а—1)-го порядка включительно. Порядок действия приводится в табл. 3.9 на данных примера 3.1, в котором у независимого фактора — процентного содер- содержания хлопка — пять равноотстоящих уровней. Суммы квадра- квадратов для линейного, квадратического, кубического и четвертой степени эффектов образуют разбиение суммы квадратов, обу- обусловленной обработками, и могут быть включены в ДА (табл. ЗЛО). У любого из этих эффектов одна степень свободы; он 59
Таблица 3.9 Вычисление полиномиальных эффектов для примера 3.1 Коэффициенты ортогональных контрастов I проверяется сравнением соответствующей суммы квадратов со средним квадратом ошибки. Из результатов табл. 3.10 следует, что квадратический и ку- кубический эффекты процентного содержания хлопка являются значимыми при сравнении с Fo,o5;i;2o- Следовательно, эмпири- эмпирические данные мы аппроксимируем кубическим полиномом, скажем, у = ао + а1Р1(х)+а.2Р2(х)+азРз{х)+е, где Ри(х)—ортогональный полином ы-го порядка. Ортогональ- Таблица 3.10 Дисперсионный анализ Процентное содержа- содержание хлопка: линейный квадратический кубический четвертой степени Ошибка Сумма 475,76 C3,62) C43,21) F4,98) C3,95) 161,20 1 1 1 1 20 24 118,94 33,62 343,21 64,98 33,95 8,06 14,76 : 4,17 42,58* 8,06** 4,21 * Значимо при 1 проценте. ** Значимо при 5 процентах. 60 ность понимается в том смысле, что если а —число уровней х, то ^Pu(Xj)Ps(Xj)=Q при u^s. Первые пять ортогональных полиномов имеют вид Р0(х) = 1; Р, (х) = Я, Рг« = К Рз (х) = Я3 * 4 (Х) = Л4 X — X X— X X — X а2 — 1 12 X — X ' х-х'2 За2 —7 20 За2— 13 14 3(а2-1)(а2 —9) 560 где d — интервал между уровнями х; а — число уровней; {Яг} — постоянные, введенные для того, чтобы полиномы при- принимали целочисленные значения. В приложении VII приведена таблица коэффициентов ортогональных полиномов и значений Я; для а<10. Оценки параметров при использовании ортого- ортогональных полиномов имеют вид , I —и, I,..., а—1. Вывод этих соотношений будет дан в 13.7. Для данных примера 3.1 мы можем получить следующие оценки параметров модели: *о —¦ = -^=15,0400; 2 У Pi ОСо '-— ¦ 41 ~ 5-10 -155 5-14 = 0,820 0; = —2,214 3; ¦=т?=-'-1400- Если мы хотим повысить или понизить порядок модели, то благодаря свойству ортогональности полиномов {Р%(х)} нет необходимости пересчитывать {а,}, уже входившие в модель. Поскольку число уровней а = Ъ и интервал между уровнями d — Ъ, то уравнение модели при аппроксимации ортогональными 61
полиномами имеет вид — 25\ /3-52-7 5 А 20 Значения К\ = 1, Лг=1 и Яз=5/б взяты из таблицы приложения VII. После упрощений получаем уравнение у = 64,593 6—9,010 Ох + 0,481 4л;2—0,007 6л;3, которое может быть использовано для предсказания прочности волокна при изменении содержания хлопка от 15 до 35%. На- Например, если мы захотели предсказать прочность волокна, ска- скажем, при х = 30%, то получаем г/ = 64,593 6—9,010 0 -30 + 0,481 4- 302—0,007 6-303 = 22,35. Вообще говоря, для описания эмпирических данных жела- желательно получить полином наименьшей степени. При этом ока- оказывается удобным использовать ортогональные полиномы, так как простота обращения с ними позволяет экспериментатору добавлять значимые слагаемые или исключать незначимые, не меняя значений ранее найденных коэффициентов. Более полно регрессионные методы будут обсуждены в гл. 13. 3.7. МОЩНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗА При проверке любых гипотез экспериментатора обычно ин- интересует мощность используемого критерия. В этом параграфе мы рассмотрим применение оперативных характеристик для определения мощности ДА. Важным аспектом применения этих характеристик является выбор с их помощью такого числа реплик, чтобы планируемый эксперимент оказался чувствитель- чувствительным к важным потенциальным различиям уровней фактора. Рассмотрим сначала мощность критерия для модели по- постоянных эффектов в случае выборок равного объема. По опре- определению, 1 — р = Р (отклонить Но \ #0 ложна) = = P(F0> Fa.,а~\: N-a\Но ложна). C.27) Для нахождения числовых значений величин, входящих в вероятностное утверждение C.27), необходимо знать распре- распределение статистики Fo при условии ложности нулевой гипотезы. Можно показать, что в этом случае статистика F0 = MSo^/MSOm подчиняется нецентральному ^-распределению с а—1 и N—а степенями свободы и параметром нецентральности б. Если 6 = 0, то нецентральное F-распределение переходит в обычное (центральное) ^-распределение. 62 Для нахождения вероятностей в выражении C.27) исполь- используются оперативные характеристики (приложение IV). Эти ха- характеристики представляют собой зависимость вероятности ошибки II рода р от параметра Ф, где a a* C.28) Величина Ф2 связана с параметром нецентральности б. Кри- Кривые построены для а = 0,05 и а=0,01 и некоторого диапазона чисел степеней свободы числителя и знаменателя. При использовании оперативных характеристик эксперимен- экспериментатор должен задать величину разности средних, которую он а хочет обнаружить, в терминах^ т?- На практике обычно неиз- вестна а2 — дисперсия ошибки, поэтому нужно задавать вели- а чину отношения 2 rV°2' которую желательно обнаружить. На- оборот, если доступна оценка а2, то а2 можно заменить ее оценкой. Например, если нас интересует чувствительность уже проведенного эксперимента, то в качестве оценки о2 мы могли бы использовать УИ5ОШ- Пример 3.7. Предположим, что в ДА при а=0,01 сравниваются пять сред- средних. Экспериментатору хотелось бы знать, сколько реплик потребуется, если важно отклонить #0 (когда она ложна) с вероятностью, не меньшей 0,90, при ^ Tj/a8=5,0. Для этого случая и нужно воспользоваться оперативными характеристиками для а—1=5—1=4 с Af—а=а(п—1)=5(П'—1) степенями свободы ошибки (приложение IV). Возьмем сначала п=4. Это дает Ф2=4, Ф = 2 и 5-3=15 степеней свободы. Из приложения IV находим E^0,38. Следовательно, мощность критерия со- составляет приблизительно 1 — E=1-—0,38=0,62. Это меньше требуемого зна- значения, т. е. /г=4 реплик недостаточно. Продолжая аналогичным образом, мы можем построить следующую таблицу: п 4 5 6 ф2 4 5 6 ф 2,00 2,24 2,45 а (п-1) 15 20 25 Р 0,38 0,18 0,06 Мощность A-Р) 0,62 0,82 0,94 Таким образом, для обеспечения требуемой мощности критерия необхо- необходимы по меньшей мере п=6 реплик. 63
Для модели случайных эффектов мощность критерия опре- определяется выражением 1 — р = Р (отклонить Яо | Яо ложна) = = P(Fo>Fa;a-i;N-a\a2>0). C.29) Здесь также необходимо знать распределение статистики /70 = = MSO6p/MSom при условии истинности альтернативной гипо- гипотезы. Можно показать, что если истинна #i(cr2 >0), то Fo под- подчиняется центральному F-распределению с а—1 и N—а степе- степенями свободы. Поскольку мощность критерия для модели случайных эф- эффектов выражается через обычное, центральное ^-распределе- ^-распределение, то мы могли бы найти величину мощности, воспользова- воспользовавшись таблицей F-распределения из приложения III. Однако это проще сделать с помощью оперативной характеристики. Набор таких характеристик для а = 0,01 и 0,05 и различных значений числа степеней свободы числителя и знаменателя приведен в приложении V. Они представляют собой зависи- зависимость величины ошибки II рода от параметра % = C.30) Поскольку а2 обычно неизвестно, то мы можем либо использо- использовать некоторую априорную оценку, либо задать величину Ох которую мы хотим обнаружить, в терминах отношения alia2. Пример 3.8. Предположим, что для каждой из пяти выбранных случай- случайным образом обработок проведено по шесть наблюдений; мы хотнм опреде- определить мощность критерия прн а=0,05, если а2 = а2. Поскольку а=5, п=6 и а2 = а2, то Х=У1 +1-6=2,646. По оперативной характеристике с а—1=4, N — а=25 степенями свободы и а=0,05 находим Р~0,20. Таким образом, мощность критерия примерно равна 0,80. 3.8. ОТКЛОНЕНИЯ ОТ ДОПУЩЕНИЙ, ПРИНЯТЫХ В ДИСПЕРСИОННОМ АНАЛИЗЕ В основе ДА лежат следующие допущения: эффекты обрабо- обработок аддитивны, а ошибки эксперимента представляют собой независимые нормальные случайные величины с одинаковыми дисперсиями. Вообще говоря, мы никогда не можем быть пол- полностью уверены в том, что эти допущения справедливы; более того, часто у нас бывают все основания считать, что они не вы- выполняются. Следствия отклонений от допущений, принятых 64 в ДА, проверялись многими авторами, в Частности, БартлеттбМ [4], Кокреном [19], Эйзенхартом [30] и Боксом {10, 11]. У Кокрена и Кокса [21] отмечается, что строгое выполнение допущений, принятых в ДА, не столь существенно, т. е. неболь- небольшими отклонениями от этих допущений можно пренебрегать. Эти авторы утверждают также, что отклонения от принятых допущений влияют как на уровень значимости, так и на мощ- мощность статистических критериев. Например, если эксперимента- экспериментатор полагает, что уровень значимости используемого критерия составляет 5%, то фактически он может быть равным 7или 8%. Как правило, истинная величина ошибки I рода превосходит за- заданную, и, следовательно, слишком многие разности эффектов обработок признаются значимыми. Влияние указанных откло- отклонений на мощность критерия сказывается в том, что значение точной статистической модели позволило бы построить более мощный критерий. Итак, вероятности ошибок и доверительные интервалы должны рассматриваться как приближенные. Допущение об однородности дисперсий часто может приве- привести к нежелательным результатам, которые появляются, если не- некоторые из обработок обладают неустойчивыми эффектами или же наблюдения подчиняются не нормальному, а асимметрич- асимметричному распределению, так как для асимметричных распределе- распределений чаще всего дисперсия зависит от среднего. В такой ситуа- ситуации обычно применяют преобразование результатов наблюдений, и ДА ведется уже с преобразованными данными. Необхо- Необходимо подчеркнуть, что при использовании этого метода выводы, полученные с помощью ДА, относятся к преобразованным сово- совокупностям. Выбору подходящего преобразования посвящены многочис- многочисленные исследования. Если экспериментатору известно теоре- теоретическое распределение результатов наблюдений, то он может воспользоваться этой информацией при выборе преобразова- преобразования. Например, если наблюдения подчиняются распределению Пуассона, то применяется преобразование^. = уУц или у*. — ~у 1 -\-yij, если логарифмически нормальному, то подходящим оказывается логарифмическое преобразование у*—\пуц; для Данных, выраженных дробями и подчиняющихся биномиаль- биномиальному распределению, полезно преобразование 1/^.= arcsin t/t-j. Когда выбор преобразования не является очевидным, подыски- подыскивается обычно преобразование, выравнивающее дисперсии не- независимо от среднего. В факторных экспериментах, которые мы будем рассматривать в гл. 6, используется другой метод: выби- выбирается преобразование, минимизирующее средний квадрат взаимодействий, и мы приходим к эксперименту, результаты ко- которого легче интерпретируются. Дальнейшее обсуждение пре- преобразований см. у Бартлетта [4], Бокса и Кокса [16], Долби [25], Дрейпера и Хантера [27]. " Д. К. Монтгомери 65
Если эффекты обработок неаддитивны, то преобразования, обсуждающиеся выше, также могут оказаться полезными. Неад- Неаддитивность может объясняться несколькими причинами. Напри- Например, истинные эффекты обработок могут оказаться мультипли- мультипликативными, т. е. yij = \meij, или же могут существовать эффекты взаимодействия, не включенные в модель. Преобразования, ис- используемые в случае неаддитивности, изменяют также и рас- распределение ошибок эксперимента. Однако в большинстве случаев такое преобразование приближает распределение оши- ошибок к нормальному. Критичным является, вообще говоря, допущение независи- независимости. Правильная рандомизация обеспечивает независимость при разнесении обработок по экспериментальным объектам, в результате чего независимыми могут считаться и ошибки экс- эксперимента. Обычно правильной рандомизации можно добиться при помощи случайного выбора порядка, в котором должны производиться наблюдения. 3.9. ПРОВЕРКА РАВЕНСТВА НЕСКОЛЬКИХ ДИСПЕРСИЙ При одинаковых размерах выборок ДА относительно устой- устойчив к не очень большим отклонениям от допущения, что эф- эффекты обработок обладают одинаковой дисперсией. Однако это не так, когда объемы выборок различны или одна из дисперсий заметно отличается от других. Следовательно, часто оказыва- оказывается необходимой проверка гипотезы Я о о 9 О- СГ[ —СГ2 = ... = Оа, Hi: неравенство не выполняется хотя бы для одной сгг-2. В этом случае широко применяется критерий Бартлетта. В его основе лежит статистика, выборочное распределение ко- которой хорошо аппроксимируется ^-распределением с а—1 сте- степенью свободы, где а — число случайных выборок из независи- независимых нормальных совокупностей. Эта статистика имеет вид = 2,3026 qlc, C.31) где с=1 S2 = Si2 — выборочная дисперсия i-й совокупности. 66 Если выборочные дисперсии Si2 заметно отличаются друг от друга, то величина q принимает большие значения; если же все Si2 одинаковы, то она равна нулю. Следовательно, мы откло- отклоняем Яо при слишком больших значениях хо2, т. е. в случае, когда гДе %2 ¦ _i — верхняя а-процентная точка %2-РаспРеДеления с а — 1 степенью свободы. Различные исследования показывают, что критерий Барт- Бартлетта весьма чувствителен к предположению о нормальности, т. е. при сомнениях в правильности такого предположения этим критерием пользоваться не следует. Обзор других критериев равенства нескольких дисперсий дан Андерсоном и Макли- ном [1]. Пример 3.9. Применим критерий Бартлетта к данным примера 3.1. Най- Найдем сначала выборочные дисперсии для каждой обработки: «Si2 =11,2; S22=9,8; S32=4,3; S42 = 6,8 и S52 = 8,2. Затем вычислим S2=— D-11,2 + 4-9,8 + 4-4,3 + 4-6,8 + 4- 8,2) = 8,06; р 20 q = 20 Ig 8,06 — 4 (lg 11,2 + Ig 9,8 + Ig 4,3 + Ig 6,8 + Ig 8,2) = 0,44; 3-4 \A 20 Наконец, численное значение статистики для проверки гипотезы %2 2 = 2,302 6 о 1,10 = 0,94. Поскольку Х2о,о5; 4 = 9,49, то мы не можем отклонить нулевую гипотезу и делаем вывод, что дисперсии однородны. 3.10. РЕГРЕССИОННЫЙ ПОДХОД К ДИСПЕРСНОМУ АНАЛИЗУ До сих пор мы пользовались интуитивным, эвристическим подходом к ДА. Однако может быть дан и более строгий фор- формальный вывод с помощью метода, который позднее окажется полезным для понимания основ статистического анализа более сложных планов экспериментов. Суть этой процедуры, общего регрессионного критерия значимости, состоит в определении уменьшения общей суммы квадратов при аппроксимации мо- моделью с полным набором параметров и суммы квадратов при аппроксимации моделью, соответствующей нулевой гипотезе. Разность этих двух сумм квадратов и есть сумма квадратов, обусловленная обработками, с помощью которой может быть проведена проверка нулевой гипотезы. Важным этапом процедуры является составление системы нормальных уравнений для модели; их можно получить, обра- 3* 67
зовав сумму квадратов ошибки и продифференцировав ее по каждому неизвестному параметру, как мы это делали в пара- параграфе 3.3.2. Есть, однако, более простой путь: правила, приве- приведенные ниже, позволяют получать нормальные уравнения непо- непосредственно для любой модели эксперимента (в основе сле- следующих ниже формальных операций лежит математический аппарат, описываемый в 3.3.2.— Прим. ред.). Правило 1. Каждому параметру модели, подлежащему оценке, соответствует одно нормальное уравнение. Правило 2. Правая часть любого нормального уравнения равна сумме всех наблюдений, которые содержат параметр, со- соответствующий данному нормальному уравнению. Для иллюстрации этого правила рассмотрим модель одно- факторного эксперимента. Первое нормальное уравнение соот- соответствует параметру ц, поэтому его правая часть равна у.., по- поскольку все наблюдения содержат ц. Правило 3. Левая часть любого нормального уравнения представляет собой взвешенную сумму всех параметров мо- модели, причем целочисленный множитель при каждом из них оп- определяется тем, сколько раз этот параметр встречается в сумме, стоящей в правой части уравнения. Значок А ставится для того, чтобы подчеркнуть, что полу- полученная величина является оценкой, а не истинным значением параметра. Рассмотрим, например, первое нормальное уравнение в од- нофакторном дисперсионном анализе. В соответствии с введен- введенными правилами оно имеет вид поскольку ц встречается во всех N наблюдениях, tj встречается только в п наблюдениях для первой обработки, т2 — в и наблю- наблюдениях для второй обработки и т. д. Сравнивая полученное уравнение с уравнением C.12), видим, что оно правильное. Вто- Второе нормальное уравнение соответствует xi, оно имеет вид поскольку только наблюдения для первой обработки содержат Т[ (это дает г^в правой части уравнения), \i и tj равно п раз встречаются в у\., а все остальные п — ни разу. В общем слу- случае левая часть любого нормального уравнения представляет собой математическое ожидание (оценку математического ожи- ожидания.— Прим. ред.) правой части. Теперь рассмотрим уменьшение суммы квадратов при ап- аппроксимации данных некоторой моделью. При этой аппроксима- аппроксимации мы «объясняем» определенную долю изменчивости, т. е. уменьшаем необъясненную изменчивость на определенную вели- величину. Такое уменьшение всегда оказывается равным сумме про- произведений оценок параметров на правые части соответствую- 68 щих нормальных уравнений. Например, при однофакторном ДА уменьшение суммы квадратов при аппроксимации моделью составляет R (\1, т) = + T2i/2. C.32) 1=1 Уменьшение суммы квадратов при аппроксимации моделью с параметрами ц и {тг}, обозначенное R(\i,т), иногда называ- называется также «регрессионной» суммой квадратов для модели уц = — ^т.^.г.._ Число степеней свободы, соответствующих умень- уменьшению суммы квадратов, например R{\i, т), всегда совпадает с числом линейно-независимых нормальных уравнений. Остаточ- Остаточная изменчивость, не объясненная моделью, находится из соот- соотношения i, т). C.33) 2 i ?=1 /=1 Эта величина является знаменателем статистики, используемой для проверки гипотезы Но: tt = 0. В качестве иллюстрации рассмотрим применение общего ре- регрессионного критерия значимости к классификации по одному признаку и покажем, что это приводит к обычному однофак- торному ДА. Статистическая модель имеет вид уц = \1 + Т{ + вц, а нормальные уравнения получаются по приведенным выше правилам: N\JL + ПХГ + ПХг + ¦ • • + "та = У-', Сравните эти нормальные уравнения с уравнениями C.12). а Наложив ограничение 2 tt = 0> найдем оценки ц и п: i=i у=~у.., Ъ = У1. — У.., 1=1,2,..., а. Уменьшение суммы квадратов при аппроксимации этой мо- моделью составляет в соответствии с выражением C.32) а а _ !ш. = у.у..+% (yt.—y.)yi.= причем число степеней свободы равно а, поскольку линейно-не- 69
зависимы а нормальных уравнений. Сумма квадратов ошибки находится с помощью уравнения C.33) 5som = 2 2 4—Я(и> *) = 2 2 -—2 ^. '•=i /=i i=i /=i n i=i ¦ ей соответствует N — а степеней свободы. Найдем сумму квадратов, обусловленную обработками т;. Для этого рассмотрим модель при условии, что истинна нуле- нулевая гипотеза, т. е. т,г = 0 при всех i, следовательно, г/о = Для такой модели нормальное уравнение одно а оценкой \i является \i = y... Таким образом, уменьшение суммы квадратов при аппроксимации моделью только с параметром \i составляет Для этой модели нормальное уравнение одно, следовательно, число степеней свободы R(\i) равно единице. Сумма квадра- квадратов, обусловленная {тг}, при учете того, что ц входит в мо- модель, определяется разностью R(\i, т) и Я() у которой а—1 —степень свободы. Эта разность в уравнении C.9) обозначалась SS06p- Если, как обычно, принять допущение о нормальности, то для проверки гипотезы Яо: Тг = 0 использу- используется статистика [i ?tii-R(v,*)] Li=i /=i J /(N-a) которая при истинности нулевой гипотезы подчиняется ^-рас- ^-распределению с а—1 и N— а степенями свободы. Это, конечно, та же статистика, которая используется в однофакторном ДА. 3.11. ЗАДАЧИ 3.1. Исследуется предел прочности портландцемента. С экономической точки зрения приемлемыми являются четыре различных метода приготовле- приготовления смеси. Получены следующие данные: Метод приготовле- приготовления Предел прочности, кГ/смг 212,9 220,0 180,0 160,0 200,0 230,0 190,0 170,0 186,5 197,5 198,5 160,0 189,0 215,0 205,0 176,5 70 а) Проверьте гипотезу о том, что метод приготовления смеси влияет на предел прочности цемента. Возьмите а = 0,05. б) Используйте множественный критерий размахов Дункана для парного сравнения средних. Оцените эффекты обработок. 3.2. Изготовителя индикаторов интересует влияние четырех различных типов покрытия электронно-лучевых трубок на их проводимость. Получены следующие данные: Тип покрытия 1 2 3 4 143 152 134 129 141 149 136 127 Проводимость 150 137 132 132 146 143 127 129 а) Существуют ли различия в проводимости, обусловленные типом по- покрытия? Возьмите а = 0,05. б) Оцените математическое ожидание общего среднего и эффекты обра- обработок. в) Найдите 95-процентную интервальную оценку среднего для покрытия типа 4 и 99-процентную интервальную оценку средней разности для покры- покрытий типов 1 н 4. г) Проверьте все пары средних с помощью множественного критерия раз- махов Дункана прн а = 0,05. д) Допустим, в настоящее время применяется покрытие типа 4. Если желательно минимизировать проводимость, то каковы ваши рекомендации изготовителю? 3.3. Измерялось время отклика (в мс), для трех различных типов схем, применяющихся в устройствах автоматического отключения. Получены ре- результаты: Тип схемы 1 2 3 9 20 6 12 21 5 Время отклика 10 23 8 8 17 16 15 30 7 а) Проверьте гипотезу о том, что эти трн типа схем обладают одина- одинаковым временем отклика. Возьмите а = 0,01. б) Используйте множественный критерий размахов Дункана для парного сравнения средних по обработкам. в) Постройте набор ортогональных контрастов в предположении, что до начала эксперимента вы полагали, что время отклика схем типа 2 отлича- отличается от времени отклика схем двух других типов. г) Какова мощность этого критерия, если желательно обнаруживать раз- з лнчие ^ xilQ =3,0? ;=1 3.4. Изготовитель считает, что партии сырья, поступающие от поставщика, обладают значимыми различиями в содержании кальция. На складе нахо- находится большое число партий сырья, из них для исследования выбираются 71
случайным образом пять, и для каждой по пять раз проводится химиче- химический анализ. Получены следующие данные: Партия 1 23,46 23,48 23,56 23,39 23,40 Партия 2 23,59 23,46 23,42 23,49 23,50 Партия 3 23,51 23,64 23,46 23,52 23,49 Партия 4 23,28 23,40 23,37 23,46 23,39 Партия 5 23,29 23,46 23,37 23,32 23,38 а) Есть ли значимые изменения в содержании кальция от партии к партия? б) Оцените компоненты дисперсии. в) Если важно обнаружить отношение а^/а2=2,5с высокой вероятностью, то каково должно быть число реплик? 3.5. Исследуются батареи трех марок. Предполагается, что срок годно- годности (в неделях) у разных марок различен. Пять батарей каждой марки под- подвергались проверке, которая дала следующие результаты: Марка- 1 2 3 100 76 108 Срок 96 80 100 годности 92 75 96 96 84 ¦98 92 82 100 а) Различаются ли сроки годности батарей разных марок? б) Оцените компоненты соответствующей статистической модели. в) Постройте 95-процентную интервальную оценку среднего срока год- годности батареи марки 2; 99-процентную интервальную оценку средней раз- разности сроков годности батарей марок 2 и 3. г) Какую бы марку вы избрали для использования? Если изготовитель обязуется заменять бесплатно любую батарею, вышедшую нз строя ранее чем через 85 недель, то какой ожидается процент батарей, которые ему при- придется заменить? а 3.6. Докажите, что дисперсия линейной комбинации 2 С{У{- Равиа 3.7. Рассмотрим данные задачи 3.3. а) Напишите нормальные МНК-уравнення для этой задачи и решите их относительно (х и т,-, наложив обычное ограничение^ Х( ~ ®' Оцените Ti—Xz- л б) Решите эти уравнения с использованием ограничения Тз=0. Совпа- Совпадают ли эти оценки с полученными в п. а)? Почему? Теперь оцените Ti—Тг и сравните результат с п. а). Какое утверждение можно сформулировать относительно оценивания контрастов для т.,? в) Оцените ц.+ть 2т,—т2 —т3 и ц.+Т1+т2, используя два найденных ре- решения нормальных уравнений. Сравните результаты для этих двух случаев. 72 ГЛАВА ЧЕТВЕРТАЯ РАНДОМИЗИРОВАННЫЕ БЛОКИ, ЛАТИНСКИЕ КВАДРАТЫ И СВЯЗАННЫЕ С НИМИ ПЛАНЫ 4.1. РАНДОМИЗИРОВАННОЕ ПОЛНОБЛОЧНОЕ ПЛАНИРОВАНИЕ Во многих экспериментальных ситуациях возникает необхо- необходимость спланировать испытания так, чтобы можно было конт- контролировать изменчивость, обусловленную посторонними источ- источниками. Пусть, например, мы хотим установить, приводят ли че- четыре различных типа острия к разным показаниям прибора для определения твердости. Измерения проводятся следующим образом: в образец металла вдавливается острие, и по величине углубления судят о твердости образца. Экспериментатор решил провести по четыре наблюдения для каждого острия. Фактор только один — тип острия — при полностью рандомизированном плане однофакторного эксперимента 4X4=16 испытаний слу- случайным образом распределяются по экспериментальным объек- объектам, т. е. образцам металла, и снимаются показания прибора для определения твердости. Следовательно, для такого эк- эксперимента необходимы 16 различных образцов металла, по одному для каждого опыта. В полностью рандомизиро- рандомизированном эксперименте описан- описанного типа может встретиться Таблица 4.1 Рандомизированный полноблочный J j план эксперимента по проверке].,^ твердости Тип острия Образец 1 4 3 1 2 ¦ 2 2 1 4 3 3 3 2 1 4 4 1 2 4 3 серьезная проблема. Если об- образцы металла несколько раз- различаются по твердости, напри- например, из-за разных температур обжига, то в изменчивость ре- результатов наблюдений твердо- твердости внесут свой вклад и экспериментальные объекты (образцы металла). Вследствие этого ошибка эксперимента будет отра- отражать как случайную ошибку, так и различия между образцами. Нам хотелось бы обеспечить как можно меньшую величину ошибки эксперимента, другими словами, исключить из нее из- изменчивость между образцами. При плане эксперимента (табл. 4.1), позволяющем этого добиться, каждое острие прове- проверяется на каждом из четырех образцов. Такой план называется рандомизированным полноблочным планом. Слово «полнота» означает здесь, что каждый блок (образец) содержит все 73
обработки (острия). При использовании такого плана блоки или образцы представляют собой более однородные экспери- экспериментальные объекты, на которых проводятся сравнения между остриями. Такая стратегия повышает точность этих сравнений. Внутри одного блока порядок, в котором проверяются все че- четыре острия, определяется случайным образом. Отметим анало- аналогии между этой задачей планирования и задачей из 1.4, где об- обсуждался парный /-критерий. Рандомизированный полноблоч- полноблочный план является обобщением этого понятия. Рандомизированные полноблочные планы, вероятно, наибо- наиболее часто встречаются при планировании экспериментов. Си- Ситуации, в которых они должны применяться, весьма разнооб- разнообразны, но при некотором опыте определяются достаточно легко. Экспериментальные установки или аппаратура часто обладают различными рабочими характеристиками и представляют собой типичный фактор группирования в блоки. Партии сырья, опера- операторы, моменты времени также являются характерными источ- источниками изменчивости в эксперименте, которая может контроли- контролироваться систематическим образом при использовании блоков. 4.1.1. Статистический анализ Предположим, что в общем случае у нас есть а обработок (которые нужно сравнить между собой) и Ъ блоков. Рандоми- Рандомизированный полноблочный план приведен на рис. 4.1. Каждый Блок 1 Блок 2 Блок Ь Рис. 4.1. Рандомизированный полноблочный план. блок содержит по одному наблюдению на каждую обработку, а порядок, в котором осуществляется выбор обработки внутри блока, определяется случайным образом. Рандомизация прово- проводится только внутри блоков, поэтому мы говорим, что блоки представляют собой ограничение на рандомизацию. Статистическая модель рассматриваемого плана экспери- эксперимента имеет вид / + ei/, i=l, 2,..., а; /=1, 2 Ь, D.1) где \i — математическое ожидание общего среднего; т, — эффект i'-й обработки; Cj — эффект /-го блока; е,^- — случайная ошибка, 74 причем, как обычно, e,,~NlD @, сг2). В начале рассмотрений будем считать обработки и блоки фиксированными факторами. Эффекты обработок и блоков определяются как отклонения от математического ожидания общего среднего, т. е. и ь ¦ Нас интересует проверка равенства эффектов обработок, чему соответствуют гипотезы #1 : Тг=5^0 ХОТЯ бы ДЛЯ ОДНОГО i. Пусть уг. — сумма всех наблюдений для г-й обработки; y.j — сумма всех наблюдений в /-м блоке; г/.. — общая сумма всех на- наблюдений и N=ab — общее число наблюдений: ь . = 2 Уц, »=1, 2 а; D.2) ц, /=1, 2,..., Ь D.3) а Ь а Ь .. = 2 2 уч=Ъ ^.=2 у-1- 1=1 /=1 i=l y=i D.4) Аналогичным образом у{.— среднее наблюдений для i-й об- обработки; г/.j —среднее наблюдений в /-м блоке и 'у.. — общее среднее всех наблюдений, т. е. ~У1. = УФ\ У.,- = У.//с; y.. = y.JN. D.5) Общую скорректированную сумму квадратов можно предста- представить в виде i i i i (уи-у.J= а Ь _ .•=1 /=1 D.6) Раскроем скобки в правой части этого соотношения, тогда 2 2 Шц-У.)г = ЬЪ (Ус-уJ + а% 2 75
+2 2 (Уч-Ус-у,— 1 i 2 i ( Простые, но громоздкие выкладки показывают, что смешанные произведения обращаются в нуль, поэтому выражение 2 (^/- & +2 il D-7) представляет собой разбиение общей суммы квадратов. В сим- символическом виде выражение D.7) можно записать как SSo6a,= SS^ + SSt, + SS0!U. D.8) Число всех наблюдений составляет N, поэтому SS06m, обла- обладает N—1 степенью свободы. Поскольку а— число обработок, а Ь — число блоков, то SS06P и SS6n обладают а—\ и Ь—1 степе- степенями свободы соответственно. Сумма квадратов, обусловленная ошибкой, — это общая сумма квадратов, уменьшенная на сумму квадратов для обработок и сумму квадратов для блоков. Числу ab всех наблюдений соответствует ab—1 степень свободы, следо- следовательно, SSoni обладает ab—1—(а— 1) — (Ь—1) = (а-1) F- 1) степенями свободы. Далее сумма чисел степеней свободы сла- слагаемых в правой части выражения D.8) совпадает с числом сте- степеней свободы в левой части; поэтому принимая, как обычно, допущение о нормальности ошибок, мы с помощью теоремы 3.1 получаем, что SS06P/a2, SS6ll/a2 и SSomJa2 — независимые слу- случайные переменные, подчиняющиеся распределению хи-квадрат. Отношение суммы квадратов к соответствующему числу степе- степеней свободы есть средний квадрат. Можно показать, что если обработки и блоки фиксированы, то математические ожидания средних квадратов имеют вид 2 а —1 г=1 Следовательно, для проверки равенства эффектов обработок должна использоваться статистика 76 подчиняющаяся ^-распределению с а—1 и (а—1) (Ь—1) степе- степенями свободы при условии истинности нулевой гипотезы. Крити- Критической областью является верхний шлейф ^-распределения, и МЫ ОТКЛОНЯеМ #о, еСЛИ Fo > Fa\ a-V, (а-1) (Ь-П- Мы можем также проверить гипотезу Яо: Pj = O, сравнив ста- статистику F0=MS6jl/MSom cFa;b_i; (a_i) (й_1).Эта гипотеза утверж- утверждает, что блоки не отличаются друг от друга. Такая проверка часто используется для того, чтобы определить, следует ли про- проводить группирование в блоки при аналогичных экспериментах в будущем. При проверке этой гипотезы нужно быть очень осто- осторожным. Блоки представляют собой ограничение на рандомиза- рандомизацию, т. е. ab обработок не распределяются случайным образом по экспериментальным объектам. В действительности блоки ча- часто сами являются объектами эксперимента (как, например, при определении твердости) и рандомизация ограничена их разме- размерами. В этих обстоятельствах проверка гипотезы #o:Pj = O, при- приведенная выше, не является приемлемой, поскольку блоки обра- образованы и используются не случайным образом. Это замечание важно, потому что экспериментатор иногда применяет фактор, представляющий интерес для характеристики блоков, а затем вводит внутри блоков набор обработок, соответствующий дру- другому фактору. В таком случае, однако, ограничение на рандоми- рандомизацию, обусловленное группированием в блоки, может зачастую лишить смысла проверку междублокового эффекта. Если иссле- исследователя действительно интересуют два фактора, то лучше при- применить другие методы планирования эксперимента. Обсуждение этого вопроса проводится Андерсоном и Маклином [1]. Результаты проверки гипотез обычно сводятся в таблицу ДА (табл. 4.2). Расчетные формулы для сумм квадратов можно по- получить, выразив слагаемые в отношении D.7) в терминах сумм для обработок и блоков: 2 2 1=1 1=1 D.9) D.10) D.11) причем сумма квадратов для ошибки находится вычитанием: SSoai = SSo6Bl-SSo6p-SS6jl. D.12) Мы дали описание процедуры проверки гипотез в предполо- предположении, что обработки и блоки фиксированы, тем не менее та же процедура используется и при случайных обработках или бло- блоках. Интерпретация результатов, конечно же, соответствующим образом меняется. Например, если блоки случайны, то мы 77
считаем результаты сравнения обработок одинаковыми для всей совокупности блоков, из которой случайным образом были выбраны те блоки, которые исследовались в эксперименте. Со- Соответствующие изменения претерпевают и математические ожи- Таблица 4.2 Дисперсионный анализ для рандомизированного полноблочного плана Источник изменчивости Обработки Блоки Ошибка Сумма Сумма квадратов 1 а*-; »?. SSoin (вычитанием) Степени свободы а 1 Ь— 1 (а— 1) F— 1) N—\ Средний квадрат ¦SSo6p a—I 55бл ft—1 (а — 1) (fc — 1) MSo6p MS ош рр менчивости по обработкам ис- используется статистика Fo= дания средних квадратов. Например, если блоки случайны, то Е (MSen) = сг2 + астр, где ар — дисперсия эффектов блоков. Во вся- всяком случае, E(Ms'o6p) никогда не зависит от эффекта любого из блоков и для проверки из- Таблица 4.3 Рандомизированный полноблочный план для эксперимента по проверке твердости Пример 4.1. Рассмотрим экспе- эксперимент по определению твердости описанный в 4.1. Есть четыре острия и четыре образца металла. Каждое острие по разу проверяется на каж- каждом из образцов, т. е. эксперимент проводится по рандомизированному полноблочному плану. Данные этого эксперимента приведены в табл. 4.3. Подчеркнем, что порядок, в котором острия проверялись на конкретном образце, был случайным. Для упрощения вычислений зон- зондируем исходные данные, вычтя из каждого наблюдения 9,5 и умножив ре- результат на 10 (табл. 4.4.). Найдем суммы квадратов: 4 4 1 1 SSo6ux=y у yj— — y2 =154,00 — — 202= 129,00; Тип острия 1 2 3 4 Образец (блок) 1 9,3 9,4 9,2 9,7 2 9,4 9,3 9,4 9,6 3 9,6 9,8 9,5 10,0 . 4 10,0 9,9 9,7 10,2 ¦So06p — ~~ — —у2 = — [32 + 42 + i N " 4 203 -2J+152] —— =38,50; 78 Таблица 4.4 Кодированные данные для эксперимента по проверке твердости Тип острия 1 2 3 4 У-i Образец (блок) 1 2 — 1 —3 2 —4 2 —1 -2 — 1 1 —3 3 1 3 0 5 9 4 5 4 2 7 18 3 4 2 15 20 = у.. ~ If = 82>50; 2 p—SS6n = 129,00—38,50—82,50=8,00. Результаты ДА приведены в табл. 4.5. Прн а=0,05 критическое зна- значение Fo.os; з; 9 = 3,86. Тогда 14,42>3,86 и мы приходим к выводу, что тип острия влияет на отсчет твердости. Кроме того, различия между блоками оказываются значимыми, так как средний квадрат для блоков велик по сравнению с ошибкой. Таблица 4.5 Дисперсионный анализ эксперимента по проверке твердости Источник изменчивости Обработки (тип острия) Блоки (образцы) Ошибка Сумма Сумма квадратов 38,50 82,50 8,00 129,00 Степени свободы 3 3 9 15 Средний квадрат 12,83 27,50 0,89 14,42 Интересно рассмотреть результаты, которые получил бы исследователь, если бы не знал о существовании рандомизированных полноблочных планов. Допустим, что он использовал четыре образца и распределил по ним острия случайным образом, получив (случайно) план, приведенный в табл. 4.3. Не- Некорректный анализ этих данных как результатов полностью рандомизирован- рандомизированного однофакторного эксперимента приведен в табл. 4.6. Поскольку Fo,o5; з; 12= Таблица 4.6 Некорректный аиалнз данных эксперимента по проверке твердости как полностью рандомизированного плана Источник изменчивости Тип острия Ошибка Сумма Сумма квадратов 38,50 90,50 129,00 Степени свободы 3 12 15 Средний квадрат 12,83 7,54 1,70 79
= 3,49, то мы не можем отклонить гипотезу, что четыре острия дают одина- одинаковые результаты определения твердости. Таким образом, использование ран- рандомизированного плана позволило уменьшить уровень шума в данных на- настолько, что стало возможным обнаружить различия между четырьмя ти- типами острия. Если в рандомизированном полноблочном плане обработки фиксированы, а анализ показывает, что между ними существуют значимые различия, то можно продолжить исследование сред- средних по обработкам. Для этой цели могут быть использованы ор- ортогональные контрасты или множественный критерий размахов Дункана. В последнем случае стандарт ошибки среднего для обработки определяется выражением Экспериментатору часто приходится решать, сколько именно блоков включить в план. Например, в задаче об измерении твер- твердости были использованы четыре блока (образца). В общем слу- случае число блоков должно выбираться достаточно большим, с тем чтобы обеспечить соответствующую мощность критерия. Отме- Отметим, что при увеличении числа блоков растет также и число сте- степеней свободы ошибки, что повышает мощность критерия. При определении числа блоков можно пользоваться оперативными характеристиками из приложения. Для модели постоянных эф- эффектов используются кривые из приложения IV, где а а' причем число степеней свободы числителя составляет а—1, а знаменателя— (а— 1) F—1). Для модели случайных эффек- эффектов используются кривые из приложения V, где Х = — <>1' причем число степеней свободы числителя составляет а—1, а знаменателя— (а— 1) F—1). На практике дисперсия ошибки о2 обычно заменяется соответствующей оценкой. Пример 4.2. В эксперименте, проводимом по рандомизированному полно- блочиому плану, необходимо сравнить пять обработок в шести блоках. Иссле- Исследователя интересует мощность критерия при уровне значимости а=0,05, если истинные средние по обработкам [Xi = 5,0, [x2=8,0,^[X3=4,O, ц,4=3,0 и ц,5=5,0. Из предыдущих экспериментов известна оценка а2=4,0. Поскольку среднее для t-й обработки имеет вид ц,; = ц.+т4 и мы накладываем ограничение 5 г2 5 i=i 80 откуда следует, что Ti=0, т2=3, т3=—1, т4=—2 и т5=0. Поэтому ф!=±ут2 = А. 14 = 4,2 аа2 ?г[ 5'4 и Ф = 2,049. Число степеней свободны (а— 1) (Ь — 1) = E— 1) F— 1) =20; в соответствии с кривой приложения IV вероятность правильного отклоне- отклонения гипотезы Но: Т; = 0 при таком плане и условии, что на самом деле 5 2 1? = 14, а а2=4,0 составляет приблизительно 0,94. Предположим, что эксперимент проводился по рандомизиро- рандомизированному полноблочному плану, а группирование в блоки не было в действительности необходимым. При рандомизирован- рандомизированном полноблочном плане число степеней свободы ошибки со- составляет (а—1) F—1). Если бы эксперимент проводился по пол- полностью рандомизированному плану с 6 репликами, то число степеней ошибки было бы равно а(Ь—1). Таким образом, не- необоснованное группирование в блоки приводит к потере а(Ь—1) — (а—1)F—1)=6—1 степени свободы ошибки, и мощ- мощность критерия без особой необходимости оказывается понижен- пониженной. Однако если эффекты блоков действительно важны, а груп- группирование в блоки не проводится, то ошибка эксперимента может оказаться настолько завышенной, что значимые различия между обработками не будут обнаружены. Иллюстрацией этому может служить некорректный анализ данных примера 4.1. Как пра- правило, если у экспериментатора возникают сомнения относительно существенности эффектов блоков, то лучше все-таки применять блочное планирование. Такое решение, окажись оно неправиль- неправильным, приведет к небольшой потере степеней свободы ошибки и, если только возможное число степеней свободы ошибки не слиш- слишком мало, несущественно повлияет на результаты анализа. Отметим, наконец, что линейная модель рандомизированного полноблочного плана совершенно аддитивна, т. е. считается, что между блоками и обработками нет взаимодействия. В сущности, это означает, что эффект изменения уровня интересующего нас фактора сохраняется от блока к блоку. Если же взаимодействие между блоками и обработками существует, то средний квадрат ошибки будет отражать как ошибки эксперимента, так и эф- эффекты взаимодействия. Вообще говоря, при этом средний квад- квадрат ошибки увеличивается, а точность сравнения обработок по- понижается. Исключением является модель со случайными бло- блоками. В этой ситуации как средний квадрат для обработок, так и средний квадрат для ошибки содержат эффекты взаимодей- взаимодействия, и, следовательно, значимость влияния обработок может, как обычно, проверяться сравнением среднего квадрата для об- обработок со средним квадратом для ошибки. Такая процедура не дает никакой информации о взаимодействии; для обнаружения эффектов взаимодействия необходимо использовать метод, опи- описанный в гл. 6. 81
Таблица 4.7 Рандомизированный полноблочный план для эксперимента по проверке твердости с одним недостающим наблюдением 4.1.2. Оценивание недостающих данных При проведении экспериментов по рандомизированному пол- полноблочному плану иногда оказывается, что в одном из блоков недостает наблюдения. Это может быть вызвано невниматель- невнимательностью, промахом или не зависящими от нас обстоятельствами, например, повреждением экспериментального объекта, избежать которого было невозможно. Недостающее данное приводит к но- новой проблеме при анализе, поскольку обработки уже не ортого- ортогональны блокам, т. е. не в каждом из них встречаются все обра- обработки. К этой проблеме существуют два подхода. При одном из них, приближенном анализе, находится оценка недостающего значения, а затем проводится обычный ДА так, как если бы эта оценка была настоящим наблюдением, только число степеней свободы ошибки уменьшается на единицу. Та- Такой подход рассматривается в этом параграфе; второй под- подход — точный анализ — обсуж- обсуждается в 4.1.3. Допустим, что недостает наблюдения г/tj для г-й обра- обработки в /-м блоке. Обозначим недостающее данное через х. Пусть, например, в экспери- эксперименте по определению твер- твердости (пример 4.1) при проверке острия 2 на образце 3 сло- сломался образец и наблюдение не было сделано (табл. 4.7). В общем случае пусть у..'— общая сумма наблюдений при одном недостающем данном, г/г.' — сумма для обработки с одним недостающим данным и г/./— сумма для блока с одним недо- недостающим данным. Предположим, что мы хотим выбрать оценку недостающего данного так, чтобы х давало наименьший вклад а Ь в сумму квадратов ошибки. Поскольку SSom= 2 2 (Уи— _ _ >=i ;=i — Hi-—У-1-\-У.) > то это эквивалентно выбору значения х, ми- минимизирующего a b I a S 1=1 /=1 Тип острия 1 2 3 4 Образец (блок) 1 2 — 1 —3 2 2 — 1 2 1 . 1 3 1 X 0 5 4 5 4 2 7 1=1 \/=I , / a b \2 или ¦—y ¦ ab ¦¦ где R включает в себя все слагаемые, не зависящие от х, 82 Из условия dSSom/dx = 0 получаем выражение __ D.14) которое является оценкой недостающего данного. Для данных табл. 4.7 находим, что #2.'=1, у.з'=Ь и у, .'=17. Следовательно, в соответствии с соотношением D.14) Х — #23 — 4-1+4-6— 17 3-3 = 1,22. Теперь можно провести обычный ДА, используя г/2з = 1,22 и уменьшив число степеней свободы для ошибки на единицу. Ре- Результаты такого анализа приведены в табл. 4.8. Сравните эти результаты приближенного анализа с результатами для полного набора данных (см. табл. 4.6). Таблица 4.8 Приближенный дисперсионный анализ для примера с одним недостающим наблюдением Источник изменчивости Тип острия Образцы (блоки) Ошибка Сумма Сумма квадратор 39,98 79,53 6,22 125,73 • Значимо при 5 процентах. Степени свободы 3 3 8 14 4.1 Средний квадрат 13,33 26,51 0,78 17,12* Если недостает нескольких данных, то их оценки можно найти, записав сумму квадратов для ошибки как функцию недо- недостающих значений, приравнять нулю производные этой функции по каждому из них и решить получившиеся уравнения. Можно поступить по-другому и оценить недостающие данные итераци- итерационным способом с помощью уравнения D.14). Допустим, что не- недостает двух данных. Тогда мы выберем значение одного из них произвольно и используем его вместе с настоящими данными для оценки второго данного по уравнению D.14). Затем из этого уравнения находится новая оценка первого недостающего дан- данного, затем новая оценка второго и т. д. Процесс продолжается до тех пор, пока результаты не сойдутся к некоторому пределу. В любой задаче с недостающими данными число степеней сво- свободы ошибки уменьшается на единицу на каждое недостающее наблюдение. 83
4.1.3. Оценивание параметров модели и общий регрессионный критерий значимости Если в модели рандомизированного полноблочного плана и обработки и блоки фиксированы, то параметры этой модели можно оценить методом наименьших квадратов. Напомним, что линейная статистическая модель имеет вид уц = \а + г» + Pj + гц, i=l, 2, ..., а; /=1, 2, ..., Ь. Применяя правила для составления нормальных уравнений (см. параграф 3.10) и учитывая, что для решения системы урав- уравнений необходимо наложить два ограничения: 1=1 Р 2 1=1 получим ab\i=y..\ , = y{., i = l, 2,..., a; ,¦=#.,, /=1, 2 b. Решением этой системы уравнений является Ъ = Уи—У.., 1 = 1, 2,..., а; D.15) D.16) D.17) Для обоснования ДА данных экспериментов, построенных по рандомизированным полноблочным планам, можно применить общий регрессионный критерий значимости. Используя выраже- выражение D.17), уменьшение суммы квадратов при аппроксимации полной моделью можно записать в виде Р>./= _ (y.t—y-)y.t = t=l y.i-itу..* ?=1 причем этой величине соответствует а + 6—1 степень свободы, 84 а сумме квадратов для ошибки а Ь = 2 1>(уч-ш-у.1+у-J i=i [=\ соответствует (а— 1) (Ь—1) степеней свободы. Сравните полу- полученное выражение для SSom с выражением D.7). При проверке гипотезы Н0:п — 0 используется упрощенная модель точно такая же, как и при однофакторном ДА. По аналогии с выражением C.32) уменьшение суммы квадратов при аппрок- аппроксимации этой моделью можно записать в виде ко*. р)=—i</v а причем число степеней свободы равно Ь. Следовательно, сумма квадратов, обусловленная {т,}, при модели, содержащей пара- параметры \i и {Pj}, определяется выражением R(i\p, P) = K(ji, т, P)-/?(jif P) = ~ Ъ ^У(- аЬУ-' которое совпадает с выражением D.10) для суммы квадратов для обработок с а—1 степенью свободы. Сумма квадратов для блоков находится при аппроксимации упрощенной моделью которая тоже совпадает с моделью однофакторного ДА. Таким же образом по аналогии с выражением C.32) уменьшение сум- суммы квадратов при аппроксимации этой моделью можно запи- записать в виде причем число степеней свободы равно а. Сумма квадратов для 85
блоков ji,- после аппроксимации моделью с параметрами \i и определяется выражением т) *, т) = и - i и ) 1 U(/ f / 1 I* ;. I ь*1/ t—i j — l i—i } — i ей соответствует b—1 степень свободы [сравните с выражением D.11)]. С помощью общего регрессионного критерия значимости мы установили вид сумм квадратов для обработок, для блоков и ошибки в эксперименте, построенном по рандомизированному полноблочному плану. В действительности общий регрессионный критерий значимости при анализе рандомизированных полно- полноблочных планов не применяется, но может оказаться полезным при анализе более сложных рандомизированных блочных пла- планов, которые обсуждаются в гл. 5. Точный анализ при недостающих данных. В 4.1.2 рассматри- рассматривалась приближенная процедура анализа при недостающих дан- данных в эксперименте, построенном по рандомизированному пол- полноблочному плану. Она представляет собой получение оценки недостающего данного, минимизирующей средний квадрат ошибки. Можно показать, что при приближенном анализе сред- средний квадрат для обработок оказывается смещенным в том смы- смысле, что при истинности нулевой гипотезы E(MS06p) превосходит E(MS0UI). Как следствие этого, слишком много результатов объ- объявляются значимыми. Точный анализ при недостающих данных может быть прове- проведен с помощью общего регрессионного критерия значимости. В этом случае план эксперимента является несбалансирован- несбалансированным; поскольку не во всех блоках встречаются все обработки, то мы говорим, что обработки и блоки не ортогональны друг другу. Точный метод анализа используется также и при рандо- рандомизированных блочных планах более общего типа, его обсужде- обсуждение будет продолжено в гл. 5. 4.2. ЛАТИНСКИЕ КВАДРАТЫ В 4.1 были введены рандомизированные полноблочные планы, позволяющие уменьшить остаточные ошибки экспери- эксперимента за счет исключения изменчивости, обусловленной экспе- экспериментальными объектами. Существуют и другие виды планов, в которых применяется группирование в блоки. Предположим, например, что экспериментатор исследует влияние пяти различ- различных формул взрывчатой смеси, используемых при производстве динамита, на наблюдаемую силу взрыва. Смесь по каждой из формул приготавливается из партии сырья, объем которой по- позволяет проверить не более пяти формул. Далее смеси приготав- 86 ливаются несколькими операторами, которые могут существенно различаться по квалификации и опыту. Таким образом, оказы- оказывается, что план эксперимента должен предусмотреть «усредне- «усреднение» влияния двух внешних факторов — партий сырья и опера- операторов. План, позволяющий решить эту задачу, состоит в том, чтобы проверить каждую формулу смеси в точности один раз в каждой партии сырья в точности по одному разу каждым из пяти операторов (табл. 4.9). Такой план называется латинским квадратом. Отметим, что наблюдения расположены квадратом, а пять формул (обработок) обозначены латинскими буквами А, В, С, D и Е — этим и объясняется название «латинский квад- квадрат». Видно, что как партии сырья (строки), так и операторы (столбцы) ортогональны обработкам. Таблица 4.9 Латинский квадрат для задачи о формулах взрывчатой смесн Партии сырья 1 2 3 4 5 Операторы 1 Л =24 В = 17 С= 18 ?>=26 ? = 22 2 В =20 С = 24 ?> = 38 ? = 31 Л = 30 3 С= 19 ?> = 30 ? = 26 Л = 26 В = 20 4 ?> = 24 ?=27 Л =27 В = 23 С =29 5 ? = 24 Л = 36 В = 21 С = 22 ?> = 31 Латинские квадраты применяются для того, чтобы исключить два внешних источника неоднородности, т. е. чтобы обеспечить систематическое группирование в блоки по двум направлениям. Таким образом, строки и столбцы, в сущности, представляют со- собой два ограничения на рандомизацию. В общем случае латин- латинский квадрат для р факторов или латинский квадрат рХр — это квадрат, состоящий из р строк и р столбцов. Каждая из р2 получающихся ячеек содержит одну из р букв, соответствующих обработкам, причем каждая буква встречается в каждой строке и каждом столбце один и только один раз. Ниже даны примеры латинских квадратов: 4X4 А В D С В С A D С D В А D А С В 5X5 A D В Е С D А С В Е С В Е D А В Е А С D Е С Р А В 6X6 A D С Е В F В А Е С F D С Е D F А В D С F В Е А F В A D С Е Е F В A D С
Статистическая модель для латинского квадрата имеет вид УЦк = И + «( + Т/ + К + 8j/ft, t=l, 2 р; /=1, 2 р; ft=l, 2,..., р, D.18) где t/tjk — наблюдение в i-й строке и й-м столбце для /-Й обра- обработки; ц — математическое ожидание общего среднего; а* — эф- эффект t'-й строки; X] — эффект /-й обработки; рь — эффект &-го столбца; г^н— случайная ошибка. Эта модель полностью аддитивна, т. е. взаимодействия между строками, столбцами и обработками отсутствуют. По- Поскольку на каждую ячейку приходится только одно наблюде- наблюдение, то для его обозначения необходимы лишь два из трех ин- индексов i, j и k. Обратимся, например, к задаче о взрывчатых смесях (см. табл. 4.9); если i = 2 и & = 3, то автоматически сле- следует, что / = 4 (формула смеси D), а если t=l и /=3 (формула смеси С), то k=3. Это вытекает из того, что каждая обработка в каждом столбце и каждой строке встречается один и только один раз. При ДА осуществляется разбиение общей суммы квадратов N=p2 наблюдений на компоненты для строк, столбцов, обрабо- обработок и ошибки, например, SSo6m = SSCTP + SSeton6 + SSo6p + SSoai D.19) с числом степеней свободы: Всего Строки Столбцы Обработки Ошибка Р2-1= Р-1 + р-1 + Р-1 + (р-2)(р-1). При обычном допущении eah~NID@, о2) суммы квадратов в правой части выражения D.19), если каждую из них разделить на о2, представляют собой независимые случайные переменные, подчиняющиеся ^-распределению. Для проверки гипотезы об отсутствии эффектов обработок должна использоваться стати- статистика F0 = MSo6p/MSom, которая при условии истинности нулевой гипотезы подчиняется F-распределению с р—1 и (р—2) (р—1) степенями свободы. Можно также проверить гипотезы об отсутствии эффектов строк или столбцов, образовав отношение MSCtp или MSc-юлб к MSom. Однако поскольку строки и столбцы представляют собой огра- ограничение на рандомизацию, такая проверка может оказаться не- нестрогой. Процедура вычислений при ДА приведена в табл. 4.10, из которой видно, что этот анализ является непосредственным обобщением случая рандомизированного полноблочного плана, причем сумма квадратов для строк определяется через суммы наблюдений по строкам. Таблица 4.10 Дисперсионный анализ для латинского квадрата Источник изменчивости Обработки Строки Столбцы Ошибка Сумма Сумма квадратов —V N "¦¦¦ -7'- j P 5^столб = 2j V..k~ Р k=l SS0U1 (вычитанием) i i k 1 2 - дг » • Степени свободы р-1 р-1 р-1 (Р-2)Х Х(р— 1) р2— 1 Средний квадрат оообр р-1 SSCTP р-1 5остолб р-1 (р _ 2) <р — 1) Ра MS0(,p MS от Пример 4.3. Рассмотрим задачу о формулах взрывчатой смеси, упоми- упоминавшуюся выше. Здесь как партии сырья, так и операторы представляют собой ограничения на рандомизацию. В этом эксперименте используется ла- латинский квадрат 5X5 (см. табл. 4.9). После кодирования (вычитанием 25 из каждого наблюдения) мы получаем данные (табл. 4.11). Таблица 4.11 Кодированные данные для задачи о формулах взрывчатой смеси Партии сырья 1 2 3 4 5 У..к А В С D Е 1 = _i = —8 у — 1 = -3 -18 В С D Е А 2 = -5 = 13 = 6 = 5 18 Операторы С D Е А В 3 = —1 = 5 = 1 = 1 = -5 —4 D Е А В С 4 1 = 2 9 = —2 = 4 5 Е А В С D 5 = _1 = 11 = —4 , Q = 6 9 Ч.. -14 9 5 3 7 У... = Ю 89
Общая сумма квадратов и суммы квадратов для партий сырья (строк) и операторов (столбцов) находятся следующим образом: 550бщ = 22 i k У2ш _Ly2 = 680__L N ¦¦ 25 = 67б,00; 5Scbip — ^ </; . P i=l --L,2 =4-K- ___!_ Ю2 = 68,00; 25 5SOnep = —У\У2к- — У* = — [( - 18J + 18» Р *=1 ( - 4J + б2 + 9*} - — 102 = 150,00. 25 Суммы по обработкам (латинским буквам) приведены ниже: Латинская буква Сумма по обработке А 0.1. = 18 В у.г. = -24 С у.з. = —13 D ул. = 24 Е ул. = 5 Сумма квадратов, обусловленная формулами смеси, исходя из найденных сумм, имеет величину SS*opM= — У. у2-, ~У2 =-L[18*+(-24)*+(-13J + 24* + 52]- Р jZ\ ¦'¦ N ¦ 5 —L юг = ззо,оо. 25 Сумма квадратов для ошибки находится вычитанием: ооош==»^»^об1ц — иосыр »^о опер — ООфорн" =676,00 — 68,00 — 150,00 — 330,00 = 128,00. Результаты ДА приведены в табл. 4.12. Различия формул взрывчатой смеси оказываются значимыми на уровне одного процента. Кроме того, сред- средний квадрат для операторов велик по сравнению со средним квадратом ошибки. Таблица 4.12 Дисперсионный анализ для задачи о формулах взрывчатой смеси Источник изменчивости Формулы Партии сырья Операторы Ошибка Сумма Сумма квадратов 330,00 68,00 150,00 128,00 676,00 * Значимо при 1 проценте. Степени свободы 4 4 4 12 24 Средний квадрат 82,50 17,00 37,50 10,67 7,73* Латинский квадрат, у которого буквы в первой строке и пер- первом столбце расположены в алфавитном порядке, называется стандартным; такой план эксперимента использован в при- примере 4.3. Стандартный латинский квадрат всегда можно полу - чить, если расположить буквы в первой строке в алфавитном порядке, а в каждой из последующих строк — со сдвигом на одно положение влево по сравнению с предыдущей. В табл. 4.13 приведена сводка некоторых сведений о латинских, в том числе стандартных, квадратах. При латинском квадрате, как и при любом плане экспери- эксперимента, наблюдения должны производиться в случайном порядке. Соответствующая процедура рандомизации состоит в том, что для проведения конкретного эксперимента латинский квадрат выбирается случайным образом. Как видно из табл. 4.13, суще- существует довольно большое число латинских квадратов заданного размера, поэтому их невозможно пронумеровать и выбрать один из них случайным образом. Обычно для этого используется таб- таблица латинских квадратов, например, у Фишера и Иейтса [32], причем порядок следования строк, столбцов и букв задается произвольно (более полное обсуждение см. там же). Иногда в эксперименте, спланированном по латинскому квад- квадрату, одно из наблюдений оказывается недостающим. Для ла- латинского квадрата рХр оценку недостающего значения можно получить по формуле 90 р{у,+у:,+у:,)ъ... 2 (p_2)(p_l) V > где штрихи означают, что суммы по строкам, столбцам и обра- обработкам и общая сумма не содержат недостающего значения. Латинские квадраты могут оказаться полезными в ситуа- ситуациях, когда строки и столбцы соответствуют факторам, которые экспериментатору требуется в действительности исследовать, а не ограничениям на рандомизацию. Таким образом, при всего р2 наблюдениях могут быть исследованы три фактора (строки, столбцы и буквы), причем каждый из них на р уровнях. Для применения этого плана необходимо допущение, что между фак- факторами отсутствует взаимодействие, вопросы, связанные с взаи- взаимодействием, будут обсуждаться позднее. Перекрестные планы и планы, сбалансированные относи- относительно остаточных эффектов. Иногда встречаются ситуации, когда фактором в эксперименте являются периоды времени. Пусть в общем случае необходимо проверить р обработок в р периодах времени на пр экспериментальных объектах. Напри- Например, исследуется влияние двух физиологических растворов раз- различного состава на обезвоживание организма человека. В опыте заняты 20 обследуемых. В первый период времени одной поло- половине обследуемых (выбранных случайным образом) дается рас- раствор 1, а другой половине — раствор 2. В конце этого периода 91
1 92 o< V 3s n rt a. о u OHh Ж Ц m о 1 X X в ж CJ HHJ.T3 ч о ч чис аты и а. 5 а ж eg ндар.тны я s- _> о. X с t~- X 6X6 Ю X Ю 4X4 3X3 о. (U S со «J 0< О, о 03 ч: о ft. ч Q Cj CQ ч: ft. Ч Q о CQ ч: ы Q CJ 0Q "С В С D я: CJ оз тных а. СО Ч я СО S CD.. 03 ч: о ft. ч Q CJ оэ Ч С5 ч; ft. Cj CQ Ci CJ 4 ч; OQ ч; Q Cj 03 ^ CJ 03 n о римеры квадрат С оэ . 4 Q CJ 03 о ft. 4 Q CJ •ч; 4 оа ft. p^ aa 4 ч; Q CJ OQ Q CJ 03 CJ CJ оэ ч: о ft. 4 CJ ft. 03 ч; 4 Q Cj ч; 03 4 Q ABC Q Q CJ 03 ч; о ft. 4 03 CJ ft, Q ч; 4 ч; OQ Q Cj 4 4 Q О 03 ч; о ft. ч; оз Cj ч Q ft. 1 a. «j ч; a. ft. 4 Q Cj 03 ч; о 1 о о сч CD 9408 тс — X Я я ь а. § X та в исло о о ь СО а. « со о X Т . о S о> ¦* CD О СМ Ю с» 00 00 S <м 3 576 CN атнн- ч о ч О) Ш ю о о X числ! ра о со Си ч а СКИХ KB, х 3 о стандартн квадрате S я зЗ <ие таблиц: змера, npei о от <и о. ЕС ~ Sl « tt С? ш , й; о 5 wg _ f-l »ч §s ОЙ eg Йейтс 1953. С о. **! а* ише 4-е, в5 •: s в . -S жио найти исследова О X а и IS 1' о я ИЗ Э1 :ких едения номичес [ мало. той и G.S <о 5- а> 2 1 • Неко ологическ цего 7x7, ¦ ёг измеряется отклик; затем следует период отдыха, который необ- необходим для исключения влияния введения растворов. Во второй период времени обследуемым, которым давался раствор 1, да- дается раствор 2, а тем, кому давался раствор 2,— раствор 1. План такого эксперимента называется перекрестным планом. Для проведения анализа он представляется в виде набора из де- десяти латинских квадратов с двумя строками (периоды времени) и двумя обработками (составы растворов); два столбца в каж- каждом из десяти квадратов соответствуют обследуемым. Подроб- Подробное исследование статистического анализа данных таких экспе- экспериментов приведено у Кокрена и Кокса [21], Джона [47], Андер- Андерсона и Маклина [1]. Латинские квадраты можно использовать и при планирова- планировании экспериментов, в которых обработки обладают остаточным эффектом; например, если данные по раствору 2 во второй пе- период времени все еще отражают некоторое влияние раствора 1, проверявшегося в первый период времени. Планы, сбалансиро- сбалансированные относительно остаточных эффектов, детально обсужда- обсуждаются Кокреном и Коксом [21] и Джоном [47]. 4.3. ГРЕКО-ЛАТИНСКИЕ КВАДРАТЫ Рассмотрим латинский квадрат рХр- Наложим на него дру- другой латинский квадрат рХр, в котором обработки обозначены греческими буквами. Если при наложении каждая греческая буква встречается с каждой из латинских букв один и только один раз, то говорят, что такие латинские квадраты ортого- ортогональны, а образующийся при этом квадрат называют греко-ла- греко-латинским. Пример греко-латинского квадрата 4x4 приведен в табл. 4.14. Греко-латинские квадраты могут использоваться при плани- планировании экспериментов для систематического контроля трех ис- источников мешающей неоднородности, т. е. для группирования в блоки по трем направлениям. Такие планы позволяют иссле- исследовать всего при р2 наблюдениях четыре фактора (строки, столбцы, латинские и греческие буквы), причем каждый из них на р уровнях. Греко-латинские квадраты существуют для всех /7^3, кроме /; = 6. Статистическая модель эксперимента, планом которого явля- является греко-латинский квадрат, имеет вид ytju = М- + 8, + Ъ + «л = Ч>/ + Цъи i=l. 2 р; /=1, 2,..., р; fc=l, %..., р; /= 1, 2,..., р, где D.21) /ijhi — наблюдение в /-Й строке и 1-й столбце для /-й латин- латинской и k-й греческой букв; 9,- — эффект t'-й строки; ту — эффект у-й латинской буквы; соь — эффект й-й греческой буквы; % — эф- 93
Таблица 4.14 Греко-латинский квадрат 4x4 фект /-го столбца; eijhi~NlD(O, о2) — случайная ошибка. Для однозначного задания наблюдения необходимы лишь два ин- индекса из четырех. ДА проводится практически так же, как и в случае латин- латинских квадратов. Поскольку любая из греческих букв в каждой строке и каждом столбце и с каждой латинской буквой встречается один и только один раз, то фактор, представлен- представленный греческими буквами, ор- ортогонален факторам, соответ- соответствующим строкам, столбцам и латинским буквам. Следо- Следовательно, сумма квадратов, обусловленная фактором,пред- фактором,представленным греческими бук- буквами, может быть выражена через суммы для греческих букв, а экспериментальная ошибка должна быть уменьшена на соответствующую вели- величину. Правила вычислений приведены в табл. 4.15. Нулевые гипотезы о равенстве эффектов обработок, представленных стро- строками, столбцами, латинскими и греческими буквами, проверя- проверяются на основе отношений соответствующего среднего квадрата Таблица 4.15 Дисперсионный анализ для греко-латинского квадрата Строка 1 2 3 4 Столбец 1 Аа вь ср Dy 2 вр Ау Da 3 3 Лб Ва 4 Db Са ву лр Источник изменчивости Латинские буквы Греческие буквы Строки Столбцы Ошибка Сумма Сумма квадратов 55-= р 2*-- i '¦¦¦• Р г=1 " 5Som (вычитанием) 550бщ=2 2 2 2 4ы --j7~^.... Степень свободы р-1 р-1 р-1 р-1 (р—3)(р—1) р«-1 к среднему квадрату ошибки. Критическое значение — верхняя Процентная точка F-распределения с р—1 и (р—3)(р—1), сте- степенями свободы. Пример 4.4. Предположим, что при исследовании формул взрывчатой смеси (см. пример 4.3) может оказаться важным еще один фактор — испы- испытательные установки. Пусть этих установок пять, обозначим их греческими буквами а, р, у, б и е. Получившийся греко-латинский квадрат приведен в табл. 4.16. Таблица 4.16 Греко-латинский квадрат для задачи о формулах взрывчатой смеси Партии сырья 1 2 3 4 5 У- л 1 Ла = —1 ВР = -8 Cv = -7 D6= 1 ?е = —3 — 18 2 by = -5 Сб = —1 De= 13 ?а = 6 ЛР = 5 18 Операторы Се Da ?Р Ау В8 3 = —6 = 5 1 i = -5 —4 4 Dp = Еу = Лб = Ве = Са = 5 — 1 2 2 4 5 ?6 = Ле = Ва = ср = 9 — 1 11 4 —3 6 — 14 9 5 3 7 «/... = ю Отметим, что суммы для партий сырья (строк), операторов (столбцов) и формул смеси (латинских букв) такие же, как в примере 4.3, поэтому 55Сыр = 68,00; 55„Пер= 150,00; 55форм =330,00. Найдем суммы для испытательных установок: Греческая буква а I Сумма для испыта- испытательной установки У..1. = Ю у.* = -6 У..з. = -3 У.л. = -4 У..5. = 13 Тогда сумма квадратов, обусловленная испытательными установками. -L [Ю2 + ( — бJ о — ЗJ + ( — 4J + 132] 102 =• 62,00. 2,Ъ Результаты полного ДА сведены в табл. 4.17. Различия между форму- формулами смеси оказываются значимыми на уровне одного процента. Сравнивая табл. 4.17 и 4.12, видим, что исключение изменчивости, обусловленной испы- испытательными установками, уменьшило ошибку эксперимента. При этом, однако, уменьшилось и число степеней свободы ошибки с 12 (при латинском квад- квадрате в примере 4.3) до 8. Таким образом, число степеней свободы получаемой оценки ошибки стало меньшим, и критерий может оказаться менее чувстви- чувствительным. 94 95
Таблица 4.1? Дисперсионный анализ для задачи о формулах взрывчатой смеси Источник изменчивости Формулы Партии сырья Операторы Испытательные установки Ошибка Сумма Сумма квадратов 330,00 68,00 150,00 62,00 66,00 676,00 Степени свободы 4 4 4 4 8 24 Средний квадрат 82,50 17,00 37,50 15,50 8,25 Fo 10,00* • Значимо при 1 проценте. Идея образования греко-латинского квадрата из двух орто- ортогональных латинских квадратов может быть обобщена. При на- наложении трех или более ортогональных латинских квадратов рХр образуется гиперквадрат рХр. В общем случае полного набора р—1 ортогонального латинского квадрата оказывается возможным исследовать до р+1 фактора включительно. При этом используются все (р+1)(р—1)=р2—1 степени свободы, так что необходима независимая оценка дисперсии ошибки. Оче- Очевидно, что при использовании гиперквадратов также требуется отсутствие взаимодействия между факторами. 4.4. ЗАДАЧИ 4.1. Химик хочет проверить влияние четырех реактивов на прочность некоторого покрытия. Из-за возможной изменчивости между образцами по- покрытия он решает применить план с рандомизированными блоками, взяв в качестве последних образцы. Выбирается пять образцов, и на них в слу- случайном порядке проверяются четыре реактива. Получены следующие данные: Реактив 1 2 3 4 Образец 1 73 73 75 73 68 67 68 71 • 74 75 78 75 4 71 72 73 75 5 67 70 68 69 Проведите анализ данных и сделайте соответствующие выводы. 4.2. Оцените параметры модели т, и Р/ для задачи 4.1 в предположении, что реактивы и образцы фиксированы. 4.3. Допустим, в задаче 4.1 недостает наблюдения для реактива 2 и об- образца 3. Проведите анализ, оценив недостающее значение. Проведите точный анализ и сравните результаты. 96 4.4. Два недостающих наблюдения в плане с рандомизированными бло- блоками. Предположим, что в задаче 4.1 недостает наблюдений для реактива 2 и образца 3, а также для реактива 4 и образца 4. а) Проведите анализ, оценив недостающие данные итерационным спосо- способом, описанным в 4.1.2. б) Продифференцируйте 550Ш по двум недостающим значениям, прирав- приравняйте результаты нулю и найдите оценки недостающих наблюдений. Прове- Проведите анализ с использованием найденных оценок. в) Выведите общие формулы для оценок двух недостающих значений из различных блоков. г) Выведите общие формулы для оценок двух недостающих значений из одного и того же блока. 4.5. Инженер по организации производства исследует влияние четырех методов сборки А, В, С, D на продолжительность сборки блока радиоэлек- радиоэлектронной аппаратуры. Для участия в эксперименте выбираются четыре сбор- сборщика. Однако инженеру известно, что независимо от метода из-за утомляе- утомляемости рабочего время, необходимое для последней сборки, может быть боль- большим, чем для первой. Другими словами, возникает систематическое изменение продолжительности сборки. Для учета этого источника изменчивости инженер применяет латинский квадрат (см. ниже). Проведите анализ данных и сде- сделайте соответствующие выводы. Метод сборки 1 2 3 4 1 С = 10 В = 7 Л =5 D= 10 ?> С В А 2 = 14 = 18 = 10 = 10 Рабочий 3 Л =7 ?>= 11 С = 11 5 = 12 В = 8 Л = 8 ?> = 9 С = 14 4.6. Планы с несколькими латинскими квадратами (Кюкрен и Кокс [21], Джон [47]). Латинский квадрат рХр содержит только р наблюдений для каждой обработки. Для увеличения числа реплик экспериментатор может использовать несколько квадратов (несущественно, одинаковых или различ- различных), скажем, п. Соответствующая модель имеет вид Уцш = Iх + РЛ + ai{h) + %;+ &т + (тр)й + е.т, i= 1,2, .. ., р; / = 1,2 р; k= 1,2, ..., р; ft = 1,2, ..., п, где yijkh — наблюдение для обработки / в строке i и столбце k квадрата ft; Рл — эффект ft-ro квадрата; (тр),-/, — взаимодействие между обработками и квадратами. а) Напишите нормальные уравнения для этой модели и решите их отно- относительно оценок параметров модели в предположении, что соответствующие дополнительные условия для параметров имеют вид 2jPft = 0> 2«f(ft) = ° и 2iW)=° Для всех h' 2^ = 0 ft i k i для всех ft и 2 (тр),/й = 0 для всех /. h б) Постройте таблицу ДА для этого плана. 4.7. Выход химического процесса измерялся на пяти партиях сырья при пяти концентрациях кислоты, пяти продолжительностях реакции А, В, С, D, Е и пяти концентрациях катализатора а, E у, б, 8. Использовался греко-латин- греко-латинский квадрат, приведенный ниже. Проведите анализ данных и сделайте со- соответствующие выводы. Д. К. Монтгомери 97
Партия 1 2 3 4 5 1 Ла = By = Се = Dft = ?6 = 26 18 20 15 10 D ft op Сб Da Яу Ле Концентрация кислоты 2 = 16 = 21 = 12 = 15 = 24 Су De яр Лб Ва 3 = 19 = 18 = 16 = 22 = 17 D6 Яа Лу Be ср 4 = 16 = 11 = 25 = 14 = 17 Яе лр Вб Со. Dy 5 = 13 = 21 1 Ч = 10 = 17 = 14 4.8. Предположим, что в задаче 4.5 инженер полагает, что рабочие места сборщиков могут являться дополнительным источником изменчивости. Можно ввести четвертый фактор — рабочее место а, [5, у, 6 и использовать греко- латинский квадрат, приведенный ниже. Проведите анализ данных и сделайте выводы. Метод сборки 1 2 3 4 Рабочий 1 ср = п Ва = 8 Лб = 9 Dy= 9 2 Лу= 10 Сб = 12 Da =11 ЛР = 8 3 D6= 14 Лу=10 ВР = 7 Са= 18 4 Ла = 8 ?>Р = 12 Су =15 В6 = 6 ГЛАВА ПЯТАЯ НЕПОЛНОБЛОЧНЫЕ ПЛАНЫ 5.1. ВВЕДЕНИЕ В некоторых экспериментах с рандомизированными блоч- блочными планами может оказаться, что нельзя проверить все обра- обработки в каждом из блоков. Ситуации такого рода обычно объясняются либо нехваткой средств или экспериментальной ап- аппаратуры, либо реальными размерами блока. Предположим, на- например, что при определении твердости (см. пример 4.1) раз- размеры образца металла позволяют проверить на каждом из них только три острия, т. е. каждое острие не может быть проверено на каждом из образцов. В подобных случаях можно использо- использовать рандомизированные блочные планы, при которых не во всех блоках встречается каждая из обработок. Такие планы, из- известные под названием рандомизированных неполноблочных планов, и рассматриваются в данной главе. 98 5.2. СБАЛАНСИРОВАННЫЕ НЕПОЛНОБЛОЧНЫЕ ПЛАНЫ Если все сравнения обработок между собой являются одина- одинаково важными, то обработки в каждом блоке должны выби- выбираться сбалансированно, т. е. так, чтобы каждая пара обработок встречалась столько же раз, сколько и любая другая. Сбаланси- Сбалансированный неполноблочный план — это такой неполноблочный план, в котором все возможные пары обработок встречаются одинаковое число раз. Пусть при числе обработок, равном а, в каждом из блоков могут быть проверены только k (k<a) из них. Тогда сбалансированный неполноблочиый план можно по- построить, взяв (?) блоков и разместив различные сочетания об- обработок в различных блоках. Во многих случаях, однако, уда- удается обеспечить сбалансированность плана и при числе блоков, меньшем, чем (аА. Таблицы сбалансированных неполноблочных планов приведены у Фишера и Иейтса [32], Дейвиса [24], Кок- рена и Кокса [21]1. Рассмотрим такой пример. Инженер-химик считает, что время протекания некоторого химического процесса зависит от вида применяемого катализатора. Предполагается исследовать четыре вида катализаторов. В процедуру эксперимента входит выбор партии сырья, загрузка опытной установки, проведение отдельного цикла работы опытной установки с каждым из ката- катализаторов и определение продолжительности реакции. На эф- эффективность применения катализатора может влиять изменчи- изменчивость сырья по партиям, поэтому инженер принимает решение использовать партии в качестве блоков. Однако объем партии позволяет провести только три цикла работы, следовательно, Таблица 5.1 Сбалансированный неполиоблочный план для эксперимента катализатором Обработка (катализатор) 1 2 3 4 У-i Блок (партия сырья) 1 73 73 75 221 2 74 75 75 224 3 67 68 72 207 4 71 72 75 218 'Л. 218 214 216 222 У.. = 870 1 См. также Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. Пер. с англ. Под ред. А. Н. Колмогорова и Ю. В. Прохорова. М., Наука, 1976, § 38.54. (Прим. ред.) 4* 99
необходимо использовать рандомизированный неполноблочный план. Сбалансированный неполноблочный план этого экспери- эксперимента и его результаты приведены в табл. 5.1. Порядок, в кото- котором проверялись катализаторы в каждом блоке, выбирался слу- случайным образом. 5.2.1. Статистический анализ Пусть, как обычно, а — число обработок, а Ь — число блоков. Кроме того, предположим, что каждый блок содержит k обра- обработок, каждая обработка встречается в эксперименте г раз (или делается г реплик) и общее число наблюдений составляет N— = ar=bk. Если a = b, то план называется симметричным. Далее каждая пара обработок в одном и том же блоке встречается Х = = r(k—1) (а—1) раз, причем параметр К должен быть целым. Для вывода этого выражения рассмотрим какую-либо из обра- обработок, скажем, первую. Обработка 1 встречается в г блоках, каждый из которых содержит k—1 другую обработку. Всего в блоках, содержащих обработку 1, распределяется r(k—1) дру- других обработок, среди которых каждая из а—1 оставшихся обра- обработок встречается К раз, следовательно, \(а—l)=r(k—1). Статистическая модель имеет вид «/{;¦= E.1) где г/tj — t'-e наблюдение в j-u блоке; ц — математическое ожи- ожидание общего среднего; п — эффект t-й обработки; pj — эффект /-го блока; eh~NID (О, а2) —случайная ошибка. Общая изменчивость данных, выражаемая общей скорректи- скорректированной суммой квадратов -4гУ2. E-2) может быть представлена в виде разбиения «S«S общ г= 5о обр(ИСПр) Н~ «Ь «J б Л "Ь О О ОШ) где в сумму квадратов для обработок введена поправка для раз- разделения эффектов блоков и обработок. Такая поправка необхо- необходима, поскольку различные обработки входят в различные со- сочетания блоков по г в каждом и, следовательно, разности неис- неисправленных сумм по обработкам у\., г/г., ¦. -, г/а. зависят также и от разностей между блоками. Сумма квадратов для блоков SS6n = — 2 у2! г/2., E.3) где у.) — суммэ наблюдений для \-то блока соответствует Ь—1 степени свободы. Исправленная сумма квадратов для обработок определяется выражением 'обр (испр) — " E.4) где Qi — исправленная сумма наблюдений для t-й обработки, равная Q; = Уи 2 ijy.j, t = 1, 2,.... а, E.5) причем rtij=l, если i-я обработка встречается в /-м блоке, и 1 * «ij = 0 в противном случае. Таким образом, величина—Y п^у.,- k /=i является средним арифметическим сумм по блокам, содержа- содержащим i-ю обработку. Сумма исправленных сумм по обработкам всегда равна нулю. Число степеней свободы 550бр(испр> состав- составляет а—1. Сумма квадратов для ошибки находится вычитанием: со ее ос , оо . /с. с\ «->°ош — «^«-'общ '-'«-'обр (испр) — 1-'1-'бл> ^0.0^ ей соответствует N—а—6+1 степень свободы. При проверке гипотезы о равенстве эффектов обработок должна использоваться статистика Fq = MS обр(ИСПр)/'MS ош- Основные соотношения для ДА приведены в табл. 5.2. Таблица 5.2 Дисперсионный анализ для сбалансированного неполноблочного плана Источник изменчи- изменчивости Обработки (исправ- (исправленные) Блоки Ошибка Сумма Сумма квадратов 550Ш (вычитанием) 22*/ -ту2. Степени свободы а—1 6—1 N —а — -6+1 N — 1 Средний квадрат •^^обр (испр) а—1 6 — 1 N—а—6+1 ''"'^обр (испр) MSqiu Пример 5.1. Рассмотрим данные эксперимента с катализаторами (см. табл. 5.1), параметры соответствующего сбалаисированиого неполноблочного плана а=4, 6=4, к=Ъ, т=3, &=2 и N=\2. Анализ этих данных ведется 101
следующим образом. Находим общую сумму квадратов 550бщ = 2 2 у2н - ~ у2. =63156 —h: 87°2 =81 -^ i j 12 12 В соответствии с выражением E.3) для суммы квадратов по блокам по- получаем SS6n = —V (/27 - — у2 =—B212 + 2072 + 2242+2182)- — 8702 = 55,00. Далее с помощью выражения E.5) определим исправленные суммы по об- обработкам Q, = 218— 1/3B21+224 + 218)=—9/3; Q2=214 — 1/3B07+224+218) =—7/3; Q3=216 — 1/3B21 +207+224) =—4/3; Q4=222— 1/3B21+207 + 218) =20/3; откуда в соответствии с выражением E.4) для исправленной суммы квадра- квадратов для обработок получаем г; о __ R V О2 = О°обр(испр) л Zj v' Ла 1=1 9 \2 -т + -т + f I|=22'75- Сумма квадратов для ошибки находится вычитанием: SS0U1 = SSo6ui - SSo6p(Hcnp) - SS6n = 81,00-22,70 - 55,00 = 3,25.. Результаты ДА приведены в табл. 5.3. Поскольку fo>-fo,o5; з; 5=5,41, то приходим к выводу, что применяемые катализаторы оказывают значимое влияние на время протекания процесса. Таблица 5.3 Дисперсионный анализ для примера 5.1 Источник изменчивости Обработки (исправ- (исправленные) Блоки Ошибка Сумма Сумма квадратов .22,75 55,00 3,25 81,00 Степени свободы 3 3 5 11 Средний квадрат 7,58 0,65 11,66 Если исследуемый фактор фиксирован, то может представ- представлять интерес сравнение средних по отдельным обработкам. При использовании ортогональных контрастов в их основу кладутся исправленные суммы по обработкам, т. е. {Qi}, а не {Цг.}- 102 Сумма квадратов для контраста имеет вид SSr = - 23 1=1 где {Ci} — коэффициенты контраста. Для сравнения всех пар исправленных средних по обработкам можно применить мно- множественный критерий размахов Дункана. Как будет показано в 5.2.2, для исправленных средних по обработкам справедливы оценки Xi — kQilCka)\ Соответствующий стандарт ошибки опре- определяется выражением E.7) Проиллюстрируем применение множественного критерия раз- махов Дункана на данных примера 5.1. Расположим исправлен- исправленные средние по обработкам в возрастающем порядке. Ti=*Q1/(Xfl)=3(—9/3)/B-4)= —9/8; = 3(-7/3)/B-4) = -7/8; = 3(-4/3)/B-4)=-4/8; T4=fcQ4/(Aa) =3B0/3)/B-4) =20/8. Из приложения VI для а=0,05 и пяти степеней свободы ошибки находим значения го,05 B; 5) =3,64; го,о5 C; 5) =3,74; fo,o5 D; 5) =3,79. Подставив значение yWSom=0,65 (см. табл. 5.3) в выражение E.7), получим Таким образом, Я2 = г0,о5 B; 5); 5 = 3,64-0,40=1,46; 5); S = 3,74 -0,40= 1,50; D; 5); 5 = 3,79-0,40=1,52 и сравнения дают 4 с 1: 20/8—(—9/8) =29/8> 1,52 (Я4); 4 с 2: 20/8— (—7/8) =27/8 > 1,50 (R3); 4 с 3: 20/8— (—4/8)= 24/8> 1,46 (R2); 3 с 1: —4/8—(—9/8) =5/8 < 1,50 №); 3 с 2: — 4/8— (—7/8)= 3/8< 1,46 (R2)\ 2 с 1: —7/8—(—9/8) =2/8< 1,46 (Д2). 103
Результаты проверки обобщены на рис. 5.1: катализатор 4 отличается от трех остальных, различий между другими сред- средними не наблюдается. —9/8 -7/8 -4/8 20/8 Рис. 5.1. Результаты применения множествен- множественного критерия размахов Дункана. В выбранном нами методе анализа общая сумма квадра- квадратов разбивается на исправленную сумму квадратов для обрабо- обработок, неисправленную сумму квадратов для блоков и сумму квадратов для ошибки. В некоторых случаях бывает интересно оценить эффекты блоков, тогда используется другой метод раз- разбиения величины 5<->общ = >->So6p "t" ""бл(испр) + •J'S ош. причем в S506p поправка не вводится. Если план симметричен, т. е. если а = Ь, то для исправленной SS^n может быть получена простая формула. Исправленные суммы по блокам имеют вид 1 a r 1=1 тогда г — 2 E.8) E.9) Сбалансированный неполноблочный план эксперимента в примере 5.1 симметричен, поскольку а=6=4, следовательно, Q1/=221 —1/3 B18 + 216 + 222) =7/3; Q2' = 224—1/3 B18 + 214 + 216) =24/3; Q3'=207—1/3 B14 + 216 + 222) =—31/3; Q4' = 218—1/3 B18 + 214 + 222) =0 При этом SSo6p = —B182 + 2142 + 2162 + 2222) 8702 = 11,67. Сводка результатов ДА для симметричного сбалансирован- сбалансированного неполноблочного плана приведена в табл. 5.4. Отметим, что суммы квадратов, связанные со средними квадратами из 104 этой таблицы, при сложении не дают общую сумму квадратов, т. е. Это является следствием неортогональности блоков и обра- обработок. Таблица 5.4 Дисперсионный анализ для примера 5.1 с учетом как блоков, так и обработок Источник изменчивости Обработки (исправ- (исправленные) Обработки (неисправ- (неисправленные) Блоки (неисправлен- (неисправленные) Блоки (исправленные) Ошибка Сумма <-умма квадратов 22,75 11,67 55,00 66,08 3,25 81,00 Степени свободы 3 3 3 3 5 11 Средний квадрат 7,58 — — 22,03 0,65 11,66 — — 33,90 5.2.2. МНК-оценивание параметров Найдем оценки эффектов обработок для модели сбаланси- сбалансированных неполных блоков. Нормальные МНК-уравнения имеют вид a; = 1, 2 Ь. E.10) Наложив ограничение STi=SPj = O, получим, что \\,=у... Да- Далее с помощью уравнений для {р^} исключим эффекты блоков из уравнений для 6 о ь [rk х{—г Т(—2 2 П{>пр( тр = кУ{- ~2 пиУ-1- E-!!) /=i p=i /=i Заметим, что правая часть уравнения E.11) равна kQi, где Q,- — исправленная сумма по t-й обработке [см. выраже- е ние E.4)]. Тогда, поскольку 2п,-;пр,=Я при рф1, a n2Pj = nPj /=> 105
(так как nPj = O или 1), уравнение E.11) можно записать в виде r(k—l)xi—l^lxp = kQi, i = l, 2 а. E.12) Р=\ Наконец, заметим, что из ограничения 2 т; = 0 следует 2 хр =—т(-, и вспомним, что r(k—1)=Х(а—1), поэтому p=i i i = kQi, i = l, 2,..., а. E.13) Следовательно, МНК-оценки эффектов обработок в модели сбалансированных неполных блоков имеют вид Tt = -=-Qf,* = l, 2,..., а. E.14) Для иллюстрации рассмотрим сбалансированный неполно- блочный план из примера 5.1. Поскольку Qi=—9,3; Q2 =—7,35 Q3 = — 4/3 и Q4=20/3, то T-i =— I I =^ У/Ol To == I I = , 1 2-4 \ 3 / ' 2 2-4 V 3 / 8 3 / 4 \ . ;o * 3 / 20 \ 20 T3 = =—4/8; T4 = —— =—. 3 2-4 V 3 / ' 2-4 V 3 / 8 Эти же результаты мы получили в 5.2.1. 5.3. ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИИ МЕЖДУ БЛОКАМИ В СБАЛАНСИРОВАННОМ НЕПОЛНОБЛОЧНОМ ПЛАНЕ Анализ сбалансированного неполноблочного плана, данный в 5.2, называется обычно внутриблочным анализом, так как раз- разности между блоками исключаются, а все контрасты относи- относительно эффектов обработок могут быть выражены в виде срав- сравнений между наблюдениями в одном и том же блоке. Такой анализ справедлив независимо от того, фиксированы блоки или случайны. Йейтс [71] отметил, что если эффекты блоков явля- являются некоррелированными случайными переменными с нулевым средним и дисперсией сг|, то можно получить дополнительную информацию относительно Хг — эффектов обработок. Он назвал метод получения этой дополнительной информации междублоч- междублочным анализом. Рассмотрим суммы по блокам y.j как совокупность Ь наблю- наблюдений. Следуя Джону [47], эти наблюдения можно описать IQG моделью E.15) i=l \ i=i / причем слагаемое в скобках можно считать ошибкой Между- Междублочные оценки ц и т; находятся при минимизации суммы квадратов «ошибки» ?=1 Это приводит к следующим нормальным МНК-уравнениям: ^ i—i xt: kr p 2 Ь = 2 ntiy.,, 1 = 1,2,..., a, i E.16) где ц и г; — междублочные оценки. Решение си-стемы уравне- уравнений E.16) при ограничении 2 Т(== 0 имеет вид xt=- /=i Р = У..\ E.17) ПцУ.,—?ггу\, i = i, 2,..., а. E.18) л Можно показать, что междублочные {т,} и внутриблочные {тг} оценки некоррелированы между собой. Междублочные оценки {тг} могут отличаться от внутриблоч- ных {тг}, например, для сбалансированного неполноблочного плана из примера 5.1 1 -F33—3372,50) =10,50; т, =¦ т, = ¦ Т4 = 3—2 1 3 — 2 1 3—2 1 3 — 2 F49-3372,50) = —3,50; F52-3372,50) = —0,50; F46—3372,50) = —6,50. Отметим, что величины 2 пчУ-1 были использованы ранее для вычисления исправленных сумм по обработкам при внутри- блочном анализе (см. пример 5.1). 107
Предположим теперь, что мы хотим объединить внутриблоч- ные и междублочные оценки для получения одной оценки каж- каждого п, которая является несмещенной и обладает минималь- минимальной дисперсией. Можно показать, что и ti и т; являются несме- несмещенными оценками, причем ' ' "\ - а2 (внутриблочная) У'( тЛ = ¦№—lX (O2 + k a\) (междублочная). а (г — X.) ^ р' Используем для оценивания т, линейную комбинацию этих двух оценок, скажем, E.19) Оптимальными весовыми коэффициентами для комбиниро- комбинированной несмещенной оценки с минимальной дисперсией оказы- оказываются ai = uJ(Ui + u2) и a2=u2/(Ui + u2), где ^ = 1/1/(т,) и u2=l/V(ti). Таким образом, оптимальные весовые коэффици- коэффициенты обратно пропорциональны дисперсиям т* и п. Отсюда сле- следует, что наилучшая комбинированная оценка имеет вид а (а—Я) ZR a2 а(г-Х) или после некоторых упрощений ь ka2) , 1 = 1, 2,..., а, kQt[ ) -, t = l, 2 а. E.20) т. = К сожалению, выражение E.20) нельзя использовать для оценивания, п, так как дисперсии а2 и ст| неизвестны. Обыч- Обычный подход состоит в нахождении оценок а2 и ар по данным эксперимента и замене этих параметров в выражении E.20) своими оценками. За оценку о2 обычно принимается средний квадрат ошибки из внутриблочного анализа, т. е. внутриблоч- внутриблочная ошибка, тогда Оценка ар находится из исправленного (на обработки) сред- среднего квадрата для блоков. В общем случае для сбалансирован- 108 ного неполноблочного плана этот средний квадрат имеет вид E.21) а его математическое ожидание (вывод см. Грейбилл [39]) — о — 1 Таким образом, если Л15бл(Испр)>М5Ош, то для мается оценка 2 I) J Or ~ СУИ5й„ ivrr,^ —MSoin) , а если к оценке вида прини- :, то полагаем ар =0. Это приводит kQ( (о2 + k о|) + i ~ kry , a2p>0, E.23а) E.236) Найдем комбинированные оценки для данных примера 5.1. Из табл. 5.4 следует, что a2 = MSom=0,65 и MS6n{Bcap)=22,03. [Подчеркнем, что значение А^5бЛ(испР) было найдено с учетом "симметричности плана; в общем случае необходимо пользо- пользоваться выражением E.21)]. Поскольку MS6n(Hcnp)>MSom, то для оценки ^р используется выражение E.22), откуда ° ( Следовательно, подставив а2=0,65 и ар =8,02 в выражение E.23а), получим комбинированные оценки п*, приведенные ниже. Для удобства даны также внутриблочные и междублоч- междублочные оценки. В этом примере оценки ti* близки к внутриблоч- ным, так как дисперсия междублочных оценок сравнительно ве- велика. Параметр Т2 т3 Внутриблочиая оценка — 1,12 -0,88 -0,50 2,50 Междублочная оценка 10,50 -3,50 -0,50 —6,50 Комбинированная оценка -1,09 -0,88 —0,50 2,47 109
5.4. ЧАСТИЧНО СБАЛАНСИРОВАННЫЕ НЕПОЛНОБЛОЧНЫЕ ПЛАНЫ До сих пор мы рассматривали сбалансированные планы, тем не менее существует ряд неполноблочных планов иного вида, которые иногда оказываются полезными. Для произвольной комбинации параметров требование постоянства Я может при- привести к слишком большому числу или размеру блоков. Напри- Например, если при восьми обработках блок должен вмещать три из них, то для целочисленности К наименьшее число реплик должно быть г = 21. Это приводит к плану из 56 блоков, чего, очевидно, слишком много для большинства практических за- задач. Для уменьшения числа блоков, необходимых в таких слу- случаях, исследователь может использовать частично сбалансиро- сбалансированные планы, в которых одни пары обработок встречаются Ai раз, другие — Яг раз, ..., и оставшиеся пары — Ят раз. Пары обработок, которые вст- встречаются Я, раз, называются {-ассоциированными. В таких случаях говорят, что план со- содержит т ассоциированных классов. Таблица 5.5 _ Частично сбалансированный неполноблочный план с двумя ассоциированными классами Блок 1 2 3 4 5 6 Комбинации 1 3 2 1 3 1 2 4 5 2 4 5 обработок 3 5 6 4 6 6 Пример частично сбалан- сбалансированного неполноблочного плана приведен в табл. 5.5. Одни обработки встречаются Я,1 = 2 раза (такие, как 1 и 2), другие только Яг=1 раз (та- (такие, как 4 и 5). Таким образом, план содержит два ассоцииро- ассоциированных класса. Мы дадим описание внутриблочного анализа для таких планов. Частично сбалансированный неполноблочный план с двумя ассоциированными классами описывается следующими парамет" рами: 1. Обработки, число которых равно а, размещены в Ь бло- блоках. Каждый блок содержит k наблюдений, каждая обработка встречается в г блоках. 2. Две обработки, являющиеся ^-ассоциированными, встреча- встречаются в Яг блоках, i=l, 2. 3. У каждой обработки ровно щ (-ассоциированных обрабо- обработок, i=l,2. Число tii не зависит от выбранной обработки. 4. Если две обработки являются /-ассоциированными, то число обработок /-ассоциированных с одной из них и & = ас- социированных с другой равно ptf (i, j, &=1,2). Числа pjh* удобно записывать в виде матриц 2X2, причем ptf — элемент с индексами /, k в i-й матрице. ПО Для плана (см. табл. 5.5) нетрудно проверить, что а=6, 6, k = 3, r=3, Я4 = 2, Я2=1, rti = l, п2 = 4. Покажем, как определить величины р^. Рассмотрим две любые обработки, являющиеся 1-ассоциированными, скажем, 1 и 2. Для обработки 1 единственной 1-ассоциированной является обработка 2, а 2-ассоциированными— обработки 3, 4, 5 и 6. Для обработки 2 единственной 1-ассоциированной является об- обработка 1, а 2-ассоциированными — обработки 3, 4, 5 и 6. Объ- Объединяя эту информацию, получим табл. 5.6. Сосчитав число об- обработок в ячейках этой таблицы, мы, очевидно, получим матрицу {Рл1}, приведенную выше. Элементы pjh2 определя- определяются аналогично. Таблица 5.6 Ассоциированность обработок с обработками 1 и 2 Обработка 1 1-ассоциированная 2-ассоциированная Обработка 2 1-ассоциированная — — 2-ассоциированная — 3, 4, 5, 6 Линейная статистическая модель для частично сбалансиро- сбалансированного неполноблочного плана с двумя ассоциированными классами имеет вид #*j = M'+T» + Pj + e'/> E.24) где ц — математическое ожидание общего среднего; п — эф- эффект 1-й обработки; р3-— эффект /-го блока и гц~ЫЮ (О, а2) — случайная ошибка. Найдем общую сумму квадратов, сумму квадратов для блоков (неисправленную) и сумму квадратов для обработок (исправленную). Как и ранее, будем называть 1 ь Qi=yt.—^2 пцу.1 исправленной суммой по t'-й обработке. Определим также ве- величины S\ (Qi) =%Qs, s я i l-ассоциированы; s 1 (rk—r+X2) + (Ях—Я2) X 111
A*) X c,= c2= Оценка эффекта i-й обработки имеет вид тг = * [(*-с2) Q, + (Cl-c2) S г (ft — 1) а исправленная сумма квадратов для обработок — SS06p(Hcnp) = а л E.25) Основные соотношения ДА приведены в табл. 5.7. Для про- проверки Но: Тг = 0 используется статистика Fo = MS/MS Таблица 5.7 Дисперсионный анализ для частично сбаланснрованного неполноблочного плана с двумя ассоциированными классами Источник изменчивости Обработки (исправленные) Блоки Ошибка Сумма Сумма квадратов 1 Ь . вычитанием VVU2 1 2 ^Г" бИ- Степени свободы "Ц а —1 6—1 6ft — 6 — а + 1 6ft — 1 Можно показать, что для дисперсии любого контраста вида ти—г», где обработки и и о являются i-ассоциированными (i — = 1,2), справедливо выражение Это означает, что вследствие частичной сбалансированности плана не все сравнения между обработками оцениваются с оди- одинаковой точностью. Мы рассмотрели только внутриблочныи анализ; детали меж- междублочного анализа обсуждаются, в частности, у Бозе и Ши- мамото [6], Джона [47]. Последняя работа содержит подробное исследование общей теории неполноблочных планов. Обширная 112 таблица частично сбалансированных неполноблочных планов с двумя ассоциированными классами приведена в работе Бозе, Клэтверти и Шриханда [7]. Таблица 5.8 Квадрат Юдена для пяти обработок (А, В, С, D, Е) 5.5. КВАДРАТЫ ЮДЕНА Существуют «неполные» латинские квадраты — планы, в ко- которых число столбцов не совпадает с числом строк и обрабо- обработок. Рассмотрим, например, план, приведенный в табл. 5.8. От- Отметим, что если добавить к этому плану еще один столбец Е, А, В, С, D, то получится латинский квадрат 5x5. Большинство таких планов было разработа- разработано Юденом, и поэтому соответ- соответствующие квадраты носят его имя. Квадрат Юдена в общем случае представляет собой ла- латинский квадрат, в котором не хватает хотя бы одного столб- столбца (или строки или диагонали). Однако при вычеркивании бо- более чем одного столбца (стро- (строки или диагонали) из латин- латинского квадрата не всегда по- получается квадрат Юдена. При произвольном выбрасывании более чем, скажем, одного столбца из латинского квадрата может нарушиться его сбалансирован- сбалансированность. В общем случае квадрат Юдена соответствует симмет- симметричному сбалансированному неполноблочному плану, причем строки представляют собой блоки, а каждая обработка встреча- встречается в каждом столбце или каждом «положении» блока один и только один раз. Смитом и Хартли [66] показано, что квад- квадраты Юдена могут быть построены для всех симметричных сбалансированных неполноблочных планов; таблица квадра- квадратов Юдена приведена Дейвисом [24]. Другие виды «неполных» латинских квадратов обсуждаются Кокреном и Коксом [21, гл. 13]. Линейная модель для квадрата Юдена имеет вид Строка 1 2 3 4 5 - Столбец 1 А В С D Е В С D Е А » С D Е А В 4 D Е А В С = |Л + Ог + Tj ijh, где \i — математическое ожидание общего среднего; aj — эф- эффект «-го блока; tj — эффект /-й обработки; р& — эффект h-ro «положения»; eah~NID @, а2) —случайная ошибка. Поскольку «положения» встречаются в каждом блоке и с каждой обработкой один и только один раз, то они ортого- ортогональны блокам и обработкам. Анализ при использовании квадратов Юдена аналогичен анализу сбалансированного ИЗ
неполноблочного плана, но дополнительно можно найти сумму квадратов для «положений». Пример 5.2. Инженер по организации производства исследует влияние пяти уровней освещенности на частость появления дефектов при некоторой сборочной операции. В этом эксперименте время может быть фактором, поэтому инженер решает использовать пять дней как блоки. Однако в по- помещении, где проводится эксперимент, четыре различных рабочих места, что является потенциальным источником изменчивости. Инженер решает приме- применить квадрат Юдена с пятью строками (дни или блоки), четырьмя столб- столбцами (рабочие места) и пятью обработками (уровни освещенности). Коди- Кодированные данные эксперимента приведены в табл. 5.9. Таблица 5.9 Кодированные данные для примера 5.2 День (блок) 1 2 3 4 5 E..k Рабочее место • 1 Л =3 в = о С = —1 D = -l ? = 5 6 2 В= 1 с = о D = 0 ? =6 А =2 9 3 С= -2 D = -l ? = 5 А =4 В= 1 7 4 D = 0 ? = 7 Л =3 в = о С=-1 9 п.. 2 6 7 9 7 Суммы по обработкам Ул. = 12 (А) У*. = 2 (В) у.,. = - 4 (С) y.t. = -2 (D) У.ъ. = 23 (Е) 31 = у... Рассматривая этот план как сбалансированный неполноблочный, находим a=b = 5, r=k=4 и Х=3, а также 2;ь — — у2 =183,00 312 = 134,95. N 20 Исправленная сумма квадратов для обработок находится следующим образом: Qi= 12 — 1/4B+7+9+7) =23/4; Q2=2 — 1/4B+6+9+7) =—16/4; Q3= — 4- 1/4B+6+7+7) =—38/4; Q4= —2—1/4B+6 + 7 + 9)=—32/4; Q5=23 — 1/4F+7+9+7) =63/4. Далее 55дни 114 /=i 2j - 312 = 6,70; 20 2 = 1,35; ~ 55общ ~~ 55обр(испр) ~ 55места ~ = 134,95—120,37 — 6,70—1,35 = 6,53. Влияние блоков (или дней) можно оценить по величине исправленной суммы квадратов для блоков: Q'i = 2— 1/4A2+2 — 4 — 23) =0; Q'2=6— 1/4A2 — 3 — 2 + 23) =5/4; <2'з=7 — 1/4A2 — 4 — 2+23) =—1/4; Q'4=9— 1/4A2 + 2 —2+23) = 1/4; Q's=7—1/4A2+2 —4 + 23)=—5/4; 2 Полный ДА приведен в табл. 5.10 Уровни освещенности являются зна- значимыми на уровне одного процента. Таблица 5.10 Дисперсионный анализ для прнмера 5.2 Источник изменчивости Уровень освещенности (исправленный) День (неисправленный) » (исправленный) Рабочее место Ошибка Сумма * Значимо при 1 проценте. Сумма квадратов 120,37 6,70 @,87) 1,35 6,53 134,95 Степени свободы 4 4 f 8 19 Средний квадрат 30,09 0,22 0,45 0,82 36,87* 5.6. РЕШЕТЧАТЫЕ ПЛАНЫ Рассмотрим сбалансированный неполноблочный план с k2 обработками, размещенными в b = k(k+l) блоках с k наблю- наблюдениями в блоке и r = k+\ репликой. Такие планы называются сбалансированными решетками. В табл. 5.11 приведен пример с &2 = 9 обработками в 12 блоках при трех наблюдениях в каж- каждом. Отметим, что блоки могут быть сгруппированы таким образом, чтобы каждая группа содержала полную реплику. 115
Дисперсионный анализ для сбалансированных решеток прово- проводится так же, как и для сбалансированных неполноблочных пла- планов, за исключением того, что находится сумма квадратов для реплик, которая затем вычитается из суммы квадратов для бло- блоков. Репликам соответствует k степеней свободы, блокам — k2—\. Таблица 5.11 Сбалансированный решетчатый план 3X3 Блок 1 2 3 Блок 4 5 6 Реплика I 1 2 3 4 5 6 7 8 9 Реплика II 1 4 7 2 5 8 3 6 9 Блок 7 8 9 Блок 10 11 12 Реплика III 1 5 9 7 2 6 4 8 3 Реплика IV 1 8 6 4 2 9 7 5 3 Решетчатые планы часто используются в ситуациях, когда число возможных комбинаций обработок велико. Для того чтобы уменьшить размеры плана, исследователь может прибег- прибегнуть к частично сбалансированным решеткам. Опишем вкратце некоторые из этих планов. Две реплики плана для k2 обрабо- обработок в 2k блоках с k наблюдениями в каждом называются про- простой решеткой. Возьмем, например, две первые реплики плана в табл. 5.11. Видно, что он частично сбалансирован; так, ска- скажем, обработка 2 встречается в одном и том же блоке с обра- обработками 1, 3, 5 и 8, но не встречается ни разу с обработками 4, 6, 7 и 9. Решетчатый план k2 обработок в 3k блоках, сгруппи- сгруппированных в три реплики, называется тройной решеткой. При- Примером могут служить первые три реплики в табл. 5.11. Решет- Решетчатый план для k2 обработок в 4k блоках, сгруппированных в четыре реплики, называется четверной решеткой. В некоторых случаях могут оказаться полезными и другие виды решетчатых планов. Например, для k3 обработок в k2 блоках с k наблюдениями в каждом можно использовать куби- кубическую решетку. Решетчатый план для k(k+l) обработок в k+l блоке размера k называется прямоугольной решеткой. Детали анализа и таблицы для решетчатых планов приведены в книге Кокрена и Кокса [21]. 116 5.7. ЗАДАЧИ 5.1. Инженер исследует эффективность применения пяти видов добавок к топливу. Он решает использовать двигатели как блоки, однако из-за вре- временных ограничений он вынужден взять неполноблочный план. Эксперимент проводится по сбалансированному плану с пятью блоками, его данные при- приведены ниже. Проведите анализ этих данных и сделайте выводы. Добавка 1 2 3 4 5 Двигатель 14 12 13 11 2 17 14 11 12 3 14 13 11 10 4 13 13 12 12 5 12 10 9 8 5.2. Постройте ортогональные контрасты для данных задачи 5.1. Найдите суммы квадратов для каждого контраста. 5.3. Примените общий регрессионный критерий значимости для анализа данных из примера 5.1. 5.4. Проведите междублочный анализ для плана из задачи 5.1. 5.5. Проверьте, существует ли сбалансированный неполноблочный план с параметрами а=8, r=8, k=A и Ь = 16. 5.6. Покажите, что дисперсия внутриблочных оценок (хЛ равна fe(a-lH2/(b2). V \ и v 5.7. Рассмотрите частично сбалансированный неполноблочный план, при- приведенный ниже. Проведите внутриблочный анализ, обсуждавшийся в 5.4. Обработка 1 2 3 4 5 6 Блок 1 14 10 20 24 16 13 3 12 17 9 4 10 15 11 5 О О СО 6 16 12 8 5.8. Проведите анализ для следующего квадрата Юдена: Блок 1 2 3 4 5 Положение 1 А =2 В ==6 С = 1 D = 8 ? = 7 2 В = 9 Л = 5 ?> = 9 ? = 8 С = 6 3 С = 0 ? = 5 А =0 В = 10 ?> = 11 4 D = 14 С= 3 ?=7 А = 4 В = 10 117
ГЛАВА ШЕСТАЯ ВВЕДЕНИЕ В ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ 6.1. ЭЛЕМЕНТАРНЫЕ ОПРЕДЕЛЕНИЯ И ПРИНЦИПЫ Во многих экспериментах приходится исследовать эффекты двух и более факторов. Можно показать, что в этом случае наиболее эффективны факторные эксперименты. Факторным мы называем такой эксперимент, в каждом полном опыте или реп- реплике которого исследуются все возможные комбинации уровней факторов. Например, при а уровнях фактора А и Ь уровнях фактора В каждая реплика содержит все аЪ комбинаций обра- обработок. Факторы, исследуемые в факторном эксперименте, часто называются пересекающимися. Эффект фактора определяется как изменение отклика, обу- обусловленное изменением уровня фактора. Его часто называют главным эффектом, поскольку он относится к факторам, пред- представляющим основной интерес в эксперименте. Рассмотрим, на- например, данные табл. 6.1. За главный эффект фактора А можно принять разность средних откликов на первом и втором уровнях А, т. е. величину 40 + 52 20 + 30 _ О1 А 2 2 Другими словами, возрастание фактора А от уровня 1 до уровня 2 вызывает увеличение среднего отклика на 21 единицу. Аналогично главный эффект В составляет _ 30 + 52 20 + 40 ,. ~ 2 ~~ 2 ~ Если число уровней факторов больше двух, то приведенное определение необходимо изменить, поскольку разности средних откликов могут быть образованы многими способами (далее этот вопрос обсуждается более подробно). В ряде экспериментов может оказаться, что разности откли- откликов на некоторых уровнях одного фактора неодинаковы для различных уровней других факторов; в таких случаях говорят, что между факторами существует взаимодействие. Рассмотрим, например, данные табл. 6.2. На первом уровне фактора В эф- эффект фактора А составляет Л = 50—20 = 30, а на втором — 118 Л = 12—40 = — 28. Таким образом, эффект фактора А зависит от выбора уровня фактора В, следовательно, факторы А и В взаимодействуют. Введенные понятия можно проиллюстрировать графически. На рис. 6.1 показана зависимость отклика (по данным табл. 6.1) от уровня фактора А для обоих уровней В. Отметим, что линии, соответствующие В, и В2, почти параллельны. Это свидетельствует об отсутствии взаимодействия между факто- факторами Л и В. На рис. 6.2 показана аналогичная зависимость для данных табл. 6.2. Видно, что линии, соответствующие В1 и В2, здесь не параллельны. Это означает, что между факторами А и В существует взаимодействие. Подобные графики часто ока- оказываются очень удобными при интерпретации значимых взаи- 60г 50 §J0 520 ^10 - - В^ В^ I I А/ ^2 Фактор А 001- ЩЗО ¦=20 10 — - зГ I _) Фактор А 2 Рис. 6.1. Факторный экспери- эксперимент без взамодействия. Рис. 6.2. Факторный эксперимент с взаимодействием. модействий. При анализе данных нельзя, однако, ограничи- ограничиваться одними графиками, так как их интерпретация субъ- субъективна. Таблица 6.1 Факторный эксперимент Таблица 6.2 Факторный эксперимент с взаимодействием Фактор А Л, А, Фактор В в, 20 40 в* 30 52 Фактор А А> А, Фактор в, 20 50 В в3 40 12 Отметим, что при заметном взаимодействии практическое значение соответствующих главных эффектов невелико. При оценивании главного эффекта А по данным табл. 6.2 мы бы 119
получили 20 + 40 Таблица 6.3 Метод варьирования факторов по одному т. е. очень малую величину. Напрашивается вывод об отсут- отсутствии эффекта; однако когда мы рассматривали эффекты А на различных уровнях фактора В, то видели, что это не так. Эффект фактора А существует, но он зависит от уровня фак- фактора В. Другими словами, знать взаимодействия АВ оказыва- оказывается более важным, чем главный эффект. Значимое взаимодей- взаимодействие может маскировать значимость главных эффектов; это ясно показывают данные табл. 6.2. При существовании значи- значимого взаимодействия экспериментатор может исследовать уровни одного фактора, скажем, А, зафиксировав уровни дру- других факторов, что помогает сделать выводы относительно глав- главного эффекта А. 6.2. ПРЕИМУЩЕСТВА ФАКТОРНЫХ ЭКСПЕРИМЕНТОВ Легко продемонстрировать преимущества факторных экспе- экспериментов. Рассмотрим, например, два фактора А и В с двумя уровнями каждый. Обозначим уровни факторов Аъ А2 и Вь В2. Информацию об этим фак- факторах можно получить, варьи- варьируя их последовательно по од- одному (табл. 6.3). Эффект из- изменения фактора А определя- определяется разностью A2Bi—АХВХ. Из-за наличия ошибки экспе- эксперимента желательно взять, скажем, два наблюдения для каждой комбинации обрабо- обработок и оценить эффекты фак- факторов на основе средних откликов. Таким образом, об- общее число наблюдений равно шести. При проведении факторного эксперимента необходимо исследовать еще одну комбинацию обработок — А2В2. Тогда только по четырем наблюдениям можно получить две оценки эффекта А:А2ВХ—АХВХ и А2В2— —АХВ2. Аналогично можно найти и две оценки эффекта В. Эти оценки можно использовать для определения оценок сред- средних каждого главного эффекта. Средние эффектов имеют ту же точность, что, и в эксперименте с изменением факторов по одному, но для них требуются результаты только четырех на- наблюдений. Допустим теперь, что существует взаимодействие. Если в эксперименте с изменением факторов по одному установлено, 120 Фактор А А! А, Фактор В Bi Л1В1 АА в2 А,Вг что при АХВ2 и А2ВХ отклик больше, чем при АХВЪ то было бы логично сделать вывод, что при А2В2 он будет еще больше. При взаимодействии такой вывод, однако, может оказаться со- совершенно неправильным; примером могут служить данные табл. 6.2. Таким образом, факторные эксперименты обладают несколь- несколькими преимуществами. Они более эффективны по сравнению с экспериментами, в которых факторы изменяются по одному. Факторный эксперимент необходим при существовании взаимо- взаимодействия, чтобы избежать ошибочных выводов. Факторные экс- эксперименты позволяют оценивать эффекты фактора на несколь- нескольких уровнях других факторов, т. е. сделать выводы, справедли- справедливые для целого диапазона условий эксперимента. 6.3. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (КЛАССИФИКАЦИЯ ПО ДВУМ ПРИЗНАКАМ) Одним из простейших типов факторных экспериментов яв- являются эксперименты с двумя факторами или наборами обра- обработок. Пусть а уровней фактора А и b уровней фактора В ис- исследуются в факторном эксперименте, т. е. каждая реплика со- содержит все аЬ комбинаций обработок. Обозначим п — число реплик эксперимента и уци — наблюдение для i-ro уровня фак- фактора А и /-го уровня фактора В в k-w. реплике; данные оформим в виде таблицы (табл. 6.4). Порядок, в котором проводятся аЬп наблюдений, выбирается случайным образом, так что план яв- является полностью рандомизированным. Таблица 6.4 Расположение данных в факторном плане для двух факторов Фактор А 1 2 ¦ а Уш, УгН, У аи, 1 Уш, ¦¦¦, Уип У212, ¦ • ¦ , Уъип Уап, ¦••> Уат Уш Уш У an, Фактор В 2 Уш Уип Ут, ¦ ¦ ¦, Уъгп Уагг, • • ¦, Уат ¦ • ¦ У1Ы, УгЫ, УаЫ, Ь УШ Vlbn УъЬъ, • • • > УгЬП УаЪг УаЪп 121
Наблюдения можно описать линейной статистической мо- моделью вида yw = n+Tt + fL}+ №)и + гци, F-1) r = l, 2,..., a; /=1, 2, ..., b; k=\, 2, ..., n, где [i—математическое ожидание общего среднего эффекта; Ti — истинный эффект г-ro уровня фактора А; (т$)ц — эффект взаимодействия между т, и fr; eljft — случайная ошибка. Будем вначале считать оба фактора фиксированными, а эф- эффекты обработок определим как отклонения от математиче- математического ожидания общего среднего, т. е. наложим ограничения а Ь Stj = 0 и 2р, = 0. При п репликах эксперимента общее число на- '=1 ./=1 , блюдении составляет abn. Для нас представляет интерес получение оценок параметров модели F.1), а также проверка гипотез относительно этих па- параметров. Подходящей процедурой проверки является ДА. По- Поскольку мы рассматриваем два контролируемых источника из- изменения Л и В, то эта процедура называется двухфакторным ДА или классификацией по двум признакам. 6.3.1. Статистический анализ модели постоянных эффектов Пусть уг.. обозначает сумму всех наблюдений для г'-го уровня фактора А, у.,. — сумму всех наблюдений для /-го уровня фактора В, уц. — сумму всех наблюдений для г-го уровня фак- фактора А и /-го уровня фактора В, у... — общую сумму всех на- наблюдений. Определим"]/,-., У-у и_Уц. как средние, соответствую- соответствующие обработкам и ячейкам, и у... как общее среднее. Расчет- Расчетные формулы имеют вид /=1 ft=l a n i=l ft=l n у a. = 2 yi'k' i=l> 2> F.3) (=i /=i ft=i aon Общая скорректированная сумма квадратов может быть пре- преобразована следующим способом: 2 -у-J = 2 2 122 ц. — Ус. — У.!.+У..) + (Уин —Ун)]* = 2 F-4) поскольку шесть смешанных произведений в правой части равны нулю. Отметим, что для общей скорректированной суммы квад- квадратов справедливо разбиение 5ообщ = 55д + 5SB + 5SAB + 5SOm, F-5) т. е. разбиение на сумму квадратов, обусловленную «строками» или фактором ЛE5а), сумму квадратов, обусловленную «столб- «столбцами» или фактором В (SSB), сумму квадратов, обусловленную взаимодействием между А и В (SSAB), и сумму квадратов, обусловленную ошибкой SS0U1. Из вида последнего слагаемого в выражении F.4) следует, что для того, чтобы сумма квадра- квадратов, обусловленная ошибкой, не была смешана с взаимодей- взаимодействием, необходимы хотя бы две реплики (п^2). Число степеней свободы, соответствующих каждой сумме квадратов, составляет: Эффект Степени свободы А а—\ В 6 — 1 Взаимодействие Л В . . (а — 1) (Ь — 1) Ошибка аЪ (п — 1) Сумма abn — 1 Такое расщепление общего числа степеней свободы по суммам квадратов можно обосновать следующим образом. У главных эффектов (Л и В) а и Ъ уровней соответственно; поэтому, как указано, они обладают а—1 и Ъ—1 степенями свободы. Число степеней свободы взаимодействия определяется просто раз- разностью числа степеней свободы для ячейки (т. е. ab—1) и двух главных эффектов Л и В, а именно, ab—1 — (а—1) — (Ь—1) = = (а—1) (Ь—1). При п репликах каждой из ab ячеек соответ- соответствует п—1 степеней свободы, поэтому число степеней свободы ошибки составляет ab (п—1). Заметим, что сумма чисел степе- степеней свободы слагаемых в правой части выражения F.5) равна общему числу степеней свободы. Тогда, если предположить, что &iih~NID @, а2), то в соответствии с теоремой Кокрена (тео- (теорема 3.1) отношения каждой из сумм квадратов в правой части выражения F.5) к величине а2 представляют собой независи- независимые случайные переменные, распределенные по закону %2 с ука- указанным числом степеней свободы, 123
В предположении, что факторы А я В фиксированы, мате- математические ожидания средних квадратов имеют вид E(MSA) = E E (MS B) = E 1 ее \ „2 ssB =о an E(MSAB) = (а _!)(&— 1) 6-1 SSAB) = o* 2j 6 — 1 ;•=! a b (а-1)F-1) ?,? hi' и 1 -SS. , o6(n — Следовательно, для проверки гипотез Яо:, Тг = 0 (нет эффек- эффектов фактора-строки), #0: Pj = O (нет эффектов фактора-столбца) и Яо: (tP)jj = O (нет эффектов взаимодействия) нужно соста- составить отношения соответствующих средних квадратов к среднему квадрату ошибки. Эти отношения подчиняются .F-распределе- нию с соответствующим числом степеней свободы числителя и аЬ (п—1) степенями свободы знаменателя. Критическая об- область— верхний шлейф /•'-распределения. Процедура проверки оформляется в виде таблицы ДА (табл. 6.5). Нетрудно получить расчетные формулы для сумм квадра- квадратов, входящих в выражение F.5). Общая сумма квадратов, как обычно, находится по формуле i 2 ?*&* J-/.. F-6) 1 /«=1 fc=l abn Таблица 6.5 Таблица двухфакторного дисперсионного анализа для модели постоянных эффектов Источник изменчивости Сумма квадра- квадратов Степени свободы Средний квадрат Обработки А Обработки В Взаимодейст- Взаимодействие Ошибка Сумма SSA SSB SSAB SS общ a —I 6 — 1 ab(n — l) abn — 1 a—1 SSA MSB = 6-1 SSB MSAB = (а —1)F—I) 1 SSAb MSr,m — .Г: ab(n—\) MSA 124 a суммы квадратов для главных эффектов — по формулам 6n abn F.7) an abn 1 I. F.8) Величину SSAB удобно находить в два этапа. Сначала рас- рассчитывается сумма квадратов сумм по аЬ ячейкам 1 'ячейки 1 а ь о = — 2 2 уч.- abn у2... Эта сумма включает в себя также SSA и SSB, следовательно, на втором этапе SSab находится вычитанием: ООав = <->ОЯчейки — SSa — SSb- F-9) Значение SSom также находится вычитанием: оо0ш = '->>Ьобщ — »-><Ьа — ЬЬв — SSab F.10) или1 При проверке гипотез относительно п, р;- и (т$)ц средние квадраты, стоящие в числителе, являются статистически неза- независимыми. Однако /^-отношения не обладают этим свойством из-за общего знаменателя — среднего квадрата MS0U1. Следо- Следовательно, определение уровней значимости гипотез относительно т,, Pj и (tp)ij представляет собой проблему одновременных ста- статистических выводов. Мы не будем ее рассматривать; читатель может найти ее обсуждение у Миллера [52]. Пример 6.1. Предполагается, что на максимальное выходное напряжение аккумуляторных батарей некоторого типа влияют материал пластин и тем- температура помещения, где они установлены. В лаборатории проводятся четыре реплики факторного эксперимента для трех типов материала и трех значений температуры; результаты наблюдений приведены в табл. 6.6, где числа со Таблица 6.6 Данные по максимальному выходному напряжению для примера 6.1 Тип ма- материала 1 2 3 У.1. Температура, СС 10 130 155 -eg* 74 180 W9 150 188 fi9o. 159 126 623 138 ПО ,7Rt 168 160 °'b 1738 18 34 40 299* 80 75 229 136 122 479, 106 115 4/9 174 120 573» 150 139 °'й 1291 26 20 70 230* 82 58 230 25 70 ,„„, 58 45 198 96 104 342* 82 60 йи Ус. 998 1300 1501 770 у...=3799
звездочками — суммы для ячеек {уц}. Порядок, в котором производились 36 наблюдений, определялся случайным образом. Найдем численные значения сумм квадратов а Ь п 1 t=l /=1 k=l 1 aon = 1302 + 1552 + 744 Ь 602 — — 37992 = 77 646,96; 36 SS матер Ьп f^ 9 I 2 У1 . 7-У ..= abn = —!— (9982 + 13002 + 15012) — 37992 = 10 683,72; 1 b an f4 1 У.; ; У...= ' ПпП abn = J_A7382+12912 + 7702) — 37992 = 39 118,72; 3-4 36 темпер n ,~l 1=\ ""« = — E392 -f 2292 -\ 1-3422) — J-37992 — 10 683,72 — 39 118,72 = 9613,77 4 36 и SSom = 5*Ьобщ—5оматер—*Ь5темпер—55взаим = 77 646,96—10 683,72— —39 118,72—9613,7= 18 230,75. Результаты ДА приведены в табл. 6.7. Поскольку Fo,os; 4; 27 = 2,73, до де- делаем вывод, что между материалом и температурой существует значимое взаимодействие. Далее Fo,os; 2; 27 = 3,35, поэтому главные эффекты — мате- материал и температура — также являются значимыми. Таблица 6.7 Дисперсионный аналнз данных по напряжению батарей Источник изменчивости Типы материала Температура Взаимодействие Ошибка Сумма Сумма квадратов 10 683,72 39 118,72 9 613,77 18 230,75 77 646,96 Степени свободы 2 2 4 27 35 Средний квадрат 5 341,86 19 558,36 2*403,44 675,21 7,91 28,97 3,56 Для облегчения интерпретации результатов эксперимента полезно по- построить зависимости средних откликов для каждой комбинации обработок (рис. 6.3). О статистически значимом взаимодействии свидетельствует отсут- отсутствие параллельности линий графика. Вообще говоря, более высокое выход- 126 ное напряжение наблюдается при низкой температуре независимо от вида материала. При изменении температуры от низкой до промежуточной выход- выходное напряжение для материала типа 3 даже возрастает, а для материалов 1 и 2 — уменьшается. При изменении температуры от промежуточной до вы- высокой выходное напряжение для материалов 2 и 3 уменьшается, а для ма- материала 1 — остается практически 175 ^150 125 100 75 10 18 Температурите 26 Рис. 6.3. Зависимости среднего вы- выходного напряжения от темпера- тем же. Для сравнения средних ка- какого-либо фактора можно вос- воспользоваться множественным критерием размахов Дункана, поскольку оба фактора счита- считаются фиксированными. Если взаимодействие значимо, то результаты сравнений средних одного из факторов (например, А) между собой могут быть искажены взаимодействием АВ. В такой ситуации обычно фиксируют фактор В на неко- некотором уровне и применяют критерий Дункана к средним фактора А на этом уровне. Предположим, что в примере 6.1 мы хотим обнаружить разности между средними для трех ви- видов материала. Поскольку взаимодействие оказалось значимым, то мы проведем это сравнение только на одном уровне темпе- температуры, скажем, уровне 2 A8° С). Будем считать, что лучшей оценкой дисперсии ошибки является MSom из таблицы ДА и что дисперсия ошибки эксперимента одинакова для всех комби- комбинаций обработок. Расположим средние для трех видов мате- материала в возрастающем порядке г/12. = 57,25 (материал вида 1); г/гг- = 119,75 (материал вида 2); г/з2-== 145,75 (материал вида 3). Для стандарта ошибки этих средних получаем V \ = V^t MS- = V т675>21 = 12-99' поскольку каждое из средних находится по п = 4 наблюдениям. Из приложения VI берем величины го,о5 B; 27) =2,91 и го,О5 C; 27) =3,06 и рассчитываем наименьшие значимые размахи #2 = r0,05B; 27); S- =2,91-12,99 = 37,80; 3; 27); S- =3,06-12,99 = 39,75. 127
Сравнения средних дают результаты 3 с 1 : 145,75—57,25=88,50>39,75 (/?3); 3 с 2 : 145,75—119,75 = 26,00<37,80 (R2); 2 с 1 : 119,75—57,25 = 62,50>37,80 (R2). Проведенный анализ свидетельствует о том, что на уровне температуры 18° С среднее выходное напряжение для материа- материалов 2 и 3 одинаково, а среднее выходное напряжение для ма- материала 1 значительно ниже, чем для двух других. При существовании взаимодействия исследователь мог бы сравнить между собой все аЬ средних по ячейкам и определить, разности каких пар средних являются значимыми. При таком анализе разности средних по ячейкам включают в себя как эф- эффекты взаимодействия, так и оба главных эффекта. В примере 6.1 получилось бы тогда 36 сравнений всех возможных пар из 9 средних по ячейкам. Заметим, наконец, что мы привели результаты только для сбалансированных планов; в несбалансированных факторных экспериментах анализ существенно сложнее. В некоторых слу- случаях могут оказаться полезными формулы для недостающих данных (гл. 4). Обычно же приходится применять анализ, ос- основанный на общем регрессионном критерии значимости. Де- Детальное обсуждение несбалансированных планов дано Сёр- лом [63]. 6.3.2. Оценивание параметров модели Для параметров модели двухфакторного ДА Уцк=\1 + Т{ + $}+ (т$)ц + В{}к F.11) можно получить МНК-оценки. Число параметров, подлежащих оцениванию, равно \+a + b + ab, поэтому получаем l+a + b + ab нормальных уравнений. Используя метод, изложенный в 3.10, нетрудно показать, что они имеют вид ^ ^ ^Pj + n^ 2 №)ц = У...; F.12а) &)ц = У1..> 1" = 1> 2 а; F-126) = У-1.> / = 1«2 •••¦• Ь'> FЛ2в) Р)у=#/., 1=1, 2,.... а; /=1, 2,..., Ь). F.12г) Для удобства перед каждым нормальным уравнением напи- написан параметр, которому оно соответствует. 128 Попытаемся решить полученные нормальные уравнения. За- Заметим, что а уравнений F.126) при сложении дают уравнение F.12а), так же как и Ь уравнений F.12в). При суммировании уравнений F.12г) по / для некоторого i получаем одно из урав- уравнений F.126), а при суммировании по i для некоторого / — одно из уравнений F.12в). Следовательно, a + b + l уравнений си- системы F.12) оказываются линейно-зависимыми, и однозначного решения не существует. Для того чтобы найти одно из реше- решений, наложим ограничения 2 Т|=0; F.13а) F.136) \ п. ; 1 о F.13b) 2 (тР)у = 0; t = l, 2 а. F.13г) Уравнения F.13в) и F.13г) дают а + b—1 независимых ог- ограничений, еще два — уравнения F.13а) и F.136), следова- следовательно, общее число ограничений равно a + b + l, что позволяет решить систему нормальных уравнений. При наложении рассмотренных ограничений нормальные уравнения F.12) значительно упрощаются, и их решение имеет вид У1..—У..., » = 1, 2, .... a; y.j.—y...> /=1. 2,..., b; y..., i= 1, 2,.... a; /= 1, 2, ...,&. F.14) Отметим, что эффекты факторов-строк оцениваются раз- разностью среднего для строки и общего среднего, эффекты факто- факторов-столбцов— разностью среднего для столбца и общего сред- среднего, а эффект ij-ro взаимодействия — разностью среднего для ij-к ячейка и общего среднего за вычетом эффектов ?-й строки и /-го столбца. 6.3.3. Мощность критерия Для определения мощности критерия в факторных экспе- экспериментах можно использовать оперативные характеристики (приложение IV); соответствующие значения Ф2, число степе- степеней свободы числителя и знаменателя приведены в табл. 6.8. 5 Д. К. Монтгомери 129
Для иллюстрации применения оперативных характеристик пред- предположим, что в примере 6.1 мы хотели установить, достаточно ли четырех реплик для отклонения нулевой гипотезы с высокой вероятностью, если эффекты материала отличаются не менее чем на J?t? = 800. С помощью табл. 6.8 находим, что Ф2 = ЗХ Х4-800/C-675,21) =4,74, где в качестве оценки о2 использо- использовано значение MSom = 675,21. На основе оперативных характе- характеристик приложения IV при а = 0,05, двух степенях свободы чис- числителя и 27 степенях свободы знаменателя получаем, что Р~0,09. Таким образом, четыре реплики обеспечивают мощ- мощность критерия, примерно равную 0,91, т. е. наши шансы пра- правильно отклонить гипотезу Яо: Тг = 0, если обработки отлича- отличаются на указанную величину, составляют 91 %• Таблица 6.8 Параметры оперативных характеристик (приложение IV) для двухфакторного дисперсионного анализа, модель постоянных эффектов Фактор Степени свободы числителя Степени свободы знаменателя an a b AB iSS с*)?/ o—l 6-1 (a-\)(b-\) ab (n—\) ab (n—l) ab (n—l) 6.4. СЛУЧАЙНЫЕ И СМЕШАННЫЕ МОДЕЛИ В предыдущих параграфах мы предполагали, что оба фак- фактора А я В фиксированы. Другими словами, а уровней фактора А я.Ь уровней фактора В при проведении эксперимента были заданы исследователем, и, следовательно, выводы на основе ре- результатов ДА приложимы только к тем уровням, которые дей- действительно были использованы в эксперименте. В этом пара- параграфе мы рассмотрим две другие модели: модель случайных эф- эффектов, в которой уровни А и В выбираются случайным обра- образом, и смешанную модель, в которой уровни одного фактора фиксированы, а другого — случайны. 130 6.4.1. Модель случайных эффектов Рассмотрим ситуацию, при которой уровни факторов А и В выбираются случайным образом из больших совокупностей, что соответствует модели случайных эффектов, или компонентов дисперсии. Поскольку а уровней А и Ъ уровней В были выбраны случайным образом, то наши выводы окажутся справедливыми для всех уровней из совокупностей, исследуемых в эксперименте. Наблюдения можно представить линейной моделью вида i=l, 2, ..., а; /=1, 2, ..., b; k=l, 2,..., п, F.15) где параметры модели п, р3-, (тр),-3- и гт — случайные перемен- переменные. Точнее, предположим, что xt~NID @, о2), $,~NID @, о2), (rf)ij~NID @, ах&) и Eijk~NID@, о2). В выражении для дис- дисперсии любого наблюдения V (yijk) = а2 + а2 +а2р + а2, слагае- слагаемые о2, о2, о2р и о2 называются компонентами дисперсии. Нас будут интересовать гипотезы #-, о2 = 0, Щ ^ = 0 и Н:о о2 =0. Отметим аналогию с моделью случайных эффектов в однофак- торном ДА. Основы ДА остаются прежними, т. е. величины SSA, SSB, SSab, SS06m и SSom находятся так же, как и для модели посто- постоянных эффектов. Однако для определения статистик, исполь- используемых при проверке гипотез, необходимо рассмотреть матема- математические ожидания средних квадратов. Можно показать, что - an op; F.16) Из этих соотношений видно, что для проверки гипотезы Щ °тр = 0 следует использовать статистику Fo = MSAB/MSom, F.17) поскольку при истинности гипотезы #0 математические ожида- ожидания числителя и знаменателя совпадают и равны о2 и лишь в противном случае Е (MSAB)>E (MSom). Отношение Fo под- подчиняется ^-распределению с числом степеней свободы числи- числителя и знаменателя (а—1) (Ь—1) и ab (n—\) соответственно. Аналогичным образом для проверки H'Qa2x=0 используется статистика F0=MSA/MSOVJ, 5* F.18) 131
подчиняющаяся F-распределению с а—1 и (а—1) (Ь—1),адля проверки Щ а2 =0 — статистика F0=MSB/MSoni, F.19) подчиняющаяся ^-распределению с Ь—1 и (а—1) (Ь—.Л). От- Отметим, что указанные статистики отличаются от статистик для проверки гипотез при фиксированных факторах А и В. Построе- Построение статистик всегда опирается на выражения для математиче- математических ожиданий средних квадратов. Пример 6.2. Предположим, что в примере 6.1 мы могли бы взять больше различных материалов и значений температуры н что те, которые приведены в табл. 6.6, выбраны случайным образом. Теперь рассматривается модель случайных эффектов; результаты ДА для нее приведены в табл. 6.9. Видно, что первые четыре столбца этой таблицы такие же, как и в примере 6.1, но значения отношения Fo найдены в соответствии с уравнениями F.17), F.18) и F.19). Взаимодействие также является значимым на уровне 5%; поскольку •Fo,o5; 2; 4=6,94, то приходим к выводу, что эффект температуры является зна- значимым, а материал не оказывает значимого влияния на выходное напря- напряжение. Таблица 6.9 Дисперсионный анализ для примера 6.2, модель случайных эффектов Источник изменчивости Типы материала Температура Взаимодействие Ошибка Сумма * Значимо при 5 Сумма квадратов 10 683,72 39 118,72 9 613,77 18 230,75 77 646,96 процентах. Степени свободы 2 2 4 27 35 Средний кваДрат 5 341,86 19 558,36 2 403,44 675,21 1: з, ,. 22 13* 56* Компоненты дисперсии можно оценить с помощью проце- процедуры ДА. Для этого приравняем наблюдаемые значения сред- средних квадратов в строках таблицы ДА их математическим ожи- ожиданиям и решим получившиеся уравнения относительно компо- компонентов дисперсии, тогда F.20) = — (MSAB-MSom); п an bn 132 Для иллюстрации применения этого метода оценим компо- компоненты дисперсии для экспериментальной ситуации, описанной в примере 6.2. Из соотношений F.20) получаем о? = — E341,86—2403,44) = 244,87; ар = — A9 558,36—2403,44) =1429,58; 3-4 а% = — B403,44—675,21) = 432,06 4 а2=675,21. Для величины о2 можно получить интервальную оценку, так как отношение ah (n—I) MSomfa2 подчиняется ^-распределе- ^-распределению с аЬ (п—1) степенями свободы. Однако точные интерваль- интервальные оценки других компонентов дисперсии не могут быть най- найдены по причинам, обсуждавшимся в 3.5. Приближенные ме- методы получения интервальных оценок компонентов дисперсии рассмотрены Сёрлом [63, 64]. 6.4.2. Смешанные модели Рассмотрим теперь ситуацию, когда один из факторов — А фиксирован, а другой — В является случайным. Такая ситуа- ситуация описывается смешанной моделью ДА. Линейная статистиче- статистическая модель имеет вид i=\, 2,.... а; /=1, 2,..., Ь\ k=\, 2,..., п, F.21) где тг — фиксированный эффект; |3j — случайный эффект; взаи- взаимодействие (тр),7 также считается случайным эффектом; et-jA— случайная ошибка. Предположим, что фиксированные эффекты а {г,} подчиняются условию Ет, = 0, a $j~NID @, al). Эффекты t=i взаимодействия считаются случайными величинами, распреде- распределенными по нормальному закону с нулевым средним и диспер- дисперсией [(а—1)/а]а2„, однако сумма компонентов взаимодействия по фиксированному фактору равна нулю, т. е. Это означает, что элементы взаимодействия для заданного уровня фиксированного фактора оказываются зависимыми. 133
Действительно, можно показать (см. задачу 6.1), что Cov К-Ф)и. (*Р)*'/] = L o?p, t ф V. а Ковариация (х$)ц и (тр)у при /=И=/' равна нулю; случай- случайная ошибка Enh~NID (О, о2). В этой модели дисперсия (TP)ij определяется как [(а—1)/а] о^р, а не а2р, с тем чтобы упростить выражения для математических ожиданий средних квадратов. На их вид влияет также предположение (тр) -j = 0, а именно, можно показать, что F.22) Поэтому при проверке гипотезы Н:о Тг = 0— используется ста- статистика F0 = MSA/MSAB, подчиняющаяся /•'-распределению с числом степеней свободы а—1 и (а—1) (Ь—1). При проверке H-Q o| =0 — используется статистика F0=MSB/MSoai, подчиняющаяся ^-распределению с Ь—1 и аЪ (п—1). Наконец, при проверке Н'о а|р =0 — используется статистика подчиняющаяся F-распределению с (а—1) (Ъ—1) и аЪ (п—1). Для смешанной модели можно найти оценки постоянных эф- эффектов * = УГ - ] F.23) Компоненты дисперсии а|, а?р и о2 оцениваются с помощью процедуры ДА. Решив три последних уравнения F.22) относи- относительно трех неизвестных, получаем — (MSAB—MSom) п a =MSom. 134 Этот общий подход можно применять для оценивания ком- компонентов дисперсии в любой смешанной модели. Отбрасывая уравнения, содержащие фиксированные факторы, мы всегда по- получаем систему уравнений для компонентов дисперсии. В табл. 6.10 приведены основные соотношения ДА длядвух- факторной смешанной модели. В смешанных моделях можно проверять гипотезы относительно отдельных средних для об- Таблица 6.10 Дисперсионный анализ для двухфакторной смешанной модели Источник изменчивости Строки (А) Столбцы (В) Взаимодействие Ошибка Сумма Сумма квадратов SSA ssB ssAB •Ь^ош 'Ь'^ОбЩ Степени свободы а-1 6 — 1 (а-1) F-1) аЬ (п—1) abn — 1 Математическое ожидание среднего квадрата о2 + ап0| а«+ло?р 02 работок фиксированного фактора. При применении таких про- процедур, как множественный критерий размахов Дункана, необ- необходимо обращать внимание на правильность определения стан- стандарта ошибки среднего для обработки. Андерсон и Маклин [1] показали, что стандарт ошибки среднего для фиксированной об- обработки равен [Средний квадрат для проверки постоянного эффекта I1/2 Число наблюдений, вошедших в среднее для обработки] Другие смешанные модели. Было предложено несколько дру- других смешанных моделей, которые отличаются от обсуждавшейся выше «стандартной» модели допущениями относительно слу- случайных компонентов Pj и (tfi)ij- Рассмотрим вкратце одну из них. Допустим, что фиксированные эффекты {тЛ подчиняются ус- а ловию 2 Tt = 0, а случайные эффекты |3j~./V/D @,op). Эффекты взаимодействия (т$)ц~ NID @, oL), кроме того, они не зави- зависят от случайных эффектов Pj. Компоненты случайной ошибки e,ijh~NID @, а2). Отметим, что эта модель отличается от рас- рассмотренной ранее прежде всего допущением о независимости эффектов взаимодействия. 135
Выражения для математических ожиданий средних квадра- квадратов в этой модели приведены в табл. 6.11. Сравнивая ее с табл. 6.10, замечаем, что единственное явное различие между ними— присутствие компонента дисперсии oL в математическом ожи- ожидании среднего квадрата для случайного эффекта (в действи- действительности есть и другие различия, вызванные неодинаковостью Таблица 6.11 Дисперсионный анализ для двухфакторной смешанной модели другого вида Источник изменчивости Строки (А) Столбцы (В) Взаимодействие Ошибка Сумма Сумма квадратов SSA ssB ssAB с с о о общ Степени свободы а 1 6—1 (а—1) F — 1) ab (n — 1) abn — 1 Математическое ожидание среднего квадрата 2 . 2 г '" j! •^ тб т < ? ' а — 1 ст2 + n<J?p ст2 определений дисперсии эффекта взаимодействия в этих двух моделях, но они несущественны). В результате этого для про- проверки гипотезы #^а|=0 — следует использовать статистику FQ=MSB!MSAB в отличие от F0=MSB/MSom в стандартной модели. Этот крите- критерий должен оказаться более консервативным, чем критерий в стандартной модели, так как MSab обычно превосходит MSOm- Для оценки компонентов дисперсии можно воспользоваться процедурой ДА. С помощью табл. 6.11 находим, что по сравне- сравнению с соотношениями F.24) изменяется только оценка an Обе рассмотренные модели являются частными случаями смешанной модели, предложенной Шеффе [60, 62]. В ней пред- предполагается, что наблюдения можно описать выражением 1= 1, 2,..., а; /= 1, 2,..., b; k= 1, 2,..., п, где Щц и гцк — независимые случайные величины, причем обладают свойствами 136 а У т —( Zi Тг — * (трЬ = 0, /=1, 2 Ь. Шеффе вводит ковариационную матрицу величин {т^}. Задавая элементы этой матрицы, можно неявным образом определить дисперсии и ковариации |3j и (тр)г> Таким образом, две модели, рассмотренные выше, являются частными случаями модели Шеффе. Статистический анализ этой модели отличается от ана- анализа нашей стандартной модели лишь тем, что, вообще говоря, при истинности гипотезы Яо: Тг = 0 — статистика MSЛ/MSab не всегда подчиняется ^-распределению. Таблица 6.12 Параметры оперативных характеристик (приложения IV и V) для двухфакторного дисперсионного анализа, случайная н смешанная модели Модель случайных эффектов Фактор Степени свободы числителя Степени свободы знаменателя АВ Ьпа\ anaz а' 4- not а-\ 6—1 '+¦?• 'tp (я —0) F— 1) (а—1) (ft— 1) ab (n—\) Смешанная модель Фактор Параметр Степени свободы числителя Степени свободы знаменателя Прило- Приложение А (фик- сир.) В (слу- чайн). АВ 6n а an а—1 Ь — 1 я.= (я—1IF—1) аЬ(п—1 ab (n—l) IV 137
При таком разнообразии смешанных моделей возникает вопрос: а какую все-таки модель использовать? Большинство специалистов по статистике отдают предпочтение стандартной модели, и она встречается в литературе наиболее часто. Если корреляционные связи компонентов невелики, то можно поль- пользоваться любой моделью — влияние их различий будет несу- несущественным. При дальнейшем упоминании смешанных моделей мы будем иметь в виду стандартную смешанную модель. Од- Однако если данные сильно коррелированы, то, возможно, при- придется применить модель Шеффе. Обзор различных смешанных моделей дан в статье Хокинга [43]. 6.4.3. Мощность критерия при случайной и смешанной моделях При двухфакторном ДА для случайной и смешанной моде- моделей можно использовать оперативные характеристики. Для слу- случайной модели используется приложение V, а необходимые вы- выражения для параметра X, числа степеней свободы числителя и знаменателя приведены в верхней половине табл. 6.12. Для смешанной модели используются приложения IV и V, причем соответствующие выражения для Ф2 и X приведены в нижней половине табл. 6.12. 6.5. ОБЩИЙ СЛУЧАЙ ФАКТОРНОГО ЭКСПЕРИМЕНТА Результаты двухфакторного ДА можно распространить на общий случай с а уровнями фактора А, Ь уровнями фактора В, с уровнями фактора Сит. д., организованными в факторный эксперимент. При п репликах полного эксперимента общее число наблюдений составляет abc ... п. Еще раз подчеркнем, что необходимы по меньшей мере две реплики (nZ^2) для того, чтобы определить сумму квадратов, обусловленную ошибкой, в случае, когда все возможные взаимодействия включены в мо- модель. Если все факторы эксперимента фиксированы, то легко сформулировать и проверить гипотезы относительно главных эффектов и взаимодействий. В модели постоянных эффектов статистики для всех главных эффектов и взаимодействий стро- строятся в виде отношения соответствующего среднего квадрата к среднему квадрату ошибки. Критические области этих F-кри- териев лежат в верхнем шлейфе распределения. Число степеней свободы для любого главного эффекта равно числу уровней фактора без единицы, а для взаимодействия — произведению чисел степеней свободы отдельных компонентов взаимодей- взаимодействия. Рассмотрим, например, модель трехфакторного ДА Уны = ii+ti + Pj+ya + (*Р) а + (ху) tk + (Py) ih + (*Pv) W + еда> t=l, 2,..., a; /=1, 2,..., b; *=1, 2,..., c; 1=1, 2,..., n. F.25) 138 Табл. 6.13 представляет собой таблицу ДА для фиксирован- фиксированных факторов А, В и С. Вид F-критериев для главных факторов и взаимодействий непосредственно следует из выражений для математических ожиданий средних квадратов. Дадим расчетные формулы для сумм квадратов из табл. 6.13. Общая сумма квадратов находится как обычно abcn >=1 j=\ k=\ /=1 F.26) Суммы квадратов для главных эффектов выражаются через суммы наблюдений для факторов Л (г/,...), В (у.,..) и C(y..k.) следующим образом: ben abcn 1 . -г—У F.27) F.28) A—I abcn F.29) При нахождении сумм квадратов для двухфакторных взаи- взаимодействий необходимо знать суммы для ячеек АхВ, Ах С и ВхС. Часто оказывается удобным разбить исходную таблицу данных на три двухфакторные таблицы, тогда суммы квадратов для ячеек находятся по формулам F.30) F.31) Ь с ~ "^ -f— y2 -SSB-SS = ячейки (ВС) F.32) Отметим, что двухфакторные суммы квадратов по ячейкам выражаются через суммы каждой из двухфакторных таблиц. Сумма квадратов для трехфакторного взаимодействия опреде- 139
43 m X 3 в в к о о с в о as о в о. о я х и для И II 140 О. :ва ж О 1 и 0) а е ожидай О и: и а> X ь л ь л S редний вадрат и* 3 # о со и Я с Сте Сумма квадратов очник енчи- >сти М s a S к СО a MSC . , бега 1 а О СО 1 1 ч; СО со Ч со a о СО 'VnT ^П 1 асп 1 - ч СО ч СО СО со a о СО (N Л! abn I о Ь U СО о СО со о ч СО a о СО с о ^* 1 1 а -f- Ч СО ^ L со со CQ о СО a О со 4—^ с j и-' 1 о ч; со о е о со со о о со a о со р- ' ' , с а 1 -|- D О Ч СО о ч со СО. О CQ о ч «с a О 00 СО. с -1)(с- ^^ 1 -f- D О ч СО ¦ч J t 1 ¦s ч ч; СО СО О CQ ¦ч; ел О О СО **^ 1 1 о о СО СО ибка О с ¦о а 3 о СО со мма >> ляется трехфакторными суммами для ячеек {уци}, а именно, % а Ь с 1 1=1 /^1 fe=l UuLfl о о А — jo в — ^>^> С— *^ АВ— *^*^ АС^*^* ВС ==г (D.ooHJ ) SSA—SSb—Ь&с—SSAb—SSAc— SSbc F.336) Сумма квадратов для ошибки находится вычитанием сумм квадратов для всех главных эффектов и взаимодействий из об- общей суммы квадратов или СС ОС СС / Л Z?/ /d QA\ ^<Jom — ^^общ ^э^ячеики \fiDL*). yv.ot} Пример 6.3. Изготовитель безалкогольных напитков исследует влияние концентрации углекислоты А, рабочего давления в устройстве для разлива В и скорости конвейера С на объем газированного напитка в бутылке. Вы- Выбраны три уровня концентрации, два уровня давления н два уровня скорости и проведен факторный эксперимент с двумя репликами. Порядок, в котором делались 24 наблюдения, определялся случайным образом. Данные экспери- эксперимента в кодированном виде приведены в табл. 6.14; цифрами со звездочками показаны суммы для ячеек {уць}. Таблица 6.14 Кодированные данные для примера 6.3 Концентрация л 10 12 14 Суммы В X С У-!- , y.jk. Суммы 10 12 14 25 Скорость ( 200 —3 _4* — 1 0 1* 1 5 9* 4 6 Давление В 250 -1 21 АХ В, уц В 25 -5 4 22 30 1 16 37 0 2 1 7 6 5 -1* 3* 13* -1 0 2 3 7 9 20 Суммы 10 12 14 30 Скорость 200 — 1* 5* 16* 1 1 6 5 ¦ 10 11 34 54 АХ С, уи С 200 \ -5 6 25 250 2* 11* 21* 250 1 14 34 —4 20 59 141
Общая скорректированная сумма квадратов находится в соответствии с выражением F.26): t 2 2 ^т^2... =871-А-75- = 386,625. - i=i y=i *=i /=i айс" ^4 ^=t 2 2 ii yi *i а суммы квадратов для главных эффектов — в соответствии с выражениями F.27), F.28) и F.29) ее _ ben 24 = 252,750; SS ... =• i—i скор _L_ -V #2 !—y2 = —B62+492) —=21,042. abn ??, " ' aben 12 24 При вычислении сумм квадратов для двухфакторных взаимодействий нужно знать двухфакторные суммы для ячеек. Например, при нахождении взаимодействия концентрация — давление, или взаимодействия АВ, необхо- необходимо знать суммы для ячеек АхВ, т. е. {j/.j..}, приведенные в табл. 6.14. С помощью выражения F.30) получаем ss =_L_v v и2. 1 сп (=i j=i 1 7^2 = —[( — 5J + I2 + 42 + 162 + 222 + 372] — — 252,750 — 45,375 = 5,250. Для взаимодействия концентрация — скорость, или взаимодействия АС, используются суммы для ячеек АХС {(/*. л.}, приведенные в табл. 6.14, и выражение F.31): А0 Ьп ?j fc-Si '•"• aben ¦¦¦¦ А ° _ _L[( _ 5)а + I2 + б2 + 142 + 252 + 342] — ——252,750 — 22,042 = 0,583. 4 24 Взаимодействие давление — скорость, или взаимодействие ВС, находится с помощью сумм для ячеек ВхС {y.jh), приведенных в табл. 6.14, и выра- выражения F.32): ssbt = an ? aben 1 7^2 = _L (б2-(- 152 + 202 + 342) 45,375 — 22,042 = 1,042. При вычислении суммы квадратов для трехфакторного взаимодействия необходимо знать суммы для ячеек АхВхС {Уш.}> которые в табл. 6.14 даны цифрами со звездочками. Из выражения F.33а) получаем SS 1 ABC 1 а Ь с : JL V V V «?•>, 7\ 7\ 7\ i>tik. . п fn, t—t ь—i aben y2...-ssA-ssB-ssc-ssAB- 142 ~SSAC~' - IJ + 22+l2+32 7C2 Ц2_|_92_|_ ]32_|_ 162 + 212] -^ 252,750 — 45,375 — 22,042 — 5,250 — Заметим, что SS •0,583—1,042= 1,083. а Ь с ячейки (ABC) „2 i=l /=l k=l — у2 =328,125, aben тогда SSom = и (ЛВС) = 336, 625 — 328,125=8,500. Результаты ДА сведены в табл. 6.15. Мы видим, что концентрация угле- углекислоты, рабочее давление и скорость конвейера оказывают значимое влия- влияние на объем напитка в бутылке. Взаимодействие концентрация — давление значимо на уровне 10%, что свидетельствует о слабом взаимодействии между этими факторами. Таблица 6.15 Дисперсионный анализ для примера 6.3 Источник изменчивости Концентрация А Давление В Скорость С АВ АС ВС ABC Ошибка Сумма Сумма квадратов 252,750 45,375 22,042 5,250 0,583 1,042 1,083 8,500 336,625 Степени свободы 2 1 1 2 2 1 2 12 23 Средний квадрат 126,375 45,375 22,042 2,625 0,292 1,042 0,542 0,708 178,412* 64,059* 31,118* 3,706** 0,412 1,471 0,765 * Значимо при 1 проценте. ** Значимо при 10 процентах. Мы указывали, что если все факторы в факторном экспери- эксперименте фиксированы, то построение статистик для проверки ги- гипотез проводится непосредственно. Статистика для проверки любого главного эффекта или взаимодействия всегда получа- получается делением соответствующего среднего квадрата на средний квадрат для ошибки. Однако если в факторном эксперименте используется случайная или смешанная модель, то построение статистик не так очевидно. Для правильного построения крите- критериев необходимо исследовать математические ожидания сред- средних квадратов. Вспомним, например, двухфакторный анализ этих моделей в 6.4, где правильный критерий был найден непо- непосредственно по выражениям для математических ожиданий средних квадратов. В связи с этим возникает необходимость 143
разработки процедуры получения выражений для математиче- математических ожиданий средних квадратов. В гл. 7 будет дан набор правил для получения сумм квадратов, чисел степеней свободы и математических ожиданий средних квадратов для общего класса планов. 6.6. ПОЛИНОМИАЛЬНЫЕ ЭФФЕКТЫ КОЛИЧЕСТВЕННЫХ ФАКТОРОВ В 3.6 для количественного фактора с равноотстоящими уров- уровнями был рассмотрен простой метод выделения линейного, квад- ратического, кубического и т. д. эффектов этого фактора, обла- обладающих одной степенью свободы. Кроме того, было показано, что для аппроксимации эмпирических данных можно использо- использовать ортогональные полиномы и на этой основе предсказывать отклик на промежуточных уровнях фактора. Те же принципы можно применить и к факторным экспериментам, что иллюст- иллюстрируется следующими двумя примерами. Другие интересные примеры применения этого метода приведены Хиксом [41], Ан- Андерсоном и Маклином [1]. Пример 6.4. Один качественный и один количественный фактор. Рас- Рассмотрим эксперимент, описанный в примере 6.1. Здесь температура является количественным фактором, а материал — качественным. Кроме того, три уровня температуры отделены друг от друга равными промежутками. Таким образом, для того чтобы исследовать влияние температуры на выходное на- напряжение, мы можем найти линейный и квадратический эффект температуры. Расчет линейного и квадратического эффектов температуры, обозначаемых Та и Гкв, а также сумм квадратов для них приведен в табл. 6.16. Таблица 6.16 Вычисление полиномиальных эффектов температуры, пример 6.4 Уровни темпера- температуры, °С 10 18 26 Суммы по обработкам »¦/¦ 1738 1291 770 / з \ Эффекты 2 С\У1 \/=1 / Суммы квадратов ап^с) L /=i J Коэффициенты ортогональных контрастов (с,) Линейный —1 0 +1 Т л = — 968 со (-Э68J л 4-3-2 = 39 042,67 Квадратнческий + 1 —2 + 1 7-Кв = -74 ssr (~74)г SSrKB 4-3-6 = 76,05 144 Сумму квадратов для взаимодействия можно разбить на компонент взаимодействия между материалом и линейным эффектом температуры (МхТл) и компонент взаимодействия между типом материала и квадрати- ческим эффектом температуры (Л1хГкв). Для того чтобы найти эти компо- компоненты, необходимо определить линейные и квадратические эффекты темпе- температуры для каждого материала, а затем — суммы квадратов этих эффектов (табл. 6.17). Таблица 6.17 Полиномиальные эффекты взаимодействия МхТ, пример 6.4 Уровни тем- температуры, °С Суммы по типам материала (»,/.) Коэффициенты ортого- ортогональных контрастов (Су) Линейный Квадрати- ческнй 10 18 26 539 229 230 623 479 198 576 583 342 —1 0 + 1 +1 —2 Эффекты: М, X Тл = — 309; М„ X М, X ГКв = Суммы квадратов: — 425; М, X Г л = — 234; 2 X ГКв = - 137; М3 X Г м v т = — [3093+(-425K + (-234K]- (~968Г МХ7Л 4-2 12-2 Л* X Г 13ПЧ-(-137>'+(-248)=]- ;в = -248. = 2315,07; = 7298,70. Отметим, что SSMT — SSajxTj, + $$МХТКВ- РезультатыДА приведены в табл. 6.18. Линейный эффект температуры очевиден; значимой квадратиче- ской зависимости отклика от температуры не наблюдается. Кроме того, зна- значимым является взаимодействие, обусловленное компонентом МхТкв. Таблица 6.18 Дисперсионный анализ для примера 6.4 Источник изменчивости Типы материала М Температура Т Линейный Квадратический Взаимодействие М X Тл М X ГКв Ошибка Сумма Сумма квадратов 10 683,72 39 118,72 C9 042,67) G6,05) 9 613,77 B 315,07) G 298,70) 18 230,75 77 646,96 Степени свободы 2 2 1 1 4 2 2 27 35 Средний квадрат 5 341,86 19 558,36 39 042,67 76,05 2 403,44 1 157,54 3 649,75 675,21 Fo 7,91* 28,97* 57,82* 0,12 3,56** 1,71 5,41** • Значимо при 1 проценте. ¦• Значимо при 5 процентах. 145
Поскольку эффект температуры оказался значимым, то у эксперимента- экспериментатора может возникнуть желание построить по эмпирическим данным кривую отклика с тем, чтобы предсказывать зависимость выходного напряжения от температуры. Однако существование значимого взаимодействия приводит к тому, что характер зависимости выходного напряжения от температуры определяется видом используемого материала. Следовательно, эксперимен- экспериментатору придется построить три кривые отклика — по одной для каждого материала. Если в факторном эксперименте несколько факторов явля- являются количественными, то их можно разложить на полиноми- полиномиальные эффекты с одной степенью свободы каждый. Кроме того, взаимодействия количественных факторов можно разбить ана- аналогичным образом на компоненты взаимодействий, обладающие одной степенью свободы. Такая ситуация рассматривается в сле- следующем примере. Пример 6.5. Два количественных фактора. Предполагается, что эффек- эффективная продолжительность использования режущего инструмента, установлен- установленного на станке с цифровым управлением, зависит от скорости и угла за- заточки. Выбраны три значения скорости и три значения угла и проведен фак- факторный эксперимент с двумя репликами. Кодированные данные приведены в табл. 6.19, звездочками указаны суммы для ячеек {уц}. Таблица 6.19 Данные эксперимента по продолжительности использования инструмента Угол заточ- заточки, град. 15 20 25 У.1. Скорость резания, об/мин 125 2 —3* —1 0 2* 2 -1 \* 0 —2 150 —3 —3* 0 1 4* 3 5 11* 6 12 175 2 5* 3 4 10* 6 0 — 1* j 14 н.. —1 16 9 23 = </... В табл. 6.20 приведены основные результаты ДА. Оба фактора считаются фиксированными. Скорость резания, угол заточки и их взаимодействие оказы- оказываются значимыми на уровне 5%. Линейные и квадратические эффекты обоих факторов можно определить с помощью метода, рассмотренного в i римере 6.4. Результаты расчетов при- приведены в табл. 6.21. Отметим, что сумма квадратов для фактора может быть получена сложением сумм квадратов для линейного и квадратического ком- компонентов этого фактора. В данном эксперименте оба фактора являются количественными, следо- следовательно, взаимодействие ТС можно разбить на компоненты, обладающие 146 одной степенью свободы каждый, скажем ТС лхл, ТСлукв< ТСквул и ТСквУкВш В общем случае любое двухфакторное взаимодействие между количествен- количественными факторами можно разбить на (а— 1)F— 1) компонентов, обладаю- Таблица 6.20 Дисперсионный анализ данных по продолжительности использования инструмента Источник изменчивости Угол заточки Т Скорость резания С Взаимодействие ТС Ошибки Сумма Сумма квадратов 24,33 25,33 61,34 13,00 124,00 Степени свободы 2 2 4 9 17 Средний квадрат 12,17 12,67 15,33 1,44 8,45* 8,80* 10,64* * Значимо при 5 процентах. щих одной степенью свободы каждый. Часто некоторый компонент оказы- оказывается значимым из-за нетипичного отклика в одной из ячеек. Поэтому обще- общепринятой является практика находить только компоненты низших порядков, а оставшиеся компоненты рассматривать совместно как эффекты взаимодей- Таблица 6.21 Полиномиальные эффекты угла заточки Т и скорости С резании, пример 6.5 Суммы по Угол (г/(. ) j 16 9 обработкам Скорость (*¦/•) 2 12 14 Эффекты Суммы квадратов Коэффициенты ортогональных контрастов Линейный j 0 + 1 Сл = 16 SSTjl = 8,33 SSCjl =21,33 Квадратический + 1 -2 + 1 сткк:=-?24 5St-Kb = 16,00 SScKb = 4,00 Суммы 24,33 25,33 ствий высших порядков. Статистическая значимость этих компонентов выс- высших порядков свидетельствовала бы об очень сложной связи между фак- факторами. Для расчета компонентов взаимодействия, обладающих одной степенью свободы каждый, необходимо знать суммы для ячеек и коэффициенты орто- ортогональных контрастов. Проиллюстрируем применение этого метода. Рассмот- 147
рим коэффициенты для сумм, определяющих взаимодействие ТСлу<л (табл. 6.22). Числа в этой таблице, например, сц, получаются умножением коэффициентов, соответствующих Тл, иа коэффициенты для Сл. Контраст ГСлХл получается как сумма произведений коэффициентов из табл. 6.22 иа суммы для соответствующих ячеек (см. табл. 6.19, числа со звездочками), т. е. V -l)= -8. Сумма квадратов для контраста ГСлхл имеет вид G-СлхлJ (-8)' «24 (-8K 2-4 = 8,00. Таблица 6.22 Коэффициенты взаимодействия гл 1 0 +1 сл -1 +1 0 —1 0 0 0 0 +1 —0 1 +1 Коэффициенты для компонентов взаимодей- взаимодействия ГСлхкв, ГСквхл и ГСквХкв находятся аналогичным образом (табл. 6.23, где приведены также контрасты и суммы квадратов для каж- каждого компонента взаимодействия). Легко видеть, что сумма компонентов вза- взаимодействия, обладающих одной степенью сво- свободы каждый, равна сумме квадратов для вза- взаимодействия, т. е. SSTC = SSj-С лхл SSTC KBX11 +SSrc KBXKB = 8,00 + 42,67 + 2,67 + +8,00 + 61,34. Таблица 6.23 Вычисление взаимодействий 7"СЛхКв> 7СКвхЛ и ГСКвхКв Тл _1 о +1 з = Я СКв +1 —1 о +1 -2 +2 0 —2 Т'С.лхкв = 3 2 сиуч- = + 1 —1 0 + 1 -32 SSTCnxKB = (Т'СлхквJ «224 (-32J ,о - — = 42, 212 + 1 —2 + 1 3 < Сл —1 j +2 -1 тсКвх 3 2' 1 /=i iSTCKl (ТСкв 0 0 0 0 л = ЦУЦ >хЛ = хлJ «224 (-8J 212 о + 1 + 1 —2 + 1 = —8 67 ГКв + 1 —2 + 1 скв + 1 + 1 —2 + 1 —2 —2 +4 2 7'СКвхКв = 3 3 = 2 2w=- ssrcKBXKB = (^СквхквJ «224 _ (-24J -8 2-36 + 1 + 1 —2 + 1 -24 00 148 Результаты расширенного ДА приведены в табл. 6.24. Как линейный, так и квадратический компоненты эффекта угла заточки являются значи- значимыми; скорость резания оказывает только линейный эффект на продолжи- продолжительность использования инструмента. Значимыми являются также взаимо- взаимодействия ГСдХл, УСдхкв и ТСкв+Кв, причем компонент ГСлХкв весьма ве- велик по сравнению с остальными. На рис. 6.4 построены зависимости средних по ячейке от угла заточки для всех трех значений скорости, они иллюстрируют квадратический эффект угла заточки. На рис. 6.5 приведены зависимости средних по ячейке от ско- скорости резаиия для трех значений угла заточки. Уайиер [69] отмечает, что Скоросгпь=150 Скорость = П5 \ Скорость=125 20 Иго/i за то ти 125 150 175 Скорость резания Рис. 6.4. Зависимости среднего по Рис. 6.5. Зависимости среднего по ячейке от угла заточки (к при- ячейке от скорости резаиия (к при- примеру 6.5). меру 6.5). двумерные графики полезиы при анализе взаимодействий между двумя коли- количественными факторами. Если обозначить Х\ — угол заточки и #2 — скорость резания, то из табл. 6.24 следует, что для продолжительности использования ииструмеита Таблица 6.24 Дисперсионный анализ для примера 6.5 Источник изменчивости Угол заточки (Т Кв) Скорость резаиия (Сл) (СКв) Взаимодействие (ГСлхл) G"Слхкв) (П7КвХл) (ГСквХКв) Ошибка Сумма Сумма квадратов 24,33 (8,33) A6,00) 25,33 B1,33) D,00) 61,34 (8,00) D2,67) B,67) (8,00) 13,00 124,00 • Значимо прн 5 процентах. Степени свободы 2 1 1 2 1 1 4 1 1 1 1 9 17 Средний квадрат 12,17 (8,33) A6,00) 12,67 B1,33) D,00) 15,33 (8,00) D2,67) B,67) (8,00) 1,44 8,45* 5,78* 11,11* 8,80* 14,81* 2,77 10,64* 5,56* 29,63 1,85 5,56* 149
справедлива полиномиальная аппроксимация, например, вида y=ao+a.iPl(xl) +anP2(xl) +a2Pi(x2) + + ai2P! (*,) Р, (х2) + aI22Pi (*i) P2 (х2) + Ч-а^Рг^ОРг^+е, где а! — линейный коэффициент угла заточки; ai22 — коэффициент при первой степени угла заточки и второй степени скорости резания и т. д.; Pi(Xj) — ортогональные полиномы, введенные в параграфе 3.6. Эти коэффициенты и полиномы находятся точно так же, как и в 3.6, например, з з S 2 Учр1 (*п) Pi (*»/) «12 = 1=1 2 S (=1 /=1 _ 1 — 20 x2 — 150 25 Найдя аналогичным образом значения других слагаемых в соотношении F.35), получим следующее выражение для поверхности отклика относи- относительно факторов х\ и х2. у = 3,40 + 0,544 (xi — 20) — 0,08(*, — 20J + 0,1688(х2— 150) — — 0,008(*, - 20) (х2 — 150) — 0,0004 (*i — 20) (хг— 150)г— — 0,00002 (х, — 20) 2(x2— 150J. Это выражение можно использовать для предсказания продолжительности использования инструмента на промежуточных уровнях угла заточки и ско- скорости резания или же для определения уровней факторов, при которых она максимальна. Систематическое рассмотрение методов исследования поверх- поверхности отклика проводится в гл. 14. 6.7. ОДНО НАБЛЮДЕНИЕ В ЯЧЕЙКЕ В некоторых случаях встречаются факторные эксперименты с единственной репликой, т. е. с одним наблюдением в ячейке. При двух факторах, например, и одном наблюдении в ячейке линейная статистическая модель имеет вид i=l, 2, .... a; /=1, 2, b. F.36) ДА для такого плана в предположении, что оба фактора фиксированы, приведен в табл. 6.25. Из выражений для математических ожиданий средних квад- квадратов следует, что дисперсию ошибки о2 оценить нельзя, т. е. не существует какого-либо очевидного способа разделить эф- эффект двухфакторного взаимодействия (тр) ,j и эксперименталь- экспериментальную ошибку. Поэтому, если эффект взаимодействия не равен нулю, то критерии для проверки главных эффектов построить 150 нельзя. Если же взаимодействие отсутствует, то при всех i и / (тр),; = О и справедлива модель yii = H + Xi + ^j + ei},i=l,2,...,a;i=l,2 b. F.37) Если применима модель F.37), то остаточный средний квад- квадрат (остаточный, поскольку определяется как сумма квадратов, остающаяся от 55Общ после вычитания сумм квадратов главных эффектов.— Прим. ред.) в табл. 6.25 является несмещенной оцен- оценкой о2, и критерии для проверки главных эффектов можно по- построить на основе сравнения MSA и MSB с М50от. Таблица 6.25 Дисперсионный анализ для классификации по двум признакам при одном наблюдении в ячейке Источник изменчивости Сумма квадратов Степени свободы Средний квадрат Математическое ожидание среднего квадрата Строки А Столбцы В Остаток или А В Сумма вычитанием a b . a-\ 6-1 (a—1) F—1) ab—1 MS A MSB MSq (a—1)F—1) X Для того чтобы установить, существует взаимодействие или нет, может оказаться полезной процедура, предложенная Тьюки [67]. При использовании этой процедуры остаточная сумма квад- квадратов разбивается на компонент, обусловленный неаддитив- неаддитивностью (взаимодействием), и компонент, обусловленный ошиб- ошибкой, т. е. ее —. ооиеад — ( F.38) с одной степенью свободы и ¦-><->ош = '->1-*ост 1-)'->11еад F.39) с (а—\)(Ь—1) — 1 степенями свободы. Для проверки существо- существования взаимодействия находится значение статистики F.40) 151 SS0Ui/[(a—1) F—1) —
Тогда, если F0>Fa-, 1; (O-i)(&-i)-i> T0 гипотеза об отсутствии взаи- взаимодействия должна быть отклонена. (Эта процедура иногда на- называется критерием полной аддитивности эффектов.— Прим. ред.) Пример 6.6. На присутствие примеси в химическом продукте влияют два фактора — давление и температура. Данные одной реплики факторного эксперимента приведены в табл. 6.26. Вычислим ь 1=1 аЬ о-О SSo6« = 2 S 4 ^"!/2. = 166-129,07 = 36,92 и SSoCT = SS06iu, — SSA — SSB — 36,93 —23,33— 11,60 = : Таблица 6.26 Данные о содержании примесей для примера 6.6 Температура, ° С 35 50 65 У-1 Давление 25 5 3 1 9 30 4 1 1 6 35 ' 6 4 3 13 40 3 2 1 6 45 5 3 2 10 23 13 8 44 = у.. Сумма квадратов, обусловленная неаддитивностью, находится в соответ- соответствии с выражением F.38) следующим образом: а Ь 2 21 УцУ1.У-1 = 5-23-9+ 4-23-6+ •¦• +2-8-10 = 7236; неад ! неа« abSSASSB [Щ р 1 _- —[7236 — 44B3,33+ 11,60+ 129,07)]'= B0'00J _ о, 0985, 3-5-23,33-11,60 4059,42 а сумма квадратов, обусловленная ошибкой,— в соответствии с выраже- выражением F.39) SSom = SSooT —SSHeafl= 2,00—0,098 5= 1,901 5. Результаты полного ДА приведены в табл. 6.27. Для проверки иа неад- неаддитивность используется статистика Fo=0,098 5/0,271 6=0,36, поэтому де- делаем вывод, что полученные данные не свидетельствуют о существовании взаимодействия. Главные эффекты — температура и давление — являются значимыми. 152 Таблица 6.27 Дисперсионный анализ для примера 6.6 Источник изменчивости Температура Давление Неаддитивность Ошибка Сумма Сумма квадратов 23,33 11,60 0,098 5 1,9015 36,93 Степени свободы 2 4 1 7 14 Средний квадрат 11,67 2,90 0,098 5 0,2716 42,97* 10,68* 0,36 * Значимо при 1 проценте В заключение отметим, что модель F.37) для двухфактор- ного факторного эксперимента с одним наблюдением в ячейке по виду совпадает с моделью D.1) для рандомизированного полноблочного плана. Тем не менее экспериментальные ситуа- ситуации, которые приводят к этим двум моделям, совершенно раз- различны. Выражение F.37)—это модель факторного экспери-. мента, в котором все аЬ наблюдений производятся в случайном порядке; в то время как при модели D.1) а уровней фактора рандомизируются только внутри блока. Блоки представляют со- собой ограничение на рандомизацию, и, следовательно, способы, с помощью которых собираются данные, и интерпретация этих двух моделей совершенно различны. 6.8. ЗАДАЧИ 6.1. Исследуется выход химического процесса. Двумя наиболее важными переменными считаются давление и температура. Выбираются три уровня каждого фактора и проводятся две реплики факторного эксперимента. По- Получены следующие данные: Температура Низкая ^Средняя Высокая Давление 200 90,4 90,2 90,1 90,3 90,5 90,7 215 90,7 90,6 90,5 90,6 90,8 90,9 230 90,2 90,4 89,9 90,1 90,4 90,1 Проведите анализ этих данных и сделайте выводы. Оцените компоненты в соответствующей статистической модели. При каких условиях вы бы вели этот химический процесс? 6.2. Инженер полагает, что иа чистоту поверхности металлической детали влияют скорость подачи и глубина резаиия. Данные факторного экспери- эксперимента по исследованию этих факторов приведены ниже. Проведите анализ 153
данных и сформулируйте свои выводы. Оцените компоненты соответствую- соответствующей модели. 6.3. Для данных задачи 6.2 постройте 95-процентную интервальную оценку средней разности откликов при скоростях подачи 0,08 и 0,10 мм/с. 6.4. Исследуются факторы, влияющие на прочность синтетического во- волокна иа разрыв. Случайным образом выбираются четыре станка и три оператора и проводится эксперимент с волокном из одной партии. Данные этого эксперимента приведены ниже. Проведите анализ данных и сделайте выводы. Оцените компоненты дисперсии. Скорость подачи, мм/с 0,08 0,10 0,12 Глубина резаиия, мм 4,0 | 74 64 60 92 86 88 99 98 102 4,5 | 79 68 73 98 104 88 104 99 95 5,0 '| 82 88 92 99 108 95 108 ПО 99 6,0 99 104 96 104 ПО 99 114 111 107 Оператор 1 2 3 Стаиок 1 109 ПО ПО 112 116 114 2 ПО 115 ПО 111 112 115 1 з 111 109 114 119 1 * ПО 108 114 112 120 117 6.5. Инженер-механик исследует осевое усилие, развиваемое сверлильным станком. Он полагает, что наиболее важными факторами являются скорость сверления и скорость подачи материала. Он выбирает случайным образом четыре скорости подачи и использует верхний и нижний уровни скорости сверления, представляющие крайние рабочие условия. Получены следующие данные: Скорость сверлення 125 200 Скорость подачи 0,015 2,70 2,78 2,83 2,86 0,030 2,45 2,49 2,85 2,80 0,045 2,60 2,72 2,86 2,87 0,060 2,75 2,86 2,94 2,88 154 Проведите анализ и сделайте выводы. 6.6. Рассмотрите данные задачи 6.1. Примените метод, описанный в тек- тексте, для выделения линейного и квадратического эффектов давления. 6.7. Примените множественный критерий размахов Дункана к данным задачи 6.1 и определите, какие уровни фактора «давление» обладают зна- значимыми различиями. 6.8. Рассмотрите данные, приведенные ниже, в предположении, что фак- факторы в строках и столбцах фиксированы. Проведите анализ этих данных и сделайте выводы. Проведите проверку неаддитивности. Фактор в строке 1 2 3 Фактор в столбце ¦ 36 18 30 39 20 37 3 36 22 33 32 20 34 6.9. Рассмотрите модель трехфакторного ДА: (=1, 2, ..., а; /=1, 2, ..., b; k=l, 2, . .., с. Заметим, что реплика всего одна. Предположив, что все факторы фикси- фиксированы, постройте таблицу ДА и включите в нее математические ожидания средних квадратов. Какую величину вы бы использовали в качестве «ошибки эксперимента» при проверке гипотез? 6.10. Отдел контроля качества отделочной фабрики изучает влияние не- нескольких факторов на качество окрашивания хлопчато-синтетической ткани. Выбираются три оператора, три продолжительности цикла и две темпера- температуры; три небольших образца ткани подвергаются окрашиванию при каждом из выборов условий. Ткань после отделки сравнивается со стандартом и получает некоторую числовую оценку; полученные данные приведены ниже. Проведите анализ этих данных и сделайте выводы. Продолжитель- Продолжительность 40 50 60 Температура, ° С 150 | 175 Оператор 1 23 24 25 36 35 36 28 24 27 1 2 27 28 26 34 38 39 35 35 34 з 31 32 29 33 34 35 26 27 25 1 I 24 23 28 37 39 35 26 29 25 1 2 38 36 35 34 38 36 36 37 34 3 34 36 39 34 36 31 28 26 24 155
6.11. Для задачи 6.1 определите мощность критерия при обнаружении з истинной разности эффектов давления таких, что 2 Ру = 0,08, где f$j — эф- фект /-го давления. 6.12. Для задачи 6.4 определите мощность критерия при обнаружении эффекта станков такого, что Оа—т, где о»—компонент дисперсии для фак- фактора «станки». Достаточно ли для этого двух реплик? 6.13. Покажите, что для смешанной модели двухфакторного эксперимента Cov [(т р),7(т р = - — О2р при I [ 7 / 6.14. Рассмотрите двухфакторную смешанную модель. Покажите, что стандарт ошибки среднего эффекта фиксированного фактора (скажем, А) для множественного критерия размахов Дункана равен [MSAB/bn]Ч ГЛАВА СЕДЬМАЯ ПРАВИЛА НАХОЖДЕНИЯ СУММ КВАДРАТОВ И МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ СРЕДНИХ КВАДРАТОВ Для проведения ДА необходимо найти суммы квадратов для каждого компонента модели и соответствующее им число сте- степеней свободы, и на основе математических ожиданий средних квадратов построить статистики для проверки гипотез. При сложных планах экспериментов, особенно при использовании случайных или смешанных моделей, часто оказывается полез- полезным применять для этого формальную процедуру. Мы приведем ряд правил, позволяющих находить выражения для эффектов модели (под эффектом здесь понимается как глав- главный эффект, так и взаимодействие), числа степеней свободы и математических ожиданий средних квадратов для любого сба- сбалансированного факторного, гнездового1 или гнездового фак- факторного эксперимента (отметим, что частично сбалансированные планы, например, неполноблочные планы и латинские квадраты, исключаются из рассмотрения). Эти правила обсуждаются не- несколькими авторами, в том числе Шеффе [62], Беннетом и Франк- Франклином [5], Хиксом [41] и Сёрлом [63, 64]. Применение правил будет иллюстрироваться на модели двухфакторного экспери- эксперимента. 1 Гнездовые планы рассматриваются в гл. 11. 156 7.1. ПРАВИЛА ДЛЯ СУММ КВАДРАТОВ Правило 1. Слагаемое модели, соответствующее ошибке ец-..m, записывается в виде е&...ут, где индекс т относится к реплике. Для двухфакторной модели это правило означает, что Eijk переходит в е^до. Правило 2. Помимо математического ожидания общего сред- среднего (л и слагаемого, соответствующего ошибке [г(ц...)т], модель содержит все главные эффекты и любые взаимодействия, кото- которые, по мнению исследователя, существуют. Если между k фак- факторами существуют все возможные взаимодействия, то среди них ф двухфакторных, ф трехфакторных, . .., одно й-фактор- ное взаимодействие. Если один из факторов в слагаемом заклю- заключен в скобки, то между ним и другими факторами в этом сла- слагаемом взаимодействий нет. Правило 3. Индексы любого слагаемого модели разделяются на три класса: а) «живые» — те, которые есть в слагаемом и не заключены в скобки; б) «мертвые» — те, которые есть в сла- слагаемом и заключены в скобки; в) отсутствующие — те, которые есть в модели, но отсутствуют в данном слагаемом. Так, в слагаемом (x^ij)ij индексы i и / — «живые», a k — от- отсутствующий; в 8(ij)ft k — «живой, a i и / «мертвые». Правило 4. Степени свободы. Число степеней свободы лю- любого слагаемого модели равно произведению числа уровней, со- соответствующих каждому «мертвому» индексу, и числа уровней без единицы — каждому «живому» индексу. Например, число степеней свободы, связанных с (х$)ц, равно (а—1) (Ь—1), а число степеней свободы, связанных с е^до, равно аЪ(п — 1). Правило 5. Суммы квадратов. Чтобы получить расчетную формулу для суммы квадратов какого-либо эффекта, сначала представим в виде суммы число степеней свободы, соответст- соответствующее этому эффекту. Например, для р^ это просто 6 — 1. Каждое слагаемое в такой сумме является символической фор- формой скорректированной суммы квадратов. Затем предпримем следующие шаги: а) положим, что 1 представляет собой корректирующее сла- слагаемое, т. е. 1 = 1 аЬ . . . п f=i /=i П \2 2 Ун • • • m Вместо каждой из остальных символических форм запишем сумму всех наблюдений в виде повторных сумм; так, вместо Ъ а Ь ' п запишем 2 2 2 ^f/*» i=i /=i k=\ б) перегруппируем знаки суммирования так, чтобы те, кото- 157
рые соответствуют буквам символической формы (в данном слу- случае Ь), оказались внешними; оставшуюся часть слагаемого за- заключим в скобки. Так, для b получаем /=1 \t=lft=l в) запишем величину в скобках с помощью обычных «точеч- «точечных» индексов (т. е. точка, заменяющая индекс, означает, что по этому индексу произведено суммирование). Следовательно, г) возведем величину в скобках в квадрат и разделим на произведение чисел уровней, соответствующих «точечным» ин- индексам. В нашем примере для слагаемого b получаем выраже- ь ние вида 2#2/ Чап)^ которое представляет собой нескорректи- рованную сумму квадратов. Скорректированная сумма квад- квадратов для эффекта получается заменой каждой символической формы соответствующей нескорректированной суммой квадра- квадратов. Так, для получения суммы квадратов для р3- заменим сим- символические формы в 6— 1 на нескорректированные суммы квад- квадратов, найденные ранее, тогда "~"~ an ^•'- abn "••¦¦ Это, очевидно, сумма квадратов для главного эффекта В в двухфакторном анализе. В качестве еще одного применения правила 5 рассмотрим сумму квадратов, например, для (т.р)г.,, т. е. SSab- Представим число степеней свободы в виде суммы: (а—1)F — 1) = = ab — а — 6+1. Следовательно, сумма квадратов находится следующим образом: ab b n 22 2 2 2 i=i а 2 — а Ь п Л 2 уф =i k=i b n 2 2 уч /=i *=1 4i.) — Ь а Ь п 2 2 2 у /=! /=1 ''=' Ь 1 22^ 2 abn abn шаг а) шаг б) шаг в) У... шаг г) abn 158 Наконец, объединяя нескорректированные суммы квадратов в последней строке с учетом знаков выражений, стоящих над каждым столбцом, получаем п ?,?,-'¦ Ъп ?,-•¦ an ft—' • abn " • - Это выражение эквивалентно выражению F.9). 7.2. ПРАВИЛА ДЛЯ МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ СРЕДНИХ КВАДРАТОВ Мы видели, что математические ожидания средних квадра- квадратов играют важную роль в ДА. Исследовав эти выражения, можно построить статистики для проверки гипотез относительно любого параметра модели. Статистики представляют собой от- отношение средних квадратов, выбранных так, чтобы математи- математическое ожидание среднего квадрата в числителе отличалось от математического ожидания среднего квадрата в знаменателе только на исследуемый компонент дисперсии или фиксирован- фиксированный фактор. Выражения для математических ожиданий средних квадра- квадратов в любой модели всегда можно найти так, как мы это де- делали в гл. 3, т. е. непосредственно применяя оператор мате- математического ожидания. Этот метод решения «в лоб», может оказаться очень трудоемким. Правила, приведенные ниже, позво- позволяют во всех случаях находить математические ожидания сред- средних квадратов для любого плана; при некоторой практике ими пользоваться довольно просто. При применении этих правил к смешанной модели получаются выражения для математиче- математических ожиданий средних квадратов, которые соответствуют до- допущениям стандартной смешанной модели (см. параграф 6.4). Для иллюстрации применения правил будет использована двух- факторная модель постоянных эффектов. Правило 1. С каждым эффектом связан либо компонент дис- дисперсии (случайный эффект), либо фиксированный фактор (по- (постоянный эффект). Если взаимодействие содержит хотя бы один случайный эффект, то оно в целом считается случайным. Ком- Компоненты дисперсии, связанные со случайными эффектами, обо- обозначаются соответствующими греческими буквами в качестве нижнего индекса. Так, в двухфакторной смешанной модели с фиксированным фактором А и случайным фактором В компо- компонент дисперсии, связанный с В, обозначается о», а компонент дисперсии для AB — oL. Постоянный эффект всегда представ- представляется отношением суммы квадратов слагаемых модели, свя- связанных с этим фактором, к числу его степеней свободы. В на- р шем примере эффект А имеет вид ^ 159
Правило 2. Математические ожидания средних квадратов. Для получения математических ожиданий средних квадратов составим таблицу, в которой каждому слагаемому модели (среднему квадрату) отводится строка, а каждому индексу — столбец. Над каждым индексом записывается число уровней фактора, связанного с этим индексом, и отмечается характер фактора, фиксированный (F) или случайный (R); реплики всегда считаются случайными. а) В каждой строке записывается единица, если «мертвый» индекс слагаемого в строке соответствует индексу в столбце. F F R а Ь п Фактор i / к 1 1 б) В каждой строке при совпадении какого-либо из индек- индексов слагаемого в строке с индексом в столбце записывается нуль, если в этом столбце фактор фиксирован, и единица — если случаен. Фактор F Ь I Р/ О О О О 1 1 1 в) В оставшиеся пустые места в строках вписывается число уровней, указанное над каждым столбцом. F F R Фактор тг Р/ (тР)г/ Чт а 1 0 а 0 1 0 ' Ъ 0 0 1 п k п п п 1 160 г) Для получения математического ожидания среднего квад- квадрата для какого-либо слагаемого модели сначала прикрыва- прикрываются все столбцы, соответствующие «живым» индексом этого слагаемого. Затем в каждой строке, содержащей все индексы рассматриваемого слагаемого, берется произведение чисел, оставшихся неприкрытыми, и умножается на соответствующую характеристику рассеивания фиксированного или случайного фактора, полученную по правилу 1. Сумма этих величин и есть математическое ожидание среднего квадрата для рассматривае- рассматриваемого слагаемого модели. Например, для того, чтобы найти Е. (MSA), закроем столбец /. Произведения чисел, оставшихся не- неприкрытыми в строках, содержащих индекс i, равны Ъп (строка 1), 0 (строка 3) и 1 (строка 4). Отметим, что во второй строке i отсутствует. Следовательно, математическое ожидание среднего квадрата имеет вид Полный набор математических ожиданий средних квадратов для рассматриваемого плана приведен в табл. 7.1. В табл. 7.2 и 7.3 показан вывод математических ожиданий средних квадра- квадратов для двухфакторных случайной и смешанной моделей соот- соответственно. Модель трехфакторного эксперимента рассматри- рассматривается в следующем примере. Таблица 7.1 Вывод выражений для математических ожиданий средних квадратов, двухфакторная модель постоянных эффектов Фактор ч Р/ е('7> к F а i 0 а 0 1 F ь 1 Ь 0 0 1 R п k п п п 1 Математическое ожидание среднего квадрата Ъп П2 | п а2 ° Д. К. Монтгомери 161
Таблица 7.2 Вывод выражений для математических ожиданий средних квадратов, двухфакторная модель случайных эффектов Фактор Tf Р/ (*P)v е«7>* R а i i а 1 1 R ь 1 b 1 1 1 R n k n n n 1 Математическое ожидание среднего квадрата а2 + «а2р + Ьпа\ а2 + гаа2р + апа2& а2 + гаа2р а2 Таблица 7.3 Вывод выражений для математических ожиданий средних квадратов, двухфакторная смешанная модель Фактор Ч Р; (tP)v 8(.7) к F а i 0 а 0 _. 1 ь i b 1 1 1 R n k n n n 1 Математическое ожидание среднего квадрата a2 + «a?p+a_i 2т2 a2 + ano| a2 + «a2p a2 Пример 7.1. Рассмотрим трехфакторный эксперимент с а уровнями фак- фактора A, b уровнями фактора В, с уровнями фактора Сип репликами. Ана- Анализ этого плана в предположении, что все факторы фиксированы, дан в па- параграфе 6.5. Определим теперь математические ожидания средиих квадратов в предположении, что все факторы случайны. Соответствующая статистиче- статистическая модель имеет вид Выражения для математических ожиданий средних квадратов, получен- полученные с помощью приведенных выше правил, даны в табл. 7.4. Из рассмотрения этих выражений следует, что, если А, В и С являются случайными факторами, то не существует точных критериев для главных эффектов. Другими словами, если мы хотим проверить гипотезу ох =0, то мы не можем построить такое отношение двух средиих квадратов, чтобы един- единственным слагаемым в числителе, которое не встречалось в знаменателе, было Ьсп а\. То же наблюдается и для главных эффектов факторов В 162 и С. Заметим, что для двухфакторных и трехфакторных взаимодействий точные критерии существуют. Однако исследователя, скорее всего, интересуют в первую очередь главные эффекты. Вопрос о том, как проверяются главные эффекты, обсуждается в следующем параграфе. Таблица 7.4 Вывод выражений для математических ожиданий средиих квадратов, трехфакторная модель случайных эффектов Фактор Ч Pi Yk (*P)V (Py)/* (•sPy)v* 8(«/ft)' R a j 1 a a 1 1 a 1 1 R b 1 b 1 b 1 b 1 1 1 R с k с с 1 с 1 1 1 1 R n I n n n n n n n 1 Математическое ожидание среднего квадрата a -)- спа\а + bna2 -\- raa2g + bcna2 a2 + c«a2p -f ana2&y + na2.^ + acraa^ a2 + braaly + ana|? + na2&y + abraa2 2,2, 2 a2 + raa?pv+6«a2? 2 2 2 a + "°tPy + araapv a2+na?p? a2 7.3. ПРИБЛИЖЕННЫЕ f-КРИТЕРИИ В факторных экспериментах с тремя или более факторами при случайной или смешанной модели или в некоторых других, более сложных, планах часто оказывается, что хотя бы для одного из эффектов модели нельзя построить точного критерия. Одним из возможных способов обойти эту трудность является принятие допущения, что некоторые взаимодействия пренебре- пренебрежимо малы. В частности, в примере 7.1, если бы мы могли обоснованно считать все двухфакторные взаимодействия прене- пренебрежимо малыми, то, положив а2р = а2? = ст2? = 0, могли бы по- построить критерии для главных эффектов. Несмотря на то что такой подход кажется привлекательным, допущение о пренебрежимости одного или нескольких взаимо- взаимодействий должно быть основано на характерных особенностях исследуемого процесса или на проверенных результатах преды- предыдущих опытов. Вообще говоря, это допущение обосновать не- нелегко, и к его принятию надо относиться серьезно. Нельзя исключать какие-либо взаимодействия из модели без достаточ- достаточных на то оснований. Некоторые исследователи предлагают ме- метод, при котором сначала проверяются взаимодействия, затем те из них, которые не оказались значимыми, полагаются рав- 163
ными нулю, и в этом допущении проверяются остальные эф- эффекты в том же эксперименте. Хотя такой метод и применяется иногда на практике, однако при его использовании любое реше- решение относительно взаимодействий подвержено ошибкам обоих родов. Вариантом рассмотренной идеи является объединение сред- средних квадратов при дисперсионном анализе, для того чтобы по- получить оценку ошибки с большим числом степеней свободы. Например, допустим, что в примере 7.1 статистика Fo= — MSabc/MSooi не оказалась значимой, тогда гипотеза ЯЗ atpv =" не отклоняется, и обе величины MSABC и М50Ш яв- являются оценками дисперсии ошибки <т2. Экспериментатор может попробовать объединить MSABC и MSom в соответствии с вы- выражением Ms _ abc {п - 1) MSoaj + (q-l)(b-l)(c-l)MSABC ош' abc(n—l) + (a— 1) (Ь — 1)(с— 1) так, что E(MSovi') =a2. Отметим, что число степеней свободы MSom' составляет аЪс(п—1) + (а—1) (Ь—1) (с—-1) вместо abc(n—1) для исходной величины MSom. Опасность объедине- объединения состоит в возможности совершить ошибку II рода и объеди- объединить средний квадрат для фактора, в действительности являю- являющегося значимым, с ошибкой и получить таким образом новый остаточный средний квадрат MSOmr, значение которого завы- завышено. Это затруднит обнаружение других значимых эффектов. Напротив, если у исходного среднего квадрата ошибки число степеней свободы очень мало (скажем, меньше 6), то экспери- экспериментатор может выиграть при объединении за счет значитель- значительного потенциального повышения точности последующих прове- проверок. Приемлемой для практики является следующая процедура. Если число степеней свободы исходного среднего квадрата ошибки меньше 6, то объединять следует только при условии, что F-статистика для этого среднего квадрата не является зна- значимой для большого значения а (скажем, a = 0,25). Если число степеней свободы исходного среднего квадрата ошибки более 6, то объединять их не надо. Если какие-либо взаимодействия нельзя считать пренебре- пренебрежимо малыми, а тем не менее необходимо сделать выводы от- относительно тех эффектов, для которых не существуют точные критерии, то можно воспользоваться процедурой, предложенной Сэттервейтом [58]. Метод Сэттервейта основан на выборе двух линейных комбинаций средних квадратов, например, MS' = MSr+ ...+MSS G.1) и MS"=MSu + ...+MSv G.2) таким образом, чтобы E(MS') —E(MS") оказалось равным эф- 164 фекту (параметру модели или компоненту дисперсии), рассмат- рассматриваемому в нулевой гипотезе. Тогда в критерии проверки мо- может использоваться статистика F — MS' MS" G.3) где р — . (MSr + ¦ ¦ . -f MSS)* G.4) (MSU MS2u/fu+ ...+MS2v/fv G.5) fi — число степеней свободы, связанное со средним квадра- квадратом MSi. Нельзя рассчитывать на то, что р и q окажутся целыми, по- поэтому в таблицах F-распределения необходима интерполяция. Например, в трехфакторном ДА при модели случайных эффек- эффектов (см. табл. 7.4) довольно легко заметить, что для проверки #о: <т|=0 можно использовать статистику F=MS'/MS", где MS' = MSA+MSABc и MS"=MSab+MSac. При этом числа сте- степеней свободы для F находятся по выражениям G.4) и G.5). Выбор такого критерия основан на том, что и числитель, и знаменатель статистики G.3) приближенно являются случай- случайными переменными, кратными распределению хи-квадрат. При этом в числителе и знаменателе статистики G.3) нет одинако- одинаковых средних квадратов и, следовательно, числитель и знамена- знаменатель независимы. Таким образом, отношение F из выражения G.3) приближенно подчиняется F-распределению с р и q сте- степенями свободы. Сэттервейт подчеркивал, что при использова- использовании этого метода необходимо проявлять осторожность, когда некоторые из средних квадратов в MS' и MS" берутся с отри- отрицательными знаками. Гейлор и Хоппер [36] показали, что для MS'=MSi — MSz приближение Сэттервейта справедливо, если 0,025; fy, U г0,5; f,; f, причем и f2>/i/2. Пример 7.2. Исследуется падение давления в расширительном клапане турбины. Конструктор считает, что важными переменами, влияющими на падение давления, являются температура газа А у впускного отверстия кла- клапана, скорость турбины В и начальное давление газа С. Эти три фактора организуются в факторный эксперимент, причем температура газа считается фиксированным фактором, а скорость турбины й давление — случайными 165
факторами. Кодированные данные двух реплик приведены в табл. 7.5. Линей- Линейная модель для этого плана имеет вид эффект скорости турбины В; где т;—эффект температуры газа A; Va — эффект давления газа С. Таблица 7.5 Кодироваиные данные о падении давления для эксперимента с клапаном турбины Давле- Давление С . 50 75 85 Температура газа А 15° С Скорость В 150 -2 —3 —6 4 — 1 2 200 0 -9 —5 — 1 —4 —8 225 — 1 -8 —8 —2 17 —7 300 4 4 —3 —7 -2 4 25° С Скорость В 150 14 4 12 24 20 6 200 6 0 8 6 2 0 225 1 -2 6 2 3 0 300 —7 6 -5 2 -5 — 1 35° С Скорость В 150 -8 —8. — 8 3 9 —1 200 2 20 1 —7 j 2 225 — 1 2 -9 —8 4 у 300 —2 -8 3 1 3 ДА приведен в табл. 7.6.' К этой таблице добавлен столбец «Математи- «Математическое ожидание среднего квадрата», выражения в котором получены мето- методами параграфа 7.2. Из этих выражений следует, что точные критерии су- существуют для всех эффектов, кроме главного эффекта Л; результаты про- проверок по этим критериям также приведены в табл. 7.6. Для проверки гипо- гипотезы Но: т;=0 — можно использовать статистику F=MS'/MS", где MS'= = MSA+MSABc h MS"=MSab+MSac, поскольку Е(MS') — Е(MS") = g* Для определения значения этой статистики найдем MS'=MSA+MSABC = 190,50+ 17,38=207,88; MS"=MSAB + MSAC = 72,32 + 59,04= 131,36, тогда F=AfS7AfS"=207,88/131,36=l,58. Числа степеней свободы 207,882 MS\l2 + MSABCI\2 190.50V2 + 17.38VI2 -MS асJ 131,36s = 2,38 MS2AB/6+MS'AC/i ' 72,32V6+59,04«/4 = 9,90. 166 Сравнение F=l,58 с Fo,o5; 2,зв,- э.эо показывает, что мы не можем откло- отклонить #о- Мы приходим к выводу, что главный эффект В и взаимодействия АВ и АС являются значимыми. Однако графики для этих взаимодействий (рис. 7.1) показывают, что эффект А может быть большим на нижних уров- уровнях В и верхних уровнях С. Таким образом, вполне возможно, что главный эффект А маскируется сильными взаимодействиями АВ и АС. щ о- -30 во 75 8=150 . •В=200 B=J00 В=250 90 б) к Ю0г ~S 50 и С: о 0 X -50 60 75 С -85 С-75 Рис. 7.1. Взаимодействия в эксперименте по исследованию падения давления. Таблица 7.6 Дисперсионный анализ даиных по падению давления Источник изменчи- изменчивости Темпера- Температура А Скорость В Давление С АВ АС ВС ABC Ошибка Сумма • Значимо Сумма квадра- квадратов 381,00 712,44 23,58 433,89 236,17 200,31 208,61 1100,00 3296,00 Степени свободы 2 3 2 6 4 6 12 36 71 при 5 процентах. Математическое ожидание среднего квадрата а2 + Ьпа\у + спа\§ + tpv а — j ^J i о2 + а«ст|7 + acnal а2 4- aio|v + abnOy о2 + «о2рг + с/га?р °2 + "°2pv + bnah а2 + a«a|v а2 + «o2pv а2 Средний квадрат 190,50 237,48 11,79 72,32 59,04 33,39 17,38 30,56 1,58 7,11 * 0,35 4,16* 3,40* 1,09 0,58 167
7.4. ЗАДАЧИ 7.1. Воспользуйтесь процедурой, обсуждавшейся в 7.2, и определите ма- математические ожидания средних квадратов для трехфакторной модели посто- постоянных эффектов. 7.2. Для примера 7,1 предложите соответствующие статистики для про- проверки всех главных эффектов и взаимодействий. Проделайте то же в пред- предположении, что Л и В фиксированы, а С'случаен. 7.3. Выведите выражения для математических ожиданий средних квад- квадратов, приведенные в табл. 7.6. 7.4. Рассмотрите четырехфакторный эксперимент с фактором Л на о уровнях, фактором В на b уровнях, фактором С на с уровнях, фактором D на d уровнях и п репликами. Напишите выражения для сумм квадратов, числа степеней свободы и математических ожиданий средних квадратов при следующих предположениях: а) Л, В, С и D фиксированы; б) Л, В, С и D случайны; в) Л фиксирован, ~а В, С и D случайны; г) А и В фиксированы, а С и D случайны; д) А, В и С фиксированы, a D случаен. Существуют ли точные критерии для всех эффектов? Если нет, то пред- предположите статистики для проверки тех эффектов, которые не могут быть проверены непосредственно. 7.5. Проведите анализ данных в задаче 6.10, предположив, что опера- операторы, продолжительности цикла и температуры выбирались случайным об- образом. Оцените компоненты дисперсии. 7.6. Рассмотрите трехфакторную модель 1-1,2 а; /=1,2, ..., Ь; й-1,2 с. В предположении, что все факторы случайны, постройте таблицу ДА, дополнив ее выражениями для математических ожиданий средних квадратов. Предложите соответствующие статистики для проверки всех эффектов. ГЛАВА ВОСЬМАЯ ФАКТОРНЫЕ ПЛАНЫ ТИПОВ 2 и 3" 8.1. ВВЕДЕНИЕ Факторные планы широко используются в экспериментах с несколькими факторами, когда необходимо исследовать их совместное воздействие на отклик. В гл. 6 рассматривались об- общие методы анализа для факторных планов. Однако существует несколько важных частных случаев общего факторного плана, которые широко применяются в работе исследователя, а также составляют основу других планов, имеющих большое практиче- практическое значение. 16» Первый из этих частных случаев — k факторов с двумя уров- уровнями каждый. Уровни могут быть количественными, например, два значения температуры, давления, текущего времени, и ка- качественными, скажем, два станка, два оператора, «верхний» и «нижний» уровни фактора или даже присутствие и отсутствие фактора. Для полной реплики такого плана необходимо 2X2X...X2=2ft наблюдений; он называется факторным планом типа 2fe. Второй частный случай — k факторов с тремя уровнями каждый — называется факторным планом типа 3fe. В настоящей главе рассматриваются специальные методы анализа для этих двух типов планов, причем предполагается, что факторы фиксированы, планы полностью рандомизированы и справедливо обычное допущение о нормальности распреде- распределения ошибки. 8.2. АНАЛИЗ ФАКТОРНОГО ПЛАНА ТИПА 2" Планы типа 2h особенно полезны на ранних этапах исследо- исследования, когда чаще всего приходится рассматривать много фак- факторов. При использовании таких планов число комбинаций об- обработок, с помощью которых могут быть исследованы в полном факторном эксперименте k факторов, оказывается минималь- минимальным. Поскольку для каждого фактора берется только два уровня, мы должны полагать, что отклик приблизительно линеен в диапазоне изменения выбранных уровней. 8.2.1. План 22 Первым планом типа 2h является план лишь с двумя фак- факторами, скажем, А и В, с двумя уровнями каждый, т. е. план 22. Уровни факторов можно произвольным образом назвать «ниж- «нижним» и «верхним». Рассмотрим, например, исследование влия- влияния концентрации реагента и присутствия катализатора на время протекания некоторой химической реакции. Пусть фак- фактор А — концентрация реагента и рассматриваются два уровня — 15 и 25 процентов. Фактор В — катализатор, причем верхнему уровню отвечает присутствие, а нижнему — отсутствие катали- катализатора. Данные трех реплик этого эксперимента приведены ниже. Комбинация обработок А нижний, В нижний А верхний, В нижний А нижний, В верхний А верхний, В верхний Реплика I 28 36 18 31 II 25 32 19 30 Ш 27 32 23 29 Сумма 80 100 60 90 169
Комбинации обработок для рассматриваемого плана изобра- изображены графически на рис. 8.1. Будем, как принято, обозначать эффект фактора заглавной латинской буквой; так, А относится к эффекту фактора А, В — к эффекту фактора В и АВ — к взаи- взаимодействию АВ. В плане 22 нижний и верхний уровни А и В на осях А и В обозначаются 0 и 1 соответственно. Гак, 0 на оси А — нижний уровень концентрации A5%), а 1—верхний уровень B5%), 0 на оси В — отсутствие катализатора, а 1 — его присутствие. Кроме того, координаты вершин квадрата представляют со- собой четыре комбинации обработок: 00 — оба фактора на ниж- Верхнш 1Т Ъ=60A8+19+23) аЪ*90C1+30+29) ^npucy'mcmbue) I 1 I g Нижний (отсутствие) 0 ¦*- A) =80B8+25+27) а=100C6 +32+32) Рис. 8.1. Комбинации обработок в плане 22. 0 1 Нижний A5%) Верхний B5%) Концентрация реагента, А нем уровне, 10 — А на верхнем и Б на нижнем уровнях, 01—В на верхнем и А на нижнем уровнях, 11—оба фактора на верх- верхнем уровне. Эти комбинации обработок обычно обозначаются строчными буквами (см. рис. 8.1). Как видно из этого рисунка, верхний уровень любого фактора в комбинации обработок обо- обозначается соответствующей строчной буквой, а в обозначении нижнего уровня соответствующая буква отсутствует. Так, а представляет собой комбинацию обработок А на верхнем уровне и В на нижнем уровне, Ъ — Л на нижнем и В на верхнем уровне, ab — оба фактора на верхнем уровне. Кроме того, принято обо- обозначать A) комбинацию обработок — оба фактора на нижнем уровне. Такие обозначения применяются во всех планах типа 2fe. Определим средний эффект фактора как изменение отклика, обусловленное изменением уровня этого фактора и усредненное по уровням других факторов. Будем обозначать A), а, Ъ и ab также и суммы наблюдений во всех п репликах для данной ком- комбинации обработок (см. рис. 8.1). Тогда эффект А на нижнем уровне В равен [а— A)]/я, эффект А на верхнем уровне В ра- 170 вен [ab— Ь]/п, и среднее арифметическое этих величин = -^ {[ab b] + [a-(\)]) = ~- (8.1) Средний эффект В выражается через эффект В на нижнем уровне А (т. е. [Ь—A)]/«) и на верхнем уровне А (т. е. [ab — а]/га) как (8.2) Определим эффект взаимодействия АВ как среднюю раз- разность между эффектом Л на верхнем уровне В и эффектом Л на нижнем уровне В: АВ = -±г[[аЬ-Ь]-[а-A)])=-±-1аЬ + A)-а-Ь]. (8.3) Но АВ можно определить и как среднюю разность между эф- эффектом В на верхнем уровне Л и эффектом В на нижнем уровне Л, что также приводит к выражению (8.3). Приведенные выражения для эффектов Л, В и АВ можно получить и иным способом. Заметим, что эффект Л [выражение (8.1)] находится при сравнении двух комбинаций обработок в правой части квадрата на рис. 8.1 с двумя комбинациями об- обработок в левой части. Далее эффект В [выражение (8.2)] на- находится при сравнении результатов двух наблюдений в верхней части квадрата с результатами двух наблюдений в нижней ча- части. Наконец, эффект взаимодействия АВ определяется раз- разностью между суммой комбинаций обработок на диагонали квадрата, идущей справа налево [ab и A)], и суммой комбина- комбинаций обработок на диагонали, идущей слева направо (Ь и а). Используя данные примера (см. рис. 8.1), можно получить оценки средних эффектов А = 2-3 2-3 J, • О -(90+100—60—80) = 8,33; (90 + 60—100—80) = —5,00; -(90 + 80—100—60) =1,67. Рассмотрим теперь, как находятся суммы квадратов для Л, В и АВ. Заметим, что в выражении (8.1) для оценивания ис- используется контраст, а именно Контраст A = ab+a — Ъ— A). (8.4) Кемпторн [48], Андерсон и Маклин [1] называют этот кон- контраст общим эффектом Л. Из выражений (8.2) и (8.3) видно, Щ
что и для оценивания В и АВ используются контрасты, более того, эти три контраста ортогональны. Сумму квадратов, соот- соответствующую любому контрасту, можно найти с помощью вы- выражения C.17) как отношение квадрата контраста к произве- произведению числа наблюдений в каждой ячейке на сумму квадратов коэффициентов контраста. Следовательно, -±-[ab + a-b-(\)f; (8.5) tli (8.6) (8.7) являются суммами квадратов для А, В и АВ. Используя данные примера (см. рис. 8.1), можно найти зна- значения сумм квадратов по выражениям (8.5), (.8.6) и (8.7): SSA = -^ = 207,67; SSB = = 75,00; (8.8) 4-3 — 0.00. Общая сумма квадратов находится обычным образом, т. е. У2... (8.9) 2 2 2 2 2 2 fa— В общем случае 55Общ обладает 4га— 1 степенью свободы.. Сумма квадратов ошибки, у которой 4 (га— 1) степеней свободы, находится обычно вычитанием: SS0m=SSo6in — SSa — SSb — SSab- (8.10) Для данных примера (см. рис. 8.1) получаем sso6n;= 2 2 2 fa—ттУ- •= i=i /=i k=\ 4 ¦л 9398,00—9075,00 = 323,00; 55ош=55 общ — SSa — SSb — 55 ав — = 323,00 — 207,67 — 75,00 — 8,33 = 32,00, где использованы значения SSa, SSb и 55ав из соотношений (8.8). Полный ДА приведен в табл. 8.1. Оба главных эффекта являются значимыми на уровне 1%. 172 Часто оказывается удобным записывать комбинации обрабо- обработок в порядке A), a, b и ab, который называется стандартным. Если использовать стандартный порядок, то видно, что при оценивании эффектов коэффициенты контрастов оказываются следующими: А: 1В: АВ: A) — 1 — 1 + 1 а + 1 — 1 j b — 1 + 1 — 1 ab + 1 + 1 + 1 Таблица 8.1 Дисперснонны{Ганализ данных на рис. 8.1 Источник изменчивости А В АВ Ошибка Сумма Сумма квадратов 207,67 75,00 8,33 32,00 323,00 • Значимо при 1 проценте. Степени свободы 1 1 1 8 11 Средний квадрат 207,67 75,00 8,33 4,00 Fo 51,92* 18,75* 2,08 Отметим, что коэффициенты контраста для оценивания эффекта взаимодействия являются произведениями соответствующих ко- коэффициентов для двух главных эффектов. Коэффициенты кон- контрастов всегда равны либо +1, либо —1, и для определения правильного знака для каждой комбинации обработок можно пользоваться таблицей алгебраических знаков (табл. 8.2). Столбцы в этой таблице обозначены А, В (главные эффекты), взаимодействие АВ и /, что соответствует сумме или среднему Таблица 8.2 Алгебраические знаки для вычисления эффектов в плане 22 Комбинация обработок A) а Ь ab Факторный эффект + + А + 1 + 1 В + + АВ + + 173
всего эксперимента; отметим, что в столбце / стоят только знаки плюс. Строки обозначены комбинациями обработок. Для того чтобы найти контраст для оценивания любого эффекта, необ- необходимо умножить знаки в нужном столбце таблицы на соответ- соответствующие комбинации обработок и результаты сложить. Напри- Например, контраст для оценивания А имеет вид—A)+а — b + ab, что согласуется с выражением (8.1). 8.2.2. План 2 Предположим, что исследуются три фактора А, В и С, каж- каждый на двух уровнях. Такому факторному эксперименту соот- соответствует план 23; восемь комбинаций обработок можно пред- представить графически в виде вершин куба (рис. 8.2). Обобщая обозначения 8.2.1, запишем комбинации обработок в стандарт- стандартном порядке: A), a, b, ab, с, ас, be и abc. Вспомним, что эти строчные буквы обозначают также суммы всех наблюдений для данной комбинации обработок. Используя эти восемь комбинаций обработок, мы можем оце- оценить главные эффекты А, В и С, двухфакторные взаимодействия АВ, АС и ВС и трехфакторное взаимодействие ABC. Рассмот- Рассмотрим оценивание главного эффекта А. Эффект А при В и С на нижних уровнях равен [а— A)]/я. Эффект А при В на верхнем и С на нижнем уровнях равен [ab — b]/n. Эффект Л при С на верхнем и В на нижнем уровнях равен [ас — с]/п. Наконец, эф- эффект А при В и С на верхних уровнях равен [abc — bc]/n. Тогда средний эффект А равен просто среднему арифметическому этих четырех величин, т. е. -be]. (8.11) An Это выражение можно представить в виде контраста для срав- сравнения четырех комбинаций обработок на правой грани куба (где А на верхнем уровне) с четырьмя комбинациями обрабо- обработок на левой грани (где А на нижнем уровне): А = — [a + ab -i-ac + abc—A) — b—с—be]. 4ft Аналогичным образом эффект В является контрастом для сравнения четырех комбинаций обработок на задней грани куба с четырьмя комбинациями обработок на передней грани, т. е. ?= — [b + ab + bc + abc— A) — с—с— ас]. (8.12) An Эффект С является контрастом для сравнения четырех ком- комбинаций обработок на верхней грани куба с четырьмя комби- 174 нациями обработок на нижней грани, т. е. 1 С = An [c-f ac + bc + abc—A) — a— b — ab]. (8.13) При С на нижнем уровне эффект взаимодействия АВ опре- определяется средней разностью между эффектами А на двух уров- уровнях В, т. е. A/2га) {[ab — b] — [a — A)]}. При С на верхнем уровне эффект взаимодействия АВ равен (l/2n)X[(abc—be) — Верхний)' ФакторС Нижний.,0-- аЪс 1,Верхнии 'Факторе 0,Huowhuu О 1 Нижний. Верхний Фактор А Рис. 8.2. Комбинации обработок в плане 23. — (ас — с)]. Средний эффект АВ есть просто среднее арифме- арифметическое этих двух величин: ^ (8.14) Подобным образом находим средние эффекты АС и ВС: АС = —-[A) —c-f- b—ab—c-f ac— bc + abc]. (8.15) (8.16) = —[{\) + a—b—ab—c—ac + Эффект ABC определяется как средняя разность между взаимодействием АВ для двух разных уровней С. Так, ABC =-^-{[abc— be] — [ас—с] — [ab—b] + [a— A)]} = An [abc—bc—ac + c—ab + b + a (8.17) В выражениях (8.11) —(8.17) величины в квадратных скоб- скобках представляют собой контрасты относительно комбинаций 175
обработок. По коэффициентам контрастов можно построить таблицу алгебраических знаков (табл. 8.3). Знаки для главных эффектов определяются так: плюс соответствует верхнему, а ми- минус— нижнему уровню фактора. Знаки в остальных столбцах можно находить, перемножая строку за строкой знаки в соот- соответствующих предыдущих столбцах. Например, знаки в столбце АВ получаются перемножением знаков в каждой строке столб- столбцов Л и В. По этой таблице легко построить контраст для лю- любого эффекта. Таблица 8.3 Алгебраические знаки для вычисления эффектов в плане 23 Комбинация обработок 0) а b ab с ас be abc Факторный эффект / А 1 В 1 АВ + 1 1++I 1 + С i АС + 1 + 1 +1 + ВС ++1111++ ABC +11+I++| У табл. 8.3 несколько интересных свойств: 1) Во всех столб- столбцах, кроме столбца /, число знаков плюс и минус совпадает. Сумма произведений знаков в любых двух столбцах равна нулю. 3) Любой из столбцов не меняется при умножении на столбец/, т. е. / является тождественным элементом. 4) Произведение любых двух столбцов совпадает с одним из столбцов таблицы. Например, АХВ=АВ и АВхВ = АВ2 = А. Мы видим, что произ- произведения берутся по модулю 2, а именно, показатель может при- принимать значения только 0 или 1; если он больше единицы, то уменьшается на числа, кратные двум, до тех пор, пока не ста- станет нулем или единицей (это объясняется тем, что число уров- уровней каждого фактора равно двум, т. е. рассматриваются планы типа 2h.— Прим. ред.). Все эти свойства вытекают из ортого- ортогональности контрастов, используемых для оценивания эффектов. Суммы квадратов для эффектов найти нетрудно, поскольку каждому эффекту соответствует контраст с одной степенью сво- свободы. В плане 23 с п репликами сумма квадратов для любого эффекта имеет вид SS = — (КонтрастJ. 8п (8.18) Пример 8.1. Вспомним пример 6.3, в котором исследовалось влияние про- процентного содержания углекислоты, рабочего давления и скорости конвейера на объем газированного напитка в бутылке. Предположим, что использова- 176 лись только два уровня процентного содержания, так, что эксперименту со- соответствует план 23 с двумя репликами. Кодированные данные приведены в табл. 8.4. Таблица 8.4 Данные для задачи об объеме наполнения, пример 6.3 Концентра- Концентрация А 10 12 Давление В 25 Скорость С 200 -3 —1 -4 = A) 0 1 1 = 0 250 | 0 — \=с 2 1 3 = ас 30 Скорость С 200 — 1 0 — 1 = 6 2 3 5 = а6 250 1 1 2= be 6 5 И = abc Используя суммы по комбинациям обработок (см. табл. 8.4), мы можем найти средние эффекты: А = [а — — Ь + ас — с + обс — Ьс] = L -2] =-L.24=3,00; 8 В = [6 — A) + аЬ — а + be — с + abc — ас] = 4ft 1-(-4)-1-(-1)-3] = — -18=2,25; о 8 С = [с + ас + be + abc — (I)— a — 6 — об] = = JL [-1 + 3 + 2+И-(-4)-1-(-1)_5] = —.14 = 1,75; о 8 АВ = [ab — a — b -f(l) + abc — be — ас + с] = An = JL[5-l-(-l) + (_4)+lI-2-3 + (-I)] = —-6=0,75; о 8 АС = [(!) —о + 6 — ab — c + ac— be + abc] = An = -i-[-4-l + (-l)-5-(-l) + 3-2+II] = — -2=0,25; 177
1 4/г = _L[_4+1 — (— 1) — 5 — (— 1) — 3 + 2+1 l] = -i--4= 0,50; in = _L [n_ 2-3 - (-4)] = 4- -4 = 0,50. Суммы квадратов находятся с помощью выражения (8.18): 242 = — = 36,00; 16 б2 = —=2,25; 16 182 142 = —= 20,25; SSC = —= 12,25; 16 16 22 SSAC = —= 0,25; 16 =-7r= I.M. 16 42 = -2—= 1.00 16 Легко проверить, что обычные методы анализа для факторных экспери- экспериментов приводят к этим же значениям сумм квадратов. По отдельным на- наблюдениям находим общую сумму квадратов, 78, 00, и вычитанием, SSOm = = 5,00. Результаты ДА приведены в табл. 8.5. Все три главных эффекта яв- являются значимыми. Таблица 8.5 Дисперсионный анализ данных по объему наполнения Источник изменчивости Концентрация А Давление В Скорость С АВ АС ВС ABC Ошибка Сумма Сумма квадратов 36,00 20,25 12,25 2,25 0,25 1,00 1,00 5,00 78,00 ¦ Значимо при 1 проценте. Степени свободы 1 1 1 1 1 1 1 8 15 Средний квадрат 36,00 20,25 12,25 2,25 0,25 1,00 1,00 0,63 57,14* 32,14* 19,44* 3,57 0,40 1,59 1,59 8.2.3. Общий случай плана типа Iй Методы анализа, которые мы рассматривали до сих пор, мо- могут быть обобщены на случай факторного эксперимента типа 2h, т. е. эксперимента с k факторами на двух уровнях каждый. Ста- Статистическая модель для плана типа 2h включает в себя k глав- главных эффектов, (|) двухфакторных взаимодействий, (*) 178 трех- факторных взаимодействий, ..., одно ^-факторное взаимо- взаимодействие. Таким образом, полная модель плана типа 2к содер- содержит 2h—1 эффект. Здесь также используется система обозна- обозначений комбинаций обработок, введенная ранее. Например, в плане 25 abd обозначает комбинацию обработок с факторами А, В и D на верхних уровнях и факторами С и Е на нижних уровнях. Комбинации обработок можно записать в стандартном порядке, вводя факторы по одному, причем каждый новый фак- фактор последовательно объединяется с предшествующими факто- факторами. Например, стандартный порядок для плана 24 таков: A), а, b, ab, с, ас, be, abc, d, ad, bd, abd, cd, acd, bed и abed. Для того чтобы оценить эффект или найти сумму квадратов для эффекта, мы должны сначала определить контраст, связан- связанный с этим эффектом, что всегда можно сделать с помощью таблицы алгебраических знаков типа табл. 8.2 или 8.3. Однако для значения k, больших 2 или 3, это становится неудобным, и предпочтителен более эффективный метод. В общем случае кон- контраст для эффекта АВ ... К определяется, если правую часть выражения представить в виде суммы Контраст АВ ... ft=(a±l)(ft±l) ...(k±l), (8.19) используя при этом правила обычной алгебры и заменяя в окон- окончательном соотношении 1 на A). Знак в каждом из выражений в скобках выбирается так: если соответствующий фактор вхо- днт в эффект, то берется знак минус, если нет — то знак плюс. Проиллюстрируем использование выражения (8.19) на при- примерах. В плане 23 контраст для АВ равен ' Контраст ав= (а— 1) (Ь — 1) (с+1) = = abc-\-ab + c+ A) — ас — be — а — Ь, а в плане 25 контраст для ABCD имеет вид Контраст abcd= (a— 1) (b — 1) (с— 1) (d— 1) (e+l) = = abode + cde + bde + ade + bee+ace + + ab + A) — a — b — с — abc — d — abd — acd — bed — — ae — be — ce — abce — de — abde — acde — bede. После того как найдены контрасты для эффектов, можно оценить эти эффекты и вычислить суммы квадратов в соответ- соответствии с выражениями К ^ (8.20) АВ ... К = ^- Контрастов .. .к; «2й SS АВ . ¦ . К~' п2к (КонтрастЛв .. . кJ, (8.21) где п — число реплик ДА для плана типа 2к приведены в табл. 8.6. 179
Таблица 8.6 Дисперсионный анализ для плана 2 Источник изменчивости k главных эффектов А В К ( о 1 ДвУхФакТ0Рньгх взаимодействий АВ АС JK ( о I трехфакторных взаимодействий \ / ABC ABD UK 1*1 = 1 fe-факторное взаимодейст- вие ABC ... К Ошибка Сумма Сумма квадратов SSA SSB SSK SSab ssAC ssJK SSabc SSabd SSuk SSabc ... к SS06i4 Степени свободы 1 1 1 1 1 1 1 1 1 ' 1 2*(n-l) п1к — 1 8.2.4. Единственная реплика плана типа lk Даже при сравнительно небольшом числе факторов общее число комбинаций обработок в плане типа 2к велико, например, для плана 25 оно составляет 32, для плана 28 — уже 64 и т. д. Поскольку возможности исследователя обычно ограничены, то ограничено и число проводимых реплик эксперимента. Часто, когда экспериментатору не хочется отбрасывать какие-либо из исходных факторов, удается провести только одну реплику. При единственной реплике эксперимента типа 2к невозможно получить оценку ошибки, т. е. найти средний квадрат ошибки, и создается впечатление, что нельзя проверить гипотезы относи- 180 тельно главных эффектов и взаимодействий. При обычном под- подходе к анализу в этом случае принимается, однако, допущение, что некоторые взаимодействия высоких порядков пренебрежимо малы, и при оценивании ошибки эксперимента можно объеди- объединять их средние квадраты, математические ожидания которых равны о2. Как указывалось в гл. 7, выбор взаимодействий для вычисления среднего квадрата ошибки должен производиться до анализа данных: если после проверки взаимодействий высо- высоких порядков отнести к ошибке взаимодействия, кажущиеся ма- малыми, то это может привести к существенному занижению оценки истинной ошибки эксперимента. Обычно такая проце- процедура рекомендуется для планов типа 2Ь, начиная с 24. Метод объединения средних квадратов для взаимодействий высоких порядков при оценивании ошибки небезупречен с точки зрения статистической теории. Если некоторые из этих взаимо- взаимодействий значимы, то оценка ошибки оказывается завышенной; в результате этого могут остаться необнаруженными другие зна- значимые эффекты и будут выявлены как значимые взаимодейст- взаимодействия, взятые в качестве ошибки. Как правило, вероятно, нера- неразумно считать двухфакторные взаимодействия равными нулю без априорных обоснований. Если большинство двухфакторных взаимодействий мало, то, скорее всего, и все взаимодействия вы- высоких порядков не окажутся значимыми. (Необходимо преду- предупредить— за контрпримерами при применении этих рекоменда- рекомендаций далеко ходить не приходится). При анализе таких планов исследователь должен принимать во внимание как свои знания о природе рассматриваемого яв- явления, так и здравый смысл. Например, если при анализе плана 25 главные эффекты А, В я С, так же как и АВ и АС, велики, то, скорее всего, и ABC может быть велико. Поэтому ABC нельзя включать в число взаимодействий для оценивания ошибки. Такое решение лучше всего принимать до исследова- исследования ABC. Пример 8.2. Единственная реплика плана 24. Некоторый химический про- продукт получается в камере высокого давления. На опытной установке прово- проводится факторный эксперимент для исследования факторов, которые, как считается, могут влиять на скорость фильтрации этого продукта, а именно, температуры (Л), давления (В), концентрации реагента (С) и скорости пе- перемешивания (D). Рассматриваются два уровня каждого фактора; данные одной репликн плана 24 приведены в табл. 8.7. Порядок, в котором произ- производились 16 наблюдений, определялся случайным образом. Полагаем, что взаимодействия трех и четырех факторов пренебрежимо малы, и их можно использовать для оценивания ошибок. ДА данных полу- полученных на опытной установке, приведен в табл. 8.8. Главные эффекты АС и D являются значимыми, так же как и взаимодействия АС и AD. Часто оказывается полезным и другой подход к анализу данных един- единственной реплики плана типа 2\ предложенный Дэниелом [23]. Если данные являются независимыми нормальными переменными, то 2* — 1 оценка эф- эффектов, полученная при анализе для плана типа 2к, подчиняется нормаль- нормальному распределению. Обнаружение значимых эффектов облегчается, если 181
оценки эффектов нанести на нормальную вероятностную бумагу'. Эффекты, которые не являются значимыми, т. е. обусловленные в первую очередь слу- случайной ошибкой, должны иметь вид нормального распределения. Таблица 8.7 Данные о скорости фильтрации для эксперимента с опытной установкой Do Di А„ Bu Со 45 43 с, 68 75 Si Со 48 45 с\ 80 70 А, Во с„ 71 100 с, 60 86 в, с. 65 104 с, 65 96 Таблица 8.8 Дисперсионный анализ даиных опытной установки Источник изменчивости А в \С D АВ АС AD ВС BD CD Ошибка Сумма Сумма квадратов 1870,56 39,06 390,06 855,56 0,06 1314,06 1105,56 22,56 0,56 5,06 127,84 5730,94 * Значимо прн 5 процентах. •* Значимо прн 1 проценте. Степени свободы 1 1 1 1 1 1 1 1 1 1 5 15 Средний квадрат 1870,56 39,06 390,06 855,56 0,06 1314,06 1105,56 22,56 0,56 5,06 25,57 1 0 73,15** 1,53 15,25* 33,46** <1 51,39** 43,24** <1 <1 <1 Расположим оценки эффектов в порядке возрастания и на- нанесем на нормальную вероятностную бумагу /-ю из этих вели- величин с ординатой Pj=(j — 0,5)/B" — 1), ;=1, 2, . .., 2k— 1. На этом графике эффекты, которые пренебрежимо малы, будут группироваться около прямой линии, а значимые эффекты — вдали от нее. Затем можно объединить пренебрежимо малые эффекты для получения оценки ошибки. 1 Нормальная вероятностная бумага — это бумага, на которую нанесена масштабная сетка таким образом, что функция нормального распределения изображается прямой линией. (Правила построения и применения вероятност- вероятностных сеток изложены в ГОСТ 11.008—75.— Прим. ред.). 182 Продемонстрируем этот метод анализа на данных примера 8.2. Табл. 8.9 представляет собой таблицу алгебраических знаков для коэффициентов контрастов в плане 24. С помощью этих контрастов можно найти оценки 15 факторных эффектов: / 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Эффект А AD D С ABD В ВС ABC ABCD АВ BD CD A CD BCD AC Оценка 21,67 16,63 14,63 9,88 4,13 3,13 2,38 1,88 1,38 0,13 —0,38 —0,43 —0,63 —2,63 —18,13 (i - o,5)/ 0,9667 0,9000 0,8333 0,7667 0,7000 0,6333 0,5667 0,5000 0,4333 0,3667 0,3000 0,2333 0,1667 0,1000 0,0333 Упорядоченные эффекты, нанесенные на нормальную вероят- вероятностную бумагу, представлены на рис. 8.3. Из этого рисунка видно, что все малые эффекты лежат приблизительно на одной Таблица 8.9 Постоянные контрастов для плана 24 A) a b ab с ас be abc d ad bd abd cd acd bed abed •к + + + + + + + + _ + + + + + + + + + — + + + + + -j- + _ — — + + + + + 4- +  + + — — + + + + + + + + — + + + -j- + + "Ч + + + + + + + + — + -j- + + + -j- 4- + q "Ч + + + + -J- 1 -f- -j- + Q + + 4- t + + + Q  + 1 + _ + 4- 4- + Q + 4- + + _ + 4- 4- + Q U  4- + + 4- i 4- i^ 4- 4- + Q + 4- 4- \ 4- \ 4- i 4- + Q Cj o> *4 + _ 4- 4- 4- i _L J 4- I _L 1 + прямой, а большие эффекты — вдали от нее. Поскольку среди больших эффектов нет взаимодействий трех и четырех факто- факторов, то эти эффекты можно объединить для получения оценки ошибки, что и было сделано в примере 8.2. 183
С помощью рис. 8.3 можно дать и иную интерпретацию ре- результатов. Поскольку В (давление) не является значимым, то мы можем исключить этот фактор из эксперимента, получая тем самым эксперимент типа 23 с факторами Л, С и О и двумя репликами. Это видно из табл. 8.9, поскольку столбцы для А, С и D становятся теперь уровнями в плане 23. ДА данных при таком упрощающем допущении приведен в табл. 8.10. Выводы, • l ю -1 /> -10 I -5 i i / i 1 I / f 7 t. /. 5 • С 10 • / m Л 15 • i PO \ ? 0,95 0,90 0,70 0,50 0,20 0,10 Рис. 8.3. Упорядоченные эффекты для факторного плана 24 в при- примере 8.2. Таблица 8.10 Дисперсионный анализ для плана 23 (факторы (А, С и D) Источник изменчивости А с D АС AD CD ACD Ошибка Сумма • Значимо Сумма квадратов 1870,56 390,06 855,56 1314,06 1105,56 5,06 10,56 179,52 5730,94 при 1 проценте. Степени свободы 8 15 Средний квадрат 1870,56 390,06 855,56 1314,06 1105,56 5,06 10,56 22,44 Р г 0 83,36* 17,38* 38,13* 58,56* 49,27* <1 <1 184 следующие из этого анализа, существенно не отличаются от тех, к которым мы пришли в примере 8.2. В общем случае, если при единственной реплике плана типа 2ft можно отбросить h(h<.k) факторов, то исходные данные будут соответствовать полному двухуровневому факторному эксперименту для оставшихся k—h факторов с 2h репликами. 8.2.5. Алгоритм Йейтса для плана типа 1к Иейтсом [70] предложен очень простой метод оценивания эф- эффектов и нахождения сумм квадратов в плане типа 2k. Этот ме- метод лучше всего изучать на числовом примере. Рассмотрим данные эксперимента 23 в примере 8.1 (табл. 8.11). Комбинации обработок всегда записываются в стандартном по- порядке, причем столбец, озаглавленный «Отклик», содержит со- соответствующее наблюдение (или сумму всех наблюдений) для данной комбинации обработок. Первая половина столбца A) получается сложением последовательных пар соседних значе- значений отклика. Вторая половина столбца A) также получается сложением последовательных пар соседних значений- отклика, но с изменением знака на противоположный у первого числа пары. Например, в столбце A) получаем 5 = — (—4)+ 1,6 = = —(—1) +5 и т. д. Таблица 8.11 Алгоритм Йейтса для данных примера 8.1 Комбинация обработок (О a b ab с ас be abc Отклик —4 1 — 1 5 — 1 3 2 11 A) —3 4 2 13 5 6 4 9 B) 1 15 11 13 7 11 1 5 C) 16 24 18 6 14 2 4 4 Эффект / A В AB С AC ВС ABC Оценка эффекта C)/rt2*—I 3,00 2,25 0,75 1,75 0,25 0,50 0,50 Сумма квадратов CJ,n2* 36,00 20,25 2,25 12,25 0,25 1,00 1,00 Столбец B) получается из столбца A) таким же образом, как столбец A) из столбца «Отклик». Аналогично столбец C) получается из столбца B). В общем случае плана типа 2к нужно построить k столбцов такого вида. Столбец C) [в общем случае столбец (k)\ представляет собой контраст для эффекта, обозначенного строчными буквами в начале строки. Далее для получения оценки эффекта нужно разделить числа в столбце C) на величину n2k~i (в нашем примере n2k-i = 8). Наконец, 185
суммы квадратов для эффектов получаются, если числа в столбце C) возвести в квадрат и разделить на величину n2k (в нашем примере n2fe=16). Оценки эффектов и суммы квадратов, полученные с помощью алгоритма Иейтса для данных примера 8.1, согласуются с ре- результатами, полученными в этом примере обычным методом. Отметим, что число на пересечении столбца C) [в общем слу- случае столбца (k)] и строки, соответствующей A), всегда равно общей сумме всех наблюдений. В алгоритме Иейтса, несмотря на его очевидную простоту, удивительно легко допускаются числовые ошибки, поэтому при выполнении процедуры необходимо быть крайне внимательным. Для частичной проверки правильности вычислений можно ис- использовать то обстоятельство, что сумма квадратов элементов /-го столбца в 2^ раз превосходит сумму квадратов элементов столбца «Отклик». Заметим, однако, что такая проверка не вы- выявляет ошибки в знаках элементов /-го столбца. Другие методы проверки рассматриваются Гудом [37, 38], Рейнером [57], Кемп- торном [48] и Дейвисом [24]. 8.3. АНАЛИЗ ФАКТОРНОГО ПЛАНА ТИПА 3* 8.3.1. Обозначения для ппанов типа 3'! Рассмотрим теперь анализ для планов типа 3fe, т. е. планов факторных экспериментов с k факторами на трех уровнях каж- каждый. Факторы и взаимодействия будут обозначаться заглавными буквами. Без потери общности три уровня факторов можно на- называть нижним, промежуточным и верхним и обозначать их цифрами 0, 1 и 2 соответственно. Обозначение каждой комби- комбинации обработок в плане типа 3h будет состоять из k цифр, причем первая из них указывает на уровень фактора А, вто- вторая— уровень фактора В, . . . и k-я цифра — уровень фактора К. Например, в плане З2 цифры 00 обозначают комбинацию обра- обработок с факторами Л и В на нижних уровнях, а 01—с А на нижнем уровне и В на промежуточном. Такая система обозначений могла бы применяться и в пла- планах типа 2k; основная причина, почему это не делается,— рас- распространенность в литературе системы A), a, b, ab, ... Однако цифровая система обозначений, используемая в планах типа 3fe, обладает тем преимуществом, что она легко обобщается на планы других факторных экспериментов. 8.3.2. План З2 Простейшим среди планов типа 3й является план З2, т. е. план с двумя факторами на трех уровнях каждый. Комбинации обработок для этого плана приведены на рис. 8.4; их число со- 186 ставляет 32 = 9, поэтому им соответствует восемь степеней сво- свободы. Главные эффекты А и В обладают двумя степенями сво- свободы каждый, а взаимодействие АВ — четырьмя. При п репли- репликах общее число степеней свободы оказывается равным пЗ2— 1, из них 32(rt— 1) приходится на ошибку. Суммы квадратов для А, В и АВ можно найти обычными методами анализа для факторных экспериментов, обсуждав- обсуждавшимися в гл. 6. В качестве альтернативы в 8.3.5 рассматрива- рассматривается обобщение алгоритма Иейтса на планы типа 3h. Сумму квадратов для любого главного эффекта можно разбить на ли- линейный и квадратический компоненты с одной степенью сво- Фактор А Нижний Промежуточ- Верхний Нижний. 0 I Промежуточный 1 Верхний 2Y- 1 ныи 00 01 02 Т 10 11 20 21 12 22 Рис. 8.4. Комбинации обработок в плане З2. боды каждый; при этом, как показано в гл. 6, используются ортогональные контрасты. Конечно, такое разбиение имеет смысл для количественных факторов с равноотстоящими уров- уровнями. В качестве иллюстрации рассмотрим задачу об эффективной продолжительности использования режущего инструмента из примера 6.5. Этот эксперимент ставился для исследования влия- влияния скорости резания и угла заточки на продолжительность ис- использования инструмента в станке с цифровым управлением. Было выбрано по три значения скорости и угла. Для удобства ДА для этого плана З2 с двумя репликами повторен в табл. 8.12 (частные вопросы вычисления сумм квадратов и разбиения глав- главных эффектов на линейные и квадратические компоненты см. В параграфе 6.6). Разбиение двухфакторного взаимодействия АВ на компо- йенты можно построить двумя способами. При первом из них ЛВ разбивается на четыре компонента с одной степенью сво- свободы каждый, которые соответствуют АВлХя, АВл+т, АВКБХ л 187
и ЛВквхкв- Как было показано в примере 6.5, для этого исполь- используются ортогональные контрасты, причем для наблюдений про- продолжительности использования инструмента оказалось, что ^влхл =8,00, SSABjlxKs =42,67, SS/4Bkbxji=2>67hSS/,Bkbxkb = = 8,00. Поскольку такое разбиение ортогонально, то отметим, что SSAB = SSABjlXJl +SSAB]lXKB +SSABrbXji +SSab kbxkb. Дисперсионный анализ для примера 6.5 Источник изменчивости Сумма квадратов Степени свободы Средний квадрат Угол А Мл) Мкв) Скорость В (Вл) В) (ВКв) . ._ Взаимодействие АН Ошибка Сумма 24,33 (8,33) A6,00) 25,33 B1,33) D,00) 61,34 13,00 124,00 2 1 1 2 1 1 4 9 17 12,17 (8,33) A6,00) 12,67 B1,33) D,00) 15,33 1,44 8,45* 5,78* 11,11* 8,80* 14,81* 2,77 10,64* • Значимо при 5 процентах. Второй способ основан на ортогональных латинских квадра- квадратах. Рассмотрим суммы по комбинации обработок для данных примера 6.5 (на рис. 8.5 они приведены в кружках). Два фак- фактора, А и В, соответствуют строкам и столбцам латинского квадрата 3X3. На рис. 8.5, а, б приведены два латинских квад- квадрата конкретного вида, наложенные на суммы по ячейке. Эти два латинских квадрата ортогональны, т. е. при наложении их друг на друга каждая буква первого квадрата встречается с каждой буквой второго квадрата один и только один раз. Суммы по буквам в квадрате (см. рис. 8.5, а) составляют Q = 18, R = —2 и S = 8, а сумма квадратов для них A82+(—2)г+82)/ /C-2) —242/(9-2) =33,34, ей соответствуют две степени свободы. Для квадрата (см. рис. 8.5,6) получаем Q = 0, R=\8 и S = 6; сумма квадратов для букв @2+182 + 62)/C-2) —242/(9-2) = = 28,00 с двумя степенями свободы. Отметим, что сумма этих компонентов 33,34+ 28,00 = 61,34=SSAb и обладает 2 + 2 = 4 сте- степенями свободы. В общем случае сумма квадратов, полученная из квадрата (см. рис. 8.5,а), называется АВ— компонентом взаимодействия, а сумма квадратов, полученная из квадрата (см. рис. 8.5,6), АВ2 — компонентом взаимодействия, каждому из этих компо- компонентов соответствует по две степени свободы. Такая термино- терминология используется потому, что, если обозначить уровни @, 1, 188 2) для А я В соответственно Х\ и х2, то оказывается, что буквы распределяются по ячейкам следующим образом: Квадрат (рис. 8,5, а) Q : *! + х2 = 0 (мод 3) R : хх + хг = 1 (мод 3) S : *! -f Ч = 2 (мод 3) Квадрат (рис. 8,5, б) Q : *! + 2х2 = 0 (мод 3) R : *! + 2х2 = 1 (мод 3) S : хх + 2х2 = 2 (мод 3) Заметим, например, что центральная ячейка квадрата рис. 8.5, а соответствует Xi = 1 и х2= 1, поэтому ati +¦ 2лг2 = 1 + 2• 1 = = 3 = 0 (мод. 3) и в центральной ячейке должно стоять Q. При рассмотрении выражений вида АРВЧ условимся считать, что по- I Фактор В 0 7 2 5 6) О фактор В О 1 1 Q 5 Рис. 8.5. Суммы по комбинациям обработок из примера 6.5 с нало- наложенными на них ортогональными латинскими квадратами. казатель степени первой буквы может быть только единицей; в противном случае все выражение возводится в квадрат, и показатели степеней приводятся по модулю 3. Например, А2В эквивалентно АВ2, поскольку Л2В= (Л2ВJ=Л452=ЛВ2: Эти два компонента взаимодействия не имеют реального физического смысла, и их значения обычно не приводятся в таблице ДА. Однако такое довольно произвольное разбиение взаимодействия АВ на два ортогональных компонента с двумя степенями сво- свободы каждый оказывается очень полезным при построении более сложных планов. Кроме того, связи между компонентами АВ и АВ2 взаимодействия и суммами квадратов для ЛВлхл, ^^лхкв, АВквхп и ЛВквхкв не существует. Компоненты АВ и АВ2 взаимодействия можно найти и дру- другим способом. Рассмотрим суммы по комбинациям обработок в каком-либо из квадратов, приведенных на рис. 8.5. Если сло- сложить данные вниз по диагонали слева направо, то получим суммы —3 + 4—1=0, —3+10—1 = 6 и 5+11+2=18. Сумма квадратов для этих сумм составляет 28,00 (АВ2). Аналогично суммы вниз по диагонали справа налево оказываются равными 5 + 4—1 = 8, —3 + 2—1=—2 и —3 + 11 + 10=18, причем сумма квадратов для них равна 33, 34 (АВ). Пейте называл эти 189
компоненты взаимодействия компонентами /и/ соответственно. Мы будем использовать оба эквивалентных обозначения, т. е. 1(АВ)АВ* и ]{АВ)=АВ. 8.3.3. План 3 Предположим теперь, что в факторном эксперименте иссле- исследуются три фактора (Л, В и С) на трех уровнях каждый. Это план З3; сумма организации эксперимента и обозначения ком- комбинаций обработок приведены на рис. 8.6. На 27 комбинаций обработок приходится 26 степеней свободы. Каж- Каждый главный эффект об- обладает двумя, а каждое двухфакторное взаимо- взаимодействие — четырьмя сте- степенями свободы; трех- факторное взаимодей- взаимодействие обладает восемью степенями свободы. При п репликах общее чи- число степеней свободы со- составляет яЗ3—1, из них З3 (п—1) приходится на ошибку. Суммы квадратов можно найти с помощью стандартных методов анализа для факторных экспериментов. Кроме ящ Фактов А Рис. 8.6. Комбинации обработок в плане З3 эксперимен р того, если факторы количественные и с равноотстоящими уров- уровнями, то главные эффекты можно разбить на линейные и квад- ратические компоненты с одной степенью свободы каждый. Далее, двухфакторные взаимодействия можно разложить на ли- линейный-линейный, линейный-квадратический, квадратический- линейный и квадратическии-квадратическии эффекты. Наконец, трехфакторное взаимодействие ABC можно разбить на восемь компонентов с одной степенью свободы каждый, соответствую- соответствующих линейному-линейному-линейному, линейному-линейному- квадратическому и т. д. эффектам. Такое разбиение для трех- факторного взаимодействия в общем случае не очень полезно. Таким же образом можно разбить двухфакторные взаимо- взаимодействия на их компоненты I я J, которые обозначаются АВ, АВ2, АС, АС2, ВС и ВС2 и обладают двумя степенями свободы каждый. Как и в плане З2, эти компоненты не имеют физиче- физического смысла. Трехфакторное взаимодействие ABC можно разбить на че- четыре ортогональные компоненты с двумя степенями свободы 190 каждый; они обычно называются компонентами f, I, 7 и Z взаимодействия. Их обозначают также АВ2С2, АВ2С, ABC2 и ABC соответственно. Эти обозначения эквивалентны, т. е. W(ABC)=AB2C2, Х(АВС)=АВ2С, У(ABC) = ABC2 и Z{ABC) = АВС Отметим, что показатель степени первой буквы может быть равен только единице. Компоненты W, X, Y и Z, так же как / и /, не допускают реальной интерпретации; однако они полезны при построении более сложных планов. Пример 8.3. При разливе сиропа для безалкогольных напитков в метал- металлические сосуды емкостью 5 галлонов A9 л) представляет интерес количе- количество сиропа, которое теряется из-за вспенивания. Предполагается, что на Рис. 8.7. Двухфакторные взаимодействия для примера 8.3. вспенивание влияют три фактора: конфигурация выпускного отверстия (А), оператор (В) и рабочее давление (С). Выбраны три выпускных отверстия, три оператора и три давления; кодированные данные двух реплик фактор- факторного плана З3 приведены в табл. 8.13. ДА данных по потерям сиропа приведен в табл. 8.14. Суммы квадратов были найдены обычными методами. Мы видим, что факторы — операторы и рабочее давление — значимы на уровне одного процента. Значимыми явля- являются также все три двухфакторных взаимодействия. Графический анализ двухфакторных взаимодействий приведен на рис. 8.7. Оператор 1 превосхо- превосходит операторов 0 и 2; выпускное отверстие типа 1 и высокое давление B), как оказывается, наиболее эффективны при снижении потерь сиропа на вспенивание. Продемонстрируем разбиение взаимодействия ABC на че- четыре ортогональных компонента, обладающих двумя степенями свободы каждый, на числовых данных примера 8.3. Описание общей процедуры приводится Кокреном и Коксом [21], Дейви- Дейвисом [24] и Хиксом [41]. Выберем сначала какие-нибудь два из трех факторов, скажем, А я В, я найдем суммы для компонен- 191
Таблица 8.13 Данные по потерям сиропа для примера 8.3 (кодировка: см3 — 70) Давление С 0 1 2 1 о 0 -35 -25 100 75 4 5 • -45 -60 —10 30 —40 —30 » -40 15 80 54 31 36 Зыпускиое отверстие А Оператор » 17. 24 55 120 —23 5 1 -65 —58 -55 —44 -64 —62 в 20 4 ПО 44 -20 -31 2 ° -39 -35 90 113 —30 -55 1 -55 —67 -28 —26 -61 -52 2 15 —30 ПО 135 54 4 Таблица 8.14 Дисперсионный анализ даиных по потерям сиропа Источник изменчивости Отверстие А Оператор В Давление С АВ АС ВС ABC Ошибка Сумма Сумма квадратов 993,77 61 190,33 69 105,33 6 300,90 7 513,90 12 854,34 4 628,76 11515,50 174 102,83 Степени свободы 2 2 2 4 4 4 8 27 53 Средний квадрат 496,89 30595,17 34 552,67 1575,22 1878,47 3 213,58 578,60 426,50 1,17 71,74** 81,01** 3,69* 4,40** 7,53** 1,36 • Значимо при 5 процентах. •* Значимо при 1 проценте. тов I я J взаимодействия АВ на каждом уровне третьего фак- фактора С. Эти вычисления приведены ниже. В 0 1 2 А 0 -60 — 105 -25 1 41 -123 24 2 —74 —122 -15 Суммы / -198 -106 -155 -222 —79 -158 192 О 1 2 0 1 2 185 20 134 9 -70 67 175 -99 154 -28 — 126 -51 203 -54 245 331 255 377 238 440 285 —85 —59 —144 —113 —74 —40 58 —206 —155 Суммы для 1{АВ) и J(АВ) объединяются затем в двухфактор- ные таблицы с фактором С, после чего находятся суммы / и / по диагоналям этих новых таблиц. I (АВ) Суммы I J J (АВ) Суммы / J 0 -198 -106 -155 -149 41 1 331 255 377 212 19 2 —59 —74 —206 102 105 -222 —79 —158 63 138 238 440 285 62 4 -144 —40 —155 40 23 В этих таблицах суммы / и / по диагоналям являются, в сущ- сущности, суммами, представляющими величины /[/(АВ)ХС]= =АВ2С2, J[I(AB)xC]=AB2C, I[J(AB)xC]=ABC2 и J[J(AB)X ХС] = АВС, или W, X, Y и Z компоненты ABC. Суммы квадра- квадратов находятся обычным образом, т. е. / [/ (АВ) х С] = АВ2С2 = W (ABC) = Ю22) — • 1652 = 3804,11; 54 J [I (АВ) х С] = АВгС = X (ABC) = —D12+ 192+ 1052) -. 1652 = 221,77; 18 54 / [J (АВ) х С] = ABC2 = Y (ABC) = — 18 L_. 1652= 18,77; 54 J [J (АВ) xC] = ABC = Z (ABC) = 18 A382 + 232) --1652 = 584,11. 54 Еще раз подчеркнем, что хотя это и ортогональное разбие- разбиение SSAbc, оно обычно не приводится в таблице ДА. В гл. 9 обсуждаются случаи, когда возникает необходимость вычисле- вычисления одного или более из этих компонентов. 8.3.4. Общий случай плана типа 3'! Идеи, использованные в планах З2 и З3, легко обобщаются на случай плана факторного эксперимента типа 3fe, т. е. плана с факторами на трех уровнях каждый. Для комбинации обра- Д. К. Монтгомери 193
боток применима обычная цифровая система обозначений, на- например, 0120 представляет собой комбинацию обработок в плане З4 с А и D на нижних уровнях, В на промежуточном и С на верхнем уровнях. Общее число комбинаций обработок со- составляет 3fe, им соответствует 3h— одна степень свободы. Эти комбинации обработок позволяют найти суммы квадратов для k главных эффектов (с двумя степенями свободы каждый), {*) двухфакторных взаимодействий (с четырьмя степенями свободы каждое), ..., одного /г-факторного взаимодействия с 2й степенями свободы. При п репликах общее число степеней свободы составляет пЗк — 1, причем 3А(«—1) из них прихо- приходится на ошибку. ДА приведен в табл. 8.15. Таблица 8.15 Дисперсионный анализ 3* Источник изменчивости Сумма квадратов Степени свободы Главных эффектов А В К двухфакторных взаимодействий АВ АС JK (о) трехфакторных взаимодействий ABC ABD UK (lj\ = 1 й-факторное взаимодействие ABC. . . К Ошибка Сумма SSA SSB SSK SSab SSac SSabc SS SSAbc- • -K 3* (я пЪк 194 Суммы квадратов для эффектов и взаимодействий нахо- находятся методами анализа, обычными для факторных эксперимен- экспериментов. Как правило, разложение взаимодействий третьего и бо- более высокого порядков не проводится. Однако у любого /г-фак- /г-факторного взаимодействия есть 2h~l ортогональных компонентов с двумя степенями свободы каждый. Например, четырехфак- торное взаимодействие ABCD разбивается на 24~1 = 8 ортого- ортогональных компонентов с двумя степенями свободы каждый, обо- обозначаемых ABCD2, ABCD, AB2CD, ABCD, ABCD2, AB2CD, ABZCD2 и AB2C2D2. При написании этих компонентов отметим, что показатель степени первой буквы равен только единице. Если это не так, то нужно все выражение возвести в квадрат и показатели при- привести по модулю3. Рассмотрим, например,A2BCD = (A2BCDJ = =A4B2C2D2=AB2C2D2. Эти компоненты взаимодействия не имеют физического смысла, но оказываются полезными при по- построении более сложных планов. Число комбинаций обработок в одной реплике плана типа 3k резко возрастает с увеличением k, например, для плана З3 оно составляет 27, для плана З4 — 81, для плана З5—243 и т.д. Поэтому часто проводится только одна реплика эксперимента типа 3ft, а для получения оценки ошибки объединяются взаимо- взаимодействия высоких порядков. Если, например, взаимодействия трех и более факторов пренебрежимо малы, то одна реплика плана З3 дает 8 степеней свободы для ошибки, а одна реплика плана З4 — 48. 8.3.5. Алгоритм Йейтса для плана типа 3/! Алгоритм Йейтса можно модифицировать для использования в планах типа Зк. Проиллюстрируем эту процедуру с помощью данных примера 6.1 (см. табл. 6.6). Этот эксперимент по плану З2 проводился для исследования влияния материала (А) и тем- температуры (В) на выходное напряжение батареи аккумуляторов; было сделано я = 4 реплики. Процедура приведена в табл. 8.16. Комбинации обработки записаны в стандартном порядке, т. е. факторы вводятся по од- одному, причем каждый уровень последовательно сочетается с каждым набором уровней факторов, стоящих выше в таблице. (Стандартный порядок для плана З3 был бы таким: 000, 100, 200, 010, ПО, 210, 020, 120, 220, 001, ...). В столбце «Отклик» поме- помещены суммы всех наблюдений для соответствующей комбинации обработок. Величины в столбце A) рассчитываются следующим обра- образом. Первая треть столбца образуется из сумм каждого из трех последовательных наборов по три числа в столбце «Отклик». Вторая треть — из разностей третьего и первого наблюдений в тех же наборах по три величины; такая операция соответ- "* 195
ствует нахождению линейного компонента эффекта. Последняя треть столбца состоит из разностей суммы первого и третьего числа и удвоенного второго числа в каждом наборе по три ве- величины; при этом находится квадратический компонент. На- Например, второе, пятое и восьмое числа в столбце A) получа- получаются соответственно как 229 + 479 + 583=1291, —229 + 583 = 354 и 229 — 2479 + 583=—146. Аналогичным образом столбец B) получается из столбца A). В общем случае необходимо по- построить k таких столбцов. Таблица 8.16 Алгоритм Йейтса для плана З2 в примере 6.1 Комбина- Комбинация обрабо- обработок 00 10 20 01 11 21 02 12 22 Отклик 539 623 576 229 479 583 230 198 342 A) 1738 1291 770 37 354 112 -131 -146 176 B) 3799 503 —101 —968 75 307 -74 -559 337 Эффект — Ал ^Кв 0Л ^ВЛХЛ ЛВКвХЛ бКв Л^ЛхКв ^¦°КвХКв Делитель — 2!x3!x4 2ХХ32Х4 2xx3!x4 22х3°х4 22ХЗХХ4 2xx32x4 22х3!х4 22х32х4 Сумма квадратов — 10 542,04 141,68 39 042,66 351,56 1963,52 76,06 6 510,02 788,67 Столбец «Эффект» можно определить, преобразовав комби- комбинации обработок из левой части таблицы в соответствующие эффекты, так, 10 переходит в линейный эффект А, т. е. Ал, а 11—в компонент АВЛХл взаимодействия АВ. Элементы столбца «Делитель» находятся по их общему выражению вида 2гЗ'я, где г — число факторов в рассматриваемом эффекте, t — число факторов в эксперименте, уменьшенное на число линей- линейных компонентов в этом эффекте, а п — число реплик. На- Например, делитель, соответствующий Вл, имеет вид 2'ХЗ'Х Х4 = 24. Для получения сумм квадратов нужно элементы столбца B) возвести в квадрат и разделить на соответствующие числа из столбца «Делитель». Теперь, если оба фактора А я В коли- количественные, столбец сумм квадратов содержит все необходи- необходимые величины для построения таблицы ДА. Однако в нашем примере фактор А является качественным, поэтому разбиение эффекта А на линейный и квадратический компоненты не имеет смысла. Для вычисления общей суммы квадратов используются 196 отдельные наблюдения; сумма квадратов ошибки находится вы- вычитанием. Результаты ДА приведены в табл. 8.17. Сравнение ее с табл. 6.18 показывает, что при помощи обычных методов ДА были получены, в сущности, те же результаты. Интерпретация дан- данных этого эксперимента дана в примерах 6.1 и 6.4. Таблица 8.17 Дисперсионный анализ для плана З2 в примере 6.1 Источник изменчивости А = Ал + ЛКв В, Температура (ВЛ) (ВЫ АВ (АХВЛ) = АВЛХЛ+АВКЪХЛ) (А X ВКв=АВЛхКв+АВКвхКв) Ошибка Сумма * Значимо при 5 процентах. ** Значимо при 1 проценте. Сумма квадратов 10 683 •, 72 39 118,72 C9 042,67) G6,05) 9613,77 B 315,07) G 298,70) 18230,75 77 646,96 Степени свободы 2 2 1 1 4 2 2 27 35 Средний квадрат 5341,86 19 558,36 39 042,67 76,05 2 403,44 1 157,54 3 649,75 675,21 Fo 7,91" 28,97** 57,82** 0,12 3,56* 1,71 5,41 * 8.4. ЗАДАЧИ 8.1. Инженера интересует влияние скорости резания (А), геометрии резца (В) и угла резания (С) на эффективную продолжительность исполь- использования инструмента. Выбираются два уровня каждого фактора и прово- проводятся три реплики факторного плана 23. Проведите анализ следующих дан- данных этого эксперимента: Комбинация обработок (О а b ab Реплика I 22 32 35 55 II 31 43 34 47 III 25 29 50 46 Комбинация обработок С ас be a be Реплика I 44 40 60 39 II 45 37 50 41 III 38 36 54 47 8.2. Инженер по организации производства проводит эксперимент для исследования влияния двух видов упаковки продукции на время ее транс- транспортировки. Двум рабочим предлагается перевезти 40 ящиков продукции 197
с помощью ручной тележки стандартного типа на расстояние 15 м и раз- разместить их на стеллажах. Результаты четырех реплик факторного плана 22 приведены ниже. Проведите анализ этих. данных и сделайте соответствую- соответствующие выводы. Вид упаковки 1 2 Рабочий 1 5,12 4,98 4,95 4,27 4,89 5,00 4,43 4,25 6,65 5,49 5,28 4,75 6,24 5,55 4,91 4,71 8.3. Данные, приведенные ниже, представляют собой результаты един- единственной реплики плана 25 эксперимента по исследованию предела прочности резины. Факторами являются формула смеси (А), время (В), лаборатория (С), температура (Д) и давление (?). Проведите анализ данных в предпо-. ложеиии, что взаимодействия трех и более факторов пренебрежимо малы. A)= 7 а= 9 6 = 34 об = 55 с= 6 ас= 10 6с=30 abc=50 ad=\\ 6d=30 abd=Q\ cd = 8 acd=\\ bcd=3A abed = 60 e= 8 ae=12 be=35 a6e=62 ce= 5 ace= 12 6ce = 25 abce=55 de-10 ade=15 6de=40 abde=65 cde=l5 acde = 20 bcde=34 abode=65 8.4. Нанесите оценки эффектов для задачи 8.3 на нормальную вероят- вероятностную бумагу. Оказывается ли справедливым допущение, что взаимодей- взаимодействия трех и более факторов пренебрежимо малы? Меняет ли это вашу интерпретацию данных? 8.5. При исследовании выхода процесса рассматривались четыре фактора на двух уровнях каждый. Ниже приведены данные единственной реплики плана 24 для факторов: время (А), концентрация (В), давление (С) и тем- температура (D). Проведите анализ этих данных в предположении, что взаимо- взаимодействия трех и более факторов пренебрежимо малы. Do Аа В„ с0 12 10 с« 17 19 в, С„ 13 13 С 20 17 А, В„ С„ 18 25 С 25 21 в, с„ 16 24 С 15 23 8.6. Один из главных факторов в задаче 8.5, вероятно, не является зна- значимым. Преобразуйте единственную реплику плана 2* из этой задачи в две реплики плана 23 для трех соответствующих факторов. 8.7. Исследуется влияние концентрации проявителя (А) и времени про- проявления (В) на плотность негатива, причем используется по три уровня каждого фактора. Ниже приведены данные четырех реплик факторного экс- эксперимента З2. Проведите анализ этих данных с помощью стандартных мето- методов для факторных экспериментов. 198 Концентрация проявителя 1 2 3 Время проявления, мии 10 | 15 0 5 4 7 00 -J 2 4 6 5 10 7 1 4 -JO ooo 3 2 -JOO 10 7 18 2 4 ooo 12 9 5 6 10 5 ooo 8.8. Примените алгоритм Иейтса для анализа данных задачи 8.7. 8.9 Вычислите компоненты / и / двухфакторного взаимодействия в за- задаче 8.7. 8.10. Исследуется влияние трех различных видов упаковки продукции А, трех различных типов стеллажей для ее хранения В на время, необходимое для установки на стеллажи десяти ящиков продукции. В эксперименте за- заняты трое рабочих (фактор С). Данные двух реплик факторного плана З3 приведены ниже. Проведите анализ этих данных и сделайте выводы. Рабочий 1 2 3 Вид упаковки 1 2 3 1 2 3 1 2 3 Реплика I Тип стеллажа 1 | 2 | 3 3,45 4,07 4,20 4,80 4,52 4,96 4,08 4,30 4,17 4,14 4,38 4,26 5,22 5,15 5,17 3,94 4,53 4,86 5,80 5,48 5,67 6,21 6,25 6,03 5,14 4,99 4,85 Реплика II Тип стеллажа 1 3,36 3,52 3,68 4,40 4,44 4,39 3,65 4,04 3,88 2 4,19 4,26 4,37 4,70 4,65 4,75 4,08 4,08 4,48 3 5,23 4,85 5,58 5,88 6,20 6,38 4,49 4,59 4,90 199
ГЛАВА ДЕВЯТАЯ СМЕШИВАНИЕ 9.1. ВВЕДЕНИЕ Существует много задач, для которых невозможно провести полную реплику факторного эксперимента в одном блоке, пред- представляющем собой один день, одну однородную партию сырья или одну лабораторию и т. п. Смешивание — это метод плани- планирования факторных экспериментов в виде блоков, размеры ко- которых меньше числа комбинаций обработок в одной реплике. При применении этого метода информация относительно эффек- эффектов некоторых обработок (обычно взаимодействий высокого по- порядка) становится неотличимой от информации об эффекте блоков или смешанной с ней. В данной главе мы остановимся на методах смешивания для факторных экспериментов типов 2h и 3й. Отметим, что хотя рассматриваемые планы являются неполноблочными, поскольку каждый блок не содержит все обработки или их комбинации, но особая структура пла- планов типов 2к и 3ft позволяет применить упрощенный метод ана- анализа. ,Как и в гл. 8, будем считать, что все факторы фиксиро- фиксированы. 9.2. СМЕШИВАНИЕ В ФАКТОРНОМ ПЛАНЕ ТИПА 2" Простейшие методы смешивания применяются в планах типа 2к. В этом параграфе мы рассмотрим построение и анализ факторных планов типа 2к в виде 2р неполных блоков, где p<k. Следовательно, эти планы могут быть построены в виде двух, четырех, восьми и т. д. блоков. 9.2.1. План факторного эксперимента типа 2к в двух блоках Предположим, что мы хотим провести одну реплику плана 22. Для каждой комбинации обработок необходимо определен- определенное количество сырья, а размеры партии сырья позволяют про- проверить только две комбинации обработок; таким образом, нам необходимы две партии сырья. Если партии сырья рассматри- рассматривать как блоки, то мы должны распределить комбинации об- обработок по две на каждую партию. Рассмотрим план, приведенный на рис. 9.1. Заметим, что блок 1 содержит комбинации обработок A) и ab, а блок 2 — а и Ъ. Конечно, порядок, в котором комбинации обработок про- проверяются внутри блока, является случайным, так же, как и по- порядок следования блоков. Допустим, мы оцениваем главные 200 эффекты А и В так, как будто группирования в блоки нет. Тогда из выражений (8.1) и (8.2) получаем A=~[ab + a—b Отметим, что группирование в блоки не повлияло на Л и В, поскольку комбинации обработок из каждого блока встреча- Блок 1 Блок 2 Рис. 9.1. План 22 в двух блоках. ются и со знаком плюс, и со знаком минус, т. е. любые возмож- возможные различия между блоками исключаются. Рассмотрим теперь взаимодействие Поскольку две комбинации обработок со знаком плюс [ab и A)] принадлежат блоку 1, а две со знаком минус [а и Ь\ — блоку 2, то эффект блока и взаимодействие АВ тождественны друг другу. Другими словами, АВ смешано с блоками. Причина этого становится очевидной из рассмотрения таб- таблицы алгебраических знаков для плана 22 (см. табл. 8.2). Из нее видно, что все комбинации обработок, которые входят в АВ со знаком плюс, оказались в блоке 1, а комбинации обра- обработок со знаком минус —в блоке 2. Заметим, кроме того, что, если к блоку 1 отнести A) и Ь, а к блоку 2 —а к ab, то сме- смешанным с блоками оказался бы главный эффект А. На прак- практике обычно смешивают с блоками взаимодействие высшего по- порядка. Рассмотренный метод смешивания можно применять для любого плана типа 2k в двух блоках. В качестве второго при- примера возьмем план 23 в двух блоках. Допустим, мы хотим сме- смешать с блоками взаимодействие ABC. В соответствии с табли- таблицей алгебраических знаков (табл. 9.1) отнесем к блоку 1 ком- комбинации обработок, входящие в ABC со знаком минус, а к блоку 2 — комбинации обработок со знаком плюс. Полу- Получившийся план приведен на рис. 9.2. Еще раз подчеркнем, что 201
внутри блока комбинации обработок проверяются в случайном порядке. Кемпторном [48], Хиксом [41], Андерсоном и Маклином [1] описан иной метод построения таких планов '; он основан на использовании линейной комбинации L = aiXl + a2x2 + ... + ahXh, (9.1) где Xi — уровень i-ro фактора в данной комбинации обработок; (ti — показатель степени г-го фактора в эффекте, подлежащем Блок 1 Блок 2 A) ab ас Ьс а Ь с abc Рис. 9.2. План 23 в двух блоках со смешиванием ABC. смешиванию. Для планов типа 2к все пг равны 0 или 1 и все Xi равны 0 (нижний уровень) и 1 (верхний уровень). Выраже- Выражение (9.1) называется определяющим контрастом. К одному блоку относятся те комбинации обработок, которые приводят Таблица 9.1 Алгебраические знаки для плана 23 Комбинация обработок (О а b ab с ас be abc Факторный эффект i + i А + 1 + 1 — В — i АВ + 11 + + с — + X АС 1 + 1 + — ВС ± — t ABC X + + к одинаковому значению L (по модулю 2). Поскольку L может принимать значения (по модулю 2) только 0 и 1, то 2А комби- комбинаций обработок будут распределены только по двум блокам. Для иллюстрации применения этого метода рассмотрим план 23, в котором ABC смешано с блоками. Здесь Х\ соответствует 1 Этот метод более универсален, рассмотренный ранее метод применим только для факторных планов типа 2к. (Прим. ред.) 202 А, х2 — В и Хз — С, причем ai = a2 = as=l. Поэтому определяю- определяющий контраст, соответствующий ABC, имеет вид L = xY +x2+x3. В цифровой системе обозначений.комбинация обработок A) записывается как 000, следовательно, 1=1-0+1-0+1-0=0 = 0 (мод. 2). Аналогично комбинация обработок а записывается как 100, поэтому L = i.i + i.o + bO=l = l (мод. 2). Таким образом, A) и а должны попасть в различные блоки. Для остальных комбинаций обработок получаем: Ь аЪ = 1- ас be 1.1+ 1-0= 1 = 1 (мод. 2); L = l-1+1-1 + 1- 0 = 2 = 0 (мод. 2); L=l-0+l-0+l.1 = 1 = 1 (мад. 2); L = 1-1+ 1-0+1-1 = 2 = 0 (мод. 2); L = l-0+l-l + M=2 = 0 (мод.2); abc : L = 1 • 1 + 1 • 1 + 1 • 1 = 3 = 1 (мод. 2). Таким образом, A), ab, ас и be проверяются в блоке 1; а, Ь, с и abc—в блоке 2. Зто тот же план (см. рис. 9.2), который был получен с помощью таблицы алгебраических знаков. Для построения рассматриваемых планов можно использо- использовать еще один метод. Назовем блок, содержащий комбинацию обработок A), главным блоком. Комбинации обработок в этом блоке обладают полезным теоретико-групповым свойством, а именно, они образуют группу относительно умножения по мо- модулю 2. Это означает, что любой элемент [кроме A)] в главном блоке может быть получен умножением по модулю 2 двух дру- других элементов главного блока. Рассмотрим, например, главный блок плана 23 со смешиванием ABC (см. рис. 9.2). Заметим, что ab •ac = ac-bc=abc2 = ab. Комбинации обработок в другом блоке (или блоках) можно получить умножением по модулю 2 одного элемента нового блока на каждый элемент главного блока. В плане 23 со сме- смешиванием ABC главный блок содержит A), ab, ас и be, по- поэтому мы знаем, что b входит в другой блок. Во второй блок должны входить элементы 6-A)=6; b •ab = ab2 = a; b •ac = abc; Ъ-Ъс = Ъ2с=с. Это согласуется с полученными ранее результатами. 203
Если экспериментатор не располагает независимой оценкой ошибки или не может считать какие-либо взаимодействия пре- пренебрежимо малыми, то для проверки гипотез необходимы до- дополнительные реплики эксперимента. Допустим, что экспери- эксперимент по плану 23 необходимо провести в двух неполных блоках со смешиванием ABC; исследователь решает получить четыре Реплика I Реплика II Реплика III Реплика IV Блок 1 Блок 2 Блок 1 Блок 2 Блок 1 Блок 2 Блок 1 Блок 2 A) ас аЬ be abc а b с A) ас ab be abc а b с A) ас аЬ be abc а Ь с A) ас ab be abc а Ь с Рис. 9.3. Четыре реплики плана 23 со смешиванием ABC. реплики (рис. 9.3). Отметим, что ABC смешано в каждой реп- реплике. ДА для этого плана приведен в табл. 9.2. Число наблюде- наблюдений составляет 32, а число степеней свободы 31. Восьми блокам должны соответствовать Таблица 9.2 Дисперсионный анализ для четырех реплик плана 23 со смешиванием ABC Источник изменчивости <D О о о семь степеней свободы, расщепление которых, следуя Кокрену И Коксу [21], приведено в табл. 9.2. Сумма квадратов ошибки состоит, в сущности, из двухфакторных взаимо- взаимодействий между репли- репликами и каждым из эф- эффектов (А, В, С, АВ, АС, ВС). Обычно можно без особого риска считать эти взаимодействия равными нулю и рассматривать по- получающийся средний квадрат как оценку ошибки. Главные эф- эффекты и двухфакторные взаимодействия сравни- сравниваются со средним квад- квадратом ошибки. Кокрен и Кокс [21] утверждают, что средний квадрат для ABC (или блоков) можно было бы сравнить со средним квадратом для взаимодействия репликиX блоки. Этот критерий обычно очень нечувствителен. 204 Реплики Блоки (ABC) Ошибка для ABC (реплики X блоки) А В С АВ АС ВС Ошибка (или реплики X эффекты) Сумма 1 18 31 Если возможности эксперимента позволяют получить не одну реплику плана со смешиванием, то, вообще говоря, лучше применить несколько иной метод планирования блоков в каж- каждой реплике. Суть его в том, чтобы в каждой реплике смеши- смешивать различные эффекты и попытаться получить таким образом некоторую информацию относительно всех эффектов. Эта про- процедура называется частичным смешиванием и обсуждается в параграфе 9.4. Если k сравнительно велико, скажем, ?^3=4, то нам часто приходится ограничиваться одной репликой. Экспе- Экспериментатор обычно принимает допущение, что некоторые взаи- взаимодействия высоких порядков пренебрежимо малы, и объеди- объединяют их суммы квадратов для оценивания ошибки. Это иллю- иллюстрируется следующим примером. Пример 9.1. Рассмотрим ситуацию, описанную в примере 8.2. Вспомним, что на опытной установке исследуется влияние на скорость фильтрации про- продукта четырех факторов: температуры А, давления В, концентрации реа- реагента С и скорости перемешивания D. Предположим теперь, что все 24—16 комбинаций обработок нельзя проверить за один день. В течение дня экспе- экспериментатор может провести восемь опытов, поэтому подходит план 24 со смешиванием в двух блоках. Для смешивания с блоками логично выбрать взаимодействие высшего порядка ABCD. Определяющий контраст имеет вид и легко проверить, что блоки оказываются следующими: Блок 1 A)= 45 ab= 65 ас= 60 Ьс= 80 ad=100 bd= 45 cd= 75 abcd= 96 Блок 2 Q= 71 6= 48 c= 68 rf= 43 a6c= 65 6cd= 70 acrf= 86 abd= 104 Данные эксперимента можно проанализировать с помощью алгоритма Йейтса (табл. 9.3). Суммы по блокам составляют 556 и 555, а сумма квад- квадратов для них SS6jl =-LE562 5552) 11212 = 7,562 16 что совпадает с суммой квадратов для ABCD (см. табл. 9.3). Сумма квадратов для главных эффектов и двухфакторных взаимодей- взаимодействий берутся непосредственно из алгоритма Иейтса. Экспериментатор ре- решил, что трехфакторными взаимодействиями можно пренебречь, поэтому сумма квадратов ошибки имеет вид = 14,062 5+68,062 5+10,562 5+27,562 5= 120,250 0, ей соответствует четыре степени свободы. Полный ДА приведен в табл. 9.4 (детали последующей интерпретации см. в примере 8.2). 205
Таблица 9.3 Алгоритм Йейтса для примера 9.1 Комбинация обработок (О а b ab с ас be abc d ad bd abd cd acd bed abed Отклик 75 71 48 65 68 60 80 65 43 100 45 104 75 86 70 96 A) 116 113 128 145 143 149 161 166 26 17 —8 -15 57 59 и 26 B) 229 273 292 327 43 —23 116 37 —3 17 6 5 —9 —7 2 15 C) 502 619 20 153 14 и — 16 17 44 35 -66 -79 20 — 1 2 13 D) 1121 173 25 1 79 -145 19 15 117 133 -3 33 -9 -13 —21 И Эффекты А В АВ С АС ВС ABC D AD BD ABD CD ACD BCD A BCD Сумма квадратов 1870,562 5 39,062 5 0,062 5 390,062 5 1314,062 5 22,562 5 14,062 5 855,562 5 1105,562 5 0,562 5 68,062 5 5,062 5 10,562 5 27,562 5 7,562 5 Таблица 9.4 Дисперсионный анализ для примера 9.1 Источник нзиенчивости Блоки (ABCD) А В С D АВ АС AD ВС BD CD Ошибка (или ABC + + ABD + ACD + BCD) Сумма • Значимо при 5 процентах •• Значимо при 1 проценте. Сумма квадратов 7,562 5 1870,562 5 39,062 5 390,062 5 855,562 5 0,062 5 1314,062 5 1105,562 5 22,562 5 0,562 5 5,062 5 120,250 0 Степени свободы 1 1 1 1 1 1 1 1 1 1 1 4 15 Средний квадрат 1870,562 5 39,062 5 390,062 5 855,562 5 0,062 5 1314,062 5 1105,562 5 22,562 5 0,562 5 5,062 5 30,062 5 62,22** 1,30 12,98* 28,46** <1 43,71** 36,78** <1 <1 <1 9.2.2. План факторного эксперимента типа 2к в четырех блоках Можно построить планы факторных экспериментов типа 2й со смешиванием в четырех блоках, каждый из которых содер- содержит 2k~2 наблюдений. Такие планы особенно полезны в ситуа- 206 циях, когда число факторов сравнительно велико, скажем, й^4, а размеры блоков относительно малы. Рассмотрим, например, план 25. Если каждый блок может содержать не более восьми комбинаций обработок, то нужно взять четыре блока. Построить такой план сравнительно просто. Выберем для смешивания с блоками два эффекта, скажем, ADE и ВСЕ: им соответствуют определяющие контрасты Для каждой комбинации обработок получаем пару значений L\ и L2 по модулю 2, а именно (Lb L2) = @,0), @,1), A,0) или A,1). Комбинации обработок с одинаковыми значениями (L\, L2) отнесем к одному блоку. В нашем примере Li = 0, L2 = 0 Блок 1 Li L2 A) ad be abed Блок 2 = 0 Li = 0 L2 abe ace cde bde a d abc bed Блок 3 = 1 Lx = 0 L2 be abde ce acde b abd с acd Блок 4 = 0 Lx = 1 L2 abce ae bede de e ade bee ab = i = 1 abede bd ac cd Рис. 9.4. План 25 в четырех блоках со смешиванием ADE, ВСЕ и A BCD. для A), ad, be, abed, abc, ace, cde, bde; Lx=l, L2 = 0 для a, d, abc, bed, be, abde, ce, acde; Lx = 0, L2=l для b, abd, c, acd, ae, de, abce, bede; Lx = l, L2=l для e, ade, bee, abede, ab, bd, ac, cd. Эти комбинации обработок распределяются по различным бло- блокам; полный план приведен на рис. 9.4. Нетрудно заметить, что помимо ADE и ВСЕ еще один эф- эффект должен оказаться смешанным с блоками. Четырем блокам соответствуют три степени свободы, а каждому из ADE и ВСЕ — одна, поэтому ясно, что с блоками должен быть смешан допол- дополнительный эффект с одной степенью свободы. Этот эффект — обобщенное взаимодействие ADE и ВСЕ — определяется как произведение ADE и ВСЕ по модулю 2. Так, в нашем примере с блоками смешано и обобщенное взаимодействие (ADE) и (ВСЕ) =ABCDE2 = ABCD. Это легко проверяется с помощью таблицы алгебраических знаков для плана 25, например, у Дей- Дейвиса [24]. Из рассмотрения такой таблицы вытекает следующее 207
распределение комбинаций по блокам: Знак ADE Знак ВСЕ Знак ABCD Блок 1 — — + Блок 2 + — — Блок 3 — + — Блок 4 4-+ 4~ Отметим, что произведение знаков любых двух эффектов из одного блока (например, ADE и ВСЕ) дает знак другого эф- эффекта из того же блока (в данном случае ABCD). Таким об- образом, ADE, ВСЕ и ABCD оказываются смешанными с бло- блоками. Рассматриваемый план также обладает теоретико-группо- теоретико-групповыми свойствами, обсуждавшимися в 9.2.1. Например, видно, что произведение двух комбинаций обработок из главного блока является элементом этого же блока, т. е. ad-bc = abcd, abeX Xbde = ab2de2 = ad и т. д. Для построения другого блока выбе- выберем комбинацию обработок, не входящую в главный блок, на- например, в, и умножим ее на все комбинации обработок главного блока: b-(l)=b, b-ad=abd, b-bc = c, b • abcd = ab2dc = acd и т. д., при этом мы получим восемь комбинаций обработок блока 3. На практике главный блок можно находить по опре- определяющим контрастам и теоретико-групповым свойствам, а ос- остальные блоки — методом, изложенным выше. Общая процедура построения плана типа 2й со смешиванием в четырех блоках состоит в выборе для этого двух эффектов, что автоматически приводит к смешиванию третьего эффекта, являющегося обобщенным взаимодействием первых двух. За- Затем используются два определяющих контраста (L\, L2) и тео- теоретико-групповые свойства главного блока. При выборе эффек- эффектов для смешивания нужно быть внимательным, чтобы в полу- получающемся плане не оказались смешанными эффекты, которые могут представлять интерес. Например, в плане 25 можно вы- выбрать для смешивания ABCDE и ABD, что автоматически при- приводит к смешиванию СЕ, эффекта, который, вероятно, пред- представляет интерес. При лушем выборе, когда смешиваются ADE и ВСЕ, смешивается и ABCD. Предпочтительно жертвовать ин- информацией относительно трехфакторных взаимодействий ADE и ВСЕ, а не двухфакторного взаимодействия СЕ. 9.2.3. План факторного эксперимента типа 2": в 2?' блоках Описанные выше методы можно обобщить для построения планов факторных экспериментов типа 2k со смешиванием в 2V блоках (р<&), прием каждый блок содержит ровно 2п~р на- наблюдений. Для смешивания выбираются р независимых эффек- эффектов; под независимостью мы понимаем то, что ни один из вы- выбранных эффектов не является обобщенным взаимодействием 208 остальных. Блоки можно построить с помощью р определяю- определяющих контрастов L\, L2, ..., Lp, связанных с этими эффектами. Кроме того, с блоками окажутся смешанными еще 2р — р — 1 эффекта, а именно, обобщенные взаимодействия р исходных не- независимых эффектов. При выборе эффектов для смешивания нужно проявлять осторожность, чтобы не потерять информа- информацию о эффектах, представляющих потенциальный интерес. Статистический анализ для рассматриваемых планов ве- ведется непосредственно. Суммы квадратов для всех эффектов находятся так, как будто группирования в блоки нет. Затем сумма квадратов для блоков получается сложением сумм ква- квадратов для всех эффектов, смешанных с блоками. Пусть, например, мы хотим построить план 26 со смешива- смешиванием в 23 = 8 блоках по 26~3 = 8 наблюдений в каждом. Предпо- Предположим, что для смешивания мы выбрали р = 3 независимых эффекта ABCD, AEF и ACDE. Тогда смешанными с блоками окажутся еще 2р — р—1 = 23 — 3—1=4 эффекта, а именно, обобщенные взаимодействия исходных трех эффектов: {ABCD) (AEF) = A2BCDEF = BCDEF; {ABCD) (ACDE) = A2BC2D2E = BE; (AEF) (ACDE) =A2CDE2F = CDF; (ABCD) (AEF) (ACDE) = A3BC2D2E2F = Построение восьми блоков для этого плана предоставляется чи- читателю (задача 9.3). 9.3. СМЕШИВАНИЕ В ФАКТОРНОМ ПЛАНЕ ТИПА 3h В этом параграфе мы обсудим смешивание для планов типа Зк в Зр неполных блоках, где p<k, т. е. смешивание может осу- осуществляться в трех, девяти и т. д. блоках. 9.3.1. План факторного эксперимента типа 3й в трех блоках Предположим, что хотим применить смешивание для плана типа 3k в трех неполных блоках. Этим трем блокам соответ- соответствуют две степени свободы, следовательно, с блоками должны смешиваться две степени свободы. Вспомним, что в экспери- экспериментах типа Зк каждый главный эффект обладает двумя степе- степенями свободы. Далее, каждое двухфакторное взаимодействие с четырьмя степенями свободы может быть разложено на два компонента взаимодействия (например, АВ и АВ2) с двумя сте- степенями свободы каждый; каждое трехфакторное взаимодей- взаимодействие может быть разложено на четыре компонента взаимодей- взаимодействия (например, ABC, ABC2, AB2C и АВ2С2) с двумя степе- 209
нями свободы каждый и т. д. Следовательно, с блоками удобно смешивать какой-либо из компонентов взаимодействия. Общая процедура начинается с построения определяющего контраста L = a]Xi + a2x2 + ... + akXh, (9.2) где а, — показатель степени г-го фактора в смешиваемом эф- эффекте; Xi — уровень г-го фактора в данной комбинации обрабо- обработок. Для планов типа 3k ai = 0, 1 или 2, причем первый из не- ненулевых си равен единице, а #г = 0 (нижний уровень), 1 (про- (промежуточный уровень) или 2 (верхний уровень). Комбинации обработок распределяются по блокам в соответствии со значе- Блок 1 Блок 2 Блок 3 00 11 22 10 21 02 01 12 20 Рис. 9.5. План З2 в трех блоках со смешиванием AS2. нием L по модулю 3. Поскольку L может принимать значения по модулю 3 только 0, 1 или 2, то три блока определяются од- однозначно. Комбинации обработок, для которых L = 0 (мод. 3), образуют главный блок; этот блок, всегда содержит комбина- комбинацию обработок 00.. .0. Пусть, например, мы хотим построить план З2 в трех бло- блоках. С блоками можно смешать любой из компонентов АВ и АВ2 взаимодействия АВ. Произвольно выбрав АВ2, получим оп- определяющий контраст L = X] + 2x2- Значения L по модулю Здля каждой комбинации обработок можно найти следующим об- образом: 00: L= 1-0 + 2- 0=0=0 (мод. 3); 01: 1=1-0 + 2-1=2 = 2 (мод. 3); 02: 1=1-0 + 2-2 = 4=1 (мод. 3); 10: 1=1-1 + 2.0=1 = 1 (мод. 3); 11: 1=1-1+2-1 = 3=0 (мод. 3); 21:1=1-2 + 2-1=4=1 (мод. 3); 12: 1=1-1+2-2 = 5 = 2 (мод. 3); 22: 1=1-2 + 2-2 = 6 = 0 (мод. 3); 20: 1=1-2 + 2-0 = 2 = 2 (мод. 3). Вид блоков приведен на рис. 9.5. 210 Элементы главного блока образуют группу относительно сложения по модулю 3; из рис. 9.5, например, видно, что 11 + + 11=22 и 11+22 = 00. Комбинации обработок в остальных двух блоках можно найти сложением по модулю 3 любого элемента нового блока с элементами главного блока. Так, используя 10 для блока 2, получим 10 + 00=10, 10+11=21 и 10 + 22=02. Для блока 3, исходя из 01, находим 01+00=01, 01 + 11 = 12 и 01 + + 22 = 20. Пример 9.2. Проиллюстрируем статистический анализ для плана З2 со смешиванием в трех блоках с помощью данных, приведенных ниже; они пред- представляют собой одну реплику плана З2 (см. рис. 9.5). Блок 1 Блок 2 Блок 3 00 = 4 10=—2 01 = 5 11 = —4 21 = 1 12 = -5 22 = 0 02 = 8 20 = 0 Суммы для блоков = 0 7 0 С помощью методов анализа, обычных для факторных планов, находим SSA = 131,56 и SSB=0,22, а также SS6n = — (О2 + 72 + О2) 72 = 10,89. о У Однако SSen совпадает с компонентом АВ2 взаимодействия. Для того чтобы это увидеть, запишем наблюдения: Фактор В 0 1 2 Фактор А 4 -2 0 8 -5 0 Вспомним из 8.3.2, что компонент / или АВ2 взаимодействия АВ можно иайти как сумму квадратов сумм по диагоналям слева направо. Тогда B, = — @2+ 02+ 72) -72 = 10,89, о У что совпадает с ДП приведен в табл. 9.5. По- Поскольку реплика единственная, то строгие критерии применять нельзя. Отметим, что в качестве оценки ошибки неразумно использовать ком- компонент АВ взаимодействия, так как число его степеней свободы недоста- недостаточно велико. Рассмотрим теперь не- несколько более сложный план З3 со смешиванием в трех бло- блоках по девять наблюдений в каждом. С блоками смеши- смешивается компонент (например, Таблица 9.5 Дисперсионный анализ для данных примера 9.2 Источник изменчивости Блоки (АВ2) А В АВ Сумма Су ми а квадратов 10,89 131,56 0,22 2,89 145,56 Степени свободы 2 2 2 2 8 211
АВ2С2) трехфакторного взаимодействия, и определяющий кон- контраст имеет вид Легко проверить, что комбинации обработок 000, 012 и 101 входят в главный блок. Остальные элементы этого блока полу- получаются следующим образом: 1) 000; 4) 101 + 101 = 202; 7) 101+021 = 122; 2) 012; 5) 012 + 012 = 021; 8) 012 + 202 = 211; 3) 101; 6) 101+012=110; 9) 021+202 = 220. Найти элементы другого блока можно, заметим, что комби- комбинация обработок 200 не входит в главный блок. Таким обра- образом, элементы блока 2 имеют вид 1) 200 + 000 = 200; 4) 200 + 202=102; 7) 200+122 = 022; 2) 200 + 012 = 212; 5) 200 + 021 = 221; 8) 200+211=111; 3) 200+101=001; 6) 200+110 = 010; 9) 200 + 220=120. Отметим, что для всех этих элементов L = 2 (мод. 3). По- Последний блок находится, если заметить, что 100 не входит в блоки 1 и 2. Исходя из 100 аналогичным образом получаем 1) 100 + 000=100; 4) 100+202 = 002; 7) 100+122 = 222; 2) 100 + 012=112; 5) 100 + 021 = 121; 8) 100 + 211=011; 3) 100+101=201; 6) 100+110 = 210; 9) 100 + 220 = 020. Блок 1 Блок 2 Блок 3 000 012 101 202 021 ПО 122 211 220 200 212 001 102 221 010 022 111 120 100 112 201 002 121 210 222 011 020 Рис. 9.6. План З3 в трех блоках со сме- смешиванием АВгС2. Вид блоков приведен на рис. 9.6. ДА приведен в табл. 9.6. При использовании такой системы смешивания оказывается доступной информация относительно 212 всех главных эффектов и двухфакторных взаимодействий. Оставшиеся компоненты трехфакторного взаимодействия (ABC, АВ2С и ABC2) объединяются для получения оценки ошибки, которая находится вычитанием. В общем случае плана типа 3h в трех блоках мы всегда выбираем для смешивания с блоками один из компонентов взаимодействия высшего порядка. Несме- Несмешанные компоненты этого взаимодействия можно полу- Таблица 9.6 чить, найдя обычным спосо- способом k — факторное взаимо- взаимодействие и вычитая из него сумму квадратов для блоков. 9.3.2. План факторного эксперимента типа 3/; в девяти блоках В некоторых эксперимен- экспериментальных ситуациях оказыва- оказывается необходимым применять смешивание плана типа Зк в девяти блоках; при этом с блоками смешиваются во- восемь степеней свободы. Для построения таких планов вы- выбираются два компонента взаимодействия, в результате чего смешиваются еще два ком- компонента и автоматически получаются восемь требуемых степе- степеней свободы. Эти дополнительные компоненты являются обоб- обобщенными взаимодействиями двух исходных эффектов. В планах типа Зк обобщенные взаимодействия двух эффектов (например, Р и Q) определяются как PQ и PQ2 (или P2Q). Двум исходным компонентам взаимодействия соответствуют два определяющих контраста Дисперсионный анализ для со смешиванием АВ2Сг Источник изменчивости Блоки (АВ2С2) А. в с АВ АС ВС Ошибка (АВС + АВ2С + ABC2) Сумма плана З3 х 3 X « С\о И) О 55 2 2 2 4 4 4 6 26 2; = u (мод. 3), = U (МОД. 3), /1 = 0, 1,2, (9.3) где {а,} и {fij}—показатели степеней в первом и втором обоб- обобщенных взаимодействиях соответственно при условии, что пер- первый из ненулевых си и Pj равен единице. Определяющие конт- контрасты (9.3) порождают девять совместных уравнений, которые характеризуются парой значений L\ и L2. К одному блоку от- относятся комбинации обработок с одинаковыми парами значе- значений (Lb L2). Главный блок состоит из комбинаций обработок с Li = L2 = 0 (мод. 3). Элементы этого блока образуют группу относительно 213
сложения по модулю 3; таким образом, для построения блоков можно воспользоваться методом, данным в 9.3.1. Рассмотрим, например, план З4 со смешиванием в девяти блоках по девять наблюдений в каждом. Допустим, что для смешивания мы выбираем ABC и AB2D2. Их обобщенные взаи- взаимодействия (ABC) (AB2D2) = A2B3CD2 = (A2B3CD2J=AC2D; (ABC) (AB2D2J=A3B5CD4 = B2CD = (B2CDJ = BC2D2 также смешаны с блоками. Определяющие контрасты для ABC и AB2D2 имеют вид (9-4) Девять блоков для этого плана можно построить, используя определяющие контрасты (9.4) и теоретико-групповые свойства главного блока (рис. 9.7). Блок 1 0000 0122 0211 1021 1110 1201 2012 2101 2220 Блок 2 0001 0120 0212 1022 1111 1200 2010 2012 2221 Блок 3 2000 2122 2211 0021 ОНО 0202 1012 1101 1220 Блок 4 0200 0022 0111 0221 1010 1102 2212 2001 2120 Блок 5 0020 0112 0201 1011 1100 1222 2002 2121 2210 Блок 6 0010 0102 0221 1001 1120 1212 2022 2111 2200 Блок 7 1000 1122 1211 2021 2110 2202 0012 0101 0220 Блок 8 0100 0222 ООП 1121 1210 1002 2112 2201 2020 Блок 9 0002 0121 0210 1020 1112 1201 2011 2100 2222 =@,0) @,1) B,2) B,0) B,1) A,2) A,1) A,0) @,2) Рис. 9.7. План 3* в девяти блоках со смешиванием ABC, АВЮ2, AC2D и BC2D\ В планах типа 3ft в девяти блоках смешиваются четыре ком- компонента взаимодействия. Оставшиеся компоненты этих взаимо- взаимодействий можно найти, вычитая сумму квадратов для смешан- смешанного компонента из суммы квадратов для всего взаимодейст- взаимодействия. Для вычисления компонентов взаимодействия может оказаться полезным метод, описанный в 8.3.3. 214 9.3.3. План факторного эксперимента типа 3k в Зр блоках В планах типа 3fe можно ввести смешивание в 3? блоках по 3h~p наблюдений в каждом, где p<k. Для смешивания с бло- блоками выбираются р независимых эффектов, при этом автома- автоматически оказываются смешанными еще C? — 1р—1)/2 эффек- эффектов, которые являются обобщенными взаимодействиями перво- первоначально выбранных эффектов. Рассмотрим в качестве примера смешивание плана З7 в 27 блоках. Поскольку р = 3, то выбираем три независимых компонента взаимодействия и автоматически смешиваем еще (З3 — 2-3 — 1) /2 = 10. Допустим, мы выбрали ABC2jDG, BCE2F2G и BDEFG. Описанными выше методами можно по- построить три определяющих контраста для этих эффектов и 27 блоков. Остальные 10 эффектов, которые смешаны с бло- блоками, имеют вид (ABC?DG) (BCE*F2G) = AB*DE*F2G2; (AB&DG) (BCE2F2GJ = ABsClDElFlG3 = ACDEF; (ABC2DG) (BDEFG) = AB2C*D2EFG2; (ABCWG) (BDEFGJ = AB3CW3E2F*G3 = AC2E2F2; (BCE2F2G) (BDEFG) = B2CDE3F3G2 = B2CDG2 = BC2D2G; (BCE2F2G) (BDEFGJ = B3CD2EiFiG3 = CD2EF; (ABC2DG) (BCE2F2G)BDEFG = AB3C3D2E3F3G3 = AD2; (AB&DGJ (BCE2F2G) (BDEFG) = A2BiC5D3Gi = AB2CG2; (ABC2DG) (BCE2F2GJ (BDEFG) = ЛB4C4D2?5F5G4 = ABCD2E2F*G; (ABC2DG) (BCE2F*G) (BDEFGJ = ABlC3D3ElFlGl = ABEFG. Это очень большой план, требующий 37 = 2187 наблюдений, ор- организованных в 27 блоков по 81 наблюдению в каждом. На практике мы бы прибегли к какому-нибудь иному экспери- эксперименту, проведение которого потребовало бы, как мы надеемся, меньших затрат. 9.4. ЧАСТИЧНОЕ СМЕШИВАНИЕ В 9.2.1 мы заметили, что, если экспериментатор не распола- располагает априорной оценкой ошибки или достаточными основаниями считать некоторые взаимодействия пренебрежимо малыми, то он должен увеличивать число реплик плана для оценивания ошибки. На рис. 9.3 были приведены четыре реплики плана 23 в двух блоках со смешиванием ABC. Из ДА этого плана (см. табл. 9.2) видно, что информация о взаимодействии ABC не мо- может быть восстановлена, поскольку ABC смешивается с бло- блоками в каждой реплике. Такое смешивание называется полным. 215
Рассмотрим иной вариант плана (рис. 9.8). Как и ранее, число реплик равно четырем, но в каждой из них смешиваются различные взаимодействия: в реплике I смешивается ABC, в реплике II — АВ, в реплике III — АС и в реплике IV — ВС. В результате этого информацию об ABC можно получить из Реплика I смешивается ABC Реплика II смешивается АВ Реплика III смешивается АС Реплика IV смешивается ВС A) ab ас be а b с abc A) с аЬ abc а Ь ас be A) Ъ ас abc а с аЬ be A) а be abc b с ab ас Рис. 9.8. Частичное смешивание в плане 23. данных реплик II, III и IV, информацию об АВ — из реплик I, III и IV, информацию об АС — из реплик I, II и IV, а инфор- информацию о ВС — из реплик I, II и III. Мы говорим, что о взаимо- взаимодействиях доступно 3Д информации, поскольку они не смешива- смешиваются только в трех репликах из четырех. Йейтс [70] называет отношение 3/4 относительной информацией для смешанных эф- эффектов. Смешивание, примененное в этом плане, называется частичным. ДА для рассматриваемого плана приведен в табл. 9.7. При вычислении сумм квадратов для взаимодействий используются данные только тех реплик, в которых это взаимодействие не смешивается. В сумму квадратов ошибки входят репликиX Таблица 9.7 Дисперсионный анализ плана 22 с частичным смешиванием Источник изменчивости Степени свободы Реплики Блоки в пределах реплик [или ABC (реплика 1) (реплика II) -{-АС (реплика III) -f- ВС (реплика IV)] А В С АВ (из реплик I, III и IV) АС (из реплик I, II и IV) ВС (из реплик I, II и III) ABC (из реплик II, III и IV) Ошибка Сумма АВ 17 31 216 Xсуммы квадратов главных эффектов плюс репликихсуммы квадратов взаимодействий для каждой реплики, в которой это взаимодействие не смешивается (например, репликихАВС для реплик II, III и IV). Восьми блокам соответствуют семь степе- степеней свободы, которые обычно расщепляются на три степени свободы для реплик и четыре степени свободы для блоков внутри реплик. Разложение суммы квадратов для блоков (см. табл. 9.7) непосредственно определяется выбором эффекта для смешивания в каждой реплике. Пример 9.3. Рассмотрим пример 8.1, в котором описывалось исследова- исследование влияния процентного содержания углекислоты А, рабочего давления В и скорости конвейера С на объем газированного напитка в бутылке. Допу- Допустим, что объем партии сиропа позволяет проверить не более четырех ком- комбинаций обработок. Следовательно, каждую реплику плана 23 необходимо проводить в двух блоках. Данные двух реплик, в первой из которых сме- смешивалось ABC, а во второй — АВ, приведены ниже. Реплика I Смешивается ABC A) = -3 а = ab = 2 Ъ = ас = 2 с = be = 1 abc = 0 — 1 — 1 6 @ с ab abc Реплика II Смешивается АВ = —1 = 0 = 3 = 5 а= 1 Ь = С ab= 1 6с = 1 Суммы квадратов для А, В, С, АС и ВС можно найти обычным спосо- способом или же применить алгоритм йейтса (табл. 9.8). Отметим, что в этой таблице вычисление сумм квадратов для АВ и ABC не завершено, SSabc Таблица 9.8 Алгоритм Йейтса для данных примера 9.3 Комбинация обработок A) а Ъ ab с ас be abc Отклик —4 1 — 1 5 —1 3 2 И A) —3 4 2 13 5 6 4 9 B) 1 15 11 13 7 11 1 5 C) 16 24 18 6 14 2 4 4 Эффект / А В АВ С АС ВС ABC Сумма квадратов 36,00 20,25 Не определяется 12,25 0,25 1,00 Не определяется находится только по данным реплики II, a SSab — только по данным реп- реплики I; SSAbc = —^— [а + Ь + с + abc — ab — ас — be — A )]2 = п2к 1-8 0+5 — 3 — 1 — 1 — (— 1)]2 = о, 50; 217
SSAB = 1-8 + abc + ab + с-a- b - ас- bcf = 2 + (- I) —0—(-1) —2—I]2 = 0,50. Сумма квадратов для реплик в общем случае имеет вид SS „„==— V Rl — — у2 = — F2+ 102) — 162= 1,00, реп 2К ^ h N »... 8 16 где Rh — сумма наблюдений в /i-й реплике. Сумма квадратов для блоков — это сумма SSabc по реплике I и SSab по реплике II, т. е. SSeл = 2,50. ДА приведен в табл. 9.9 Все три главных эффекта значимы на уровне одного процента. Таблица 9.9 Дисперсионный анализ для примера 9.3 Источник изменчивости Реплики Блоки в пределах реплик А В С АВ (только реплика I) АС ВС ABC (только реплика II) Ошибка Сумма • Значимо при 1 проценте. Сумма квадратов 1,00 2,50 36,00 20,25 12,25 0,50 0,25 1,00 0,50 3,75 78,0 Степени свободы 1 2 1 1 1 1 1 1 1 5 15 Средний квадрат 1,00 1,25 36,00 20,25 12,25 0,50 0,25 1,00 0,50 0,75 Fo 48,00* 27,00* 16,33* 0,67 0,33 1,33 0,67 Таблица 9.10 Дисперсионный анализ для плана З2 с частичным смешиванием Источник изменчивости Реплики Блоки в пределах реплик [АВ2 (реплика I) + АВ (реп- (реплика II)] А В АВ (только реплика I) АВ2 (только реплика II)' Ошибка Сумма Степени свободы 1 4 2 2 2 2 4 17 Частичное смешива- смешивание можно применять и в планах типа 3h. Общая процедура состоит в сме- смешивании различных ком- компонентов взаимодействия в каждой реплике. Ста- Статистический анализ для этих планов проводится так же, как и в случае планов типа 2k с частич- частичным смешиванием. Рассмотрим, напри- например, две реплики плана З2 в трех блоках. Если применить смешивание АВ2 в реплике I и АВ — 218 в реплике II, то получится план, приведенный на рис. 9.9. ДА для этого плана приведен в табл. 9.10. При частичном смешивании в планах типа Зк часто оказы- оказывается полезным находить компоненты взаимодействий по реп- репликам, в которых они не смешиваются; для этого можно вос- воспользоваться методом, приведенным в параграфе 8.3.3. 9.5. ДРУГИЕ СИСТЕМЫ СМЕШИВАНИЯ Комбинаторные свойства факторных экспериментов типа 3^ [а также 2k, если обозначать комбинации обработок 00, 10, а не A), а, ...] можно обобщить и применять к смешиванию факторных экспериментов общего типа рк, где р — простое число или степень простого числа. Комбинации обработок обо- обозначаются числами вида Х\, х2, ..., Хи, где я, — уровень 1-го фак- фактора и О^Хг^р— 1. Все числа при расчетах приводятся по мо- модулю р. На рк комбинаций обработок приходится рк—-1 сте- степень свободы, их можно расщепить на (ph— \I{р— 1) наборов по р — 1 степени свободы каждый. Последние определяются контрастами для сравнения р наборов комбинаций обработок по рк~] в каждом. Эти наборы задаются уравнениями вида L = ai*1-f-a2*2 + ... + afcXft = 0, 1, ¦ • •. Р~ 1 (мод. р). (9.5) В этом выражении {а,} — положительные целые числа в интер- интервале от 0 до р— 1, не равные одновременно нулю, причем пер- первое ненулевое а, равно единице. Любой из этих р наборов мо- может быть применен для смешивания эксперимента в р блоках по рк~1 наблюдений в каждом. Рассмотрим два примера. Девяти комбинациям обработок в плане З2 соответствуют З2—1=8 степеней свободы, которые можно расщепить на (З2—1)/C—1)=4 набора по 3—1=2 степени свободы в каждом, а именно, А, В, АВ и АВ2. В плане 52 всего 25 комбинаций обработок, им соответствуют 24 степени свободы, которые можно разбить на E2—1)/E—1)=6 набо- наборов по 5— 1 = 4 степени свободы в каждом, т. е. эффекты А, В, АВ, АВ2, АВЪ и АВ1. Любой из четырех компонентов взаимо- взаимодействия АВ можно использовать для смешивания в пяти блоках по пять наблюдений в каждом. Если выбрать АВг, то выражение (9.5) принимает вид L=x{ + 3x2 = 0, 1, 2, 3, 4 (мод. 5) и однозначно определяет комбинации обработок, попадающие в один блок. Эти идеи можно обобщить и применять при сме- смешивании в планах общего типа pk в ps блоках, где р — простое число и s<k. 219
Таблица 9.11 Четырехуровневый фактор в виде двух факторов иа двух уровнях каждый A a» ai a2 a3 P 0 0 1 1 Q o = (i) \ = q 0 = p 1 = pq Если р — степень простого числа, то тем не менее можно по- построить неполноблочные планы частного вида. Рассмотрим для иллюстрации планы типа 4k, т. е. с k факторами на четырех уровнях каждый. Суть применяемого метода состоит в расщеп- расщеплении каждого четырехуровневого фактора на два псевдофак- псевдофактора с двумя уровнями каждый. Пусть, например, А — четырех* уровневый фактор с уровнями а0, а\, а.2 и а3, тогда можно ввести та- такую организацию двухуровневых факторов (например, Р и Q), как в табл. 9.11. Каждый из эффектов Р, Q и PQ обладает одной степенью свободы, они взаимно ортогональны и соответствуют эффекту А с тремя степенями свободы. При двух факторах А и В на че- четырех уровнях каждый мы заме- заменяем А двухуровневыми псевдофак- псевдофакторами Р и Q, а В—двухуровне- В—двухуровневыми псевдофакторами R и S. Таким образом, Р, Q и PQ соответствуют A, R, S и RS—В, а остальные девять взаимодей- взаимодействий между псевдофакторами соответствуют взаимодействию АВ. Следовательно, для плана 42 можно применить смешивание в четырех блоках по четыре наблюдения в каждом, если вос- воспользоваться планом 24 для псевдофакторов Р, Q, R и S в че- четырех блоках, с которыми смешиваются PQR, QRS и PS. Общие принципы смешивания можно применять и к фактор- факторным экспериментам при различных числах уровней факторов. Рассмотрим, например, план типа 4x2, т. е. план факторного эксперимента с k факторами на двух уровнях каждый и одним фактором на четырех уровнях. С помощью псевдофакторов можно для этого плана провести анализ, как для плана типа 2ft+2. В общем случае таким методом можно ввести смешива- смешивание в любой план типа 4r2fe. В число других полезных планов, в которых возможно смешивание, входят и планы типа 2Й3Г. Поскольку 2 и 3 — простые числа, то для построения таких пла- планов не нужны псевдофакторы. В работе Марголина [50] систе- систематизированы методы анализа для планов факторных экспери- экспериментов типа 2кЪт. 9.6. ЗАДАЧИ 9.1. Рассмотрите данные первой реплики в задаче 8.1. Пусть эти на- наблюдения нельзя сделать на одной партии металла. Постройте план такого эксперимента в двух блоках по четыре наблюдения в каждом со смешива- смешиванием ABE. Проведите анализ данных. 220 9.2. Рассмотрите данные эксперимента по плану 25 из задачи 9.3. Пусть его необходимо провести в четырех блоках со смешиванием ACDE и BCD (и, следовательно, ABE). Проведите анализ данных для такого плана. 9.3. Постройте план 26 в восьми блоках по восемь наблюдений в каж- каждом, взяв в качестве независимых эффектов для смешивания с блоками взаимодействия ABCD, ACDE и AEF. Найдите другие эффекты, смешанные с блоками. 9.4. Рассмотрите план 22 в двух блоках со смешиванием АВ. Докажите алгебраическими методами, что SSab^SSbh- 9.5. Проведите смешивание плана З3 в трех блоках, использовав компо- компонент ЛВС2 трехфакторного взаимодействия. Сравните свои результаты с пла- планом на рис. 9.6. 9.6. Рассмотрите данные первой реплики в задаче 8.10. В допущении, что 27 наблюдений нельзя сделать за один день, постройте план для прове- проведения эксперимента за три дня, взяв для смешивания с блоками компонент АВ2С. Проведите анализ этих данных. 9.7. Опишите построение таблицы ДА для плана З4 в девяти блоках, приведенных на рис. 9.7. Является ли такой план приемлемым для практики? 9.8. Пусть в задаче 9.1 мы смешивали ABC в реплике I, АВ в реплике- II и ВС в реплике III. Постройте таблицу ДА. 9.9. Повторите решение задачи 9.1 в допущении, что ABC смешивалось с блоками в каждой реплике. 9.10. Постройте план 23 со смешиванием ABC в первых двух репликах и ВС — в третьей. Опишите построение таблицы ДА и выскажите свое мне- мнение о получаемой информации. 9.11. Рассмотрите факторный план 52. Используя компонент двухфактор- ного взаимодействия, проведите смешивание плана в пяти блоках. Опишите построение таблицы ДА. ГЛАВА ДЕСЯТАЯ ДРОБНЫЕ РЕПЛИКИ 10.1. ВВЕДЕНИЕ При увеличении числа факторов в факторных эксперимен- экспериментах типа 2й или 3h число наблюдений, необходимых для полной реплики плана, быстро перерастает возможности большинства исследователей. Для полной реплики плана 26 необходимо 64 наблюдения; в этом плане из 63 степеней свободы только 6 соответствуют главным эффектам и только 15 — двухфактор- ным взаимодействиям, остальные 42 степени свободы прихо- приходятся на взаимодействия трех и более факторов. В эксперимен- экспериментах типа 3k, например, для плана З5 требуется 243 наблюдения, и из 242 степеней свободы лишь 10 соответствуют главным эф- эффектам. Если экспериментатор с достаточным основанием может считать некоторые из взаимодействий высокого порядка прене- 221
брежимо малыми, то информацию о главных эффектах и взаи- взаимодействиях низкого порядка можно получить, проведя лишь дробную долю полного факторного эксперимента. Такие дроб- дробные факторные эксперименты, нашедшие широкое применение при исследованиях в промышленности, и рассматриваются в на- настоящей главе. Одним из основных приложений дробных фак- факторных планов являются отсеивающие эксперименты; в них ис- исследуется много факторов одновременно, для того чтобы выде- выделить из них (если таковые окажутся) факторы, обладающими большими эффектами. Отсеивающие эксперименты проводятся обычно на ранних этапах исследования, причем часто оказыва- оказывается, что большинство исходных факторов практически не влияет на отклик. Факторы, которые, как устанавливается, являются важными, исследуются затем более тщательно в последующих экспери- экспериментах. 10.2. ДРОБНЫЕ РЕПЛИКИ ФАКТОРНОГО ПЛАНА ТИПА 2" Простейшие дробные реплики применяются в планах типа 2й. Полная реплика факторного эксперимента типа 2h позво- позволяет получить независимые оценки k главных эффектов, (|) двухфакторных взаимодействий, ..., Vf\ /i-факторных взаимо- взаимодействий, ... и одного ^-факторного взаимодействия. Покажем, как можно получить информацию относительных главных эф- эффектов и взаимодействий низкого порядка при числе комбина- комбинаций обработок, меньшем, чем 2h. Оказывается, что эффекты, представляющие основной интерес, неотличимы от эффектов более высокого порядка; однако последние считаются настолько малыми, что ими можно пренебречь. 10.2.1. Полуреплика плана типа 2k Рассмотрим ситуацию,, когда интерес представляют три фак- фактора на двух уровнях каждый, но ограниченные возможности не позволяют экспериментатору проверить все 23 = 8 комбина- комбинаций обработок. Он может, однако, провести четыре наблюдения, что наводит на мысль о полуреплике плана 23. Поскольку та- такой план содержит 23~' = 4 комбинации обработок, то полуреп- полуреплика плана 23 часто называется планом 23~'. Табл. 10.1 представляет собой таблицу алгебраических зна- знаков для плана 23. Допустим, что в качестве нашей полуреплики мы выбрали четыре комбинации обработок а, Ъ, с и abc (они приведены в верхней половине таблицы). Для комбинаций об- обработок мы будем использовать как обычные обозначения (а, 222 b, с, ...), так и обозначения с помощью алгебраических знаков; соответствие между ними следующее: Обозначение 1 Обозначение 2 а + Ь -+- с + abc +++ Заметим, что для построения плана 23~' выбраны только те комбинации обработок, у которых в столбце «Эффект ABC» стоит плюс. Поэтому ABC называется генератором полуреплики данного вида. Далее, в столбце I также всегда стоят плюсы, и мы называем равенство I—ABC определяющим соотношением для рассматриваемого плана. Таблица 10.1 Алгебраические знаки для факторного плана 23 Комбинация обработок а Ь С abc ab ас be A) Факторный эффект 7 + + + + + А + + + + В 1+1++1+1 С + + + + АВ + 1 1 +++ 1 1 АС + 1 + 1 + 1 + 1 ВС ++Il+lI+ ABC ++++ 1 1, 1 1 Комбинациям обработок плана 23~' соответствуют три сте- степени свободы, которыми можно воспользоваться для оценива- оценивания главных эффектов. С помощью табл. 10.1 получаем А —— [а—Ь—c + abc]; C=-i-[ — а— Ь +c+abc]. Нетрудно также проверить, что оценки двухфакторных взаимодействий имеют вид ВС = — [a—b—c + abc]; 223
=-j\ — a + b~ c + abc]; abc]. Таким образом, невозможно различить А и ВС, В и АС, С АВ. В сущности, как можно показать, оценивая А, В я С, мы на самом деле оцениваем А + ВС, В+АС и С+АВ. Два или более эффектов, обладающих таким свойством, называются со- совместными. В нашем примере совместными являются А и ВС, В и АС, С и АВ. Структура совместных эффектов для рассматриваемого плана легко устанавливается с помощью определяющего соот- соотношения 1 = АВС; умножив по модулю 2 обе части этого соот- соотношения на какой-либо эффект, получим совместный с ним эф- эффект. В нашем примере для А совместным является эффект А-1 = А-АВС или А—А2ВС=ВС, так как произведение любого эффекта на тождественный элемент / равно этому же эффекту. Аналогично для В совместным является эффект В~ 1 = В • ABC или В=АВ2С=АС, а для С—С>1 = С-АВС или С = АВ. Предположим теперь, что мы выбрали другую полуреплику, т. е. комбинации обработок, которым в столбце ABC табл. 10.1 соответствует знак минус. Таким образом, в альтернативную полуреплику входят комбинации обработок Обозначение 1 Обозначение 2 be Определяющим соотношением для этого плана является / = = —ABC. Пары совместных эффектов имеют вид А = —ВС, В = = —АС и С = —АВ, т. е. при оценивании Л, В и С по этой по- полуреплике мы на самом деле оцениваем А—ВС, В—АС и С—АВ. Дробная реплика, связанная с 1=+АВС, называется главной дробной репликой'. В общем случае полуреплика плана 2й, содержащая 2Й~' на- наблюдений, называется дробным факторным планом типа 2h~1. Для его построения полный план типа 2й разбивается на два блока, причем определяющим соотношением служит взаимо- взаимодействие высшего порядка. Каждый блок представляет собой дробный факторный план типа 2Й-1 с определяющими соотно- соотношениями 1=±АВС... К, где знак генератора зависит от вы- выбора дробной реплики. На практике дробная реплика выбира- выбирается случайным образом. 1 Некоторые авторы называют главной дробную реплику, содержащую A), по аналогии с определением главного блока. 224 План типа 2Й-1 можно построить и другим способом. Сна- Сначала записываются комбинации обработок для полного фак- факторного эксперимента типа 2й, а затем добавляется k-й фак- фактор, уровни которого, обозначаемые знаками плюс и минус, определяются алгебраическим знаком взаимодействия высшего порядка, а именно, ABC... (К—1). Следовательно, для по- построения дробного факторного плана 23-1 надо выписать пол- полный факторный план 22 и приравнять фактор С взаимодейст- взаимодействию АВ. Альтернативную дроб- дробную реплику можно полу- получить, приравняв фактор С вза- взаимодействию (—АВ). Этот ме- метод иллюстрируется табл. 10.2. Пробный факторный план типа 2ft-1 можно спроектиро- спроектировать на полный факторный план для любых k — 1 из ис- исходных факторов. Для плана 23-1 эт0 очевидно из рассмотре- рассмотрения табл. 10.2. На рис. 10.1 по- показано проектирование плана 23-1 с 1 = АВС на три полных факторных плана 2*. Таким об- рис ш, п ование плана разом, если один из факторов 23-J на три плана 22. оказывается несущественным, то мы можем получить полный факторный план для оставшихся двух факторов. Более того, план типа 2Й'~' можно превратить в две реплики полного фак- факторного плана для любых k—2 факторов, четыре реплики пол- полного факторного плана для k—3 факторов и т. д. Таблица 10.2 Две полуреплики плана 23 Полный план 2-2 А + 1 + 1 В + + 23-1, 1=АВС А + 1 + 1 В + + С=АВ + 11 + 23-1, 1=-АВС А + 1 + 1 В + + С=—АВ + + Пример 10.1. Инженер-связист анализирует факторы, которые влияют на производительность (число почтовых отправлений в час) специального па- падающего устройства. Предполагается, что важными могут оказаться четыре фактора: угол наклона ленты наклонного транспортера А, скорость движе- движения леиты В, материал ленты С и положение регулировочного валика D. Выбирается по два уровня каждого из этих факторов и проводится полу- Д. К. Монтгомери 225
реплика плана 24, т. е. план 24~'. Определяющее соотношение для дробной реплики взято в виде I=ABCD, получившийся план приведен в табл. 10.3. Из рассмотрения этой таблицы видно, что для построения плана 24-1 сначала был записан полный план 23, а затем четвертый фактор D прирав- приравнен взаимодействию ABC. Поскольку генератор ABCD положителен, это главная дробная реплика. С помощью определяющего соотношения можно Таблица 10.3 План 2*—1 с определяющим соотношением I=ABCD A + + В -j_ , -_ + С + + + + D=ABC ._ _|_ _|_ _ + — + Комбинация обработок A) ad bd ab cd ac be abed Кодированный ОТКЛИК 74 108 92 130 68 105 95 133 Таблица 10.4 Дисперсионный анализ для плана 24-1 в примере 10.1 заметить, что каждый главный эффект совместен с трехфакторным взаимо- взаимодействием, а именно, A=A2BCD = BCD, B=AB2CD=ACD, C=ABC2D=ABD и D=ABCD2=ABC. Каждое двухфакторное взаимодействие совместно с дру- другим двухфакторным взаимодействием, причем пары совместных эффектов имеют вид AB = CD, AC=BD и BC=AD. Четыре главных эффекта и три пары совместных двухфакторных взаимодействий дают в совокупности семь степеней свободы этого плана. ДА для рассматриваемого плана приведен в табл. 10.4. Сумма квад- квадратов для любого эффекта находится обычным способом, т. е. по формуле SS= (Контраст) W, где ,V = 24-' = 8. Для оценки любого эффекта можно воспользоваться выражением. Эф- фект=2-Контраст/Л^. Если трехфак- торные взаимодействия пренебре- пренебрежимо малы, то наши оценки главных эффектов свободны от каких-либо других эффектов. Однако если мы не можем обоснованно считать пре- пренебрежимо малыми и двухфакторные взаимодействия, то оценки ошибки не существует и формально нельзя провести ДА. Тем ие менее ясно, что главные эффекты А (угол наклона ленты) н В (скорость ленты) велики, и необходимо предусмотреть дальней- дальнейшее исследование этих факторов. Данные примера можно проанализировать и так, как это делалось в 8.2.4, т. е. нанести оценки эффектов на нормальную вероятностную бумагу и принять, что эффекты, не ложащиеся приблизительно иа прямую линию, являются значимыми. Затем можно объединить незначимые эффекты для оценки ошнбкн. Мы можем также спроектировать дробный факторный план 24 иа одну реплику полного факторного плана для любых трех фак- 226 Источник изменчивости A+BCD B+ACD C+ABD D+ABC AB+CD AC+BD BC+AD Сумма Сумма квадратов 2701,125 1128,125 1,125 1,125 3,125 1,125 28,125 3863,875 Степени свободы 1 1 1 1 1 1 1 7 торов или на две реплнки полного факторного плана для любых двух фак- факторов. Так, данные табл. 10.3 можно рассматривать как две реплики плана 22 для А а В, поскольку только эти два фактора, как оказывается, обла- обладают заметными эффектами. Алгоритм Йейтса для дробных факторных экспериментов. Для анализа данных дробных факторных экспериментов типа 2ft~' можно использовать алгоритм Йейтса, если сначала пред- предположить, что эти данные получены в полном факторном экс- эксперименте для k—1 переменной. Комбинации обработок для полного плана записываются в стандартном порядке, а затем к ним добавляется в скобках дополнительная буква (или буквы) для того, чтобы получить действительно исследованные комбинации обработок. Далее применяется, как обычно, алго- алгоритм Йейтса. Действительно оцениваемые эффекты устанавли- устанавливаются при умножении эффектов, связанных с комбинациями обработок полного плана типа 2h~i, на определяющее соотно- соотношение дробного факторного плана типа 2h~l. Применение алгоритма к данным примера 10.1 показано в табл. 10.5. Данные организованы в полный план 23 для фак- факторов А, В и С. Затем для того, чтобы получить действительные _ комбинации обработок, добавляется буква d. Эффект, который оценивается, скажем, во второй строке этой таблицы, имеет вид A+BCD, поскольку эффекты А и BCD совместны. Таблица 10.5 Алгоритм Йейтса для дробного факторного плана 2*—1 в примере 10.1 Комбина- Комбинация обработок A) a(d) b(d) ab c(d) ас be abc(d) Отклик 74 108 92 130 68 105 95 133 (И 182 222 173 228 34 38 37 38 B) 404 401 72 75 40 55 4 1 C) 805 147 95 5 —3 3 15 —3 Эффект A+BCD B+ACD AB+CD C+ABD AC+BD BC+AD ABC+D Оценка эффекта 2XC) N 36,75 23,75 1,25 —0,75 0,75 3,75 —0,75 Сумма квадратов C)a/JV 2701,125 1128,125 3,125 1,125 1,125 28,125 1,125 10.2.2. Четвертьреппика плана типа 2h При достаточно большом числе факторов часто оказыва- оказываются полезными более мелкие дробные реплики. Рассмотрим четверть реплику плана 2й; такой план содержит 2Й~2 на- наблюдений, и его обычно называют дробным факторным планом типа 2fe-2. План типа 2й можно построить, если выбрать два эффекта или генератора и разбить полный план типа 2й на четыре блока 8* 227
Таблица 10.6 Структура совместных эффектов для плана 26-2 с /=ABCE=ACDF= =BDEF по 2h~2 наблюдений в каждом; любой из них является четверть- репликой плана 2й. Если выбранные генераторы обозначить Р и Q, то 1 = Р и I = Q называют генерирующими соотношениями для рассматриваемого плана. Знаки Р и Q (плюс или минус) зависят от того, какой из четырех блоков выбран в качестве дробной реплики. Дробная реплика, для которой и Р и Q поло- положительны, называется главной. Полное определяющее соотно- соотношение для плана включает в себя Р, Q и их обобщенное вза- взаимодействие PQ, т. е. имеет вид I = P = Q = PQ. Элементы Р, Q и PQ определяющего соотношения назовем словами. Эффекты, совместные с данным, можно найти, умножив этот эффект по модулю 2 на каждое слово оп- определяющегося соотношения. Ясно, что с любым эффектом совместны еще три. Экспери- Экспериментатор должен проявлять осторожность при выборе ге- генераторов, чтобы потенци- потенциально важные эффекты не оказались совместными. Рассмотрим в качестве примера план 26~2. Предполо- Предположим, что мы выбрали генери- генерирующие соотношения в виде 1 = АВСЕ и I = ACDF. Тогда обобщенным взаимодействием генераторов АВСЕ и ACDF будет BDEF. Таким образом, получаем определяющее со- соотношение для этого плана I = ABCE = ACDF = BDEF. Для нахождения совместных эф- эффектов (например, для А) ум- умножим этот эффект на каждое слово определяющего соотношения, и в нашем случае получим A = BCE=CDF = ABDEF. Легко проверить, что каждый глав- главный эффект совместен с трехфакторными и пятифакторными взаимодействиями, а двухфакторные взаимодействия совме- совместны друг с другом и взаимодействиями более высокого по- порядка. Так, при оценивании, например А мы на самом деле оцениваем A + BCF + CDF+ABDEF. Полная структура совмест- совместных эффектов для этого плана приведена в табл. 10.6. Если взаимодействия трех и более факторов пренебрежимо малы, то рассматриваемый план дает оценки главных эффектов, свобод- свободные от других эффектов. Для фактического построения рассматриваемого плана мы сначала получили бы четыре блока плана 26 со смешиванием АВСЕ и ACDF, а затем выбрали бы блок с комбинациями об- 228 Эффект А В с D Е F АВ АС AD АЕ AF BD BF ABF CDE Совместные с ннм ВСЕ АСЕ ABE ACF ABC ACD СЕ BE CF ВС CD EF DE CEF ABD CDF DEF ADF BEF BDF BDE BCDF DF BCDE CDEF BCEF ACDE A BCD BCD AEF эффекты ABDEF ABCDF BCDEF A BCDE ACDEF ABCEF ADEF ABCDEF ABEF ABDF ABDE ABCF ACEF ADE CBF работок, положительными относительно АВСЕ и ACDF. Это был бы дробный факторный план 26~2 с генерирующими соот- соотношениями 1 = АВСЕ и I = ACDF, причем главная — дробная реплика, поскольку оба генератора АВСЕ и ACDF положи- положительны. При более непосредственном подходе к построению рас- рассматриваемого плана сначала записываются комбинации об- обработок для полного факторного плана 26~2 = 24 в переменных А, В, С и D. Затем добавляются два фактора Е и F и сопостав- сопоставляются их уровни, обозначаемые знаками плюс и минус, со знаками плюс и минус взаимодействий ABC и ACD соответст- соответственно. Эта процедура показана в табл. 10.7. Таблица 10.7 Построение плана 26~2 с генерирующими соотношениями / = АВСЕ и / = ACDF А _ + — + — — 4- — + + — — в _ — 4- -,- — — -1- + — — + — — + С — — — + 4- + + — — — — + + + D _ — — — — — — — 4- + + + 4- _j_ _{_ + Е = ABC _ 4- + + — — + н- -¦- — + — + F = ACD _ — 4- + -- — — 4- — — A) aef be abf cef ас bcf abce df ade bdef abd cde acdf bed abedef Очевидно, что существуют три альтернативные дробные реп- реплики данного плана 26~2; они определяются генерирующими со- соотношениями 1 = АВСЕ и I = —ACDF, 1 = —ABCE и I = ACDF, 1 = —АВСЕ и I = —ACDF. Эти дробные реплики можно легко построить методом, примененным в табл. 10.7. Например, если мы хотим найти дробную реплику, для которой 1 = АВСЕ и / = = —ACDF, то в предпоследнем столбце табл. 10.7 полагаем F = —ACD и столбец уровней для фактора F принимает вид + — + + —+ h h+ — + — Полным определяющим соотношением для этой альтернатив- альтернативной дробной реплики является 1 = АВСЕ = —ACDF = —BDEF, меняются и некоторые знаки в структуре совместных эффектов 229
(см. табл. 10.6). Например, с эффектом А совместны А = ВСЕ = = —CDF=—ABDEF; таким образом, при оценивании эффекта А на самом деле оценивается А+ВСЕ—CDF—ABDEF. Наконец, отметим, что дробный факторный план 26~2 можно преобразовать в одну реплику плана 24 для подмножества из четырех факторов, которое не является словом определяющего соотношения. Его можно также преобразовать в повторную по- полуреплику плана 24 для любого подмножества из четырех фак- факторов, являющегося словом определяющего соотношения. Так, план, приведенный в табл. 10.7, становится двумя репликами плана 24-1 для факторов АВСЕ, ACDF и BDEF, поскольку они представляют собой слова определяющего соотношения. Суще- Существует 12 других сочетаний исходных шести факторов, напри- например, ABCD, ABCF и т. д., для которых рассматриваемый план проектируется на одну реплику плана 24. Рассматриваемый план можно также преобразовать в две реплики плана 23 для любого подмножества трех из шести факторов или в четыре реплики плана 22 для любого подмножества двух факторов. В общем случае любой дробный факторный план типа 2Й~2 можно преобразовать либо в полный факторный план, либо дробный факторный план для некоторого подмножества г^ ^?—2 исходных факторов. 10.2.3. Общий случай дробного факторного плана типа 2к~р Дробная реплика факторного плана типа 2ft, содержащая 2h~P наблюдений, называется 7гр-репликой плана 2й или про- проще— дробным факторным планом типа 2к~Р. Этот план можно построить, выбрав р независимых генераторов (ни один из них не должен быть обобщенным взаимодействием остальных), по- построив 2р блоков, связанных с этими генераторами, и выделив затем один блок в качестве дробной реплики. Определяющее соотношение для этого плана содержит р первоначально вы- выбранных генераторов и 2р—р—1 их обобщенное взаимодей- взаимодействие. Структуру совместных эффектов можно установить, умно- умножив каждый эффект по модулю 2 на определяющее соотноше- соотношение. При выборе генераторов следует проявлять осторожность, чтобы, не оказались совместными эффекты, представляющие потенциальный интерес. С каждым эффектом совместны 2р—1 эффекты. При умеренно больших значениях k мы обычно де- делаем допущение, что взаимодействия высокого порядка (ска- (скажем, взаимодействия трех, четырех и более факторов) пренеб- пренебрежимо малы; это существенно упрощает структуру совмест- совместных эффектов. Дробный факторный план типа 2к~Р позволяет применить для анализа данных алгоритм Йейтса. Для этого данные пред- 230 ставляются в виде результатов полного факторного экспери- эксперимента типа 2Г, где r = k—р — подмножество исходных k факто- факторов. Дополнительные факторы включаются в план, когда уста- устанавливаются эффекты, оцениваемые на самом деле (см. 10.2.1). Как правило, исходное подмножество г факторов нельзя выби- выбирать произвольным образом. Во всяком случае, анализ для рассматриваемого плана можно проводить исходя из основных принципов; оценка эффекта имеет вид Эффект+2 • Контраст/Л^, а сумма квадратов для эффекта 55= (Контраст) 2/N, где N = 2h~P — общее число наблюдений. План типа 2л~р позво- позволяет оценить только 2k~v—1 эффект (и совместных с ними эф- эффектов) . План типа 2fe~p можно преобразовать в план либо полного, либо дробного факторного эксперимента для любого подмно- подмножества r^.k—р исходных факторов. К дробным факторным планам приводят подмножества факторов, которые являются словами полного определяющего соотношения. Это оказыва- оказывается особенно полезным в отсеивающих экспериментах, когда мы еще до их проведения подозреваем, что большинство исход- исходных факторов обладает незначительными эффектами. Первона- Первоначальный план типа 2к~Р можно тогда преобразовать, скажем, в полный факторый план для наиболее интересных факторов. Выводы, полученные с помощью таких планов, надо считать предварительными, они могут быть пересмотрены при после- последующем анализе. Часто оказывается возможным дать и иную интерпретацию данных, касающихся взаимодействий высокого порядка. В табл. 10.8 приведена '/в-реплика плана 27, или дробный факторный план 27~3. Генерирующие соотношения для этого плана имеют вид I=ABCE, I = ABDF и I=ACDG; следова- следовательно, полным определяющим соотношением является / = =ABCE=ABDF=ACDG = CDEF=BDEG=AEFG. Если прене- пренебречь взаимодействиями трех и более факторов, то этот план позволяет получить оценки главных эффектов, свободные от других эффектов; двухфакторные взаимодействия при этом оказываются совместными. Разбиение на блоки в дробных факторных планах. Иногда для дробного факторного плана требуется настолько много на- наблюдений, что все они не могут быть проведены при однород- однородных условиях. В таких ситуациях может применяться разбие- разбиение дробных факторных планов на блоки. Для иллюстрации общей процедуры рассмотрим дробный факторный план 26~2 с определяющим соотношением /= =ABCE=ACDF = BDEF (см. табл. 10.7). Этот план содержит 231
Блок 1 Блок 2 16 комбинаций обработок; допустим, мы хотим разбить этот план на два блока по 8 комбинаций обработок в каждом. При выборе взаимодействия для смешивания с блоками заметим, что из рассмотрения структуры совместных эффектов (см. табл. 10.6) следует существование двух множеств совместных эффектов, состоящих только из трехфакторных взаимодей- взаимодействий. Выбрав для смешива- смешивания ABF (и совместные с ним эффекты), мы получим два блока, приведенные на рис. 10.2. Отметим, что в глав- главный блок входят те комби- комбинации обработок, у которых число букв, общих с ABF, четно. Это также те комбина- A) aef bcf abce bdef abd cde acdf be abf cef ac df ade bed abedef Рис. 10.2. План 26—2 в двух блоках со смешиванием ABF. Таблица 10.8 Дробный факторный план 27~3 ции обработок, для которых L x+ + 6 — Q (мод. 2). A + + + 4- + + 4- 4- в — 4_ 4- 1 4- 1 4- i _!_ + + .^_ C — -L. _P I r ,,| , _j- ,_j . I _]_ г 1 + 1 — + i + + i ~T~ 1 -f- + ! + E 1 + 1 + + + — F _ + + — — + i — + — — -U + — + с + — + + — 4- — — — 4- — — + A) aefd bef abg ceg acf bcfg abce df ade bdeg abdf cdef acdg bed abedefg 10.3. ЧАСТНЫЕ ТИПЫ ДРОБНЫХ ФАКТОРНЫХ ПЛАНОВ 2*р 1 Для дробных факторных планов можно ввести классифика- классификацию; Бокс и Хантер [14, 15] положили в ее основу разрешаю- разрешающую способность планов: 1 Часть материала этого параграфа в переработанном виде заимствована у Бокса и Хантера [14, 15] с разрешения Американского статистического об- общества. 232 1. Планы разрешающей способности III. К ним относятся планы, в которых никакие главные эффекты не являются со- совместными друг с другом, но с главными эффектами совместны двухфакторные взаимодействия, которые совместны друг с дру- другом. Примером служит план 23 (см. табл. 10.1). 2. Планы разрешающей способности IV. К ним относятся планы, в которых никакие главные эффекты не являются совместными друг с другом или двухфакторными взаимодейст- взаимодействиями, но последние друг с другом совместны. Примером яв- является план 24-1 (см. табл. 10.3). 3. Планы разрешающей способности V. К ним относятся планы, в которых никакие главные эффекты и двухфакторные взаимодействия не являются совместными друг с другом, но двухфакторные взаимодействия совместны с трехфакторными взаимодействиями. Примером служит план 25~'. В общем случае под разрешающей способностью плана по- понимается наименьшее число букв в слове определяющего соот- соотношения. Следовательно, приведенные выше типы планов можно назвать трех-, четырех и пятибуквенными планами соот- соответственно. Для обозначения разрешающей способности плана используются римские цифры в качестве нижнего индекса. Так, план 2^—это план типа 23~' с разрешающей способностью III. Чем выше дробность планов, тем больше нужно допущений для обеспечения однозначности интерпретации результатов. Планы разрешающей способности III, IV и V обладают не- несколькими интересными свойствами и приложениями; некото- некоторые из результатов будут приведены в настоящем параграфе. В более систематизированном и удобном виде результаты из- изложены в работах Бокса и Хантера [14, 15]. 10.3.1. План типа 2k~p с разрешающей способностью III Можно построить планы разрешающей способности III для исследования факторов, число которых не превышает k = N—1, всего по N наблюдениям, где N кратно четырем. Эти планы ча- часто используются в промышленности. Сначала будут рассмот- рассмотрены планы, где N является степенью 2, которые могут быть построены методами, уже обсуждавшимися в данной главе. Особенно важны планы, в которых требуется 4 наблюдения не более чем для 3 факторов, 8 наблюдений не более чем для 7 факторов и 16 наблюдений не более чем для 15 факторов. Если k = N—1, то дробный факторный план называется насы- насыщенным. Вплоть до трех факторов при четырех наблюдениях можно исследовать с помощью плана 23IyjI, рассмотренного в 10.2.1. К насыщенным дробным факторным планам относится и очень полезный план 2^fj4 или Vie-реплика плана Т. Его можно 233
построить, записав сначала алгебраическими знаками уровни факторов для полного плана 23 в переменных А, В и С, а за- затем сопоставив уровни четырех дополнительных факторов с взаимодействиями исходных трех факторов следующим обра- образом: D=AB, Е = АС, F = BC и G = ABC. Поэтому генерирую- генерирующими соотношениями для плана являются I=ABD, 1 = АСЕ, I = BCF и I—ABCG. Полученный план приведен в табл. 10.9. Таблица Ю.9 План 2щ4 с генерирующими соотношениями /= ABD, I = АСЕ, I = BCF и / = abcg 'а — + — + — + — + в — + + — — + + с — — — + 1 + + D = AB + — — + + — — + Е = АС + — + — — — + F = ВС + + — — — — + + G= ABC _ + + + — — ¦ + def afg beg abd cdg ace bcf abcdefg Для нахождения полного определяющего соотношения со- составим произведения генераторов ABD, АСЕ, BCF и ABCG по два, три и четыре; это дает I=ABD=ACE=BCF=ABCG=BCDE=ACDE= =CDG=ABEF=BEG=AFG=DEF=ADEG= = CEFG = BDFG = ABCDEFG. Эффекты, совместные с данным эффектом, можно найти, умно- умножив его на каждое слово определяющего соотношения; так, для В получаем B=AD=ABCE=CF=ACG=CDE-ABCDF=BCDG= =AEF=EG=ABFG=BDEF=ABDEG=DFG=ACDEFG. Рассматриваемый план является '/ш-репликой, причем глав- главной дробной репликой, поскольку знаки генераторов положи- положительны. Наименьшее число букв в слове определяющего соот- соотношения равно трем, следовательно, это план разрешающей способности III. Любой из 16 различных планов 2^4 можно было бы построить, использовав одну из 16 возможных пере- перестановок знаков в соотношениях I=±ABD, I=±ACE, 1 = = ±BCF hI=±ABCG. Семь степеней свободы данного плана можно использовать для оценивания семи главных эффектов. Оценки имеют вид 234 линейных комбинаций наблюдений, знаки в которых соответст- соответствуют столбцам табл. 10.9. Так, для оценивания А берутся ал- алгебраические знаки из столбца А. С каждым из главных эф- эффектов совместны еще 15; однако в предположении, что вза- взаимодействия трех и более факторов пренебрежимо малы, структура совместных эффектов существенно упрощается. Тогда линейные комбинации для главных эффектов являются на са- самом деле оценками A0.1) где lt относится к линейной комбинации вариантов обработок, задаваемых i-м столбцом табл. 10.9. Насыщенный план 2^4 (см- табл. 10.9) можно использо- использовать для получения планов разрешающей способности III для исследования и менее семи факторов при восьми наблюдениях. Например, для построения плана для шести факторов при восьми наблюдениях просто отбрасывается один из столбцов в табл. 10.9, скажем, столбец G; получившийся план приведен в табл. 10.10. Таблица 10.10 План 2^3 с генерирующими соотношениями / = ABD, I = АСЕ и / = BCF A _L 1 _l_ _ + В 1 + с 1 + D = AB + . . + E = AC _|_ + F = ВС + + def af be abd cd ace bcf abcdef Легко проверить, что это план разрешающей способности III. Действительно, это план 2^]3, или Vs-реплика плана 26. Определяющее соотношение для него получается исключением из определяющего соотношения для исходного плана 2^4 всех 235
слов, содержащих букву G, т. е. имеет вид В общем случае, когда отбрасываются d факторов, то опре- определяющее соотношение для нового плана состоит только из тех слов исходного определяющего соотношения, которые не содер- содержат каких-либо из отброшенных букв. При построении планов этим методом нужно быть внимательным, стараясь получить лучший из возможных планов. Если в табл. 10.9 отбросить столбцы В, D, F и G, то получится план для трех факторов при восьми наблюдениях, однако комбинации обработок будут со- соответствовать двум репликам плана 22. Экспериментатор пред- предпочел бы, вероятно, провести полный факторный эксперимент типа 23 для А, С и Е. Можно построить также план разрешающей способности III и для исследования не более 15 факторов при 16 наблюдениях. Этот насыщенный план 2'^п получается, если сначала записать 16 комбинаций обработок плана 24 для А, В, С и D, а затем приравнять 11 новых факторов взаимодействия двух, трех и че- четырех исходных факторов. Аналогичная процедура применяется и для плана 2^-26, который позволяет исследовать вплоть до 31 фактора при 32 наблюдениях. Объединение дробных реплик для разделения эффехтов. Объединяя дробные факторные планы, в которых есть знаки, противоположные друг другу, мы можем изолировать потен- потенциально интересные эффекты. Структура совместных эффектов для дробной реплики с обратным знаком одного или более эф- эффектов получается изменением знаков соответствующих факто- факторов в аналогичной структуре для исходной .дробной реплики. Рассмотрим план Щу* (см. табл. 10.9). Предположим, что кроме этой главной дробной реплики проведена еще одна с противоположными знаками в столбце для фактора D, а именно, столбец для D во второй реплике имеет вид Ь + Ь+ — Эффекты, которые оцениваются в первой реплике, определены выражениями A0.1), а для второй реплики получаем + BG—DF; A0.2) 236 в допущении, что взаимодействия трех и более факторов несу- несущественны. Теперь для двух линейных комбинаций эффектов 72(/ib/i*) и 42{U—k*) следует, что A В С D Е F G A + CE + FG B + CF + FG C + AE + BF AB+CG + EF E + AC + BG F + BC + AG G + BE + AF BD; AD; DG; D; DF; DE; CD. Таким образом, мы изолировали главный эффект D и все его двухфакторные взаимодействия. В общем случае, если к дробному факторному плану разрешающей способности III добавить еще одну дробную реплику с обратными знаками од- одного из факторов, то объединенный план позволит получить оценки главного эффекта этого фактора и его двухфакторных взаимодействий. Предположим теперь, что к дробному факторному плану мы добавляем вторую дробную реплику с обратными знаками всех факторов. Такая процедура разрывает связи совместности между главными эффектами и двухфакторными взаимодейст- взаимодействиями. Другими словами, с помощью объединенного плана можно получить оценки всех главных эффектов, свободные от каких-либо двухфакторных взаимодействий. Данный метод ил- иллюстрируется следующим примером. Пример 10.2. Проводится эксперимент для исследования времени фоку- фокусирования глаза человека. Специальная аппаратура позволяет во время опыта контролировать несколько факторов. До начала эксперимента важными счи- считаются факторы: резкость изображения на мишени А, расстояние от глаза до мишени В, форма мишени С, уровень освещенности D, размер мишени Е, плотность изображения F и обследуемый G. Рассматриваются два уровня каждого фактора. Экспериментатор полагает, что лишь некоторые из этих семи факторов действительно являются важными и взаимодействия высокого порядка между факторами пренебрежимо малы. На основе этих допущений он решает провести отсеивающий эксперимент, определить наиболее важные факторы и затем исследовать их более детально. Для этого он проверяет в случайном порядке комбинации обработок плана 27~4 (см. табл. 10.9); измеренные времена фокусирования (в мс) приведены в табл. 10.11. По данным эксперимента можно оценить семь главных эффектов (и со- совместных с ними). Уравнения A0.1) дают EF 2Q63 237 = C+AE+BF+DG=—0,28;
= E+AC+BG+DF=-0,28; = — 0,63; = — 2,43. Наибольшую величину имеют три эффекта /д, 1в и /с. Простейшая ин- интерпретация даииых состоит в том, что значимыми являются главные эф- эффекты А, В и D. Однако такая интерпретация ие единственна, поскольку можно также сделать вполне логичный вывод, что истинными эффектами являются А, В и взаимодействие АВ или, вероятно, В, D и взаимодействие BD или же, наконец, A, D и взаимодействие AD. Таблица 10.11 План 2J^4 для эксперимента по времени фокусирования глаза A — + + — + + В — — + + — — + + С — — — — + + + + D = AB + — — + + — + ? = AC + — + — — + — + F = ВС + + — — — — + G = ABC + + — — — + def afg beg abd cdg ace bcf abcdefg Отклик 85,5 75,1 93,2 145,4 83,7 77,6 95,0 141,8 Для того чтобы разделить главные эффекты и двухфакторные взаимо- взаимодействия, проводится еще одна дробная реплика, в которой все зиаки изме- изменены на обратные. Этот план приведен в табл. 10.12 вместе с измеренными значениями отклика. По этой реплике получаются следующие оценки эффектов: l*A=—A + BD+CE+FG=n,68; 1*b=—B+AD+CF+EG=— 37,73; =— 29,88; =— E+AC+BG + DF=— 0,53; r = —F+BC+AG+DE=—lfi3; Таблица 10.12 Другой план 2j для эксперимента по времени фокусирования глаза A + + ¦ + + В + + ¦— + + с + + + — — D = AB — + + + E = AC —. + — + + — + F = ВС — + + T + — G = ABC + — — + —. + + abcg bcde acdf cefg abef bdfg adeg A) Отклик 91,3 136,7 82,4 73,4 94,1 143,8 87,3 71,9 238 Объединив обе дробные реплики и образовав линейные комбинации ; + /;*) и 4i(li — li*), получаем A BD + CE + FG = 19,5 Л =1,48 В AD + CF + EG = 0,-33 В = 38,05 С AE + BF + DG= 1,53 С =—1,80 D AB + CG + EF= — 0,50 D = 29,38 Е AC + BG + DF= —0,40 ? = 0,13 F ВС + AG + DE = —1,53 F = 0,50 G CD + BE + 4F= —2,55 G = 0,13 Наибольшими эффектами являются В и D. Третий по величине эффект BD + CE+FG разумно объяснить взаимодействием BD. Для проверки полу- полученных результатов экспериментатор исследовал два фактора: расстояние В и уровень освещенности D, зафиксировав значения остальных факторов А, С, Е и F. В этих новых экспериментах ои решил рассматривать обследуе- обследуемых как блоки, т. е. не игнорировать полностью возможный эффект обсле- обследуемых, так как для завершения опытов потребуется несколько человек. Планы Плэкетта—Бёрмена. Плэкеттом и Бёрменом [56] были предложены планы для исследования k = N—1 двухуров- двухуровневых факторов в N наблюдениях, где N кратно 4. Если N яв- является степенью 2, то эти планы совпадают с планами, уже рассматривавшимися в данном параграфе. Однако планы Плэ- Плэкетта—Бёрмена часто оказываются полезными и при iV = 12, 20, 24, 28 и 36. В верхней части табл. 10.13 приведены строки алгебраиче- алгебраических знаков, необходимые для построения планов Плэкетта— Бёрмена при Л^=12, 20, 24 и 36, а в нижней части — блоки ал- алгебраических знаков для построения плана при Л^=28. При N=12, 20, 24 и 36 для построения плана нужно записать соот- Таблица 10.13 Алгебраические знаки для планов Плэкетта—Бёрмена ft=ll, ЛГ=12 /г=19, N=20 ft=23, ЛГ=24 ft=3S, N—36 + +++++ fc=27, ЛГ=2 239
ветствующую строку табл. 10.13 в виде столбца; следующий столбец получается из этого смещением элементов на одну по- позицию вниз, причем последний элемент ставится на место пер- первого. Третий столбец получается из второго аналогичным об- образом, и процесс продолжается до тех пор, пока не будет по- построен k-й. столбец. Затем для завершения плана добавляется строка знаков минус. При N = 28 три блока X, Y и Z записыва- записываются в порядке X Y Z Z X Y Y Z X и к этим 27 строкам добавляется строка знаков минус. План для &=11 факторов и N=12 наблюдений приведен в табл. 10.14. Таблица 10.14 План Плэкетта—Бёрмена дл« А 11+111+++1++ В 1++1+++111+1 С I 1111+++1++1+ D !+1++1+++111 i N=12 Е F 111+1++1+++1 С 1++1++1+111+ н ++111+1++1+1 11++1+111+++ J 1++1+111+++1 к 1+1+111+++1+ 10.3.2. Планы разрешающей способности IV и V В дробных факторных планах типа 2й~р с разрешающей способностью IV главные эффекты свободны от двухфакторных взаимодействий, причем некоторые из последних совместны друг с другом. Таким образом, если отбросить взаимодействия трех и более факторов, то план типа 2^~р позволяет непосредст- непосредственно оценить главные эффекты. Разрешающей способностью IV обладает план 26~2 (см. табл. 10.7). Две объединенные реп- реплики плана 27~4 из примера 10.2 дают план 2\~ъ. Любой план типа 2*~р должен содержать не менее 2k на- наблюдений. Планы разрешающей способности IV, содержащие ровно 2k наблюдений, называются минимальными планами. Планы разрешающей способности IV можно получить из пла- планов разрешающей способности III методом «дублирования на- 240 оборот»'. Для этого к исходной дробной реплике плана типа 2h~"c нужно просто добавить еще одну, в которой все знаки из- изменены на обратные. Затем знаки плюс в столбце I для первой дробной реплики заменяются во второй дробной реплике на знаки минус, и этому столбцу ставится в соответствие (&+1)-й фактор. В результате, получается дробный факторный план типа 2f~P+'. Применение метода к плану 2^' показано в табл. 10.15. Легко проверить, что получается план 2\~* с ге- генерирующим соотношением I = ABCD. Таблица 10.15 План 2jy , полученный методом «дублирования наоборот» Исходный план 2jj] с I — ABC Второй план 2^' с обратными зна- знаками D I + + + + 1 1 1 1 А 1 + 1 + 1 + 1 + В + + + + С + 11 + + + Разрешающей способностью V обладают дробные фактор- факторные планы, в которых никакие из главных эффектов и двух- двухфакторных взаимодействий не являются совместными друг с другом. Самое короткое слово определяющего соотношения такого плана должно состоять из пяти букв. Например, раз- разрешающей способностью V обладают план 25~' с генерирую- генерирующим соотношением I = ABCDE и план 28~2 с генерирующими соотношениями I — ABCDG и I = ABEFH. Дальнейшие примеры этих планов даны Боксом и Хантером [15]. 10.4. ДРОБНЫЕ РЕПЛИКИ ФАКТОРНОГО ПЛАНА ТИПА 3" Понятие дробной реплики можно обобщить на случай фак- факторных планов типа 3fe. Поскольку полная реплика плана 3k может потребовать довольно большого числа наблюдений даже при умеренных значениях k, то в этих планах введение Дроб- Дробных реплик особенно привлекательно. Английское написание этого метода фолд овер. (Прим. ред.) 241
10.4.1. Третьреплика плана типа 3ft Наибольшей из употребляемых дробных реплик плана типа 3k является третьреплика, содержащая 3h~1 наблюдений; сле- следовательно, она называется дробным факторным планом типа Зй~'. Для построения такого плана выбирается компонент вза- взаимодействия с двумя степенями свободы (в общем случае наи- наивысшего порядка), и полный план типа 3й разбивается на три блока. Можно использовать любой из этих блоков, являю- являющихся дробными факторными планами типа Зй~'. Если АВа* Ca*...Kak—компонент взаимодействия, служащий для определения блоков, то 1 = АВа* № .. .K,ak называется опреде- определяющим соотношением данного дробного факторного плана. С каждым главным эффектом или компонентом взаимодейст- взаимодействия, которые оцениваются в плане типа 3ft~', совместны два эффекта; их можно найти, умножив исходный эффект по мо- модулю 3 на / и I2. Рассмотрим в качестве примера третьреплику плана З3. Для построения плана мы можем выбрать любой из компонентов взаимодействия ABC, т. е. ABC, AB2C, ABC2 или АВ2С2. Таким образом, существует 12 различных третьреплик плана З3, опре- определяемых выражением Xi+0.2X2 + 0.3X3 (мод. 3), где аг = 1 или 2, a u = 0, 1 или 2. Предположим, что мы выбрали компонент АВ2С2. Каждая дробная реплика получающегося плана З3 должна содержать ровно 32 = 9 комбинаций обработок, удовлет- удовлетворяющих соотношению Х] + 2х2 + 2х3 = « (мод. 3), где « = 0, 1 или 2. Легко проверить, что эти три третьреплики имеют вид, приведенный на рис. 10.3. Для любого из полученных планов структура совместных эффектов оказывается следующей: А = А (ЛВ2С2) = Л2Б2С2 = ABC; А = А (ЛВ2С2J = Л3В4С4 = ВС; В = В(АВ2С2) = ЛВ3С2=ЛС2; С = С(АВ2С2) = С = С (ЛВ2С2J = Л2В4СБ = АВ2С; АВ = АВ (ЛВ2С2) = Л2В3С2 = АС; Следовательно, четыре эффекта, которые на самом деле оцениваются по восьми степеням свободы плана, имеют вид А + ВС+АВС, В+АС2+АВС2, С+АВ2+АВ2С и АВ+АС + ВС2. На практике такой план может быть полезен только в том слу- случае, если все взаимодействия малы по сравнению с главными эффектами. 242 План 1 План 2 План 3 Прежде чем закончить рассмотрение плана 33~', заметим, что если А обозначает строку, а В — столбец, то план можно записать в виде 000 012 021 101 ПО 122 202 211 220 т. е. в виде латинского квадрата 3X3. Допущение пренебрежи- мой малости взаимодействий, необходимое для однозначной интерпретации данных при плане 33-1, находит аналогию в пла- планах с использованием латин- латинских квадратов. Однако эти два типа планов возникают по различным причинам, один — как следствие взятия дробных реплик, другой — из-за огра- ограничений на рандомизацию. Из табл. 4.13 видно, что сущест- существует лишь 12 латинских квад- квадратов 3x3, каждый из кото- которых соответствует одному из 12 различных дробных фак- факторных планов. Комбинации обработок плана типа 3ft~' с определяю- определяющим соотношением 1 = АВа* № ... Kak можно получить __ дпц-i и иным способом. Сначала за- ~ пишем 3ft~' наблюдений пол- полного плана типа 3ft~' в обычных обозначениях цифрами 0, 1 и 2. Затем введем k-н фактор, приравняв его уровни Хи соответ- соответствующему компоненту взаимодействия высшего порядка, ска- скажем, АВа> Са*. . . (К—l)a*-i при помощи соотношения Xfe=Pl*l+P2*2 + ... + Pft-l*ft-l, (Ю.З) где Р;=C—ай)(Хг (мод. 3) при l<i^-l. В качестве иллюстрации применим данный метод к по- построению плана З4 с определяющим соотношением I = AB2CD (табл., 10.16). Легко проверить, что первые три цифры каждой комбинации обработок в этой таблице совпадают с 27 наблю- наблюдениями полного плана З3. Для AB2CD получаем ai = ct3 = a4=l и а2 = 2, откуда следует, что Pi=C—l)ai (мод 3) = C—1)-1 = = 2; р2=C— 1)а2 (мод 3) = C— 1) -2 = 4= 1 (мод 3) и р3 = = C—1)а3 (мод 3) = C—1) - 1 == 2. Таким образом, соотноше- соотношение A0.3) принимает вид xi = 2xl+x2 + 2x3. A0.4) Уровни четвертого фактора удовлетворяют соотношению A0.4), 000 012 101 202 021 ПО 122 211 220 200 212 001 102 221 010 022 111 120 100 112 201 002 121 210 222 011 020 Рис. 10.3. Три третьреплики плана З3 с определяющим соотношением 243
Таблица 10.16 План З4-1 с I=AB*CD 0000 0101 1100 1002 0202 1201 2001 2102 2200 0012 ОНО 0211 1011 1112 1210 2010 2111 2212 2221 0021 0122 022D 1020 1121 1222 2022 2121 например, 2 • 0+1 • 0+2 • 0 = 0; 2-0+1 • 1+2 • 0=1; 2-1 + 1-1 + + 2-0 = 3 = 0 и т. д. Построенному плану З4-1 соответствуют 26 степеней сво- свободы, которые можно использовать с целью нахождения сумм квадратов для 13 главных эффектов и компонентов взаимодей- взаимодействия (и совместных с ними эффектов). Совместные эффекты определяются обычным способом, например, с А совместны A(AB2CD)=ABC2D2 и A(AB2CDJ = BC2D2. Нетрудно прове- проверить, что 4 главных эффекта свободны от двухфакторных взаи- взаимодействий, но некоторые из по- последних совместны друг с другом. При статистическом анализе для плана типа 3s используются обыч- обычные методы ДА для факторных экспериментов. Суммы квадратов для компонентов вззаимодействия можно найти так же, как в 8.3. При интерпретации результатов следует помнить, что компоненты взаимодействия не имеют физиче- физического смысла. 10.4.2. Другие дробные факторные планы типа Ък~р При умеренных и больших значениях k часто желательно провести дальнейшее дробление плана типа 3ft. В общем слу- случае мы можем построить 7зр-реплику плана 3h, содержащую 3h~p наблюдений, где p<k. Такой план называется дробным факторным планом типа Зк~Р. Так, план 3h~2 — это 7э-реплика, план 3ft~3— '/27-реплика и т, д. Процедура построения дробного факторного плана типа 3fe~p состоит в выборе р компонентов взаимодействия, с помощью которых 3h комбинаций обработок разбиваются на 3? блоков. Каждый блок представляет собой дробный факторный^ план типа 3h~p. В определяющее соотношение / любой дробной реп- реплики входят р первоначально выбранных эффектов и C?— —2р—1)/2 их обобщенных взаимодействий. Умножая любой главный эффект или компонент взаимодействия по модулю 3 на / и I2, получаем совместные с ним эффекты. Дробный факторный план типа 3h'P можно также по- построить, если сначала записать комбинации обработок полного факторного плана типа 3h~p, затем ввести р дополнительных факторов, приравняв их компонентам взаимодействия (см. 10.4.1). Проиллюстрируем эту процедуру, построив план 34~2, т. е. Vg-реплику плана З4. Пусть АВ2С и BCD—два компонента вза- взаимодействия, выбранные для построения плана. Их обобщен- обобщенные взаимодействия имеют вид AB2C-BCD и AB2C(BCDJ = 244 План З4-2 с /=ЛЯ2С и I=BCD =ABD2. Таким образом, определяющим соотношением явля- является I=AB2C = BCD = AC2D = ABD2. Девять комбинаций обра- обработок плана находятся, если записать план З2 для факторов А и В, а затем добавить два новых фактора, положив х3 = 2хх+х2 и лг4 = 2лг2 + 2л;з. Это эквивалентно разбиению полного плана З4 с помощью АВ2С и BCD на девять блоков и выбора одного из них в качестве искомой дробной реплики. Окончательный вид плана Таблица 10.17 приведен в табл. 10.17. Данному плану соответствуют восемь степеней свободы, которые можно использовать для оценива- оценивания четырех главных эффектов и совместных с ними эффектов; пос- последние находятся умножением дан- данного эффекта по модулю 3 на АВ2С, BCD, AB2D, ABD2 и их квадраты. Полная структура совместных эффектов приведена в табл. 10.18. Из этой таблицы видно, что рассматриваемый план оказывается полезным только при отсутствии взаимодей- взаимодействий. Кроме того, если А обозначает строки, а В — столбцы, то из табл. 10.17 следует, что план 34~2 является также греко- латинским квадратом. Таблица 10.18 Структура совместных эффектов для плана 34~2 в табл. 10.17 0000 1021 2012 0111 1102 2120 0222 1210 2201 Эффект А В С D ABC* АС АВ*С2 AB*CD A BCD ВСЮ* ВСЮ BCD* Совместные с ACD* А ВСЮ AD АСЮ* 1 АВЮ AB*D* A BCD* АВ ним эффекты ВС* ABC А В* AB*CD* А В*СЮ CD BD ВС 3С?>2 AB*C*D ACD AC* 1* BD* AD* А ВСЮ* ABD В работе Коннора и Зилена [22] содержится большой выбор планов при 4^fe^lO; она была подготовлена по заказу На- Национального бюро стандартов и из всех существующих таблиц дробных факторных планов типа 3h~P является наиболее полной. 10.5. ЗАДАЧИ 10.1. Рассмотрите данные задачи 8.3. Пусть оказалось возможным про- провести только четвертьреплику плана 25. Постройте этот план и проведите анализ данных. 10.2. Постройте план 27~2, выбрав в качестве независимых генераторов два четырехфакторных взаимодействия. Напишите полную структуру совме- совместных эффектов для этого плана. Опишите построение таблицы ДА. 245
10.3. Рассмотрите план 25 из задачи 8.3. Пусть оказалось возможным провести только полуреплику плана. Для 16 наблюдений потребовалось два дня, поэтому в плане 25-1 необходимо смешивание в двух блоках. Постройте такой план и проведите анализ данных. 10.4. Проведите анализ данных задачи 8.5 в допущении, что они полу- получены прн плане 24-1 с I=ABCD. Спроектируйте этот план на полный фак- факторный план для подмножества тех факторов из четырех исходных, которые оказались значимыми. 10.5. Постройте план 2^"|3 Определите, оценки каких эффектов можно получить, если провести вторую дробную реплику этого плана с заменой всех знаков иа противоположные. 10.6. Примените к плану 2|^4из табл. 10.11 метод «дублирования на- наоборот». Проверьте, получается ли план 2jy4. Является ли он минимальным планом? 10.7. Инженер по организации производства проводит эксперимент по моделированию на ЭВМ системы управления запасами, используя метод Монте Карло. Независимыми переменными в его модели являются размер за- заказа А, точка возобновления заказа В, организационные расходы С, штраф за невыполнение заказа D и норма текущих расходов Е, а переменной от- отклика — среднегодовые расходы. Для сокращения машинного времени, необ- необходимого для исследования этих факторов, инженер использует план 2[^ с I=ABD и 1=ВСЕ и получает следующие результаты: rfe=95, ae=134, 6=158, abd=l9Q, cd=92, ас=187, 6се=155 и abcde= 185. а) Проверьте что комбинации обработок найдены правильно. Оцените эффекты в допущении, что взаимодействия трех и более факторов прене- пренебрежимо малы. б) Пусть к первой дробной реплике добавляется еще одна, например, ade=\36, e=93, ab=\87, 6rf=153, acd=\39, c=99, abce= 191 и 6cde=150. Как получена эта дробная реплика? Объедините эти данные с исходными и оцените эффекты. в) Пусть проводится дробная реплика аЬс=\Ъ9, се=96, bed—154, acde=\35, afte=193, bd<?=152, ad=137 и A) =98. Как получена эта дробная реплика? Объедините эти данные с исходными и оцените эффекты. 10.8. Нерегулярные дробные реплики плана типа 2h (Джон [47]). Рас- Рассмотрим план 24. Нам нужно оценить четыре главных эффекта и шесть двух- факторных взаимодействий, но полный факторный план 2* провести не уда- удается. Наибольший из возможных блоков содержит 12 наблюдений. Эти 12 на- наблюдений можно получить по четырем четвертьрепликам с определяющими соотношениями l=±AB=±ACD=±BCD, если отбросить главную дробную реплику. Покажите, как оставшиеся три дробных факторных плана 24-2 можно объединить для получения искомых эффектов в допущении, что взаи- взаимодействия трех и более факторов пренебрежимо малы. Этот план можно считать 3/4-репликой. 10.9. Постройте план З4 с определяющим соотношением I=ABCD2. На- Напишите структуру совместных эффектов для этого плана. 10.10. Постройте план З4" с l=ABCD. Напишите структуру совместных эффектов для этого плана. 10.11. Постройте план 35~2 с 1=АВС и I=CDE. Напишите структуру совместных эффектов для этого плана. 10.12. Постройте план 39~6 и проверьте, обладает ли он разрешающей способностью III. 10.13. Постройте план 53-1 с I=AB2ODE в качестве определяющего со- соотношения. Напишите структуру совместных эффектов для этого плана. 246 ГЛАВА ОДИННАДЦАТАЯ ГНЕЗДОВЫЕ, ИЛИ ИЕРАРХИЧЕСКИЕ, ПЛАНЫ 11.1. ВВЕДЕНИЕ В некоторых многофакторных экспериментах уровни одного фактора (скажем, В) при различных уровнях другого фактора (например, А) подобны, но полностью не совпадают. Такая ор- организация эксперимента называется гнездовым или иерархиче- иерархическим планом, причем уровни фактора В сгруппированы (гнез- Поставщики Партии 1 2 3 4 1 2 2 3 4 1 3 2 3 1 4 Ут Наблюдения! уи2 Уш Ум 2/122 Ут Ут Ую-- 0ш J/n-2 0ПЯ 0211 0212 0J..1 0М1 0211 0211 0222 Ущ 0211 0J23 0223 У-1Ч Рис. 11.1. Двухступенчатый угловой план. УШ У.Ш Ут 0311 УМ! 2/122 0332 ?/312 0313 2/323 0333 2/313 дятся) внутри уровней фактора А. Рассмотрим пример. Компа- Компания приобретает сырье у трех различных поставщиков; требу- требуется определить, одинакова ли чистота сырья, поступающего от каждого из них. Каждый поставщик может предоставить че- четыре партии сырья; по каждой партии можно провести три из- измерения чистоты. Физическая ситуация приведена на рис. 11.1. Это двухступенчатый гнездовой, или иерархический, план, при- причем партии сгруппированы внутри поставщиков. На первый взгляд кажется непонятным, почему два фактора — партии и поставщики — не являются пересекающимися. Будь это так, то партия 1 всегда означала бы одну и ту же партию, партия 2 всегда означала бы одну и ту же партию и т. д. В данном слу- случае факторы не являются пересекающимися, поскольку партии каждого поставщика относятся только к данному поставщику. Так, партия 1 поставщика 1 не имеет отношения к партии 1 любого другого поставщика, а партия 2 поставщика 1 — к пар- партии 2 любого другого поставщика и т. д. Для этого чтобы под- подчеркнуть, что партии каждого поставщика различаются, мы можем их перенумеровать так: партии 1, 2, 3 и 4 поставщика 1; 247
5, 6, 7 и 8 поставщика 2 и 9, 10, 11 и 12 поставщика 3 (рис. 11.2). Иногда возникает сомнение, является ли фактор пересекаю- пересекающимся или группированным. Если уровни фактора можно пере- перенумеровать произвольным образом (см. рис. 11.2), то этот фактор сгруппирован. Поставщики Партии I I I I j ! L 9 j I 10 1 111 12 Рис. 11.2. Другая схема организации двухступенчатого гнездового плана. 11.2. АНАЛИЗ ГНЕЗДОВЫХ ПЛАНОВ Линейная статистическая модель для двухступенчатого гнез- гнездового плана имеет вид A1.1) i=\, 2, ..., а; /=1, 2, ..., Ь; k=l, 2, ..., п. Так, фактор Л имеет а уровней, Ь уровней фактора В сгруппи- сгруппированы внутри каждого уровня Л, число реплик равно п. Ин- Индекс j(i) показывает, что /-Й уровень фактора В сгруппирован внутри i-го уровня фактора Л. Реплики удобно считать сгруп- сгруппированными внутри комбинаций уровней А и В, поэтому в слагаемом ошибки использован индекс (ij)k. Это сбалансиро- сбалансированный гнездовой план1,.так как внутри каждого уровня А сгруппировано равное число уровней В и равное число реп- реплик. Поскольку каждый уровень фактора В встречается не с каждым уровнем фактора Л, то Л и В взаимодействовать не могут. Общую скорректированную сумму квадратов можно запи- записать в виде а Ь п _ 222 (уч*-у---) = {уцн—Уц-)]2- (П.2) 1 Некоторые авторы только такой план и называют гнездовым, оставляя для общего случая наименование иерархический. (Прим. ред.) 248 Выполняя действия в правой части этого выражения, по- получаем 2 22 (уцк-!/..:J=Ьп2 [yt.- i=i /=i k=i «=i J йJ 2 1=1 /= + 2 2 2 [ут-Уч)\ i i i (ii.3) поскольку три смешанных произведения обращаются в нуль. Это соотношение показывает, что общую сумму квадратов можно разбить на сумму квадратов, обусловленную фактором Л, сумму квадратов, обусловленную фактором В, уровни кото- которого сгруппированы внутри уровней Л, и сумму квадратов, об- обусловленную ошибкой. В символическом виде соотношение A1.3) можно записать как *J*J Общ — О О д_ ~\~ ии В(А.) "Т" *JO ОШ* ( 1 1 .4 ) Суммы квадратов 550бщ, SSA и SSB(a) обладают abn—1, а—1 и а(Ь—1) степенями свободы соответственно; на ошибку приходится ab(n—1) степеней свободы. Отметим, что abn—1 = = a—\+a(b—\)+ab(n—\). Если ошибки e~NID@, а2), то при делении каждой суммы квадратов в правой части соотно- соотношения (П.4) на соответствующее число степеней свободы по- получаются независимые средние квадраты, причем отношение любых двух из них подчиняется /•'-распределению. Вид статистики, используемой для проверки эффектов фак- факторов Л и В, зависит от того, фиксированы они или случайны. Если факторы Л и В фиксированы, то будем считать, что а Ь 2 т, = 0 и 2 Р/ (о = 0 (г = 1,2, ... ,а), т. е. эффекты обработки Л при сложении дают нуль, а эффекты обработки дают нуль при сложении внутри каждого уровня Л. Если же Л и В случайны, то допустим, что %i~NID{0, a\) и $jd)~NID@, el). Часто встречаются смешанные модели с фик- фиксированным Л и случайным В. Математические ожидания сред- средних квадратов можно получить, непосредственно применив правила из гл. 7; соответствующие выражения приведены в табл. 11.1. Из табл. 11.1 следует, что при фиксированных Л и В для проверки гипотезы Яо: Тг = 0 используется статистика MSA/MSom, а для проверки Яо: Рлг) = О — статистика 249
MSB(A)/MSOm- Если А — фиксированный фактор, а В— случай- случайный, то для проверки Яо: т, = 0 используется отношение MSA/MSB(A) и для Яо: а2, О—MS B(a)IMS от- Наконец, если оба Таблица 11.1 Математические ожидания средних квадратов в двухступенчатом гнездовом плане а Ь п а Ь Е(М$) E(MSA) E(MSBW) E(MSom) А фиксирован В фиксирован а — 1 а2 А фиксирован В случаен 2 i 2 i Si vi 2 и, — 1 О2 + по\ о2 А случаен В случаен о2+/ш|+Ьяо2 О2 + гсо| О2 фактора А и В случайны, то для проверки Яо: а2. >0 исполь- используется MSa/MSB(a) и для проверки Яо.' <^l>0—MSB(A)/MSOm- Процедура проверки приведена в таблице ДА (табл. 11.2). Таблица 11.2 Дисперсионный анализ для двухступенчатого гнездового плана Источник изменчивости А В внутри А Ошибка Сумма Сумма квадратов ' V ..2 ' ..2 bn i 1" abn ¦" 1 У У 2 1 у 2 nij bn i i i k ' nij' У у у 2 I 2 Zj Zj Z^Vijk . *... i j k abn Степени свободы a— 1 a(ft-l) ab(re— 1) a&« — 1 Средний квадрат MS A MSB(A) MSom Расчетные формулы для сумм квадратов можно получить, рас- раскрыв скобки и приведя подобные члены в выражении A1.3): bn yl.- SSb (Л) - „ abn 1 у2..; A1.5) A1.6) ?=l /=l 1=1 1=1 /=1 4=1 a 6 n ?=1 /=1 общ " ——у2 ¦ abn ¦¦- П1.7) A1.8) Выражение A1.6) для SSB(a) можно переписать в виде J_ V у2 — 0? I ?=1 откуда следует, что SSB(A) получается суммированием по всем уровням А сумм квадратов, обусловленных уровнями В, для каждого из уровней А. Пример 11.1. Рассмотрим ситуацию из параграфа 11.1—компания поку- покупает сырье у трех различных поставщиков. Требуется определить, одинако- одинаковая ли чистота сырья всех поставщиков. От каждого из них случайным об- образом выбирается по четыре партии сырья, в каждой партии проводится три измерения чистоты. Это, очевидно, двухступенчатый гнездовой план. Данные (после кодирования вычитанием 93) приведены в табл. 11.3. Таблица 11.3 Кодированные данные по чистоте сырья, пример 11.1 (кодировка вычитанием 93) Поставщики Партии Суммы по партиям </;/. Суммы по поставщи- поставщикам </? . . 1 1 1 1 0 0 2 —2 —3 -4 9 3 2 0 1 -1 4 1 4 0 5 —5 2 1 -1 2 -3 —4 2 0 4 2 6 3 — 1 0 2 -3 4 0 3 2 5- 4 3 1 2 4 0 6 2 2 0 2 0 3 1 [ 2 2 4 3 2 1 6 14 Суммы квадратов находятся следующим образом: 250 251
1 a ее LV abn 4-3 = 19?75-4,69= 15,06; 42+ 142!-i 36 = Т2 2 4.- bn ?, -[02 - 9J + ( - 2 2 i=i y=i ft=i ]— 19,75 = 89,67—19,75 = 69,92; .у Vj,2. = 153,00-89,67 = 63,33. Результаты ДА приведены в табл. 11.4. Поставщики являются фиксиро- фиксированным, а партии — случайным фактором, поэтому выражения для матема- математических ожиданий средних квадратов берутся из среднего столбца табл. 11.1 (для удобства они повторены в табл. 11.4). ДА показывает, что при уровне значимости 5 процентов поставщики не оказывают влияния на чистоту сырья, но различия в чистоте сырья одного и того же поставщика являются значимыми. Таблица 11.4 Дисперсионный анализ данных в примере 11.1 изменчивости Поставщики Партии (внутри поставщиков) Ошибка Сумма * Значимо при Сумма квадратов 15,06 69,92 63,33 148,31 5 процентах Степени свободы 2 9 24 35 7,53 7,74 2,64 Математическое ожидание среднего квадрата а2 + За2р + 62т? а2 + За2р а2 F,, 0,97 2,94* Рассмотрим, что получилось бы, если бы мы провели некорректный ана- анализ этих данных как для факторного эксперимента с двумя факторами. Если эти факторы — партии и поставщики — считать пересекающимися, то суммы по партиям оказываются равными 2, —3, —2 и 16, причем каждая ячейка партии х поставщики содержит три реплики. Таким образом, можно найти сумму квадратов, обусловленную партиями, и сумму квадратов, обусловлен- обусловленную взаимодействием. Результаты соответствующего ДА приведены в табл. 11.5. Этот анализ показывает, что различия в партиях значимы на уровне пяти процентов; значимым оказывается и взаимодействие между партиями и по- поставщиками. Однако невозможно дать разумную для практики интерпретацию взаимодействия партииХпоставщики. Сравнивая табл. 11.4 и 11.5, замечаем, что т. е. сумма квадратов для партий внутри поставщиков состоит из суммы 252 квадратов для партий и суммы квадратов для взаимодействия партии по- поставщики. Степени свободы обладают аналогичным свойством: Па Партии X постав- Партии внутри " щики поставщиков 3+6 =9 Таблица 11.5 J Некорректный анализ для двухступенчатого гнездового плана в примере 11.1 как факторного плана (поставщики фиксированы, партии случайны) Источник изменчивости Поставщики S Партии В Взаимодействие S х В Ошибка Сумма Сумма квадратов 15,06 25,64 44,28 63,33 148,31 * Значимо при 5 процентах. Степени свободы 2 3 6 24 35 Средний квадрат 7,53 8,55 7,38 2,64 F,, 1,02 3,24* 2,80* Следовательно, мы видим, что анализ данных гнездового плана на вы- вычислительных машинах можно вести по программам для факторных планов, объединяя «главный эффект» сгруппированного фактора и взаимодействия этого фактора с тем, внутри которого он сгруппирован. Такое замечание по- полезно, поскольку программы анализа для гнездовых планов может не ока- оказаться под рукой, в то время как программы анализа для факторных планов встречаются довольно часто. Если оба фактора А и В фиксированы, то можно оценить параметры модели для сбалансированного двухступенчатого гнездового плана Нормальные МНК-уравнения для этой модели имеют вид а а Ь ц: аЬпр + ЬпЩъ + п^ 2 Р/<;)=#• • . ; (П.9а) i=i i^i ,-=1 ь т.,: Ц + пт; + л2Р/й=й ; 1"=1, 2,. . ., а; A1.96) ;=i Р/ B) •' пц + nit-4- n$j (i) = уц., l = \, 2, . . . , а; /=1, 2, . . ., b. A1.9b) Для удобства слева от каждого нормального уравнения приве- приведен параметр, которому оно соответствует: например, нормаль- нормальному уравнению A1.9а) соответствует |i, первому из уравне- уравнений A1.96) —ть второму — Тг и т. д. 253
Нормальные уравнения кажутся довольно громоздкими; од- однако их легко получить с помощью правил из параграфа 3.10. Возьмем, например, нормальное уравнение для ть т. е. первое из уравнений A1.96). Правая часть этого уравнения равна У\.., поскольку у\..— сумма всех наблюдений, содержащих х\. В r/i.. параметр \х встречается Ьп раз, п встречается Ьп раз и каждое из Pj(i)(/=1, 2, .... b) встречается п раз. Следова- Следовательно, нормальное уравнение, соответствующее х\, должно ь иметь вид &n? + &nTi+л 2 р,-(!) = #!.. [сравни с уравнением A1.96) при i=l]. Число нормальных уравнений равно \+а—ab и совпадает с числом неизвестных ([i, xi и Рда при i=l, 2, ...а и /=1, 2, ... ..., Ь). Однако при сложении уравнений A1.96) получается уравнение A1.9а), а при сложении уравнений, соответствую- соответствующих ($, для каждого уровня т* получается нормальное уравне- уравнение, соответствующее этому т*. Следовательно, число линейно- зависимых нормальных уравнений составляет \+а. Ограниче- Ограничения, обычно накладываемые на оценки параметров, имеют вид a b 2т,--=0 и 2Р/@ = 0> i = h 2,..., а. Эти ограничения сущест- венно упрощают нормальные уравнения и позволяют получить решение |J. = y... и т<=й ..—?..., t-1, 2, . . ., а; A1.10) $Щ)=-Уа- — У1-; t = l, 2,...,а; /= 1, 2, . . . , Ь. A1.11) Отметим, что это решение весьма привлекательно с точки зре- зрения интуитивных представлений: эффекты обработки А оцени- оцениваются разностью среднего арифметического всех наблюдений для данного уровня А и общего среднего, а эффекты обра- обработки В внутри .каждого уровня А—разностью среднего по соответствующей ячейке и среднего по этому уровню Л. Исполь- Используя полученное решение, можно применить общий регрессион- регрессионный критерий значимости для обоснования ДА для сбаланси- сбалансированного двухступенчатого гнездового плана (см. за- задачу 11.4). Если эффекты случайны, то оценки компонентов диспер- дисперсии ст2, о2 и ст2 можно найти с помощью процедуры ДА. Из выражений для математических ожиданий средних квадратов (последний столбец табл. 11.1) следует, что 2 MS; A1.12) Or 1 1 = — (MSB{A) — -2 .— A1.13) A1.14) bn Во многих приложениях гнездовых планов встречаются сме- смешанные модели, в которых основной фактор А фиксирован, а сгруппированный фактор В случаен. Такова ситуация, описан- описанная в примере 11.1: фактор А (поставщики) фиксирован, а фак- фактор В (партии сырья) случаен. Эффекты поставщиков можно оценить так: i. - — У- ¦ ¦ = г/2. . — у. . . — 5 12 4 12 14 13 36 13 36 13 12 36 — 28 36 | 36 29 ~36~' Для получения оценок компонентов дисперсии о2 и о2 исключим в таблице ДА строку, относящуюся к поставщикам, и используем следующие две строки. Тогда G2 = MSO1,, = 2,64 и = — (Мв (Л) - п = i_ G,77-2,64) -1,71. о 11.3. ОБЩИЙ СЛУЧАЙ т-СТУПЕНЧАТОГО ГНЕЗДОВОГО ПЛАНА Результаты 11.2 легко обобщаются на случай т полностью сгруппированных факторов. Такой план можно назвать т-сту- пенчатым гнездовым планом. Пусть, например, в литейном цехе необходимо исследовать твердость двух металлических сплавов. Проводятся три плавки каждого сплава, из которых для проверки отбираются случайным образом по две отливки, причем измерения твердости каждой из них производятся дважды (рис. 11.3). В этом эксперименте каждый уровень фактора «плавки» сгруппирован внутри уровней фактора «сплавы», а уровни фак- фактора «отливки» — внутри уровней фактора «плавки»; таким образом, получается трехступенчатый гнездовой план с двумя репликами. Факторы «сплавы» и «плавки» фиксированы, а фак- фактор «отливки» случаен. Модель для трехступенчатого плана имеет вид У ни = Iх + xi + Р/ (о + Ук an + гат v (пл5) i=l, 2,. ... а; /=1, 2. . ., Ь; k=l, 2, . . ., с; 1=1,2, ..., п. В нашем примере xi — эффект i-го сплава; $щ — эффект /-й отливки внутри i-го сплава; унш) — эффект /г-н отливки внутри /-й плавки и t'-ro сплава; е^да — слагаемое ошибки, 255 234
e~A7D@, а2). Обобщение этой модели на т факторов не пред- представляет труда. Вычисление сумм квадратов и проведение ДА для т-сту- пенчатого гнездового плана аналогичны рассмотренным в 11.2. Например, ДА для трехступенчатого гнездового плана приве- приведен в табл. 11.6, в которой даны также расчетные формулы для сумм квадратов ( отметим, что они являются непосредствен- непосредственным обобщением формул для двухступенчатого гнездового плана). Для определения статистик, используемых при проверке гипотез, необходимо найти математические ожидания средних Сплавы Плавки Отливки Наблюдения 1 1 1 1 1 1 2 1 3 1 I I I I I2 1 1 1 1 1 1 1 1 | 2 ( | 1 1 1 2 1 | 2 1 1 1 3 1 | 2 i/llll 4/ll «1211 г/1821 J/1311 J/1321 /1-212 У К*! !/|312 V1ХП У-im J/M1S J/.222J г/2322 Рис. 11.3. Трехступенчатый гнездовой план. квадратов. Например, если факторы А и В фиксированы, а фак- фактор С случаен, то с помощью методов гл. 7 мы можем полу- получить следующие выражения для математических ожиданий Таблица 11.6 Дисперсионный анализ для трехступенчатого гнездового плана Источник изменчивости Сумма квадратов Степени свободы Средний квадрат ben abcn ' ,,2 В (внутри А) С (внутри В) Ошибка Сумма у у 2 1 у „2 i j ben i en i j 1 у у у,.2 Tf ft У*к ssss 1 j k l ben i У Ум2 П i j a— 1 b(b~\) ab(c— 1) abc(n— 1) abcn — 1 MSA MS BW MS C(B) MSom 256 средних квадратов (табл. П.7). В таблице приведены вели- величины, с помощью которых находятся статистики, используемые при проверке гипотез для примера, приведенного в начале дан- данного параграфа, поскольку в нем сплавы А и плавки В фикси- фиксированы, а отливки С случайны. Таблица 11.7 Вывод выражений для математических ожидаиий средних квадратов в трехступенчатом гнездовом плане с фиксированными А и В и случайным С Фактор Р/со 4k (Ц) «««« F а i 0 1 1 1 F Ь i Ь 0 1 1 R с к С С 1 1 R п 1 п п п 1 Математическое ожидание среднего квадрата 2 „ 2 ЬСП а | я av | fl _ j - j 2 г 2 , cn vvg2 V a F — 1) /@ a2 + n<jy a* 11.4. ПЛАНЫ С ГРУППИРОВАННЫМИ И ПЕРЕСЕКАЮЩИМИСЯ ФАКТОРАМИ Иногда в многофакторных экспериментах одни факторы яв- являются пересекающимися, а другие — сгруппированными. Ан- Андерсон и Маклин A] и Хикс [41] называют такие планы фак- факторными планами с группировкой. В следующем примере рас- рассматривается статистический анализ для одного из таких планов. Пример 11.2. Инженер исследует операцию сборки блока электронной ап- аппаратуры с целью ее ускорения. Им предложены три фиксирующих приспо- приспособления и два варианта планировки рабочего места. Для проведения сборки необходимы операторы: решено выбрать случайным образом по четыре опера- оператора на каждую комбинацию приспособления и варианта планировки. Однако участки сборки находятся в различных местах в пределах предприятия, по- поэтому трудно использовать одних и тех же операторов для каждого варианта планировки. Следовательно, операторы, выбранные для работы по варианту 1, отличаются от операторов, которые будут работать по варианту 2. Комбина- Комбинации обработок в таком плане берутся в случайном порядке; проводятся две реплики эксперимента. Значения продолжительности сборки (в секундах) при- приведены в табл. 11.8. Мы видим, что операторы сгруппированы внутри вариантов планировки, а факторы «приспособления» и «планировки» пересекаются. Таким образом, этот план содержит как сгруппированные, так и пересекающиеся факторы. Д. К- Монтгомери 257
Линейная статистическая модель в этом случае имеет вид i=l, 2, 3; /=1, 2; А=1, 2, 3, 4; /=1, 2, где %i — эффект f-ro приспособления; Pj — эффект /-го варианта планировки; \h(j) — эффект й-го оператора внутри /-го варианта планировки; (тр)^— взаимодействие приспособления Хпланирования; Огу)**ш— взаимодействие приспособленияХоператоры внутри варианта планировки; г(цкI — обычное слагаемое ошибки. Отметим, что взаимодействия операторы Хпланировки быть не может, так как не все операторы работают по каждому из вариантов. Аналогично не может быть взаимодействия трех факторов: приспособления, планировки и операторы. Приспособления и планировки являются фиксиро- фиксированными факторами, а операторы — случайным. Выражения для математи- математических ожиданий средних квадратов приведены в табл. 11.9. С помощью этой таблицы можно получить статистику для проверки гипотез относительно любого эффекта или взаимодействия. Таблица 11.8 Данные по продолжительности сборки для примера 11.2 Оператор Приспособление 1 Приспособление 2 Приспособление 3 Сумма по операторам У. /ft. Сумма по планировкам У . i.. Планировка 1 1 22 24 30 37 25 21 149 2 23 24 29 28 24 22 150 3 28 29 30 32 27 25 171 4 25 23 27 25 26 23 149 619 Планировка 2 1 26 28 29 28 27 25 163 2 27 25 30 27 26 24 159 3 to to СП 00 24 23 24 27 151 4 24 23 28 30 28 27 160 633 Vi... 404 447 401 1252 - у . Общая сумма квадратов i fa ^Ж S 2 § ""*'" abcn "¦- ¦ 48 -У 2 =32956,00 12522= 299,67. " 48 Суммы квадратов для приспособлений и вариантов планировки находим обычным образом, т. е. = _L«2 !_„2 =32 739,13 —-тг- 12522== 82,80 1 Ьсп '••• abcn •••• 48 258 SS*.ae = 2 y2i- 1—?.. . = 32 660,42 L 1252^ = 4,08. асп г±х ' abcn 48 Взаимодействие приспособлениях планировки определяется с помощью сумм по ячейкам приспособления Хпланировки (равным 198, 206, 228, 219, 193 и 208) следующим образом: SS а Ь — ' у v и1 присп—план ^j ^j =4/.. 1 i=\ /=1 abcn = 32 762,25 — 12522 — 82,80 — 4,08 = 19,04. 48 Таблица 11.9 Вывод математических ожиданий средних квадратов для примера 11.2 Фактор т, Р; уи (/> (тр) ¦ • (tv\ ^ '' ik (/) ei (i/ft) F 3 i 0 3 3 0 0 1 F 2 i 2 0 1 0 1 1 R 4 ft 4 4 1 4 1 1 « 2 I 2 2 2 2 2 1 Математическое ожидание среднего квадрата а2+ 2^ +82т2 а2 + 6а2 + 242р2 "Г -р . 02 + 2a2v + 422(TPJ/ a2 + 2a|v а2 С целью нахождения суммы квадратов для операторов воспользуемся сум- суммами по уровням этого фактора; тогда SS опер 1 an 2 2 y2ik- = 32 732,33 — 32 660,42 = 71,91. Заметим, что за исключением дополнительного фактора (приспособления) это та же расчетная формула, которая использовалась при получении суммы квадратов для любого сгруппированного фактора. Число степеней свободы S6'oneP(nnaH) составляет Ь(с — 1) =2D — 1) =6. У нас иет формулы для нахождения суммы квадратов или числа степе- степеней свободы взаимодействия приспособления Хоператоры внутри варианта планировки. Для определения числа степеней свободы и суммы квадратов, обусловленной этим эффектом, воспользуемся правилами гл. 7. Соответ- Соответствующее слагаемое модели имеет вид (ty)ik(j)', с помощью правила 4 полу- получаем, что оно обладает Ь(а—1) (с—1) =2C—1) D—1) = 12 степенями сво- свободы. Сумма квадратов определяется с помощью правила 5. Сначала для 9* 259
SSnpncn—опер(плаи) записывается символический вид Ь(а—1)Х(с—1) = = abc — be — ab + b, далее abc —be -ab a b 1 » t a b n i b с = 32 900,00 — 32 732,33 — 32 762,25 + 32 660,42 = 65,84. Наконец, сумма квадратов ошибки находится вычитанием: g о __ eg со о о с с г о ош общ присп план присп—план ""опер (план) - SSnPHcn-onep (план-) = 299,67-82,80-4,08-19,04-71,91-65,84 = 56,00. Полный ДА приведен в табл. 11.10. Видно, что эффект приспособлений является значимым, как и различия операторов внутри варианта плани- планировки. Существует также значимая взаимосвязь между приспособлениями Таблица 11.10 Дисперсионный анализ для примера 11.2 Источник изменчивости Приспособления Пр Планировки Пл Операторы (внутри планировок) Оп (Пл) ПрхПл ПрхОп(Пл) Ошибка Сумма * Значимо при 5 процентах. ** Значимо прн 1 проценте. Сумма квадратов 82,80 4,08 71,91 19,04 65,84 56,00 299,67 Степени свободы 2 1 6 2 12 24 47 Средний квадрат 41,40 4,08 11,99 9,52 5,49 2,33 F« 7,54** 0,34 5,15** 1,73 2,36* и операторами внутри варианта планировки, что свидетельствует о неоди- неодинаковости эффектов приспособлений для различных операторов. Эффект пла- планировки рабочего места на продолжительность сборки сказывается несу- несущественно. Программы для вычислительных машин, предназначенные для анализа данных факторного эксперимента, можно исполь- использовать и при анализе планов с группированными и пересекаю- пересекающимися факторами. Так, эксперимент из примера 11.2 можно было бы рассматривать как факторный эксперимент с факто- факторами: приспособления (пр), операторы (оп) и планировки (пл). Тогда для получения величин, необходимых для анализа данных эксперимента с группированными и пересекающимися факторами, некоторые суммы квадратов и числа степеней сво- свободы понадобилось бы объединить следующим образом: 260 Факторный эксперимент Сумма квадра- квадратов ос *-> °пр 5оцл SSnp —ПЛ ОС J°on ^>^>пл—оп SSnp—оп <->^пр —-оп — пл SSoiu j ^общ Степени свободы 2 1 2 3 3 6 6 24 47 Факторный эксперимент с группировкой Сумма квадратов SSnp ""пл SSnp — пл | SSon (пл) = SSon + 55пл-оп 1 Olinp—on (пл) — °°пр—оп т j "f" SSnp—оп —пл ""ОШ ""общ Степени свободы 2 1 2 6 12 24 47 11.5. ЗАДАЧИ 11.1. Исследуется чистота поверхности металлических деталей, изготав- изготавливаемых на четырех станках. На каждом станке работает по три рабочих, и для проверки отбирается по две детали, изготовленные каждым из них. Станки расположены в различных помещениях, поэтому иа них работают различные группы рабочих, выбранных случайным образом. Данные этого эксперимента приведены ниже; проведите их анализ и сделайте выводы. Станок Рабочий 1 1 79 62 2 94 74 3 46 57 2 ] 92 99 2 85 79 3 76 68 3 ] 88 75 2 53 56 3 46 57 4 1 36 53 2 40 56 3 62 47 11.2. Инженер-производственник изучает изменчивость размеров деталей, изготавливаемых на трех станках. Станки оснащены двумя шпинделями, для каждого из иих берется случайным образом по четыре детали. Результаты эксперимента приведены ниже. Проведите анализ этих данных в предполо- предположении, что станки и шпиндели являются фиксированными факторами. Станок Шпиндель 1 1 12 9 11 12 2 8 9 10 8 2 1 14 15 13 14 2 12 10 11 13 3 1 14 10 12 11 2 16 15 15 14 261
11.3. Рассмотрите трехступенчатый гнездовой план, показанный на рис. 11.3. Используя данные, приведенные ниже, проведите анализ этого плана в предположении, что факторы «сплавы» и «плавки» фиксированы, а фактор «отливки» случаен. Сплавы Плавки Отливки 1 1 1 40 63 2 27 30 1 95 67 2 2 69 47 • 65 54 3 2 78 45 2 1 1 22 10 2 23 39 1 83 62 2 2 75 64 3 1 61 77 2 35 42 11.4. Проверьте выражения для математических ожиданий средних квад- квадратов, приведенные в табл. 11.1. 11.5. Несбалансированные гнездовые планы. Рассмотрите несбалансиро- несбалансированный двухступенчатый гнездовой план с 6, уровнями В внутри j-ro уровня А и пц репликами в (ij)-n ячейке. а) Напишите нормальные МНК-уравнения для этого плана. Решите их. б) Постройте таблицу ДА для несбалансированного двухступенчатого гнездового плана. в) Используя результаты п. б), проведите анализ следующих данных: Фактор А Фактор В > 6 4 8 2 —3 1 2 1 5 7 9 6 2 2 4 3 3 1 0 -3 11.6. Компоненты дисперсии в несбалансированном двухступенчатом гнездовом плане. Рассмотрите модель i= 1,2,..., a; /= 1,2,.. .;.bt; k= 1,2,..., niit где А и В — случайные факторы. Покажите, что где 262 Cn = - 11.7. Инженер исследует прочность алюминиевого сплава, поступающего от трех поставщиков в виде заготовок стандартного размера 1,0; 1,5 и 2,0 дюйма B5, 38 или 51 мм). Обработка заготовок различного размера из одной отливки требует различных технологий ковки, следовательно,^ этот фак- фактор может оказаться важным. Заготовки изготавливаются ковкой из отли- отливок, полученных в результате различных плавок. Каждый поставщик предо- предоставляет по два образца заготовок каждого размера, полученных в резуль- результате трех плавок. Данные измерений прочности приведены ниже. Проведите анализ этих данных в предположении, что поставщики и размеры заготовок фиксированы, а плавки случайны. Поставщик Плавка Размер заготовок 1" 1,5" 2" 1 • 1,230 1,259 1,316 1,300 1,287 1,292 2 1,346 1,400 1,329 1,362 1,346 1,382 3 1,235 1,206 1,250 1,239 1,273 1,215 2 1 1,301 1,263 1,274 1,268 1,247 1,215 2 1,346 1,392 1,384 1,375 1,362 1,328 3 ,315 ,320 ,346 ,357 1,336 1,342 3 1 1,247 1,296 1,273 1,264 1,301 1,262 2 1,275 1,268 1,260 1,265 1,280 1,271 3 1,324 1,315 1,392 1,364 1,319 1,323 ГЛАВА ДВЕНАДЦАТАЯ МНОГОФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ С ОГРАНИЧЕНИЯМИ НА РАНДОМИЗАЦИЮ В гл. 4 и 5 нами рассматривались планы экспериментов с ограничениями на рандомизацию, т. е. эксперименты, в кото- которых мы не можем распределить комбинации обработок по экспериментальным объектам совершенно случайным образом. Планы с рандомизированными блоками и латинские квадраты эффективны в случаях одного и двух соответственно ограниче- ограничений на рандомизацию. Эти планы обсуждались в гл. 4 и 5 применительно к однофакторному эксперименту. Однако су- 263
ществует ряд многофакторных экспериментальных ситуаций, в которых невозможна полная рандомизация. Такие планы и составляют предмет этой главы. Более подробно их обсуж- обсуждают Осл [55], Джон [47], Хикс [41], Андерсон и Маклин [1]. 12.1. РАНДОМИЗИРОВАННЫЕ БЛОКИ И ЛАТИНСКИЕ КВАДРАТЫ КАК МНОГОФАКТОРНЫЕ ПЛАНЫ Рассмотрим факторный эксперимент с двумя факторами, скажем, А и В. Линейная статистическая модель для этого плана имеет вид У г jk = (J- +Тг + Р j + (Т.Р) ц + ВИН, i=\, 2, ..., а; /=1, 2, ..., Ь; k=\, 2, .... п, A2.1) где п, Pj и (тр)гз- — эффекты факторов А, В и взаимодействия АВ соответственно. Статистический анализ для этого плана приведен в гл. 6. Теперь предположим, что для проведения экс- эксперимента по такому плану необходимо сырье определенного вида, причем оно поступает партиями, размеры которых не позволяют проверить все abn комбинаций обработок в одной и той же партии. Однако если одной партии достаточно для проведения аЬ наблюдений, то выходом из положения является проведение каждой из п реплик на отдельной партии сырья. Следовательно, партии сырья представляют собой ограничение на рандомизацию, или блок, и внутри блока проводится только одна реплика полного факторного эксперимента. Модель этого нового плана имеет вид , л, A2.2) У ilk = i=l, 2,...,а; /=1, 2,...,6; k=l, 2, где 6и — эффект fe-ro блока. Конечно, внутри одного блока по- порядок проверки комбинаций обработок рандомизируется пол- полностью. В модели A2.2) содержится допущение, что взаимодействием между блоками и обработками можно пренебречь. Такое допу- допущение принималось и ранее, при анализе рандомизированных блочных планов. Если эти взаимодействия существуют, то они не могут быть отделены от ошибки. В сущности, при такой модели ошибка состоит на самом деле из взаимодействий (тб)гь, (p6)jft и (трб)г3й. ДА приведен в табл. 12.1; по построе- построению эта таблица очень похожа на таблицу для факторного плана, в которой сумма квадратов ошибки уменьшена на сумму квадратов для блоков. При вычислениях сумма квадратов на- находится как сумма квадратов между п боковыми суммами {y..kl Математические ожидания средних квадратов выводятся в табл. 12.2 в предположении, что фактор А фиксирован, а фак- 264 тор В и блоки являются случайными. В левой части этой таблицы мы расширили модель, включив в нее взаимодействия обработок с блоками — так становится понятнее, что ошибка эксперимента состоит из этих взаимодействий. При определе- определении математических ожиданий средних квадратов мы обозна- обозначили наблюдения t/ijhh, где индекс h соответствует репликам. В этом плане реплика единственная, так что h=\. Поскольку каждый блок содержит только одну реплику, то дисперсию ошибки а2 оценить нельзя. Если бы могли провести г реплик в каждом блоке, то найти оценку а2 не представляет труда. Таблица 12.1 Дисперсионный анализ для двухфакториого рандомизированного полиоблочного плана Источник изменчивости Блоки В АВ Ошибка Сумма Сумма квадратов 1 Vff2 1 „2 t ^У ¦ -к , У ab k abn 1 Vy2 ' у2 bn i abn ' an ^У->-- abny2-- 1 2S4-- ! ssa ssB n i j abn вычитанием ¦V V V 2 1 2 lililiirtik 7-У... i j к abn Степени свободы п 1 a— 1 b 1 (a_. 1) (fo — I) (ab-\) (n-1) abn— 1 Как отмечалось ранее, допущение о пренебрежимой малости взаимодействий блоков с обработками является довольно рас- распространенным, причем принято объединять средние квадраты этих взаимодействий для оценивания ошибки. В правой части табл. 12.2 показано, как при возврате от расширенной модели к исходной получаются математические ожидания средних квадратов. В предыдущем примере рандомизация ограничивалась пре- пределами партии сырья. На практике к ограничениям на рандо- рандомизацию может приводить множество явлений, скажем, время, операторы и т. д. Если невозможно, например, провести весь факторный эксперимент за один день, то экспериментатор мог бы провести одну полную реплику в первый день, вторую реп- реплику— во второй и т. д. Следовательно, каждый день представ- представлял бы собой блок. 265
Я! О ё з X to о о. S п S I о ее X ч с о и о S В! to о X I о X S * о I •* & - g I 266 и ель мод деая о X s S нна; асшире 0,2 атическо е средне 1Драта "s о - а;-с с а; л; л а; •— a ft. - я Я ПО О 8 о, кто © о § я Математн ожидание квадр - а;* с а; -м ¦о а? '*¦• a ft. - я Я ¦U о с» VO О S Фактор и 7 а D "Г - С О а н* + ?l Ь »о .о се. -(- ем ь> ' D се. + V я е . D -|_ с -о о ^ а см ей а я D - - а | •о со: <мса + ю CNCG. О а ъ - а _^ Y - - о *-- аз. смсс' С + се. С - о 1—' м 1 СО. см«Э О a - - .—< i с «3 a се. «у a "о - a _ 1 с •о „, ь 4- ю се. су - о 1 с • 1 1 — - - 1 с 1 со Ю Ю емсе. се. t5 см Ь» D О - - а о — X = 1 1 7 X е i ij «о ается) s к Ef О В ъ - - - о со Пример 12.1. Инэкенер исслеДует методы повышения эффективности об- обнаружения целей иа индикаторе радиолокатора. Он считает важными два фактора: величину фона шумов на индикаторе, или «местных помех», и тип фильтра, помещаемого иа экран индикатора. В плане эксперимента исполь- используются три уровня местных помех и два типа фильтра. При проведении эксперимента случайным образом выбирается комбинация обработок (уро- (уровень местных помех и тип фильтра), а затем вводится сигнал, представляю- представляющий на индикаторе цель. Интенсивность сигнала повышается до тех пор, пока не произойдет его обнаружение оператором. После этого измеряется величина отклика — уровня интенсивности сигнала в момент обнаружения. Для проведения всех необходимых наблюдений на индикаторе следовало бы выбрать одного оператора. Однако операторы различаются по квалификации и навыку обращения с индикатором. Следовательно, кажется логичным использовать операторов в качестве блоков. Случайным образом были вы- выбраны четыре оператора, затем — порядок, в котором шесть комбинаций обработок проверялись каждым оператором. Итак, получаем факторный эксперимент 3X2 по полноблочному рандомизированному плану (табл. 12.3). Таблица 12.3 Уровень интенсивности при обнаружении цели Операторы (блоки) Тип фильтра Местные помехи: низкие средние высокие i 1 1 90 102 114 2 86 87 93 2 1 96 106 112 2 84 90 91 3 1 100 105 108 2 92 97 95 1 92 96 98 i 2 81 80 83 Линейная модель для этого эксперимента имеет вид у цк = (i+ti + Pj + (т.р) ц+дц + е,-jft, t=l, 2, 3; j=\, 2; *=1, 2, 3, 4, где Ti — эффект местных помех (фиксированный); Pj — эффект типа фильтра (фй) (P) й б фф б (йй) фф (фр) Pj фф фр (фиксированный); (tP)jj — взаимодействие; б* — эффект блока (случайный); Ba~NID @, а2)—случайная ошибка. Суммы квадратов для местных помех, типов фильтров и их взаимодействия вычисляются обычным образом. Сумма квадратов, обусловленная блоками, находится по суммам для операторов {У. к): SS, = — бл „и ! abn = — E722 3-2 5792 + 597а + 5302) 3-2-4 • 22782= 402,17. Полный ДА для этого эксперимента сведен в табл. 12.4, причем добавлен столбец с математическими ожиданиями средних квадратов, которые могут быть получены с помощью методов гл. 7. Поскольку оба фактора фиксиро- фиксированы, все эффекты проверяются исходя из отношений их средних квадратов к среднему квадрату ошибки. Как величина местных помех, так и тип фильтра значимы на уровне одного процента; их взаимодействие оказалось бы значимым только при десяти процентах. Таким образом, мы приходим 267
к выводу, что и величина местных помех, и тип фильтра на экране влияют на эффективность обнаружения цели оператором, причем данные в какой-то мере говорят о том, что между этими факторами существует слабое взаимо- взаимодействие. Таблица 12.4 Дисперсионный анализ данных в примере 12.1 Источник изменчивости Местные помехи G Тип фильтра F GF Блоки Ошибка Сумма Сумма квадра- квадратов 335,58 1066,67 77,08 402,17 166,33 2047,83 Степени свободы 2 1 2 3 15 23 Средний квадрат 167,79 1066,67 38,54 134,06 11,09 Матем атн ческое ожидание среднего квадрата °* + ~Ж о-2+122Р/ a2 -f- 6а| а2 15,13* 96,19* 3,48 Если на рандомизацию накладываются два ограничения с р уровнями каждое, а число комбинаций обработок в k- факторном эксперименте в точности совпадает с числом уровней ограничений, т. е. если p = ab . .. т, то для планирова- планирования такого эксперимента можно использовать латинский квад- квадрат рХр. Рассмотрим, например, модификацию эксперимента по радиолокационному обнаружению цели из примера 12.1. Факторами в этом эксперименте являются тип фильтра (два уровня) и местные помехи (три уровня), а операторы рассмат- рассматриваются как блоки. Предположим теперь, что из-за продолжи- продолжительности опыта за день можно провести только шесть наблю- наблюдений. Таким образом, дни становятся вторым ограничением на рандомизацию, что приводит к латинскому квадрату 6x6 (табл. 12.5). В этой таблице мы использовали строчные буквы U и gj для обозначения г-го и /-го уровней типа фильтра и ме- местных помех соответственно. Так, fg2 обозначает фильтр типа 1 и средний уровень местных помех. Отметим, что теперь необ- необходимо шесть операторов, а не четыре, как в исходном экспе- эксперименте, для того чтобы число комбинаций обработок в фактор- факторном эксперименте 3X2 в точности совпадало с числом уровней ограничений. При этом плане каждый день каждым оператором исследуется только один вариант опыта. Латинские буквы А, В, С, D, Е и F соответствуют 3X2 = 6 комбинациям обработок: A = heu B = fig2, C = fig3, D = f2gu E = f2g2 и F = f2g3. 268 Таблица 12.5 Эксперимент по радиолокационному обнаружению, проведенный по латинскому квадрату 6X6 День 1 2 3 4 5 6 Оператор 1 A fcft = 90) C(/ig3=H4) В (fig, = 102) Е (f2g2 = 87) F (f2g3 = 93) D (f2gi = 86) 2 в (hg* = Ю6) A (figt = 96) E (f2g2 = 90) D (f2gi = 84) С tfrf, = 112) F (f2g3 = 91) 3 ¦ С (flSa = 108) В (fig2 = Ю5) F (f2gs = 96) A (flgl = 100) D (f2gi = 92) E <f2g2 = 97) День 1 2 3 4 5 6 4 D (f,gi = 81) F (fogs = 83) A (figi = 92) В (fig2 = 96) E (f2g2 = 90) L (figs = 98) Оператор 5 F (fogs = E (f2g2 = D (f»g! = С (figs = Л (/rgi = 5 (fig, = 90) 86) 85) 110) 90) 100) Продол 6 E (f2g2 = D (fogi = L (figs = ^ (f2gs -- В (fig2 = A (figi = же ни е = 88) = 84) = 104) = 91) = 98) = 92) Шести латинским буквам соответствует пять степеней сво- свободы: главным эффектам типа фильтра (одна) и местных по- помех (две) и их взаимодействию (две). Линейная статистическая модель для этого плана имеет вид Уны = 1 = 1, 2,...,6; /=1,2,3; fe=l,2; / = 1,2 6, A2.3) где г, и Pa — эффекты местных помех и типа фильтра соответ- соответственно; а,- и 0; — ограничения на рандомизацию — дни и опе- операторы соответственно. Для вычисления сумм квадратов удобна следующая таблица с двумя входами для сумм по обработкам: Местные помехи Низкие Средние Высокие У..к. Фильтр типа 1 560 607 646 1813 Фильтр типа 2 512 528 543 1583 . Ул.. 1072 1135 1189 у =3396 269
Для сумм по строкам и столбцам получаем Строки (y.jki) Столбцы (г/i/fc.): 563 572 568 579 568 597 568 530 565 561 564 557 ДА приведен в табл. 12.6, в которой показано, как опре- определяется число степеней свободы для каждой суммы квадратов. Таблица 12.6 Дисперсионный анализ для эксперимента по радиолокационному обнаружению, проведенного как факторный эксперимент 3X2 по латинскому квадрату Источник изменчивости Местные помехи Тип фильтра F GF Дни (строки) Операторы (столбцы) Ошибка Сумма * Значимо при ** Значимо при Сумма квадратов 571,50 1469,44 126,73 4,33 428,00 198,00 2798,00 1 проценте. 5 процентах Степени свободы 2 1 2 5 5 20 35 Общая формула для числа степеней свободы О—1 6—1 (а_1)(Ь--1) ab—l ab—l (ab— l)(ab—2) (aby—l Средний квадрат 285,75 1469,44 63,37 0,87 85,60 9,90 28,86 * 148,43 * 6,40 ** Мы остановились на планировании факторных эксперимен- экспериментов с использованием рандомизированных блоков или латин- латинских квадратов. Однако аналогичным образом можно рассмот- рассмотреть и другие планы многофакторных экспериментов. Статисти- Статистический анализ для них проводится непосредственно, следуя об- общим методам, описанным выше. В качестве основы многофак- многофакторных экспериментов можно использовать также и неполно- блочные планы; интересный пример такого подхода дан Джо- Джоном [47, с. 240]. 12.2. ПЛАН С РАСЩЕПЛЕННЫМИ ДЕЛЯНКАМИ При некоторых многофакторных планах, включающих в себя рандомизированные блоки, может оказаться, что мы не в со- состоянии полностью рандомизировать порядок наблюдений вну- внутри блока. Это часто приводит к обобщению идеи рандомизи- рандомизированного блочного планирования, а именно, плану с расщеп- расщепленными делянками. Пусть, например, изготовителя бумаги интересуют три различных метода приготовления пульпы и че- четыре различные температуры ее термообработки; он хочет ис- 270 следовать влияние двух этих факторов на прочность бумаги. Для каждой реплики плана факторного эксперимента необхо- необходимо 12 наблюдений, и экспериментатор решает провести три реплики. Однако опытная установка позволяет провести за день только 12 наблюдений, поэтому экспериментатор будет прово- проводить по одной реплике в каждый из трех дней, рассматривая дни, или реплики, как блоки. В любой из этих дней эксперимент проводится так. Одним из исследуемых методов приготавлива- приготавливается партия пульпы; затем она разбивается на четыре пробы и каждая из них подвергается термообработке при одной из че- четырех температур. Другим из исследуемых методов приготав- приготавливается вторая партия пульпы; она также разбивается на че- четыре пробы, которые проверяются при четырех температурах. Наконец, процесс повторяется с партией пульпы, приготовлен- приготовленной третьим методом. Полученные данные приведены в табл. 12.7. Таблица 12.7 Данные по пределу прочности бумаги на разрыв Блоки Метод приготовления Температура 95 ПО 125 140 1 1 30 35 37 36 2 34 41 38 42 3 29 26 33 36 2 1 28 31 40 41 2 31 36 42 40 3 31 30 32 40 3 1 31 37 41 40 2 35 40 39 44 3 32 34 39 45 В качестве отправной точки мы могли бы считать, что это факторный эксперимент по рандомизированному блочному плану с тремя уровнями методов приготовления и четырьмя уровнями температуры. В таком случае порядок проведения эксперимента внутри блока должен быть полностью рандоми- зирован; другими словами, внутри блока мы должны случайно выбрать комбинацию обработок (метод приготовления и тем- температуру) и произвести наблюдение, затем случайно выбрать другую комбинацию обработок и произвести второе наблюде- наблюдение и т. д., пока не будут произведены 12 наблюдений в блоке. Однако экспериментатор получал данные по-иному: он приго- приготавливал партию пульпы и по этой партии делал наблюдения для всех четырех температур. Из-за соображений экономично- экономичности приготовления партий пульпы и их размера это единст- единственный реально осуществимый способ получения данных. Каждый блок в этом плане делится на три части, которые называются целыми делянками; методы приготовления назы- 271
ваются обработками целых делянок, или главными обработ- обработками. Каждая целая делянка, в свою очередь, делится на че- четыре части, называемые под-делянками (или расщепленными делянками), и каждой из них сопоставляется одна температура; температура называется обработкой под-делянки. Отметим, что если существуют какие-либо неконтролируемые или непланируе- мые факторы, которые изменяются при переходе от одного ме- метода приготовления к другому, то любой эффект таких факто- факторов оказывается полностью смешанным с эффектом метода приготовления пульпы. Поскольку обработки целых делянок в плане с расщепленными делянками смешаны с целыми делян- делянками, а обработки расщепленных делянок не смешаны, то лучше всего, если это возможно, наиболее интересный фактор ставить в соответствие под-делянкам. Линейная модель для плана с расщепленными делянками имеет вид т = М- + Тг + Pj + (ТР) Ц + \k + (ту) гк + A2.4) i=l/2, ..., а; /=1, 2, ..., b; k=l, 2, ..., с, где п, Pj и (tp)jj относятся к целой делянке и характеризуют соответственно блоки (фактор А), главные обработки (фак- (фактор В) и ошибку целой делянки (АВ), a yh, (xy)ik, (f>y)ih и (r$y)ijk относятся к расщепленной делянке и характеризуют соответственно обработку под-делянки (фактор С), взаимодей- взаимодействия АС и ВС и ошибку под-делянки. Отметим, что ошибка целой делянки — это взаимодействие АВ, а под-делянки — трех- факторное взаимодействие ABC. Суммы квадратов для этих факторов находятся как в трехфакторном ДА при единствен- единственной реплике плана. В табл. 12.8 приведены выражения математических ожида- ожиданий средних квадратов для плана с расщепленными делянками, в котором блоки и главные обработки случайны, а обработки под-делянок фиксированы. Отметим, что главный фактор в це- целой делянке В сравнивается с ошибкой целой делянки, а обра- обработка под-делянки С — с взаимодействием блоки X под-обра- под-обработки АС (под-обработка — обработка под-делянки.—Прим. ред.). Взаимодействие ВС сравнивается с ошибкой под-делянки. Подчеркнем, что ие существует критериев для эффекта бло- блоков А или взаимодействия блоки X под-обработки АС. По мне- мнению некоторых авторов, ошибку под-делянки нужно находить объединением взаимодействий ABC и АС, а затем сравнивать как под-обработки, так и взаимодействие ВС с этой комбини- комбинированной оценкой. Если экспериментатор обладает опытом ис- исследований в данной области и достаточно уверен в том, что блоки не взаимодействуют с различными обработками, то такой 272 Таблица 12.8 Вывод выражений для математических ожиданий средних квадратов для плана с расщепленными делянками Целая делянка Под-делянка Фактор Х1 Vfe а R i 1 а 1 а 1 а 1 1 ь F i b 0 0 b b 0 0 1 с F k с с с >— о о о о 1 R h 1 1 1 1 1 1 1 1 Математическое ожидание среднего квадрата О2 + Ьс а2 2 2 цс „2 а2 + с а2р 2 i >. 2 i а^ VI 2 а 1 " ату ' . ^j Vfe С— I 2 I _2 а2 (не допускает оценку) способ является приемлемым. Наоборот, если нет достаточ- достаточной уверенности в том, что взаимодействия пренебрежимо малы, то объединять оценки не рекомендуется. ДА данных по прочности на разрыв (см. табл. 12.7) приве- приведен в табл. 12.9. Поскольку как методы приготовления, так и температуры фиксированы, а блоки случайны, то справедливы выражения для математических квадратов из табл. 12.8. Сред- Средний квадрат для методов приготовления сравнивается со сред- средним квадратом ошибки целой делянки, а средний квадрат для температур — со средним квадратом для взаимодействия блоки X температуры или АС. Наконец, средний квадрат для взаимодействия метод приготовления X температура сравнива- сравнивается с ошибкой под-делянки. Как методы приготовления, так и температуры оказывают значимое влияние на прочность бумаги. Из табл. 12.9 видно, что ошибка под-делянки E.57) меньше ошибки целой делянки (9.74). Для планов с расщепленными делянками это обычное явление, поскольку под-делянки, вообще говоря, более однородны, чем целые делянки. Из-за того, что обработки под-делянок сравниваются с большей точностью, то предпочтительнее, если это возможно, относить обработку, представляющую наибольший интерес, к под-делянкам. 273
Планы с расщепленными делянками возникли при агротех- агротехнических исследованиях, где обычно целые делянки — это боль- большие участки земли, а под-делянки — малые. Например, не- несколько сортов зерна могут быть посеяны на различных полях (целые делянки), по одному сорту на поле. Затем каждое поле может быть разбито, скажем, на четыре под-делянки, каждая из которых может обрабатываться различными видами удобрений. Здесь сорта зерна являются главными обработками, а удобре- удобрения — под-обработками. Планы с расщепленными делянками оказываются также полезными во многих научных или про- промышленных исследованиях, когда одни факторы требуют боль- больших экспериментальных объектов, а другие— малых, как в приведенном выше примере. Таблица 12.9 Дисперсионный анализ для плана с расщепленными делянками (данные по пределу прочности из табл. 12.7) Источник изменчивости Блоки (А) Метод приготовления (В) А В (ошибка целой де- ляики) Температура (С) АС ВС ABC (ошибка под-делян- под-делянки) Сумма Сумма квадратов 88,89 155,72 38,95 384,08 18,67 57,17 66,83 810,31 ¦ Значимо при 5 процентах. ••Значимо при 1 проценте. Степени свободы 2 2 4 3 6 6 12 35 Средний квадрат 44,45 77,86 9,74 128,03 3,11 9,53 5,57 Fo 7,99 * 41,17 ** 1,71 В своей книге Джон [47] подчеркивает, что необходимо тщательно разобраться в том, каким образом собираются дан- данные, и ввести в анализ все ограничения на рандомизацию. Для иллюстрации этого замечания рассмотрим модификацию экспе- эксперимента по исследованию времени фокусирования глаза (при- (пример 10.2). Допустим, факторов всего два: резкость изобра- изображения А и уровень освещенности В. Для факторного экспери- эксперимента с а уровнями резкости, b уровнями освещенности и п реп- репликами было бы необходимо проводить все abn наблюдений в случайном порядке. Экспериментальную аппаратуру, однако, довольно трудно настраивать на различные уровни этих двух факторов, и экспериментатор решает получить п реплик, на- 274 строив ее на один из а уровней резкости и один из b уровней освещенности и сделав все п наблюдений подряд. В таком фак- факторном эксперименте ошибка в действительности представляет собой рассеивание, или шум, в системе плюс способность субъ- субъекта воспроизводить одно и то же время фокусирования. Мо- Модель для этого факторного эксперимента можно было бы запи- записать в виде г + Рг + (тР) ц + фг)к + Qijk, t=l, 2, ..., а; /=1, 2, ..., b; k=\, 2, ..., п, A2.5) где фцк характеризует рассеивание, или шум, в системе, обусловленные «экспериментальной ошибкой» (т. е. нашей не- неспособностью в точности воспроизводить одни и те же уровни резкости и освещенности при различных наблюдениях), измен- изменчивостью окружающих условий и т. п., а Вци характеризует «ошибку воспроизводимости» субъекта. Обычно мы объединяем эти компоненты в общее слагаемое ошибки, скажем гци = = фцк + вцк. Пусть F(eijft)=(T2 = (T|+(Te, тогда в факторном эксперименте средний квадрат ошибки обладает ab(n—1) сте- степенями свободы, а его математическое ожидание а2 = ог| + ог|. Если мы ограничим рандомизацию так, как во втором из приведенных выше планов, то средний квадрат «ошибки» в дис- дисперсионном анализе дает оценку «ошибки воспроизводимости» сг§ с ab(n—1) степенями свободы, но не содержит информации об «экспериментальной ошибке» сх2ф. Таким образом, средний квадрат ошибки при этом плане эксперимента слишком мал, и, следовательно, мы будем очень часто ошибочно отклонять нулевую гипотезу. Как отмечает Джон {47], данный план подо- подобен плану с расщепленными делянками, в котором каждая из ab целых делянок разбита на п под-делянок, но под-обработки отсутствуют. Ситуация также подобна взятию выборки из вы- выборки, которое рассматривает Осл E5]. В предположении, что Л и В фиксированы, математические ожидания средних квад- квадратов в этом случае имеют вид (MSAB) = ст2 + па% + {а_1)\ь_1) (тР)?;; } A2-6) 275
Таким образом, если взаимодействием пренебречь нельзя, то критерии для главных эффектов не существуют. Положение точно такое же, как и в двухфакторном ДА при одном наблю- наблюдении на ячейку. Если оба фактора случайны, то главные эф- эффекты можно сравнивать с взаимодействием. Если случаен только один фактор, то с взаимодействием можно сравнивать фиксированный фактор. Джон [47] также утверждает, что в общем случае при про- проведении анализа для факторного эксперимента, когда все главные эффекты и взаимодействия оказываются значимыми, необходимо тщательно разобраться в том, каким образом были получены данные. В модели могут быть ограничения на рандо- рандомизацию, не учтенные при анализе, и следовательно, к этим данным нельзя применять методы анализа, справедливые для факторных экспериментов. Андерсон и Маклин A, с. 191] при- приводят пример, когда экспериментатор не смог различить фак- факторный план и план с расщепленными делянками. 12.3. ПЛАН С ДВАЖДЫ РАСЩЕПЛЕННЫМИ ДЕЛЯНКАМИ Идея планов с расщепленными делянками может быть обоб- обобщена на ситуации, когда ограничения на рандомизацию могут встречаться на любом числе уровней внутри блока. При двух уровнях ограничений на рандомизацию внутри блока возни- возникает план с дважды расщепленными делянками; он иллюстри- иллюстрируется следующим примером. Пример 12.2. Врач-исследователь изучает время абсорбции некоторого вида капсул с антибиотиком. В его распоряжении три техника, дозы трех концентраций и капсулы со стенками четырех толщин. Для каждой реплики факторного эксперимента понадобилось бы 36 наблюдений. Экспериментатор решил провести четыре реплики, причем проведение каждой из них требует целого дня. Таким образом, дни являются блоками. Внутри блока (дня) при проведении эксперимента порция антибиотика передается технику, который ставит опыт с дозами трех концентраций и стенками четырех толщин. После приготовления дозы определенной концентрации все четыре толщины стенок проверялись при этой концентрации. Затем приготавливалась доза другой концентрации и проверялись все четыре толщины стенок. Наконец, четыре толщины стенок проверялись при третьей концентрации дозы. В это же время два других техника выполняли те же действия, начиная с получения антибиотика. Заметим, что внутри блока два ограничения на рандомизацию: техник и концентрация дозы. Целым делянкам соответствуют техники. Порядок, в котором порции антибиотика распределялись по техникам, определялся случайным образом. Концентрации дозы образуют три под-делянки; они мо- могут распределяться по под-делянкам случайно. Наконец, внутри дозы данной концентрации четыре толщины стенок капсулы проверяются в случайном порядке, образуя четыре под-под-делянки. Толщины стенок обычно назы- называются под-под-обработками. Поскольку внутри блока два ограничения на рандомизацию (некоторые авторы говорят, что в плане два «расщепления»), то этот план называется планом с дважды расщепленными делянками. Рис. 12.1 иллюстрирует ограничения на рандомизацию н схему эксперимента при таком плане. 276 Толщина стенок Распределение антибиотика по техникам Выбор концентрации дозы Перйое ограничение на рандомизацию второе ограничение на рандомизация Случайный порядок Блоки 1 2 3 4 Концентрация дозы Толщина стенок Толщина стенок Толщина стенок Толщина стенок Техник 1 1 2 3 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 2 1. 2 3 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 3 1 2 3 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 1 1 1 2 2 2 3 3 3 4 4 4 Рис. 12.1. План с дважды расщепленными делянками. 277
Линейная статистическая модель для плана с дважды рас- расщепленными делянками имеет вид = И +т , + + (P7)/fc+ (tPy)*/*+ + (Рб)/Л + (трб),7й+ (y8)kh + (x i=l, 2, .... a; /=1,2, .... 6; A-=l, 2 c; A= 1, 2, .. ., d, где tj, Pj и (tP),j относятся к целой делянке и характеризуют соответственно блоки (фактор А), главные обработки (фак- (фактор 5) и ошибку целой делянки (АВ); yk, (туЫ, (Pvbfc и (т$у)цк относятся к подделянке и характеризуют соответственно обработку под-делянки (фактор С), взаимодействия АС и ВС и ошибку под-делянки; бл и остальные параметры относятся к под-под-делянке и характеризуют соответственно под-под- обработку (фактор D) и остальные взаимодействия. Четырех- факторное взаимодействие (тр\6)г^/1 принимается за ошибку под-под-делянки. В предположении, что блоки случайны, а остальные факторы фиксированы, мы можем получить математические ожидания средних квадратов (табл. 12.10). Критерии для главных обра- обработок, под-обработок, под-под-обработок и их взаимодействий очевидны из рассмотрения этой таблицы. Отметим, что не су- существует критериев для блоков или взаимодействий, включаю- включающих в себя блоки. Статистический анализ для плана с дважды расщеплен- расщепленными делянками подобен анализу для единственной реплики четырехфакторного эксперимента. Число степеней свободы для каждого критерия определяется обычным образом. Так, в при- примере 12.2, в котором рассматривалось четыре блока, три тех- техника, три концентрации дозы и четыре толщины стенок, ошибка целой делянки, используемая для проверки значимости влияния техников, обладает (а—1)(Ь—1) = D—1) C—1) =6 степенями свободы. Это число сравнительно невелико, и экспе- экспериментатор может рассмотреть вопрос о введении дополнитель- дополнительных блоков для повышения точности проверки. При а блоках ошибка целой делянки обладает 2(а—1) степенями свободы; так, пять блоков дают 2E—1)=8 степеней свободы, шесть бло- блоков— 2F—1) =10, семь блоков 2G—1) = 12 степеней свободы и т. д. Следовательно, мы, скорее всего, не станем использовать менее четырех блоков, поскольку это дает лишь 4 степени сво- свободы. Каждый дополнительный блок позволяет нам выиграть 2 степени свободы ошибки. Если бы у экспериментатора была возможность использовать пять блоков, то он смог бы повысить точность проверки на одну треть (с 6 до 8 степеней свободы). При переходе от ляти к шести блокам дополнительное повыше- повышение точности составляет 25%. Если возможности позволяют, то экспериментатор должен взять пять или шесть блоков. 278 Таблица 12.10 Вывод математических ожиданий средних квадратов для плана с дважды расщепленными делянками Целая делянка Под- делянка Под-под- делянка Фактор \ (*)</ Ук {^y)i,-k (туб)(^Л (TPv6),vfcft el(ijkh) а R i 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 1 Ь F i b 0 0 b b 0 0 b b 0 0 b b 0 0 1 с F k с с с 0 0 0 0 с с с с 0 0 0 0 1 d F h d d о. d d Л о. 0 0 0 0 0 0 0 0 1 1 R I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Математическое ожидание среднего квадрата o2+bcdo2x a2 \cda2 ! acd У В2 a -j- cda2.» 2 ... 2 , °6d ^i 2' с — 1 a2+Ma|v n2 | rfn2 | ad n2 \ h 2 a^C V A2 a2 + &ca2e 2.2, ОС C lP° (&_l)(d_l) ~ 2 _¦ ,2 i ab x22(vs)L o2+Kve ¦o!+o!tW + a a2 (не оценивается) 279
12.4. ЗАДАЧИ 12.1. Исследуется выход химического процесса. Рассматриваются два фактора — температура и давление на трех уровнях каждый. За день можно сделать только девять наблюдений, поэтому экспериментатор проводит пол- полную реплику плана в день. Проанализируйте данные, приведенные ниже, в предположении, что дни являются блоками. Температура Низкая Средняя Высокая День 1-й 1 День 2-й Давление 250 86,3 88,5 89,1 260 84,0 87,3 90,2 270 85,8 89,0 91,3 250 86,1 89,4 91,7 260 85,2 89,9 93,2 270 87,3 90,3 93,7 12.2. Повторите анализ для примера 11.1 в предположении, что каждая реплика представляет собой блок. Выведите выражения для математических ожиданий средних квадратов. 12.3. Опишите проведение ДА для факторного эксперимента 23 по латин- латинскому квадрату. 12.4. Для нормализации стали ее подвергают нагреванию выше критиче- критической температуры, томлению и воздушному охлаждению. В результате этого повышается прочность стали, понижается ее зернистость, а структура ста- становится более однородной. Проводится эксперимент для определения влия- влияния температуры и продолжительности термообработки иа прочность норма- нормализованной стали. Выбираются два уровня температуры и три уровня про- продолжительности. В ходе опыта печь нагревается до температуры, выбранной случайным- образом, и в нее помещаются три образца, один из которых вынимается через 10 мин, другой — через 20 и последний — через 30 мин. Затем температура выставляется на другой уровень и процесс повторяется. Для получения данных, приведенных ниже, потребовалось четыре смены. Проведите анализ этих данных в предположении, что оба фактора фикси- фиксированы, и сделайте выводы. Смеиа 1 2 3 4 Продолжительность, мни 10 20 30 10 20 30 10 20 30 10 20 30 Температура, °С 815 63 54 61 50 52 59 48 74 71 54 48 59 870 89 91 62 80 72 69 73 81 69 88 92 64 280 12.5. Повторите решение задачи 12.4 в предположении, что уровни тем- температуры и продолжительности выбирались случайным образом. 12.6. Рассмотрите план с дважды расщепленными делянками, описанный в примере 12.2. Пусть эксперимент проводится в соответствии с описанным планом, и получены данные, приведенные ниже. Проведите анализ этих дан- данных и сделайте выводы. Блок 1 2 3 4 Толщина стенок 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 1 Гехник 2 Концентрация дозы 1 95 104 101 108 95 106 103 109 96 105 106 113 90 100 102 114 2 71 82 85 85 78 84 86 84 70 81 88 90 68 84 85 88 3 108 115 117 116 110 109 116 ПО 107 106 112 117 109 112 115 118 1 96 99 95 97 100 101 99 112 94 100 104 121 98 102 100 118 2 70 84 83 85 72 79 80 86 66 84 87 90 68 81 85 85 108 100 105 109 104 102 108 109 100 101 109 117 106 108 ПО 116 1 95 102 105 107 92 100 101 108 90 97 100 ПО 98 102 105 НО 2 70 81 84 87 69 76 80 86 73 75 82 91 72 78 80 95 3 100 106 113 115 101 104 109 113 98 100 104 112 101 105 ПО 120 12.7. Повторите решение задачи 12.6 в предположении, что концентрации дозы выбирались случайным образом. ГЛАВА ТРИНАДЦАТАЯ РЕГРЕССИОННЫЙ АНАЛИЗ 13.1. ВВЕДЕНИЕ Во многих задачах встречаются две или более переменных, между которыми существует характерная связь, причем не- необходимо исследовать природу этой связи. Например, в хими- химическом процессе выход продукта реакции связан с рабочей температурой, и может представлять интерес построить мо- модель, связывающую выход с температурой, а затем воспользо- 281
ваться этой моделью для прогнозирования, оптимизации прб- цесса или управления им. Пусть в общем случае есть одна зависимая переменная, или отклик у, которая зависит от k независимых переменных, на- например, хи хъ, ..., Xk. Связь между этими переменными харак- характеризуется математической моделью, которая называется урав- уравнением регрессии (когда у является случайной величиной.— Прим. ред.). Точнее, мы говорим о регрессии у по х\, х2, ... . .., хи- Регрессионная модель должна аппроксимировать сово- совокупность экспериментальных данных. В некоторых случаях ис- исследователю известен точный вид истинной функциональной зависимости между у и хи х2, ..., Xk, скажем, у=^{хи х2, ... ..., Xk). Однако чаще всего истинная функциональная связь неизвестна, и экспериментатору приходится выбирать подхо- подходящую функцию для аппроксимации "ф. Для аппроксимации широко используются полиномиальные модели, что в некоторых деталях будет обсуждаться в данной главе. Регрессионные методы часто используются при анализе дан- данных непланируемых экспериментов; такая ситуация может воз- возникнуть при наблюдении неконтролируемых явлений или исто- исторических записей. Однако планирование экспериментов для изучения регрессии, как будет показано далее, дает большие преимущества. 13.2. ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ Мы хотим установить связь между одной независимой пе- переменной х и зависимой переменной у. Обычно считается, что независимая переменная х непрерывна и может контролиро- контролироваться экспериментатором. Тогда, если существует план экс- эксперимента, мы выбираем определенные значения х и наблю- наблюдаем соответствующие значения у. Предположим, что истинная связь между у и х линейна и наблюдение у на каждом уровне х — случайная величина. Тогда математическое ожидание у для каждого значения х имеет вид ?(*//*) = ро + М, A3.1) где параметры Ро и Рь определяющие прямую линию, — неиз- неизвестные постоянные. Допустим, что каждое наблюдение у описывается моделью A3.2) где е — случайная ошибка с нулевым средним и дисперсией а2. Кроме того, предположим, что {е} — некоррелированные слу- случайные переменные. Модель A3.2), в которой всего одна неза- независимая переменная х, часто называется моделью простой ли- линейной регрессии. 282 Если у нас есть п пар данных (уи *,), (у2з х2), ..., (уп,хп), то мы можем построить МНК-оценки параметров модели р0 и pi. В соответствии с уравнением A3.2) можно написать, что ;, 1=1, 2, ...,.п, A3.3) тогда сумма квадратов ошибки примет вид где *=(^-)g*. и P0 = Минимизация этой суммы квадратов упрощается, если перепи- переписать уравнение модели A3.2) как A3.4) здесь мы просто скорректировали независимую переменную на ее среднее, что привело к изменению отрезка, отсекаемого на оси ординат. Уравнение A3.4) часто называется преобразован- преобразованной моделью простой линейной регрессии или просто преобра- преобразованной моделью. Помимо упрощения задачи оценивания при- применение этой модели облегчает получение и других выводов. Для преобразованной модели сумма квадратов ошибки имеет вид A3.5) МНК-оценки р'о и р1( скажем р'„ и рь должны удовлетворять уравнениям dL 'V pi i /=1 dL эо. г, = ~2 2 [У/-Й-Р, ft-*)] (*, или после упрощения 2 7=1 2 A3.6) 283
Полученные уравнения называются нормальными МНК-уравне- ниями: их решение имеет вид Ро =— 2 п i=i п 2 У/ {х,- 2 (*/- A3.7) A3.8) Таким образом, р'о и Pi—МНК-оценки величины отрезка, отсекаемого прямой на оси ординат, и угла наклона этой пря- прямой соответственно. Подобранная модель простой линейной регрессии имеет вид У = & + ЬЛ*-х) A3-9) или, если экспериментатор хочет представить результаты в тер- терминах исходного отрезка ро, то —х). A3.10) где Ро=Ро—М- Числителю и знаменателю выражения A3.8) удобно при- присвоить специальные обозначения, а именно, е= 2 (*/-*)'= 2 *Нг п \ /= A3.11) sxy= i=\ A3-12) Мы назовем Sxx скорректированной суммой квадратов х K_Sxy— скорректированной суммой смешанных произведений х и у. При вычислениях обычно используются выражения в правых частях соотношений A3.11) и A3.12). В новых обозначениях МНК-оценка углового коэффициента прямой имеет вид Pi = -?aL. A3.13) Пример 13.1. Проводилось исследование влияния скорости перемешива- перемешивания иа количество примесей в краске, получаемой химическим способом. Оно дало следующие результаты: 284 Скорость перемешивания, об/мин (X) Примеси, % (у) Скорость перемешивания, об/мин (х) Примеси, % (у) 20 8,4 32 13,2 22 9,5 34 14,7 24 11,8 36 16,4 26 10,4 38 16,5 28 13,3 40 18,9 30 14,8 42 18,5 Была предложена линейная модель у=$о величины: и вычислены следующие 12 12 12 л = 12; 2 xi =372; 2 У} =166-4; 2 у) =12104; 12 _ (/=13,87; ж = 31; ^ = 5419,60. По выражениям A3.11) и A3.2) находим Sxx= 12,104 -• 3722 = 572,00; 12 Sxy = 5419,60 .372-166,4 = 261,20. Таким образом, =261^0 = 57200 Sxx 572,00 Р"'о = «Г= 13,87 и подобранная модель имеет вид нлн (/=13,87 + 0,46(л: — 31). Если мы хотим выразить модель в терминах исходного отрезка, то р0 = р'о _ }>~х = 13,87 — 0,46 • 31 = —0,29 и, поскольку i/=Po + Pi*, то получаем (/=—0,29 + 0,46а:. Для суждения об адекватности подобранной модели боль- большое значение имеют статистические свойства МНК-оценок. Оценки р'о и Pi — случайные величины, поскольку они являются линейными комбинациями случайных переменных у$. Ис- Исследуем смешение и дисперсию этих оценок. Рассмотрим 285
сначала pi. Для математического ожидания р\ получаем ,-^)] + S n поскольку 2 (xi—х)=0и, по предположению, ?(е,)=0. Таким образом, pi — несмещенная оценка истинного углового коэф- коэффициента. Рассмотрим теперь дисперсию f$i. Мы предположили, что F(ej) =<r2, следовательно, V(i/j) = о2 и ->«/ ¦V A3.14) Случайные переменные У) некоррелированы в силу юго, что некоррелированы е3-. Следовательно, дисперсия суммы в выра- выражении A3.14) равна сумме дисперсий, причем дисперсия каж- каждого слагаемого, скажем V[yj(Xj—х)], равна o2(Xj—хJ. Таким образом, 2(*;-*J = —х. A3.15) V1" S2 —"' ' Sxx ° хх Аналогичным образом можно показать, что A3.16) A3.17) Для того чтобы найти F(Po), мы воспользовались результа- результатом Cov(p'o, Pi)=0. Попутно заметим, что ковариация ро и Pi не равна нулю, Cov(p0, fii)=—e2x/Sxx (см. задачи 13.7 и 13.8). 1 При планировании экспериментов пользоваться этим результатом сле- следует осторожно, поскольку удобная для практики модель первого порядка может отличаться от истинной. В этом случае при выборе х (см. задачу 13.11) надо иметь в виду работу Д. Бокса и Н. Драйпера — Journal of the American Statistical Association, 1959, v. 54, p. 622. (Прим. ред.) 286 Подчеркнем, что р'о и р0 — несмещенные оценки р'о и р0 соот- соответственно. Обычно бывает необходимо получить оценку о2. Разность между результатом наблюдения у, и предсказанным по урав- уравнению регрессии значением г/j, скажем, ej=yj—yjt называется остатком. Сумма квадратов остатков или сумма квадратов ошибки ' должна иметь вид -if/J.] (I3-J8) Более удобную расчетную формулу для SSom можно найти, подставив в уравнение A3.18) оценку модели yj=y + Pi(Xj—х) и упростив его следующим образом: SSoai = 2 \У<—У—Ь\ (х,—х) ]2 = 2 (У2 + У2+ Р2 (х.—хJ— /=1L' х ' п /=11 ' х ' ' — 2yy.—2piyj (xl—~x}+2$ly(xl—x) ] = 2У2 + Щ2 + $2SXX — fl XX Oil ^ // 9R 9 _1_ 9ft и *S* (v v\ /1Я 1Q\ **U ^^ У J r 1 XU i" *"Plc7 ^^ \ i / * \ * / Последнее слагаемое в этом выражении равно нулю.: 2i/2i/j = = 2п^2 и fn2Sxx=fn(SxyISxx)Sxx=p1SXy. Следовательно, это вы- выражение принимает вид п _ п _ Но 2(/2—пу2=^(у.—yy==Syy, и мы можем записать SSom как SSOm=Sra—\\Sxy. A3.20) Можно показать, что математическое ожидание SSom имеет вид E(SS0UI) = {п~2)а2. Поэтому MSOU1 A3.21) л — 2 является несмещенной оценкой сг22. 1 Сумма квадратов остатков, называемая остаточной суммой квадратов, совпадает с суммой квадратов ошибки только при корректности модели. (Прим. ред.) 2 Число степеней свободы оценки A3.21) обусловлено двумя независи- независимыми линейными ограничениями у,—у,-. (Прим. ред.) 287
Регрессионный анализ используется широко и часто непра- неправильно. Нужно упомянуть некоторые из неправильных приме- применений регрессии. Необходимо с осторожностью выбирать пере- переменные для построения моделей регрессии и определять форму аппроксимирующей функции. Вполне вероятно, что между пе- переменными можно установить связи, которые окажутся прак- практически бессмысленными. Регрессионные связи справедливы только для значений не- независимой переменной в исследованном интервале данных. Ли- Линейная зависимость, существование которой мы предположили, может быть справедливой в исходном диапазоне изменения х, но скорее всего это будет не так, когда нам встретятся значе- значения х вне данного диапазона; регрессионные модели никогда не должны использоваться для экстраполяции. Иногда создается впечатление, что справедлива модель у=$х + г. Исключение постоянного слагаемого из модели под- подразумевает, конечно, что у = 0 при х = 0. Это очень сильное допущение, которое часто оказывается неоправданным. Даже когда две переменные, как, например, рост и масса человека, казалось бы позволяют использовать такую модель, мы обычно получаем лучшую аппроксимацию, учитывая постоянное слага- слагаемое; это объясняется ограниченностью диапазона данных, от- относящегося к независимой переменной. 13.3. ПРОВЕРКА ГИПОТЕЗ ПРИ ИСПОЛЬЗОВАНИИ ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Для проверки гипотез относительно углового коэффициента и отрезка на оси ординат в регрессионной модели нам необ- необходимо принять дополнительное допущение о нормальности распределения слагаемого ошибки, т. е. е3-. Таким образом, мы предполагаем, что ej~NID@, о2). Позднее мы обсудим, как эти предположения могут быть проверены с помощью анализа остатков. Пусть экспериментатор хочет проверить гипотезу о том, что угловой коэффициент принимает некоторое значение, например, Рю. Подходящими гипотезами являются A3.22) где мы задали двустороннюю альтернативу. Тогда из ej~ ~A//D@, а2) непосредственно следует, что наблюдения yj.~ ~A//D(po+Pi*j, а2). Таким образом, Pi является линейной комбинацией независимых случайных нормальных переменных, и, значит, Pi~Af(Pi, a2ISxx) (при этом мы учли несмещенность Pi и выражение для дисперсии р\ из параграфа 13.2). Величины 288 C! и MSom независимы; тогда вследствие допущения о нормаль- нормальности оказывается, что при Яо: Pi = Pio статистика V A3.23) подчиняется ^-распределению с п—2 степенями свободы. Мы отклоним Яо: p1==p1Oi если |*о|>'«!2:п-2. A3-24) где tu находится по уравнению A3.23). Аналогичную процедуру можно использовать для проверки гипотез относительно отрезка на оси ординат. Для проверки гипотез Но: ро — Р оо! используется статистика A3.25) A3.26) и нулевая гипотеза отклоняется, если \k _ _ Очень важным частным случаем гипотез A3.22) являются Яо: р, = 0; Я1: р,^0. A3.27) Гипотеза Яо: Pi = 0 связана со значимостью регрессии. При- Принятие этой гипотезы эквивалентно выводу, что между хну нет линейной связи, т. е. лучшей оценкой у, при любом х, яв- является Уз = у. Во многих случаях это может означать, что между х и у нет причинной связи или что истинная связь нелинейна. Критерий проверки Яо: Pi=0 можно вывести двумя спосо- способами. При первом из них общая скорректированная сумма квадратов у разбивается следующим образом: Syy= ? {у,-у?= ? (У,-~УУ+ ? (у, -У)J- A3.28) /=i /=i /=i Эти два компонента Syy являются мерой соответственно вели- величин изменчивости г/j, объясняемой линией регрессии и остаточ- остаточных изменений, которые линия регрессии не объясняет. Мы п обычно определяем 5S0IH= 2 («//—У,-J как сумму квадратов п ошибки, а55рег= 2 [у/—У?— как регрессионную сумму квад- квадратов (строго говоря, обе суммы квадратов скорректированные, 10 Д. К. Монтгомери 289
и SSper называют суммой квадратов, обусловленной регрес- регрессией.— Прим. ред.). Тогда соотношение A3.28) можно перепи- переписать в виде •Jj/y = Oi_)per~b >jijoiii- (lo.zy) Расчетная формула для SSver находится из соотношения A3.20): SSper =PlS*,,. A3.30) Число степеней свободы Syy составляет п—1, а у SSper и SSOm оно равно 1 и п—2 соответственно. Можно показать, что E[SSom/(n—2)] = o2 и B[SSper/l] = = a2+f>\Sxx и SSom и SSper независимы. Таким образом, если справедлива гипотеза Яо: {5i = 0, то статистика A3.31) S о per/ * MS per SSom/(rt — 2) MSom подчиняется ^-распределению с 1 и п—2 степенями свободы; мы отклоним #0, если F0>Fa-, i;n-2. Процедура проверки обычно оформляется в виде таблицы ДА (табл. 13.1). Таблица 13.1 Дисперсионный анализ для проверки значимости регрессии Источник изменчивости Регрессия Ошибка или остаток Сумма Сумма квадратов SSper — fil^xy SSOm = Syy — PiSXy syy Степени свободы 1 я — 2 n— 1 Средний квадрат MSper MSqiii Fo MS per MS ош Критерий значимости регрессии можно также получить из уравнения A3.23) при вю=0, т. е. '«. A3.32) Возведя обе части этого соотношения в квадрат, получим ,2 _ $Sxx __ hSxy _ MS per A3.33) Заметим, что t\ в этом соотношении совпадает с Fo в соотно- соотношении A3.31). И в общем случае оказывается справедливым утверждение, что квадрат случайной переменной, подчиняю- 290 щейся ^-распределению с f степенями свободы, подчиняется ^-распределению с одной и f степенями свободы числителя и знаменателя соответственно. Таким образом, критерий, в ко- котором используется t\, эквивалентен критерию, основанному на Fo. Пример 13.2. Проверни значимость регрессии для данных примера 13.1. Подобранная модель имеет вид у—— 0,29 — 0,46лт; для Svy находим 2 й (S У^ = = 2435,14—1 • 166,4*= 127,73, а для регрессионной суммы квадратов — SSPer = PiSIV=0,46-261,20= 120,15. Таким образом, сумма квадратов ошибки SSom=SS1/1/ — SSper= 127,73— 120,15=7,58. ДА для проверки гипотезы Яо: Pi=0 сведен в табл. 13.2. Поскольку ^ooi; 1; 10=10,0, то мы отклоняем Но н делаем вывод, что Pi =5^0. Таблица 13.2 Дисперсионный анализ для примера 13.2 Источник изменчивости Регрессия Ошибка Сумма Сумма квадратов 120,15 7,58 127,73 Степени свободы 1 10 11 Средний квадрат 120,15 0,758 Fo 158,51 13.4. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ ПРИ ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ Кроме точечных оценок углового коэффициента и отрезка на оси ординат оказывается возможным построить и интерваль- интервальные оценки этих параметров. Если е3- независимы и распреде- распределены нормально, то обе переменные подчиняются ^-распределению с п—2 степенями свободы. Сле- Следовательно, 100 A—а)-процентный доверительный интервал для &i имеет вид В +1 1 / MSom Pi ^ 'a/2; n-2 I/ —г , 10* A3.34) 29!
а для A3.35). В качестве иллюстрации построим 95-процентный довери- доверительный интервал для f5i по данным примера 13.1. В соответст- соответствии с выражением A3.34) это 0,46±2,228/0,758/572,00 или 0,46±0,08. Таким образом, 95-процентный доверительный ин- интервал для Рь 0,38^Pi^0,54. Доверительный интервал можно построить и для среднего отклика при заданном х, скажем, х0; его часто называют дове- доверительным интервалом для линии регрессии. Поскольку E{y\xQ\)=i^'Q + pi(x0—х), то с помощью подобранной модели можно получить_точечную оценку Е{у\хо\) в виде Е{у\х0) = =Уо = Ро4"Р1(л;о—х). Ясно, что ?(уо) = Ро + $i(x0—х), так как Pq и pi несмещены, и поскольку Cov(P0', pi) = 0. Далее у0 распределено нормально в силу нормальности распределения р0 и рь Следовательно, 100A—а)-процентный доверительный интервал для истинной линии регрессии при х=х0 определяется выражением Уо± A3.36) Отметим, что ширина доверительного интервала для Е(у\х0) зависит от х0; она минимальна при хо = х и увеличивается с ростом | х0—х |. Пример 13.3. Построим 95-процентный доверительный интервал для линии регрессии по данным примера 13.1. Поскольку г/0=—0,29+0,46*0, то этот Таблица 13.3 Доверительные границы для примера 13.3 к 95-процентные дове- доверительные гра- границы 20 8,91 ±1,05 22 9,83 ±0,92 24 10,75 ±0,80 26 11,67 ±0,69 28 12,59 ±0,61 30 13,51 ±0,57 292 Продолжение Уо 95-процентные дове- доверительные гра- границы 32 14,43 ±0,57 34 15,35 ±0,61 36 16,27 ±0,69 38 17,19 ±0,80 40 18,11 ±0,92 42 19,03 ±1,05 интервал определяется выражением уй ±2,228 l/0,758(-L. V V 12 572,00 Прогнозируемые значения и 95- процентные доверительные границы при Xo=Xi, j=l, 2, ,.., 12 приведены в табл. 13.3. Покажем, как пользо- пользоваться этой таблицей; найдем 95-процентный доверительный интер- интервал для истинной линии регрессии, скажем, при *о = 26: 11,67 — 0,69<?(г/1*,,=26) < 11,67+ +0,69 или 10,98 < Е (у | х0=26) < 12,35. Подобранная модель 95-процент- 95-процентный доверительный интервал для истинной линии регрессии приведены на рис. 13.1. Еще одним полезным по- понятием в простой линейной регрессии является интервал предсказания, т. е. интерваль- У 25 20 15 10 5 - II I 5 10 15 20- 25 30 ¦ i i 35 40 45 х Рис. 13.1. Подобранная модель и 95-процентный доверительный интер- интервал для примера 13.3. ная оценка среднего k последующих наблюдений при некотором значении х, скажем, х0. Для иллюстрации этого понятия пред- предположим, что в условиях примера 13.1 исследователь хочет построить интервальную оценку среднего значения примесей в следующих четырех партиях краски, приготовленных при ско- скорости перемешивания лго = 34. Доверительный интервал здесь неприемлем, так как он относится к истинному среднему при- примесей (неизвестной величине), а не к результатам ее после- последующих измерений. Пусть /-е последующее наблюдение отклика при Хо обозна- обозначается у0}, а среднее этих величин 1 * Уо =-¦ — 2 Уо/- 293
Лучшей точечной оценкой у0 является уо = po + pi(#o—х). Слу- Случайная переменная -ф = у0—Уо распределена нормально с нуле- нулевым средним и дисперсией поскольку г/о и уо независимы. Таким образом, 100A—^-про- 100A—^-процентный интервал предсказания для среднего k последующих наблюдений при х0 имеет вид <1337) Отметим, что ширина интервала предсказания минимальна при Хо = х и увеличивается с ростом \х0—х\. Если k=l, то выражение A3.37) определяет интервал предсказания для еди- единичного последующего наблюдения при х0. Сравнение выраже- выражений A3.37) и A3.36) показывает, что интервал предсказания при Хо всегда шире, чем доверительный интервал при х0. Это объясняется тем, что интервал предсказания зависит как от ошибки, связанной с подобранной моделью, так и от ошибки последующих наблюдений. Для иллюстрации используем данные примера 13.1 и найдем 95-процентный интервал предсказания среднего значений при- примесей следующих двух партий краски, приготовленных при #о = 34. Он имеет вид 15,35 ± 2,222 8 0,758 (± + -L- C4 — 31)а\1 572,00 j," Вычисления дают 15,35±1,50. Таким образом, 95-процентный интервал предсказания для k = 2 при #0 = 34 : 13,35^i/o^ 16,85. 13.5. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ Во многих задачах регрессии встречается более одной не- независимой переменной. Например, выход продукта химической реакции может зависеть от температуры, давления и концент- концентрации катализатора; в этом случае необходимы по крайней мере три независимые переменные. Общая задача подбора модели A3.38) называется задачей множественной линейной регрессии. Неиз- Неизвестные параметры {рг} обычно называются коэффициентами регрессии. Отметим, что модель A3.38) описывает гиперплос- гиперплоскость в ^-мерном пространстве независимых переменных {х$. 294 Для оценивания коэффициентов регрессии в выражении A3.38) используется метод наименьших квадратов. Предполо- Предположим, что есть n>k наблюдений, и пусть хц обозначает /-е на- наблюдение или уровень переменной xf, данные сводятся в таб- таблицу (табл. 13.4). В основе процедуры оценивания лежат до- допущения: ?(е)=0, V(e)=a2 и {е} некоррелированы. В терминах эксперимен- экспериментальных данных модель запи- Таблица 13.4 сывается В виде Данные для множественной линейной регрессии У У1 У* Уп Xl Хц Хц Х\П ч Хц1 Х2П . . . • » • • • • Xk Ха Хкз Хкп /=1, 2 п. A3.39) Как и в случае простой ли- линейной регрессии, переопреде- переопределяется постоянное слагаемое где Xi = (l/n) 2*i/ —средний уровень для i-й переменной.Тогда 7=1 k _ y/ = Po+2Pf(x..-x.)+6;.) /=1, 2 п A3.41) и сумма квадратов ошибки принимает вид Ь = .|[У/-Р0-.|р? [xtl-xt)J. A3.42) Удобно ввести следующие обозначения: п п ->sr = jLJ \Xrj Xr) (Xsj Xs) = 2^ XrjXsj 1 (~i Ну ^ '~1 — 2j xri 2j xsj , г ф s; n \/=i / \/=i / n n itf= 2y/ (Xii—x{) = ^iUjXij X n \ г n A3.43) где Su — скорректированная сумма квадратов i-й независимой 295
переменной; Srs — скорректированная сумма смешанных произ- произведений хг и xs; Stj — скорректированная сумма смешанных про- произведений Х{ и у. МНК-оценки ро, Pi, . . . , P& должны удовлетворять уравне- уравнениям dL Р0. Г у A3.44) dL n k '_ О I V ., R' 'S* R I Y Y \ I Y V \ I 0 — — -^Ui—Pn— ^J Ры \Xui — Xu) \Xii — Xi' —U> 1. /=1 ' u=l V "' ; V 7 ' J i=l, 2 /г. A3.45) Упрощая эти уравнения с учетом обозначений A3.43), полу- получаем нормальные МНК-уравнения п i= 1, 2, . . . , k. A3.46) Отметим, что число нормальных уравнений составляет р = = k + l, по одному на каждый неизвестный коэффициент ре- регрессии. Решением этих уравнений являются МНК-оценки р„> Рь • • •, Рк. Решение нормальных уравнений упрощается, если их сна- сначала переписать в матричных обозначениях. Дадим матричный вывод нормальных уравнений, параллельный выводу уравнений A3.46). Модель в терминах наблюдений, т. е. соотношение A3.39), может быть записана в матричном виде где У = 296 У2 > X = (Хц—Xj) (Х21 — (Xkl — Xk) —Xz) . . . (Xkn—Xk) _ Po Pi E =^ В общем случае у— (nXl) —вектор наблюдений; X—(пХр) — матрица уровней независимых переменных; р—(pXl)—вектор коэффициентов регрессии; е—(nXl)—вектор случайных оши- ошибок. Мы хотим найти вектор МНК-оценок р, который минимизи- минимизирует величины (здесь и далее штрих означает операцию транс- транспонирования.— Прим. пер.) i (y Отметим, что L можно выразить в виде = y/y-p'X'y-y'Xp+p'X/Xp = y'y-2p A3.47) поскольку Р'Х'у—A х 1) —матрица или скаляр, и транспони- транспонированная величина (Р'Х'у)'= у'Хр — это тот же скаляр. МНК- оценки должны удовлетворять уравнению dL или после упрощения = — 2Х'у+2Х'Хр = Х'Хр = Х'у. A3.48) Мы получили нормальные МНК-уравнения, которые совпа- совпадают с уравнениями A3.46). Для решений этих уравнений ум- умножим обе части соотношения A3.48) на матрицу, обратную Х'Х. Тогда МНК-оценка р примет вид р = (Х'Х)-1 Х'у. A3.49) Нетрудно видеть, что матричная форма нормальных уравне- уравнений тождественна их скалярной форме. Записав уравнение A3.48) более подробно, мы в общем случае получим 297
п О О ... О О Ьг1 Stf . . • o О о12 о22 . . . ^2 О S Ро Pi Ik Если проделать указанное матричное умножение, то полу- получится скалярная форма нормальных уравнений. При этом не- нетрудно видеть, что Х'Х— симметричная (рХр) матрица, а Х'у—(pXl)—вектор-столбец. Отметим специальную струк- структуру Х'Х: диагональные элементы являются суммами квадра- квадратов столбцов X, а недиагональные — суммами смешанных про- произведений столбцов X. Легко установить статистические свойства МНК-оценки р. Рассмотрим сначала смещение оценки: Е (р) = Е [Х'Х)-1 Х'у] = Е [Х'Х) X' (Хр + е)] = = Е [ (Х'Х)-1 Х'Хр + (Х'Х) Х'е] = р, поскольку ?(е) = 0 и (X' Х)~1Х'Х = 1. Таким образом р— несме- несмещенная оценка р. Дисперсия оценки вектора р выражается ковариационной матрицей A3.50) Это симметричная матрица, ц-й элемент которой равен диспер- дисперсии Pi, a (ij)-u элемент — ковариации между р\ и р3-. Ковариа- Ковариационная матрица Р имеет вид Cov(p) = a2(X'X)-1. A3.51) Пример 13.4. Агент по продаже некоторого товара анализирует систему его доставки. В частности, его интересует определение времени, необходи- необходимого для обслуживания розничного магазина. Инженер, ведущий исследова- исследование, предположил, что на время доставки влияют два наиболее важных фак- фактора: число ящиков товара и максимальное расстояние, на которое он дол- должен доставляться — были собраны некоторые данные по времени доставки (табл. 13.5). Подберем для этих данных модель множественной линейной регрессии Поскольку *i=18 и *2 = 28, мы можем записать модель в матричном виде 298 24 27 29 31 25 33 26 28 31 39 33 30 25 42 40 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 — 8 — 3 — 8 2 7 0 — 6 — 4 — 2 4 6 j — 5 12 6 2 — 3 12 — 10 — 6 3 2 6 1 9 — 8 — 3 — 1 — 5 5 Pi Pi ei e2 e8 e10 811 e14 где для наглядности мы обозначили каждый столбец матрицы X соответ- соответствующей независимой переменной. Легко проверить, что Х'Х = 15 0 0 0 504 —213 0 —213 548 х'у = 463 309 63 (Х'Х)- 1/15 0 0 0 0,0024 0,0009 0 0,0009 0,0022 Таким образом, вектор МНК-оценок имеет вид Po Pi h = (X'X)-!X'y = 30,8667 0,7983 0,4167 Для регрессионной модели получаем окончательное выражение г/=30,866 7+0,798 3(х{ — 18) +0,416 7(х2 — 28). Пример 13.5. Регрессионный анализ спланированного эксперимента. Ис- Исследуется выход продукта реакции; инженер-химик выбрал три фактора (температуру, давление и процентную концентрацию) на верхнем и нижнем уровнях каждый. Проделано восемь наблюдений в соответствии с комбина- комбинациями обработок плана 23 (табл. 13.6). Отметим, что верхний и нижний 299
Таблица 13.5 Данные по времени доставки для примера 13.4 Число ящиков хг 10 15 10 20 25 18 12 Расстояние х2 30 25 40 18 22 31 26 Время, мин У 24 27 29 31 25 33 26 Число ящиков х1 14 16 22 24 17 13 30 24 Расстояние х„_ 34 29 37 20 26 27 23 33 Время, мин У 28 31 39 33 30 25 42 40 уровни каждого фактора кодированы на произвольный интервал [—1, +1]. Для аппроксимации данных воспользуемся моделью Таблица 13.6 Данные для примера 13.5 У (выход) 32 36 57 46 дг, (темпе- (температура) 1 — 1 —1 1 х2 (давле- (давление) 1 —1 1 — 1 х3 (кон- ция) —1 1 —1 1 У (выход) 65 57 48 68 х, (темпе- (температура) 1 j 1 1 #2 (давле- (давление) 1 1 — 1 1 х3 (кон- ция) J 1 1 1 Отметим, что в этой задаче XX = Поскольку матрица Х'Х диагональна, то искомая обратная к ней про- просто (X'X)~l=(l/8)h, и МНК дает следующую оценку вектора: 8 0 0 0 0 8 0 0 0 0 8 0 0 0 0 8 = 8I4; X'y = 409 45 85 9 Ро h Р2 Рз 51 1/8 5 5/8 10 5/8 1 1/8 Таким образом, подобная модель имеет вид {/=51 1/8+5 5/8ЛГ1 + 10 5/8x2+1 1/8х3. 300 В рассмотренном примере искомая обратная матрица нахо- находится очень легко, поскольку Х'Х диагональна. Интуитивно это кажется преимуществом, и не только из-за простоты вычисле- вычислений, а и из-за некоррелированности всех оценок коэффициентов регрессии, т. е. Cov(Cj, Pj) =0. Если мы можем выбирать уровни Xij до получения данных, то может быть желательно построить план эксперимента, обеспечивающий диагональность матрицы Х'Х. На практике осуществить это может быть относительно легко. Мы знаем, что недиагональные элементы матрицы Х'Х представляют собой суммы смешанных произведений столбцов X. Следовательно, мы должны приравнять нулю скалярные про- произведения столбцов матрицы X, т. е. эти столбцы должны быть ортогональными. Планы экспериментов, обладающие этим свойством при подборе регрессионной модели вида A3.38), на- называются ортогональными планами. В общем случае фактор- факторный план типа 2к является ортогональным планом для подбора множественной линейной регрессионной модели. Другие планы для аппроксимации полиномами обсуждаются в гл. 14. 13.6. ПРОВЕРКА ГИПОТЕЗ ПРИ ИСПОЛЬЗОВАНИИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ При использовании множественной линейной регрессии у экспериментатора часто возникает необходимость проверить гипотезы относительно параметров модели. Для этого требу- требуется дополнительное допущение, что {е} ~ NID@, о2) (тогда оценки Pi являются оценками максимального правдоподобия.— Прим. ред.). Отсюда непосредственно следует, что наблюдения Рассмотрим проверку значимости регрессии. При множест- множественной линейной регрессии для этого проверяются гипотезы ХОТЯ бы ПрИ ОДНОМ L A3.52) Отклонение такой нулевой гипотезы означает, что по крайней мере одна переменная вносит значимый вклад в аппроксима- аппроксимацию. Процедура проверки гипотез A3.52) является обобщением процедуры, используемой при рассмотрении простой линейной регрессии. Общая сумма квадратов Syy разбивается на регрес- регрессионную сумму квадратов и сумму квадратов ошибки: уу р и, если справедлива HQ: Pi = 0, то 55рег/о2 ~ Xfe> гДе число степе- степеней свободы х2 равно числу независимых переменных модели. Кроме того, можно показать, что SSom/o2 ~y?n-k-\ и SSom и 301
SSper независимы. Следовательно, для проверки Но- 6, = 0 вы- вычисляется p __ SSper/fe SS0IU/(n — k — A3.53) и #о отклоняется, если /7o>/7aife; „_ь_,. Процедура проверки обычно сводится в таблицу ДА (табл. 13.7). Таблица 13.7 Дисперсионный аналкз для проверки значимости множественной линейной регрессии Источник изменчивости Регрессия Ошибка или остаток Сумма Сумма квадратов Sper Sqih Степени свободы k IZ—k—l п—\ Средний квадрат MSper MS0U1 Fo MSper MSom Расчетную формулу для регрессионной суммы квадратов можно получить следующим образом: i 1=1 x 2 2 * * Поскольку Syy=SSom+SSVer, то мы видим, что регрессион- регрессионная сумма квадратов имеет вид k * у A3.54) 2j Пример J3.6. Рассмотрим даииые примера 13.4. Подобранная модель имеет вид у=30,866 7+0,798 3(*i — 18)+0,416 7 (*i —28), а из Х'у следует, 302 что Si,,=309 и S2b=63. Общая сумма квадратов принимает вид 15 1 15 • Syy = 2 У1 - -77 2 У]\ = 14 741 —77 -4632 = 449'73 > 2 а регрессионная сумма квадратов в соответствии с выражением A3.54) 2 fcSiV = °'798 3'309 + °'416 7'63 = 272-93- 1 ДА сведен в табл. 13.8. Поскольку Fo,ou 2,-12=6,93, то мы приходим к выводу, что по крайней мере одна переменная вносит значимый вклад в регрессию. Таблица 13.8 Дисперсионный анализ для проверки значимости регрессии в примере 13.6 Источник изменчивости Регрессия Ошибка Сумма Сумма квадратов 272,93 176,80 449,73 Степени свободы 2 12 14 Средний квадрат 136,47 14,73 9,26 Для нас часто представляет интерес проверка гипотез отно- относительно отдельных коэффициентов регрессии; соответствую- соответствующие критерии оказались бы полезными при определении су- существенности каждой из независимых переменных в модели. Например, модель может стать более эффективной с включе- включением в нее дополнительных переменных или, возможно, при исключении из нее одной или более переменных. Добавление переменной в модель всегда приводит к увели- увеличению регрессионной суммы квадратов и уменьшению суммы квадратов ошибки. Следует решить, достаточно ли увеличение регрессионной суммы квадратов для того, чтобы оправдать ис- использование дополнительной переменной в модели. Более того, включение в модель несущественной переменной может в дей- действительности увеличить средний квадрат ошибки, и этим сни- снизить полезность модели. МНК-оценка Р — случайная величина и, поскольку она яв- является линейной комбинацией наблюдений у,, то p~JV(P, a^X'X)-1. Таким образом, дисперсия коэффициента регрессии р, в о2 раз превосходит (t -f-1) -й диагональный элемент матрицы (Х'Х)-1, например, Си. Следовательно, каждый коэффициент регрессии Pt~Af(pi, о2Сц). 303
Гипотезы при проверке значимости любого отдельного ко- коэффициента, например рг-, имеют вид 1 A3.56) При этом используется статистика to= и Яо: Рг = 0 отклоняется, если \to\ >ta2 ; n-h~\- Эта процедура проверки может, однако, приводить к заблуждениям, так как Pi обычно не являются независимыми, т. е. встречаются ненуле- ненулевые элементы Cv3. В этом случае р4 и /-критерии выражения A3.56) окажутся зависимыми. В результате pj может казаться значимым лишь потому, что его оценка Ру не независима от р?, а Рг действительно является значимым. Нам нужна процедура, с помощью которой может быть оп- определен вклад в регрессионную сумму квадратов, вносимый одним из параметров (например, р*) при условии, что осталь- остальные параметры Pj(/=H=O уже включены в модель. Другими сло- словами, мы хотим оценить существенность слагаемого р*, вклю- включенного в модель, в которой его первоначально не было. Для этого можно воспользоваться общим регрессионным критерием значимости. Хотя мы и обсуждали общий регрессионный критерий зна- значимости ранее, дадим изложение процедуры сейчас. Пусть мо- модель имеет вид у = ХР+е, а вектор Р разбит следующим обра- образом: Р ГЬ1 Ч р2 J" причем размерности Pi и р2 равны (rXl) и [(/?—г) X 1] соот- соответственно. Мы хотим проверить гипотезы A3.57) Рассматриваемую модель можно переписать в виде у = Хр + 8 = Х1р1+Х2р2 + е, A3.58) где X] обозначает столбцы матрицы X, связанные срь а Х2 — столбцы, связанные с Рг. Для полной модели (включающей в себя как Рь так и р2) мы знаем, что jJ = (X'x)~lx'y- Кроме того, SSper (p) = р'Х'у (р степеней свободы) и п—р \/= 304 Величина 55рег(р) называется регрессионной суммой квад- квадратов, обусловленной р. Для того чтобы найти вклад в регрес- регрессию слагаемых в 0ь рассмотрим модель в предположении, что справедлива нулевая гипотеза Но: Pi = 0. Упрощенная модель находится из соотношения A3.58) у = Х2р2 + ?. A3.59) МНК-оценкой Р,2 является р2= (ХгХг)" Х2у, причем SSper (Р2) = Р2Х2У (р — г степеней свободы). A3.60) Регрессионная сумма квадратов, обусловленная Pi, при включении р.2 в модель имеет вид SSper (Pi I fc) = SSpev (P)-SSper (p2). A3.61) У этой суммы квадратов г степеней свободы; иногда ее назы- называют «дополнительной суммой квадратов», обусловленной Pi. Поскольку SSper (Pi|P2) не зависит от MSom, то для проверки нулевой гипотезы Hq: Pi = 0 можно использовать статистику S.Sper (Pi 1 Р2УГ i " р __ 0 A3.62) Если Fo>Fa;r; п-р, то мы отклоняем Но и делаем вывод, что по крайней мере один из параметров в рх не равен нулю. Рассмотренная процедура исключительно полезна. Если ре- регрессионная модель содержит несколько параметров, то мы мо- можем оценить существенность любого Pi так, как будто бы он был добавлен к модели последним, рассчитав SSPer(P,|P0, Р„. . ., Рг_„ Рг+1). . ., Pfc), t=l, 2,. . ., k. Пример 13.7. Используем данные примера 13.4 для иллюстрации при- применения общего регрессионного критерия значимости. Регрессионная модель имеет вид /=30,866 7+0,7983(*! — 18) +0,4167(х2 — 28). Нам хотелось бы сопоставить гипотезы Но: Pi = 0 и Ни (,[ФО. В обозначениях общего регрес- регрессионного критерия значимости это означает, что Pi р2 Pi Отметим, что р1= Pi—AX1)—вектор (т. е. г=1), а Р2—Bx1) — век- вектор. Регрессионная сумма квадратов для полной модели 2 i = 14564,20. 305
Отметим, что это ие та регрессионная сумма квадратов, которая была най- найдена в примере 13.4, так как SSVer (Р) вносит вклад в регрессию, обуслов- обусловленный отрезком на оси ординат. Кроме того, SS^r (Р) обозначает р=3 степенями свободы. Средний квадрат ошибки ^ош=-^- ( 2*/-&'Х'у)=-15=ТГ A4 741-14 564,20)= 14,73 обладает п — р=15 — 3=12 степенями свободы. Это согласуется с резуль- результатами примера 13.4. Для проверки Но: Pi = 0 мы должны найти SSPer(PiiP2)j=SSper(Pi|Po', ^' воспользовавшись упрощенной моделью «/= Ро'+Рг (^2 — Xt) +e. Получаем ?/=30,8667+0,1150- (х2 — 28), откуда 15 ssPer (Р.) = Р2Х2У = h X У; + hS2y = 14 298,51 с р— г = 2 степенями свободы. Таким образом, регрессионная сумма квад- квадратов для Pi с учетом Р2 ssper.(pil Р2) = ss^er (р, | р;, р2) = ssper(p) -ssper(p2) = = 14,564,20—142 98,51 =265,69 с г=\ степенью свободы. Из выражения A3.62) находим статистику для проверки гипотезы ) MS 0U1 265,69 14,73 и, поскольку Fo.oi; 1; 12=9,33, делаем вывод, что Pi?=0. Следовательно, Х\ дает значимый вклад в модель. 13.7. ДРУГИЕ МОДЕЛИ ЛИНЕЙНОЙ РЕГРЕССИИ Линейная модель у=Хр + Е является общей, ею можно вос- воспользоваться для аппроксимации любой зависимости, линей- линейной по неизвестным параметрам Р- Примером может служить полином k-й степени от одной переменной У=.Ро + PiX + р2*2 +... + $кхк + е, который мы использовали ранее для оценивания полиномиаль- полиномиальных эффектов количественного фактора. Среди других приме- примеров можно привести полином второй степени от двух пере- переменных 4 р + и тригонометрическую модель У= Ро+ Pi sin x+ рг cos x+ г. Применение общей линейной модели у=Хр + »при подборе моделей подобного вида иллюстрируется следующим приме- примером. 306 Пример 13.8. Предположим, что мы хотим аппроксимировать данные, приведенные ниже, моделью y = fi + F>X + ?X+e: х 1,0 1,2 1,4 1,6 у 6,15 7,90 9,40 10,50 В матричных обозначениях модель имеет вид 1,8 11,00 2,0 14,00 У = 6,15 7,90 9,40 10,50 11,00 14,00 а МНК-оценка х = )-1 Х'у = 6,000 0 9,000 0 14,200 0 1,0 1,2 1,4 1,6 1,8 2,0 9,000 0 14,200 0 23,400 0 1,00 1,44 1,96 2,56 3,24 4,00 14,200 0 23,400 0 39,966 4 Pi 1-1 58,95 93,39 154,47 или 79,5702 —109,284 1 35,7137 " 58,95 — 109,284 1 152,095 9 —50,222 5 93,39 35,713 7 —50,222 5 16,740 8 154,47 1,328 4 ~" 4,079 8 1,004 4 Следовательно, регрессионная модель должна иметь у = 1,328 4 + 4,079 8* + 1,004 4х2. Рассмотренным общим методом можно пользоваться при ап- аппроксимации данных, полученных в спланированном экспери- эксперименте с неравноотстоящими значениями переменных плана. При равноотстоящих уровнях переменных вычисления сущест- существенно упрощаются, если, как было показано в 3.6 и 6.6, приме- применить ортогональные полиномы. Вывод формул, использованных в этих параграфах, дается ниже. Ортогональные полиномы. В гл. 3 и 6 мы дали иллюстра- иллюстрацию применения ортогональных полиномов для вычисления по- 307
линомиальных эффектов количественных факторов. В эту про- процедуру входит подбор модели у о 11(/J2() где Pu{Xj) —ортогональный полином «-го порядка, т. е. Р„ (х}) = 1, ,| Ри (х,) = 0 и | Р„ (*,) Ps (хц = 0 при иф5. Первые пять ортогональных полиномов приведены в 3.6. Нормальные МНК-уравнения для этой модели имеют вид О О о ... о о ... о п 21 «1 2 у/ /1 i Отметим что все недиагональные элементы матрицы Х'Х оказываются равными нулю благодаря свойству ортогональ- ортогональности полиномов Pu[Xi). Следовательно, для МНК-оценок па- параметров модели получаем t= /=1 308 а для регрессионной суммы квадратов для любого параметра модели с учетом присутствия других параметров ^ 2 [^ (*/)]' t=l, 2, . . ., k, причем SSper(a0)= 2 У/ /«• Эти результаты были уже ис- \ /=i / пользованы в 3.6. 13.8. ИССЛЕДОВАНИЕ УРАВНЕНИЯ РЕГРЕССИИ При построении регрессионной модели необходимо принять несколько допущений. Оценивая параметры модели, мы обычно полагаем, что ошибки — некоррелированные случайные пере- переменные с нулевым средним и постоянной дисперсией. Для про- проверки гипотез и интервального оценивания требуется нормаль- нормальность распределения ошибки. Кроме того, мы считаем, что порядок построенной модели выбран правильно, т. е. если мы используем для описания данных полином первого порядка, то делаем предположение, что для изучаемого явления действи- действительно характерна линейная зависимость. Экспериментатор, не принимая на веру справедливость этих допущений, должен анализировать их для того, чтобы устано- установить адекватность модели, которую он пробует применить. В данном параграфе обсуждаются методы, полезные для этой цели. 13.8.1. Анализ остатков Мы определили остатки как ej = yj—tjh /=1, 2, ...,п, где Уз — наблюдение, а г/у — соответствующее значение, прогнозиру- прогнозируемое регрессионной моделью. Анализ остатков часто оказыва- оказывается полезным при проверке допущения, что ошибки zj~ ~NID@, о2), и при определении того, есть ли смысл добавлять слагаемые в модель. Для приближенной проверки нормальности распределения ошибки экспериментатор может построить частотную гисто- гистограмму остатков или нанести их на нормальную вероятностную бумагу. Необходим определенный опыт, чтобы решить, соот- соответствуют эти графики нормальному закону или нет. Можно также стандартизировать остатки, вычислив dj = ej/^MSom, /=1, 2, ...,пК Если ошибки z}~NID @, о2), то приблизительно 95% стандартизованных остатков должно попасть в интервал 1 Величину dj иногда называют единичным нормальным отклонением, образованным из остатка е^. (Прим. ред.) 309
о-) (—2,2). Остаток, выходящий далеко за границы этого интер- интервала, может указывать при присутствии выброса, т. е. наблю- наблюдения, не типичного для остальных данных. Предложены раз- различные правила отбрасывания выбросов. Иногда, однако, вы- выбросы несут важную информацию о необычных обстоятельст- обстоятельствах, интересных для экспериментато- экспериментатора, и отбрасываться не должны. Бо- Более подробно этот вопрос обсуждается Анскомбом [3]. Часто оказывается полезным строить зависимости остатков от вре- времени, если это известно (т. е. в той по- последовательности, как они получены.— Прим. ред.), от Уз и от независимых переменных хц, i=l, 2, ... k. Гра- Графики этих зависимостей можно обычно отнести к одному из четырех общих типов (рис. 13.2). Типу 13.2, а соот- соответствует нормальная ситуация, а ти- типы 13.2,6, в, г представляют собой аномалии. Если зависимость остатков имеет вид 13.2,6, то дисперсия наб- наблюдений может увеличиваться со вре- временем или ростом у, или Хц. Если за- зависимость остатков от времени отно- относится к типу (в), то в модель должно быть включено слагаемое, линейное по времени. Зависимости от у3- и хц, относящиеся к типу (в), свидетель- свидетельствуют об ошибке при вычислениях или анализе. Зависимости остатков, Рис. 13.2. Типы зависимо- имеющие вид (г), свидетельствуют стей остатков. Q неадекватности модели. 13.8.2. Проверка качества подбора Регрессионные модели часто используются для аппроксима- аппроксимации данных, когда истинная функциональная связь неизвестна. Естественно, нам хотелось бы знать, правильно ли сделано предположение о порядке пробной модели. Критерий проверки правильности такого предположения и рассматривается в дан- данном параграфе. Опасность использования регрессионной модели, плохо опи- описывающей истинную функциональную связь, иллюстрируется рис. 13.3. Очевидно, что в этой гипотетической ситуации нужно было использовать полином второго или более высокого по- порядка; в результате же подобрана очень плохая модель. 310 Дадим критерий «добротности подгонки» регрессионной мо- модели. Хотя будет рассматриваться только случай одной незави- независимой переменной, процедура легко обобщается на случай k независимых переменных. Гипотезы, которые мы хотим прове- проверить, имеют вид: #о модель адекватно аппроксимирует данные; Н\ модель не аппроксимирует данные. В процедуру входит разбиение остаточной суммы квадра- квадратов на следующие два компонента: где SS4HCT. ош — сумма квадратов, связанная с «чистой» ошиб- ошибкой эксперимента; SSHeaR — сумма квадратов, объясняв- У мая неадекватностью'. Для вычисления SS4Hct. ош нам понадобятся повторные на- наблюдения у по крайней мере при одном уровне х. Предположим, что у нас есть п наблюдений таких, что «Уп, У12, ..., yim— по- повторные наблюдения при Рис. 13.3. Неадекватная регрессионная модель. У2ь У22, • •., У2п 2 — повторные наблюдения при х2; Ути Ут2,---,Утпт—повторные наблюдения при хт. Мы видим, что существует т выделенных уровней х. Вклад в сумму квадратов «чистой» ошибки, скажем, при хи описыва- описывается выражением 2 {Уы—тУ- A3.63) Общая сумма квадратов «чистой» ошибки получается сумми- суммированием выражений вида A3.63) по всем уровням х: SS т "г 4HCT.om= 2 2 (Уш— 1 = 1 Ц=1 т причем с ней связано пе = ^(п{—1) = п — т степеней свободы. Сумма квадратов, обусловленная неадекватностью, находится следующим образом: ¦J"Ьнеад = Soош — ооЧист. ош 1 Поскольку в остатке содержится все отличие модели от наблюдения, то в общем случае его можно разбить на случайный и систематический компо- компоненты; последний существует, если модель некорректна. (Прим. ред.) 311
и обладает п—2—ne — tn—2 степенями свободы. В основе про- проверки неадекватности тогда должна лежать статистика — 2) A3.64) SS4IicT, ош/(" м) ™5ЧИСТ. ош и мы отклоним нулевую гипотезу, если F0>Fa- m_2; n-m. Процедуру этой проверки можно легко ввести в ДА значи- значимости регрессии. Если нулевая гипотеза об адекватности мо- модели отклоняется, то эту модель нужно отбросить и попытаться найти более подходящую. Если же Но не отклоняется, то тогда нет очевидных оснований сомневаться в адекватности модели . ош и MSHeaA часто объединяются для получения оценки 4,0 4,0 4,0 4,7 2,6 2,6 2,2 3,2 6,0 6,5 6,9 3,2 3,4 5,0 Пример 13.9, Пусть у нас есть данные х 1,0 1,0 2,0 3,3 3,3 у 2,3 1,8 2,8 1,8 3,7 х У 5,0 2,0 5,6 3,5 5,6 2,8 5,6 2,1 6,0 3,4 Мы можем вычислить Syy = 10,97; Sxy= 13,62; Sxx = 52,53 и х=4,382. Для регрессионной модели получаем у= 1,708+0,260*, а для регрессионной суммы квадратов SSPer = PiSxl/=0>260-13,62=3,541. Сумма квадратов «чистой» ошибки находится следующим образом: Уровень 1,0 3,3 4,0 5,6 6,0 Суммы: 2(»/-5)я 0,1250 1,805 0 0,1066 0,980 0 0,020 0 3,036 6 Степени свободы 1 1 2 2 1 ДА приведен в табл. 13.9. Поскольку Fo,i; 8; 7 = 2,75, то мы не можем отклонить гипотезу о том, что подобранная модель адекватно описывает данные. Мы объединим средние квадраты М5ЧИст.ош и MSnean для полу- получения среднего квадрата в знаменателе статистики для проверки значимости регрессии. Кроме того, поскольку Fo 05 • i-15=4,54, то мы должны считать, что P0 Таблица 13.9 Дисперсионный анализ для примера 13.9 Источник изменчивости Регрессия Остаток (Неадекватность) (Чистая ошибка) Сумма Сумма квадратов 3,541 7,429 4,3924 3,0366 10,970 Степени свободы 1 15 8 7 16 Средний квадрат 3,541 0,4952 0,5491 0,4338 Fo 7,15 . 1,27 При подборе регрессионной модели для экспериментальных данных существует хорошее правило: использовать модель са- самого низкого порядка, позволяющего адекватно описать дан- данные. В этом отношении может оказаться полезной проверка ка- качества подбора. Однако через п точек всегда можно провести полином степени п—1, так что экспериментатору не следует пы- пытаться использовать «насыщенные» модели, в которых число независимых переменных почти совпадает с числом наблюде- наблюдений у. 13.8.3. Множественный коэффициент детерминации Величина A3.65) *УУ 312 называется множественным коэффициентом детерминации (чаще — квадратом множественного коэффициента корреля- корреляции.— Прим. ред.) и широко применяется для оценки адекват- адекватности модели регрессии. Ясно, что 0<#2^1. Эту величину можно нестрого назвать величиной изменчивости данных, объ- объясняемой регрессией. Для данных примера 13.1 получаем R2 = SSper/Svv= 120,15/127,73 = 0,9407, т. е. моделью объясняется 94,07% изменчивости данных. Статистикой R2 нужно пользоваться с осторожностью, по- потому что R2 всегда можно сделать единицей, просто взяв доста- достаточно большое число слагаемых в модели. Например, мы мо- - жем получить «идеальную» аппроксимацию, проведя через п точек полином степени п—1. Кроме того, R2 всегда возрастает при добавлении переменной к модели, но это не должно озна- означать, что новая модель лучше старой. Если сумма квадратов ошибки в новой модели не станет меньше на величину, равную исходному среднему квадрату ошибки, то у новой модели ока- окажется больший средний квадрат ошибки, чем у старой, из-за потери одной степени свободы. Таким образом, новая модель, в сущности, будет хуже старой модели. 13.9. ЗАДАЧИ 13.1. Прочность на разрыв бумажной продукции связана с количеством твердой древесины в пульпе. На опытной установке изготавливаются десять образцов, данные для которых приведены ниже. Подберите с помощью этих данных простую линейную регрессионную модель, выражающую связь между Прочностью и процентным содержанием твердой древесины. 313
13.2. Используя результаты задачи 13.1, проверьте регрессионную модель на неадекватность и значимость регрессии. 13.3 Используя результаты задачи 13.1, постройте 95-процентиые дове- доверительные интервалы для углового коэффициента и отрезка на оси ординат. Прочность Процентное со- содержание 160 10 171 15 175 15 182 20 184 20 181 20 188 25 193 25 195 28 200 30 13.4. Выход химического процесса связан с концентрацией реагента и рабочей температурой. Подберите множественную линейную регрессионную модель для следующих данных: Выход 81 89 83 91 Концентра- Концентрация 1,00 1,00 2,00 2,00 Температура 65 80 65 80 Выход 79 87 84 90 Концентра- Концентрация 1,00 1,00 2,00 2,00 Температура 65 80 65 80 13.5. Проверьте множественную линейную регрессионную модель из за- задачи 13.4 иа значимость регрессии. 13.6. Подберите полиномиальную регрессионную модель второго порядка вида у = р0 + рЛ + рЛ + для следующих данных: У хг х2 26 1,0 1.0 24 1,0 1,0 175 1,5 4,0 160 1,5 4,0 163 1,5 4,0 55 0,5 2,0 62 1,5 2,0 100 0,5 3,0 26 1,0 1,5 30 0,5 1,5 70 1,0 2,5 71 0,5 2,5 13.7. Докажите, что прн использовании простой линейной регрессии Cov(pV, p\)-0. 13.8. Проверьте выражения A3.16) н_ A3.17) для смещения и дисперсии Ро и р0. Покажите, что Cov(Po, ^i)=—oix/SXx. 13.9. Найдите остатки для примера 13.1. Проведите их анализ методами, обсуждавшимися в 13.8. 13.10. Связь между дисперсионным и регрессионным анализами. Исходя из общей линейной модели у — XfL + е, где матрица X состоит из нулей и единиц,- покажите, что модель одиофакторного ДА yn=\i+~ti+Rii, t=l, 2, 3, /=1, 2, 3, 4 можно записать в виде общей линейной модели. Тогда: а) напишите нормальные уравнения (Х'Х)Р=Х'У и сравните их с нор- нормальными ураннениями, полученными для этой модели в гл. 3. 314 б) Найдите ранг матрицы Х'Х. Можно ли получить (Х'Х)-1? в) Пусть первое из нормальных уравнений отбрасывается и заменяется 3 ограничением 2п т^=0. Можно ли решить получающуюся систему уравне- ний? Если да, то найдите это решение. Найдите сумму квадратов, обуслов- обусловленную регрессией, Р'тС'у, и сравните ее с суммой квадратов для обработок в однофакторном ДА. 13.11. Пусть мы подбираем прямую линию и хотим минимизировать дисперсию рх. Если ограничиться четным числом экспериментальных точек, то где следует их разместить для минимизации V(Pi)? (Отметим, что планом, рассматриваемым в этой задаче, нужно пользоваться с чрезвычайной осто- осторожностью; данный план, хотя и минимизирует V(Pi), обладает некоторыми нежелательными свойствами, см., например, Майерс [53]. Только при прак- практически полиг>й уверенности в том, что истинная функциональная связь ли- линейна, мож1 , пытаться воспользоваться этим планом.) 13.12. взвешенный метод наименьших квадратов. Пусть мы подбираем прямую линию (/=Po+PiATi + e, но дисперсии у теперь зависят от уровня х, т. е. V(y\xl) = ail=a2/wl, 1=1,2 п. где Ш( — известные постоянные, часто называемые весами. Покажите, что получающиеся МНК-уравнения имеют вид 1=1 Po 2 шл+Pi 2 *>A = 2 «Wt, t=i c=i t=i где Wi — известные постоянные, часто называемые весами. Покажите, что получающиеся МНК-уравнеиия имеют вид (=1 п S »л г=1 п + Pi 2^: i=i ^=2 13.13. Нелинейная регрессия. В данной главе показывалось, как ме- методами множественной линейной регрессии можно подбирать полиномиаль- полиномиальные модели. В действительности таким образом можно подбирать любые модели, линейные по неизвестным параметрам. Регрессионные модели, в ко- которые неизвестные параметры входят нелинейным образом, называются нели- нелинейными моделями; к иим методы данной главы неприменимы. В некоторых случаях модели, кажущиеся нелинейными, можно сделать линейными с по- помощью подходящего преобразования. Смогли бы вы подобрать модель использовав методы данной главы? Пусть вместо этого модель имеет вид Получите нормальные МНК-уравнения для такого случая и попытайтесь их решить. 315
ГЛАВА ЧЕТЫРНАДЦАТАЯ МЕТОДОЛОГИЯ ПОВЕРХНОСТИ ОТКЛИКА 14.1. ВВЕДЕНИЕ Методология поверхности отклика (МПО)—это собрание математических и статистических методов, используемых при анализе задач, в которых несколько независимых переменных влияют на зависимую переменную или отклик, а целью явля- является оптимизация этого отклика. Обозначим независимые пере- переменные хи х2 Хк. Предполагается, что эти переменные не- непрерывны и могут контролироваться экспериментатором с пре- пренебрежимо малой ошибкой, а отклик (например, у) —величина случайная. Пусть, например, инженер-химик хочет найти значения тем- температуры (xi) и давления (х2), которые максимизируют выход исследуемого им процесса. Мы можем записать наблюдаемый отклик у как функцию уровней температуры и давления: y = f(xu х2)+е, где е — составляющая случайной ошибки. Если обозначить ма- математическое ожидание отклика Е(у)=г\, то поверхность, пред- представляемая г| = /(*1, х2), называется поверхностью отклика. Дву- Двумерную поверхность отклика можно изобразить графически, если в плоскости листа бумаги построить оси Ху и х2 и пред- представить себе, что ось Е(у) перпендикулярна этой плоскости; за- затем для получения поверхности отклика строятся линии равного математического ожидания отклика (контуры) (рис. 14.1). В большинстве задач по изучению поверхности отклика вид зависимости между откликом и независимыми переменными не- неизвестен. Таким образом, на первом этапе нужно найти под- подходящую аппроксимацию для /. Обычно используется полином невысокого порядка в ограниченной области изменения незави- независимых переменных. Если отклик хорошо описывается линейной функцией независимых переменных, то аппроксимирующей функцией является модель первого порядка е. A4.1) Если же в системе заметна кривизна, то нужно использовать полином более высокого порядка, например, модель второго порядка у = 8- < 14-2) 316 х2 50 Почти во всех задачах МПО встречаются один или оба из этих аппроксимирующих полиномов. Маловероятно, конечно, что какая-либо полиномиальная модель окажется разумной ап- аппроксимацией / во всем пространстве независимых переменных, но в относительно малых областях они достаточно хороши. Для оценивания коэффициентов аппроксимирующих поли- полиномов применяется метод наименьших квадратов, обсуждав- обсуждавшийся в гл. 13. Затем проводится МПО-анализ в терминах по- подобранной поверхности. Если эта поверхность является адек- адекватной аппроксимацией /, то анализ подобранной поверхности будет приблизительно эквива- эквивалентен анализу реальной си- системы. Параметры модели оцениваются наиболее эффек- эффективно, если для получения данных использовать специа- специальные планы экспериментов. Эти планы часто называются планами для изучения поверх- поверхности отклика; они обсужда- обсуждаются в 14.4. МПО — последовательная процедура. Часто, когда мы находимся в точке на поверх- поверхности отклика, далекой от оптимума, кривизна в системе не- невелика и приемлемой оказывается модель первого порядка. В этом случае цель МПО — быстро и эффективно привести экс- экспериментатора в окрестность оптимума. Когда область опти- оптимума определена, то можно применить более сложную модель, например, поверхность отклика второго порядка, и провести анализ для локализации оптимума. Из рис. 14.1 видно, что анализ поверхности отклика можно представлять себе как «подъем на холм», вершина которого является точкой макси- максимального отклика. Если истинный оптимум — точка минимума отклика, то можно представить себе спуск в овраг. Конечной целью МПО является определение оптимальных рабочих условий для системы или определение области про- пространства изменения факторов, в которой удовлетворяются ра- рабочие спецификации, МПО используется в первую очередь не для выяснения физического механизма системы, хотя и может оказаться при этом полезной. Отметим, кроме того, что «опти- «оптимум» в МПО понимается в особом смысле — процедуры МПО «подъема на холм» гарантируют сходимость только к локаль- локальному оптимуму. Рис. 14.1. Поверхность отклика. 317
14.2. МЕТОД КРУТОГО ВОСХОЖДЕНИЯ Во многих случаях первоначальная оценка оптимальных ра- рабочих условий для системы оказывается далекой от действи- действительного оптимума. В такой ситуации цель исследователя — быстро перейти в окрестность оптимума, применяя при этом простую и экономически эффективную процедуру эксперимен- экспериментирования. Когда мы находимся далеко от оптимума, то обычно полагаем, что в небольшой об- области изменения переменных мо- модель первого порядка адекватно аппроксимирует истинную повер- поверхность. Метод крутого восхождения — процедура последовательного пе- перемещения по пути крутого вос- восхождения, т. е. в направлении наибольшего увеличения от- отклика. Конечно же, если необхо- необходима минимизация, то тогда мы говорим о- методе крутого (наис- (наискорейшего) спуска. Подобранная модель первого порядка имеет ""' вид Рис. 14.2. Поверхность отклика А о V о первого порядка и путь крутого У==Ро~\~ 2jY4xi> ('4.о) восхождения. '=1 1 — область подбора поверхности а поверхность отклика первого отклика первого порядка; 2- порядка т. е. контуры у, пред- путь крутого восхождения v J r u г 3 V1 ставляется рядом параллельных линий (рис. 14.2). Направление крутого восхождения — это направление, в котором у воз- возрастает наиболее быстро, оно параллельно нормали к контурам подобранной поверхности отклика. Обычно в качестве пути кру- крутого восхождения мы выбираем линию, проходящую через центр области экспериментирования и нормальную к контурам подо- подобранной поверхности. Таким образом, шаги вдоль этого пути пропорциональны коэффициентам регрессии {р*} (точнее, шаги по каждому из координатных направлений.— Прим. ред.). Фак- Фактическая длина шага определяется экспериментатором на ос- основе опыта. Эксперименты проводятся по линии крутого восхождения до тех пор, пока не перестанет наблюдаться увеличение отклика. Затем для описания отклика можно подобрать новую модель первого порядка и найти новую линию крутого восхождения. Продолжая процедуру таким образом, экспериментатор попадет в окрестность оптимума; об этом обычно свидетельствует не- неадекватность модели первого порядка. В таком случае для по- 318 лучения более точной оценки положения оптимума проводятся дополнительные эксперименты, которые будут описаны в 14.3. Пример 14.1. Инженера-химика интересует определение рабочих условий, максимизирующих выход продукта реакции. На выход продукта влияют две контролируемые переменные: продолжительность и температура реакции. В настоящее время процесс ведется в течение 35 мин при температуре 155° F F8°С) и его выход составляет примерно 40%. Маловероятно, что эта об- область содержит оптимум, поэтому подберем модель первого порядка и при- применим метод крутого восхождения. Инженер решает, что для подбора модели первого порядка нужно иссле- исследовать область C0,40) мин и A50, 160)° F F5, 71)° С. Для упрощения вы- вычислений приведем независимые переменные к кодированным уровням (—1, 1). Так, если li — натуральная переменная — время, а |2 — натуральная переменная — температура, то кодированные переменные имеют вид Данные приведены в табл. 14.1. Таблица 14.1 Данные процесса для аппроксимации моделью первого порядка Натуральные переменные h 30 30 40 40 35 35 35 35 35 150 160 150 160 155 155 155 155 155 Кодированные переменные — 1 1 1 1 0 0 0 0 0 —1 1 [ 1 0 0 0 0 0 Отклик у 39,3 40,0 40,9 41,5 40,3 40,5 40,7 40,2 40,6 Отметим, что для получения данных используется факторный план 22 с добавлением пяти точек в центре плана. Повторные наблюдения в центре не могут использоваться для оценки экспериментальной ошибки. Кроме того, центр плана находится при текущих рабочих условиях. С помощью МНК для этих данных можно подобрать модель первого порядка. Следуя гл. 13, получаем модель в кодированных переменных: </=40,44+0,775x,+0,325x2. ДА для этой модели приведен в табл. 14.2, из которой видно, что модель первого порядка адекватно описывает данные. Двигаясь от центра плана точки [(*i=0, *2=0)] по пути крутого восхож- восхождения, мы.должны перемещаться на 0,775 единиц в направлении хх на каж- каждые 0,325 единиц в направлении х2. Таким образом, путь крутого восхожде- восхождения проходит через точку (xi=0, дг2=0) с наклоном 0,325/0,775. В качестве размера основного шага инженер решает использовать 5 мин продолжитель- продолжительности реакции. Из соотношения между |i и xi следует, что 5 мин продолжи- продолжительности реакции эквивалентны шагу по кодированной переменной xt вели- величиной Д*1 = 1. Поэтому шаги по пути крутого восхождения имеют величину Д*1= 1,000 0 и Ах2= @,325/0,775)Ад:,=0,419 4. 319
Таблица 14.2 Дисперсионный анализ Источник изменчивости Регрессия Ошибка (Неадекватность) (Чистая ошибка) Сумма Сумма квадратов 2,8250 0,1772 @,0052) @,1720) 3,0022 * Значимо при 1 проценте. Степени свободы 2 6 2 4 8 Средний квадрат 1,4125 0,0295 0,0026 0,0430 Fo 47,83 * 0,06 Инженер рассчитывает точки вдоль этого направления и наблюдает вы- выход в этих точках до тех пор, пока отклик не перестанет увеличиваться. Результаты приведены в табл. 14.3. Шаги даны как в кодированных, так и в натуральных переменных; кодированные переменные удобнее при планиро- планировании и анализе, но при управлении процессом должны использоваться на- натуральные переменные. Увеличение отклика наблюдается вплоть до десятого шага; одиннадцатый шаг приводит уже к уменьшению выхода. Поэтому в области вблизи точки (|i=8,5, |2= 175,970) необходима аппроксимация другой моделью первого порядка. Таблица 14.3 Эксперимент по крутому восхождению для примера 14.1 Кодированные переменные Центр д Центр + Д Центр + 2Д Центр + ЗД Центр + 10Д Центр + 11Д 0 1,0000 1,0000 2,0000 3,0000 10,0000 11,0000 0 0,4194 0,4194 0,8388 1,2573 4,1940 4,6134 Натуральные переменные 1, 35 40 45 50 85 90 155 157,097 159,194 161,287 175,970 178,067 Отклик У 41,0 41,9 43,1 80,3 79,2 Подбор новой модели первого порядка проводится в области вокруг точки (gi = 85, 12=175), причем по |, исследуется интервал [80, 90], а по 1г —[170, 180]. Кодированные переменные здесь имеют вид 1 1 *2 = -т-(?2-175). При этом для получения данных снова используется план 22 с пятью цент- центральными точками (табл. 14.4). 320 Подобранная модель первого порядка для данных табл. 14,4 имеет вид ?=78,97+1,00*1+0,50*2, результаты ДА для нее приведены в табл. 14.5. Статистика, используемая для проверки неадекватности, значима на уровне одного процента, поэтому мы делаем вывод, что подобранная модель первого порядка не является коррект- корректной. Кривизна истинной поверхности может свидетельствовать о том, что мы находимся вблизи оптимума. Здесь для более towhofo определения его по- положения необходимо провести дополнительный анализ. Таблица 14.4 Данные для второй модели первого порядка Натуральные переменные 5. 80 80 90 90 85 85 85 85 . 85 h 170 180 170 180 175 175 175 175 175 Кодированные переменные *i —1 —1 1 1 0 0 0 0 0 —1 1 —1 1 0 0 0 0 0 Отклик у 76,5 77,0 78,0 79,5 79,9 80,3 80,0 79,7 79,8 Таблица 14.5 Дисперсионный анализ Источник изменчивости Регрессия Ошибка (Неадекватность) (Чистая ошибка) Сумма Сумма квадратов 5,0000 11,1200 A0,9080) @,2120) 16 1200 * Значимо прн 1 проценте. Степени свободы 2 6 2 4 8 Средний квадрат 5,4540 0,0530 102,91 * 14.3. АНАЛИЗ МОДЕЛЕЙ ВТОРОГО ПОРЯДКА Когда экспериментатор относительно близок к оптимуму, то из-за кривизны истинной поверхности для описания отклика обычно требуется модель второго или более высокого порядка. В большинстве случаев адекватной аппроксимацией оказыва- оказывается модель второго порядка S 2 М-*- A4-4) W О О 1 И Д. К. Монтгомери S S
Анализ подобранной поверхности второго порядка часто назы- называется каноническим анализом. Предположим, что мы хотим найти уровни хи хг, ..., xh, мак- максимизирующие прогнозируемый отклик. Точка максимума, если она существует, описывается таким набором координат xit хг xh, что частные производные ду/dxi~dyldx%=.. . = dy/dxk = 0. Эта точка, скажем, с координатами xii0, Xz,o, ¦ ¦ ¦, xh,o, называется стационарной. Стационарная точка может являться точкой мак- максимума отклика, точкой минимума отклика или седловой точ- точкой. Эти три разновидности стационарных точек приведены на рис. 14.3. Частью канонического анализа и является определение характера стационарной точки. Для стационарной точки можно получить общее решение. Запишем модель второго порядка в матричном виде A4.5) где x= Xi " x2 • xk ; b = " P! " P2 • - P* _ ; в = Рп СИМ1С Pkk а именно, &—(&Xl)—вектор коэффициентов регрессии пер- первого порядка; В— симметричная (kxk)-матрица, на главной диагонали которой стоят коэффициенты при чисто квадратич- квадратичных слагаемых @u)> а недиагональные элементы равны поло- половинам соответствующих коэффициентов при смешанных произ- произведениях (Pij, ?#/). Приравняв 0 производную у по вектору х, получим _ду_ = b + 2Вх = 0. A4.6) дх Решением этого уравнения и является стационарная точка хо=-4-В-1Ь. A4.7) Кроме того, подставив полученное решение в соотношение A4.5), можно найти прогнозируемое значение отклика в ста- стационарной точке 1 " A4.8) 322 Для определения характера стационарной точки полезно преобразовать модель к новой системе координат с началом в стационарной точке х0, а затем повернуть оси этой системы 70 60 XZ б) хг 70 Рис. 14.3. Стационарные точки поверхности отклика второго порядка; а — мак- максимум отклика; б — мини- минимум отклика, в — седловая точка. так, чтобы они совпали с главными осями подобранной поверх- поверхности отклика (рис. 14.4). Можно показать, что при этом по- подобранная модель примет вид A4.9) где {Wi} — преобразованные не- независимые переменные, а {^г} — постоянные. Выражение A4.9) называется канонической формой (каноническим уравнением) мо- модели, {Яг}, являются собствен- собственными значениями или характери- характеристическими корнями матрицы В. Характер поверхности отклика можно определить по стацио- стационарной точке, знаку и величине {Xi}. Предположим сначала, что стационарная точка находится в области экспериментирования, исследованной при подборе модели второго порядка. Если все {Xi} положительны, то хо — точка минимума отклика; если все 11* 323 Рис. 14.4. Каноническая модели второго порядка.
{hi} отрицательны, то х0 — точка максимума отклика. Если же знаки {к{} различны, то х0 — седловая точка. Кроме того, поверхность оказывается наиболее крутой в направлении Дог, для которого \Кг\ наибольший. Например, на рис. 14.4 изо- изображена система, для которой хо — точка максимума (Xi и Яг отрицательны), причем |ta|>|X2|. Когда одно или несколько Я* очень малы (например, Яг~0), то система оказывается нечув- нечувствительной к переменной W{. Поверхность такого типа часто называется стационарным гребнем (рис. 14.5). Если стационарная точка находится далеко за пределами области, исследованной при подборе поверхности второго по- порядка, а одно (или более) Xt близко к нулю, то поверхность мо- Хг хг Х1 Рис. 14.5. Система со стацио- стационарным гребнем. 10, X, Рис. 14.6. Система щим гребнем. с возрастаю- жет быть возрастающим гребнем (на рис. 14.6 изображен воз- возрастающий гребень для k = 2 переменных при Ki близком к нулю и к2 отрицательном). В системах с гребнями такого типа мы не можем сказать ничего определенного об истинной поверхно- поверхности или стационарной точке, поскольку х0 не принадлежит об- области экспериментирования, исследованной при подборе мо- модели. Однако разумно продолжить исследование в направлении Wi. Если Яг положительно, то мы назвали бы систему нисходя- нисходящим гребнем. Пример 14.2. Продолжим исследование химического процесса, начатое в примере 14.1. Воспользоваться данными табл. 14.4 для описания поверх- поверхности моделью второго порядка невозможно. Экспериментатор решает до- плонить эти данные точками в количестве, достаточном для подбора модели - второго порядка. Он получает четыре наблюдения при (*i=0, хг= ±1,414) и (*i=± 1,414, *2=0). Полный набор данных приведен в табл. 14.6, а соот- соответствующий план изображен на рис. 14.7. Такой план называется централь- центральным композиционным планом. Более подробно он будет обсуждаться в 14.4.2. Подобранная модель второго порядка в кодированных переменных на- находится по МНК: = 79,940 8+ 0,994 9^ + 0,5151*2 — 1,377 0^— 1,001 8*1 + 0,250 О* 324 ДА для этой модели приведен в табл. 14.7. Неадекватность модели не яв- является значимой, а регрессия значима, поэтому мы считаем, что подобранная модель второго порядка адекватно описывает истинную поверхность. Проведем теперь канонический анализ. Заметим, что Г 0,994 9 ] Г —1,377 0 0,125 0 Ь=[ 0,515L J' B L 0,1250 -1,0018 тогда стационарная точка находится в соответствии с уравнением A4.7), X X — 0,734 5 — 0,091 7 0,994 9 0,5151 — 0,0917 1 — 1,009 6 J 0,389 01 305 6 J X и: а именно Xi, о = 0,389 0 и хг,а = = 0,305 6. В терминах натуральных переменных стационарная точка имеет вид 0,389 0 = -—¦(е1 — 85); 0,305 6 = ~ (g2 — 175), 5 откуда |,= 86,945 0 и ?2 = 176,528 0. С помощью выражения A4,8) можно найти прогнозируемое зна- значение отклика в стационарной точке ?/„=80,21. -2 ' +2 / A,1) +Z X ) Рис. 14.7. Центральный композицион- композиционный план для примера 14.2. Таблица 14.6 Центральный композиционный план для примера Натуральные переменные 1, 80 80 90 90 85 85 85 85 85 85 92,07 77,93 85 85 la 170 180 180 180 175 '175 175 175 175 175 175 175 183,07 167,93 14.2 Кодированные переменные — 1 — 1 1 1 0 0 0 7 7 0 1,414 —1,414 0 0 х. \ \ 0 0 0 0 0 1,414 —1,414 Отклик У 76,5 77,0 78,0 79,5 79,9 80,3 80,0 79,7 79,7 79,8 78,4 75,6 78,5 77,0 325
Для определения характера стационарной точки совершим преобразова- преобразование к канонической форме A4,9). Собственные значения ki и Я,2 являются корнями характеристического уравнения для матрицы В, т. е. |В — >Л|=0 или — 1,377 0 — 0,1250 которое приводится к виду 0,1250 — 1,001 8— К +2,378 8*,+1,363 9=0. = 0, Таблица 14.7 Дисперсионный анализ для модели второго порядка Источник изменчивости Регрессия Ошибка (Неадекватность) (Чистая ошибка) Сумма Сумма квадратов 28,2560 0,4871 @,2751) @,2120) 28,7431 * Значимо при 1 проценте. Степени свободы 5 7 3 4 12 Средний квадрат 5,6512 0,0696 0,0917 0,0530 ' ' Fo 81,20 * 1,73 Корнями этого квадратного уравнения являются %х = —0,964 1 и *.2=—1,414 7. Таким образом, получаем каноническую форму подобранной модели у = 80,21 — 0,964 \w\ — 1,414 7о|, а поскольку Xt и \г отрицательны и стационарная точка принадлежит об- области экспериментирования, то приходим к выводу, что эта стационарная точка является максимумом отклика. В некоторых задачах МПО может оказаться необходимым найти связь между каноническими переменными {ьщ} и пере- переменными плана {Хг}. В частностигбез установления такой связи не обойтись, если невозможно проводить процесс в стационар- стационарной точке. В качестве иллюстрации предположим, что в при- примере 14.2 мы не могли бы вести процесс при gi = 86,9450 и |г = 176,5280, так как эта комбинация факторов приводит к из- излишнему повышению стоимости. Нам хотелось бы поэтому «отойти» от стационарной точки в область с более низкой стои- стоимостью, но без существенного понижения выхода продукта. Из канонического уравнения модели видно, что поверхность от- отклика наименее чувствительна (потери выхода минимальны) в направлении Wi. Для исследования канонического уравнения необходимо преобразовать точки пространства wit W2 в точки пространства хи лг2. 326 В общем случае переменные х связаны с каноническими пе- переменными w соотношением w = M'(x—х0), где М' — ортогональная (kxk)-матрица. Столбцы М представ- представляют собой нормированные собственные векторы, связанные с {ki}, т. е. если т, —t-й столбец М, то nij является таким ре- решением уравнения (В-М)т( = 0, A4.10) ft для которого 2 тН ~ ¦ Проиллюстрируем эту процедуру с помощью подобранной модели второго порядка из примера 14.2. При ^,1= 0,9641 уравнение A4.10) принимает вид -1,377 0 + 0,9641 0,1250 0,1250 -1,0018 + 0,964 1 J L «.I J L о J или —0,4129 mn + 0,1250m2I = 0; 0,1250 ти-0,0377 m2i = 0. Мы хотим получить нормированные решения этих уравнений, т. е. решение, для которого mn2+m2i2 = l. Решение этих урав- уравнений не является единственным; удобнее всего присвоить од- одному из неизвестных произвольное значение, решить систему и нормировать полученное решение. Положив m2i* = l, находим ти* = 0,3027. Для нормирования этого решения разделим ffln* / 2+l2= 1,0448 и получим и m2i* на нормированное решение tfti пп 1,0448 0,3027 1,0448 1 1,0448 = 0,2897; = 0,957 1 1,0448 Оно является первым столбцом матрицы М. Взяв Я2 = —1,4147, мы можем повторить описанную процеду- процедуру и получить т,2=—0,957 4 и т22 = 0,288 8, что образует вто- второй столбец М. Таким образом, М = 0,2897 —0,957 4 0,9571 0,2888 ]¦ 327
-0,389 0 -0,3056 Связь между переменными w и х имеет вид \ Щ~\ Г 0.289 7 0,9571 "I Г хх [ w2 J ~[ — 0,957 4 0,2888 J [ Ч или о>1 = 0,2897 (*i—0,3890) +0,9571 (х2—0,3056); W2 = —0,9574 (х{—0,3890) + 0,2888 (х2—0,3056). Если бы экспериментатор хотел исследовать поверхность от- отклика в окрестности стационарной точки, то он мог бы опреде- определить точки необходимых наблюдений в пространстве (wit w2), а затем с помощью полученного соотношения преобразовать эти точки в пространство (хи х2), с тем чтобы сделать соответ- соответствующие измерения. 14.4. ПЛАНЫ ДЛЯ ИЗУЧЕНИЯ ПОВЕРХНОСТИ ОТКЛИКА Поверхность отклика аппроксимируется наиболее эффектив- эффективным образом, если уделить должное внимание выбору плана эксперимента. В этом параграфе мы обсудим планы, полезные при изучении поверхности отклика. 14.4.1. Планы для подбора модели первого порядка Предположим, что мы хотим для экспериментальных данных подобрать модель первого порядка с k переменными A4.11) Существует единственный класс планов, минимизирующих дисперсию коэффициентов регрессии {р\},— это ортогональные планы первого порядка. План первого порядка ортогонален, если все недиагональные элементы матрицы Х'Х равны нулю. Это означает, что равны нулю суммы смешанных произведений столбцов матрицы X. В класс ортогональных планов первого порядка входят фак- факторные планы типа 2й и те их дробные реплики, в которых глав- главные эффекты не являются совместными друг с другом. При ис- использовании этих планов мы считаем, что k факторов кодиро- кодированы к стандартным уровням ±1. Пусть, например, мы исполь- используем план 23 для подбора модели первого порядка */=P P е. Матрица X в этом случае имеет вид 328 V 1 1 1 1 1 1 1 1 — 1 — 1 — 1 — 1 1 1 1 1 1 — 1 1 1 — 1 — 1 1 1 J — 1 — 1 1 Легко проверить, что недиагональные элементы Х'Х для рас- рассматриваемого плана равны нулю. План типа 2й не позволяет оценить ошибку эксперимента; для этого необходимо повторить некоторые из измерений. Рас- Распространенным методом включения реплик в план типа 2h является дополне- дополнение плана несколькими на- наблюдениями в центре (точке Xi = 0, t=l, 2, ..., k). Введение центральных то- точек в план типа 2h не влияет на (ВЛ при х, оценка же р0 становится Рис' 148' Симплексный план при 4 = 2. средним арифметическим всех наблюдений. В при- примере 14.1 иллюстрировалось использование плана 22 с добав- добавлением пяти центральных точек при подборе модели первого порядка. Другим ортогональным планом первого порядка является симплекс. Симплекс представляет собой правильную фигуру с k-\-\ вершиной в k измерениях. Так, при k = 2 симплексный план — равносторонний треугольник, а при k = 3 — правильный тетраэдр. Симплексный план для двух переменных приведен на рис. 14.8. 14.4.2. Планы для подбора модели второго порядка Для того чтобы при подборе модели второго порядка можно было оценить ее параметры, план эксперимента должен содер- содержать по меньшей мере три уровня каждого фактора. Предпоч- Предпочтительным в этом случае классом планов для изучения поверх- 329
ности отклика является класс ротатабельных планов. План экс- эксперимента называется ротатабельным, если дисперсия прогно- прогнозируемого значения отклика у в некоторой точке х зависит только от расстояния от этой точки до центра плана, а не от на- направления на нее. Это означает, что контуры дисперсии у явля- являются концентрическими окружностями. Следовательно, при плане, обладающем таким свойством, дисперсия у не меняется при вращении, плана вокруг центра @, 0, ..., 0); отсюда и про- происходит название — ротатабельный план (rotatable — допус- допускающий вращение.— Прим. пер.). При подборе моделей второго порядка наиболее широко применяется центральный композиционный план. Он представ- представX, (-1,-1) ¦fact) @,0) (+1,1) (X,0) X Юг ос) Рис. 14.9. Центральные композиционные планы при k=2 и k = 3. ляет собой факторный или дробный факторный план типа 2h (с кодированием к обычным обозначениям ±1) с добавлением 2k «осевых» точек (±а, ОД ..., 0), @, ±а, 0, ..., 0), (ОД ±а, ..., 0), ..., @00, ..., ±а)' и По центральных точек @,0 0) (отсюда и название — центральный композиционный план.— Прим. ред.). Центральные композиционные планы при k = 2 и при k = 3 приведены на рис. 14.9. Ротатабельность центрального композиционного плана обес- обеспечивается выбором а. Это значение а зависит от числа точек в факторной части плана, а именно, центральный композицион- композиционный план оказывается ротатабельным при a = F'lu, где F — число точек, используемых в факторной части плана. Применение ро- татабельного центрального композиционного плана иллюстри- иллюстрировалось в примере 14.2. В этом примере два фактора, причем факторная часть содержит 22 = 4 точки, следовательно, ротата- ротатабельность обеспечивается при а = 4'/и =1,414. Еще одно полез- 1 Эти точки обычно называются «звездными», а расстояние а от центра до звездной точки — «звездным плечом». (Прим. ред.) 330 ное свойство центрального композиционного плана — возмож- возможность его построения из плана первого порядка (типа 2h) до- добавлением «осевых» точек и, может быть, нескольких точек в центре. Это было продемонстрировано в примерах 14.1 и 14.2. Другие свойства центрального композиционного плана опре- определяются выбором числа центральных точек щ, а именно, его можно сделать ортогональным или униформным. В униформном плане дисперсии у в начале координат и на единичном расстоя- расстоянии от него равны. По сравнению с ортогональным такой план обеспечивает большую защищенность от смещения коэффи- коэффициентов регрессии, обусловленного присутствием слагаемых третьего и более высокого порядка в истинном уравнении по- а) х2 5) х2 х1 Рис. 14.10. Эквирадиальные планы для двух перемен- переменных: а — шестиугольный; б — пятиугольный. верхности. Параметры ортогональных и униформных ротата- ротатабельных центральных композиционных планов для различных значений k приведены в табл. 14.8. Таблица 14.8 Ортогональные и планы 1 k F - «Осевые» точки «о (униф.) п0 (орт.) N (униф.) N (орт.) а униформные 2 4 4 5 8 13 16 1,414 3 8 6 6 9 20 23 1,682 ротатабельные центральные композиционные 4 16 8 7 12 31 36 2,000 1 Заимствовано в измененном виде с rimental Designs ;or Exploring Response Annals of Mathematical Statistic 5 32 10 10 17 52 59 2,378 5 'A pen. 16 10 6 10 32 36 2,000 6 64 12 15 24 91 100 2,828 разрешения издателя Surfaces» by G. E. P. „ Vol. 28, 1957, p. 195—242. 6 'A pen. 32 12 9 15 53 59 2,378 7 'A pen. 64 14 14 22 92 100 2,828 из «Multlfactor 3ox anc 8 'A Pen. 128 16 20 33 164 177 3,364 Expe- J. S. Hunter, 331
Существует несколько других ротатабельных планов, кото- которые иногда оказываются полезными в задачах с двумя или тремя переменными. В этих планах точки расположены на рав- равных расстояниях друг от друга на окружности (k = 2) или сфере (? = 3) и образуют правильные многоугольники или мно- многогранники (рис. 14.10). Такие планы часто называют эквира- диальными, так как все точки в них находятся на одном рас- расстоянии от начала координат. При k=2 ротатабельный эквирадиальный план получается объединением п2^5 точек, расположенных на равных расстоя- расстояниях друг от друга на окружности с «i^l точками в ее центре. Особенно полезными при k = 2 являются пятиугольный и шести- шестиугольный планы (см. рис. 14.10). При k = 3 эквирадиальными планами с числом точек, достаточным для оценивания всех па- параметров модели второго порядка, являются только икосаэдр A2 точек) и додекаэдр B0 точек). 14.5. ЭВОЛЮЦИОННОЕ ПЛАНИРОВАНИЕ Методология поверхности отклика часто используется иссле- исследователями и разработчиками при работе на опытных установ- установках. В приложении к производственным процессам большого масштаба МПО встречается обычно очень редко из-за сравни- сравнительно сложной экспериментальной процедуры. Но может быть так, что условия, которые были оптимальными для опытной ус- установки, оказываются не такими для реального процесса. Опыт- Опытная установка дает, например, 1 кг продукта в день, а произ- производственный процесс— 1000 кг. Такое «масштабирование» опыт- опытной установки на реальный промышленный процесс приводит обычно к искажению оптимальных условий. Если даже реаль- реальная установка начинает работать при оптимуме, то в результате «дрейфа» она постепенно отойдет от этой точки из-за изменений сырья, внешних условий и обслуживающего персонала. Необходим метод непрерывного введения производственного процесса и управления им с целью приближения рабочих усло- условий к оптимуму или ликвидации последствий «дрейфа». Этот метод не должен требовать крупных или резких изменений ра- рабочих условий, которые могли бы нарушить производственный цикл. В качестве такой рабочей процедуры Боксом [13] было предложено эволюционное планирование (ЭВОП)—метод практического управления процессом, осуществляемого обслу- обслуживающим персоналом при минимальной помощи со стороны исследователей и разработчиков. Суть ЭВОП состоит в систематическом введении небольших изменений уровней рассматриваемых рабочих переменных; для этого обычно используется план типа 2k. Изменения перемен- переменных считаются достаточно малыми, чтобы не привести к серьез- серьезным нарушениям (ухудшению качества или уменьшению коли- 332 чества продукта), но и достаточно большими, чтобы дать воз- возможность установить потенциальное повышение рабочих пока- показателей. Данные по переменным отклика, представляющим ин- интерес, собираются в каждой точке плана типа 2k. Когда в каж- каждой точке плана сделано по одному наблюдению, то говорят, что завершился цикл. После этого можно рассчитать эффекты и взаимодействия переменных процесса. Постепенно после не- нескольких циклов может оказаться, что одна или более перемен- переменных процесса или их взаимодействия обладают значимым влия- влиянием на отклик. В этот момент может быть принято решение об изменении рабочих условий для улучшения отклика. Когда эти условия определены, то говорят, что завершилась фаза. Для проверки значимости переменных процесса и взаимодей- взаимодействий требуется оценка ошибки эксперимента. Она находится по данным цикла. Кроме того, центр плана типа 2h обычно совме- совмещается с текущими наилучшими рабочими условиями. Сравни- Сравнивая отклик в этой точке и в 2h точках факторной части плана, мы можем проверить изменение среднего (ИС): если центр плана действительно совпадает с максимумом, например, то от- отклик в центре должен быть значимо большим, чем в периферий- периферийных точках плана 2h. Теоретически ЭВОП можно применять к процессу с k пере- переменными. На практике учитываются обычно только две или три переменные. Мы приведем пример для двух переменных; слу- случай k = 2> подробно обсуждается Боксом и Дрейпером [17], там же приводятся необходимые рабочие документы и их формы. Пример 14.3. Рассмотрим химический процесс, выход которого зависит от температуры х\ и давления х2. Текущие рабочие условия Xi=250°F A21°С) и х2=145 фунт/кв. дюйм A06 Н/м2). В процедуре ЭВОП используется план 22 с центральной точкой; для завершения цикла делаются наблюдения в каждой точке плана по порядку (рис. 14.11). Значения выхода на первом цикле (см. рис. 14.11) заносятся в расчетный лист ЭВОП (табл. 14.9). В конце пер- первого цикла оценку стандартного откло- отклонения получить нельзя. Эффекты и вза- взаимодействия рассчитываются обычным для плана 22 образом. Затем проводится второй цикл н данные по выходу процесса заносятся в другой расчетный лист ЭВОП (табл. 14.10). В конце второго цикла можно оценить ошибку эксперимента и сравнить оценки эффектов с 95-процент- 95-процентными (два стандартных отклонения) доверительными границами. Заметим, что «размах» относится к разностям в строке (IV); так, для размаха получаем 1,0—(—1,0) =2,0. Поскольку все эффекты в табл. 14.10 лежат в границах, определяемых соответствующими ошибками, то истинный эффект, вероятно равен нулю, и изменение рабочих условий не предусматривается. Результаты третьего цикла приведены в табл. 14.11. Здесь эффект давле- давления превосходит свою границу, определяемую ошибкой, а эффект температуры 333 250 255 Рис. 14.11. План 22 для ЭВОП.
Таблица 14.9 Расчетный лист ЭВОП — пример J4.3, и=1 5 о 1. 3 А Цикл: л = 1 Отклик: Выход Вычисление средних Рабочие условия (I) Сумма на преды- предыдущем цикле (II) Среднее на пре- предыдущем цикле (III) Новые наблю- наблюдения (IV) Разности ' [(И)-(Ш)] (V) Новые суммы 1A) + (Ш)] (VI) Новые средние \У1 = (V)/n] A) 84,5 84,5 B) 84,2 84,2 C) 84,9 84,9 D) 84,5 84,5 Вычисление эффектов 1 2 1 Эфф ~ 2 Эф 1 —г" ( Эффект температуры = - B/з +2/4 — 2/2 — ~Уь) = 0,45 Эффект давления = - B/з + 2/5 —I/a — Уд = 0,25 ект взаимодействия Т X Р = фект изменения среднего = У* + Уз + У* + % — 4#i) = — 0,02 E) 84,3 84,3 Фаза: 1 Дата: 1.11.75 Вычисление стандартного отклонения Предыдущая сумма о Предыдущее среднее Новое S = размах X X h,n = Размах (IV) = Новая сумма о Новое среднее с S новой суммы л-1 Вычисление границ ошибки 1 1 Для [ля нового среднего 2 „ , о —— У п [ля новых эффектов 2 „ у—"- изменения среднего = 1,78 334 Таблица 14.10 Расчетный лист ЭВОП — пример 14.3, и = 2 .1 Цикл: л = 2 Отклик: Выход Фаза: 1 Дата: 1.11.75 Вычисление средних Вычисление стан- стандартного отклонения Рабочие условия (I) Сумма на пре- предыдущем цикле A) 84,5 B) 84,2 C) 84,9 D) 84,5 E) 84,3 Предыдущая сумма S = (II) Среднее на пре- предыдущем цикле 84,5 84,2 84,9 84,5 84,3 Предыдущее среднее S = (III) Новые наблю- наблюдения 84,9 84,6 85,9 83,5 84,0 Новое S = размахХ X /5, „ = 0,60 (IV) Разности [(П)(ШI -0,4 —0,4 —1,0 + 1,0 0,3 Размах (IV) = 2,0 (V) Новые суммы (I) + AП) 169,4 168,8 170,8 168,0 168,3 Новая сумма S = 0,60 (IV) Новые средние У1 = (V)/n 84,70 84,40 85,40 84,00 84,15 Новое среднее с S новой суммы О = : Л—1 = 0,60 Вычисление эффектов Вычисление границ ошибки Эффект температуры = = —(уа + У* — Уа —~Уь) = 0,43 Эффект давления = = -^-B/3 + 2/5-2/3-2/4) =0,58 Эффект взаимодействия Т X Р = = — (Уз + Уз-Vi —~Уь) = О.83 Эффект изменения среднего = = — B/2 + 2/з + 2/4 + 2/в — 4^) = -0,17 5 Для нового среднего Уп Для новых эффектов ^S = 0,85 У'п Для изменения среднего -b^S = 0,76 335
Таблица 14.11 Расчетный лист ЭВОП — пример 14.3, п = 3 . 1 Цикл: /г = 3 Отклик: Выход Фаза: 1 Дата: 1.11.25 Вычисление средних Вычисление стандартного отклонения Рабочие условия (I) Сумма на предыдущем цикле A) 169,4 B) 168,8 C) 170,8 D) 168,0 E) 168,3 Предыдущая сумма S = 0,60 (II) Среднее на предыдущем цикле 84,70 84,40 85,40 84,00 84,15 Предыдущее среднее S = 0,60 (III) Новые наблюдения 85,0 84,0 86,6 84,9 85,2 Новое S = размах X X /6,„ = 0,56 (IV) Разности ЦП)-(Н1I —0,30 +0,40 —1,20 —0,90 —1,05 Размах (IV) = 1,60 (V) Новые суммы [(I)+(!")] 254,4 252,8 257,4 252,9 253,5 Новая сумма S = 1,16 (VI) Новые средние i 84,80 84,27 85,80 84,30 84,50 Новое среднее о S новой суммы л— 1 ~ = 0,58 Вычисление эффектов Вычисление границ ошибки Эффект температуры = (й + й —»а —Й>) = 0,67 Эффект давления = -(?з +</5-?2-У4) = 0,87 Для нового среднего Для новых эффектов Эффект взаимодействия Т X Р = = — (Уа + Уз — ~Уь — 2/б) = °>64 Эффект изменения среднего = = — б/г+ 2/3+ 2/4+ 05-42/1) =-0,07 Vn Для изменения среднего -b^-S = 0,60 336 совпадает с ней. Изменение рабочих условий теперь, вероятно, оправдано. В свете полученных результатов кажется разумным начать новую фазу ЭВОП вокруг точки C). Тогда xi=22b" F A07° С) н х2=150 фунт/кв. дюйм A,03- 10s Н/м2) будут приняты за центр плана во второй фазе. Важным аспектом ЭВОП является обратная передача информацни опера- операторам процесса и управляющим. Это обеспечивается вывешиванием на вид- видном месте информационной доски ЭВОП. Информационная доска для этого примера в конце третьего цикла приведена в табл. 14.12. Таблица 14.12 Информационная доска ЭВОП — цикл третий Отклик: Требование: си Сз Границь Эффекты с 95-процентными границами ошибки: Стандартное отклонение: Выход в процентах Максимизировать 150 145 84,50 85,80 84,80 84,27 84 30 40 245 250 255 Температура I ошибки для средних: +0,67 Температура Давление Изменение среднего 0,58 0,67 0,87 0,64 0,07 +0,67 +0,67 +0,67 +0,67 Большинство величин в расчетном листе ЭВОП является не- непосредственным результатом анализа для факторного экспери- эксперимента типа 2k. Например, дисперсия любого эффекта, скажем, * -у \Уз равна VI—i где 02 — дисперсия наблюдений у. Тогда для любого эффекта 337
пределы ошибки, соответствующие двум стандартным отклонен ниям (95-процентные доверительные границы), равны ±2о/Уп. Дисперсия изменения среднего V (ИС) = V [-J- {у -*У1) ] = 25 у) 25 Отсюда пределы ошибки для ИС, соответствующие двум стан- стандартным отклонениям: ±2^20/25 оЦ/'n = ±1,78 о^п. Стандартное отклонение a оценивается по размаху. Пусть г/, (я) —наблюдение в i-й точке плана на цикле п, а г/г(") —со- —соответствующее среднее г/г (л) после п циклов. В строке (IV) расчетного листа ЭВОП находятся разности Уг(п)—г/г("—1), их дисперсия У[у%(п)— Уг(п— l)]=a2z»==a2 (I + l/(n— 1)) = = о2п/(п—1). Размах этих разностей RD связан с оценкой их стандартного отклонения соотношением OD — RD/d.2- Множитель d2 зависит от числа наблюдений, учтенных при вычислении RD- Тогда RD/d.2 = o']/n/(n—1), поэтому выражение /п — — можно использовать для оценивания стандартного отклонения наблюдений (здесь k — число точек в плане). Для плана 22 с од- одной центральной точкой k = 5, а для плана 23 с одной централь- центральной точкой & = 9. Значения fh,n приведены в табл. 14.13. Таблица 14.13 Значения fk _ „ п k = 0 = 5 9 10 2 0,30 0,24 0,23 3 0,35 0,27 0,26 4 0,37 0,29 0,28 5 0,38 0,30 0,29 6 0,39 0,31 0,30 7 0.40 0,31 0,30 8 0,40 0,31 0,30 9 0,40 0,32 0,31 10 0,41 0,32 0,31 14.6. ЗАДАЧИ 14.1. На химическом заводе для получения кислорода жидкий воздух раз- разделяется на газовые компоненты методом фракционной перегонки. Чистота кислорода зависит от температуры главного конденсатора н отношения дав- давлений между верхней н нижней колоннами. Текущие рабочие условия: темпе- температура |i=—220° С и отношение давлений |2=1> 2. Найдите путь крутого вос- восхождения, используя следующие данные: 338 Температура —225 —225 —215 -215 Отношение давлений |„ 1,1 1,3 1,1 1,3 Чистота 82,8 83,5 84,7 85,0 Температура —220 —220 —220 —220 Отношение давлений ?2 счсчсч сч Чистота 84,1 84,5 83,9 84,3 14.2. Проверьте, что план, приведенный ниже, является симплексом. Под- Подберите модель первого порядка и найдите путь крутого восхождения осч х2 2 0 Хз —1 1 У 18,5 19,8 0 2 х? —2 0 Хз 1 1 У 17,4 22,5 14.3. Для модели первого порядка ^=60+1,5л:, — 0,8л:2+2,0л:з найдите путь крутого восхождения. Переменные кодированы так что 1<*^1 14.4. Проверьте, что модель первого порядка (см. пример 14.1) для данных табл. 14.1 подобрана правильно. Проверьте также ДА для этой мо- модели (см. табл. 14.2). 14.5. Шестиугольный план, приведенный ниже, используется при получении данных подбора модели второго порядка. Подберите модель второго порядка и проведите канонический анализ. х, 1 0,5 —0,5 —1 -0,5 0,5 х2 0 /0775 0 -/0775 -/0775 У 68 74 65 60 63 70 Xi 0 0 0 0 0 0 0 0 0 0 У 58 60 57 55 59 14.6. Покажите, что добавление щ центральных точек к плану типа 2к не влияет на оценки Pt(j=l, 2, ..., k), но оценка отрезка на осн ординат f}0 представляет собой среднее всех 2к + по наблюдений. 14.7. Ортогональный центральный композиционный план. Пусть для под- подбора модели второго порядка у=Ро + S Рл + 2 Рн И - *?) 339
используется центральный композиционный план. Покажите, что прн соответ- соответствующем выборе а этот план оказывается ортогональным. 14.8. Ротатабельиый центральный композиционный план. Можно показать, п что план второго порядка является ротатабельным при 2 xfux/u ~ ® > если а п п нли Ь (нлн оба) четны, н при 2 Аи = 3 2 Х1их%' Покажите, что для цент- центам и=1 рального композиционного плана эти условия приводят к величине а = /•''¦'* обеспечивающей ротатабельность, где F — число точек в факторной части плана. 14.9. Планы второго порядка требуют относительно большого числа на- наблюдений и из-за временных ограничений часто оказывается необходимым группирование в блоки. Необходимые и достаточные условия построения плана второго порядка в Ь ортогональных блоках состоят в том, что каждый блок должен образовывать ортогональный план первого порядка и что 2^ xim = т п — (п ln) 2 xju(m=l> 2, ¦ • •, b), где суммирование по т означает суммнро- и=1 вание наблюдений только в т-и блоке, а пт — число наблюдений в яг-м блоке. Проверьте, что группирование в блоки в плане, приведенном ниже, является ортогональным. Блок 1 х, 0 0 1 1 _1 1 0 0 1 —1 —1 1 0 0 1 —1 1 —1 Блок 2 *i 0 0 1 1 —1 —1 х2 0 0 1 —1 1 1 х3 0 0 —1 1 1 —1 Блок 3 Xi —1,633 1,633 0 0 0 0 0 0 Xi 0 0 —1,633 1,633 0 0, 0 0 Хз 0 0 0 0 —1,633 1,633 0 0 14.10. Группирование в блоки в центральном композиционном плане. Рас- Рассмотрите центральный композиционный план в двух блоках. Всегда ли можно найти ротатабельный план с ортогональным группированием в блоки? 14.11. Результаты измерения выхода химического процесса на первых че- четырех циклах приведены ниже. Переменными являются процентная концентра- концентрация Xi на уровнях 30, 31 и 32 и температура х2 на уровнях 60, 61 и 62° С. Проведите анализ этих данных методами ЭВОП. Цикл 1 2 3 4 Условия A) 60,7 59,1 56,6 60,5 B) 59,8 62,8 59,1 59,8 C) 60,2 62,5 59,0 64,5 D) 64,2 64,6 62,3 61,0 E) 57,5 58,3 61,1 60,1 340 Глава пятнадцатая КОВАРИАЦИОННЫЙ АНАЛИЗ 15.1. ВВЕДЕНИЕ В предшествующих главах мы обсуждали использование планов с рандомизированными блоками и латинских квадратов для повышения точности, с которой проводится сравнение обра- обработок между собой. Ковариационный анализ — еще один метод, используемый в некоторых случаях для повышения точности эксперимента. Предположим, что в эксперименте с переменной отклика у существует еще одна переменная, например х, и у ли- линейно связано с х. Кроме того, х не может контролироваться экспериментатором, но может наблюдаться вместе с у. Такая переменная х называется ковариатой, или сопутствующей пере- переменной. При ковариационном анализе наблюдаемая переменная отклика «исправляется» на линейный эффект сопутствующей переменной. Если такое исправление не производить, то сопут- сопутствующая переменная могла бы завысить средний квадрат ошибки и затруднить обнаружение истинных различий отклика, обусловленных обработками. Таким образом, ковариационный анализ является методом внесения поправки на эффекты некон- неконтролируемой мешающей переменной и, как мы увидим далее, со- сочетает в себе дисперсионный и регрессионный анализы.1 Рассмотрим пример эксперимента, в котором может быть ис- использован ковариационный анализ. Пусть необходимо опреде- определить, существуют ли различия в прочности моноволокна, изго- изготавливаемого на трех различных машинах. На прочность волокна влияет, однако, и его толщина, т. е. более толстое во- волокно будет, вообще говоря, прочнее, чем тонкое. Для исключе- исключения влияния толщины х на прочность у при определении раз- различий в прочности, обусловленных машинами, можно было бы применить ковариационный анализ. 15.2. ОДНОФАКТОРНЫЙ АНАЛИЗ С ОДНОЙ СОПУТСТВУЮЩЕЙ ПЕРЕМЕННОЙ Основная процедура ковариационного анализа будет обсуж- обсуждаться на примере плана однофакторного эксперимента с одной сопутствующей переменной. В предположении, что между от- откликом и сопутствующей переменной существует линейная 1 Такую трактовку ковариационного анализа, предложенную Р. Фишером в 1932 г., Г. Шеффе считает узкой. И действительно, иногда представляет ин- интерес исследовать, например, влияние обработок на регрессию у относительно х. {Прим. ред.) 341
связь, соответствующая статистическая модель имеет вид Уц = Н>+т* + р b,Xtj — х..) + в{,, i=l, 2, ..., a; /=1, 2, ..., n, A5.1) где tjij — /-e наблюдение переменной отклика при i-й обработке (уровне единственного фактора); Хц— измерение ковариаты, или сопутствующей переменной, соответствующее уц (т. е. ij-й опыт); х.. — среднее арифметическое значений хц; \i — матема- математическое ожидание общего среднего; т, — эффект i-й обработки; Р — коэффициент линейной регрессии, указывающий на зависи- зависимость г/jj от хц\ Eij — случайная ошибка. Мы предполагаем, что ошибки Bij~NID @, а2), угловой ко- коэффициент р#0 и истинная связь между уц и Хц линейна, коэф- коэффициенты регрессии для всех обработок одинаковы, эффекты а обработок при сложении дают нуль (St, = 0) и обработки не влияют на сопутствующую переменную. Непосредственно из выражения A5.1) видно, что модель ко- ковариационного анализа сочетает в себе линейные модели, ис- используемые в дисперсионном и регрессионном анализах, а именно, в нее входят эффекты обработок {т,}, как в однофак- торном ДА, и коэффициент регрессии р, как в регрессионном анализе. Сопутствующая переменная в выражении A5.1) взята в виде (Xij—х..), а не хц, с тем чтобы параметр ц сохранил смысл математического ожидания общего среднего. Эту мо- модель можно было бы записать и как i=l, 2, ..., а; /=1, 2, ..., п, A5.2) где ц' — постоянная, отличающаяся от математического ожида- ожидания общего среднего, равного для этой модели [x' + p*... Выра- Выражение A5.1) встречается в литературе чаще. При обсуждении ковариационного анализа нам будут удобны следующие обозначения: -«/?=? 2 .</?.•- — у2:, A5.3) an an an . _ У V (г "у \2_ У V Х2 L_ v2 • ±| -*..)(yu-y..) = I 2 A5.4) .; A5.5) A5.6) ,_~х \!=1Уй-1^ . A5.7) 342 = -2зд. —x..y..; A5.8) n (=i . an Eyy= i i (y{,—yi.r = Syy-Tyy; A5.9) ?„= 2 2 (*«-*f .)' = S«-T«; A5.10) i=i /=i Exy= 2 2 (xli-xi.)(yi,—yt.) = Sxy-Txy. A5.11) i=i /=i Отметим, что в общем случае S = T+E, где символ S исполь- использован для обозначения общих сумм квадратов и смешанных произведений отклонений от общего среднего, а символы Т и Е — для сумм квадратов и смешанных произведений для обрабо- обработок и ошибки соответственно. Суммы квадратов для х и у дол- должны быть неотрицательны; суммы смешанных произведений ху могут иметь любой знак. Покажем теперь, как при ковариационном анализе в пере- переменную отклика вносится исправление на эффект сопутствую- сопутствующей переменной. Рассмотрим полную модель A5.1), МНК- оценки (j,, п и р имеют вид ц = у.., %i~yi.—у..—f$fo-—х. .) | __ аху Ехх A5.12) Сумма квадратов ошибки при такой модели имеет вид SSom=Eyy-(ExyLExx A5.13) и обладает а(п—1) — 1 степенью свободы. Дисперсия ошибки эксперимента оценивается выражением а(п— 1)— 1 Предположим теперь, что эффект обработок отсутствует. Тогда модель A5.1) переходит в 0«=Ц + Р(*«—х..)+ец, A5.14) а'МНК-оценки ц и р — в \х=у.. и р = Sxy/Sxx. Сумма квадратов ошибки в этой упрощенной модели UUOU] = О уу Оху/&хх AО. 1О) обладает an—2 степенями свободы. В этом выражении вычитае- 343
мое (SxyJ/Sxx представляет собой величину, на которую умень- уменьшается сумма квадратов у за счет линейной регрессии у по х. Заметим, что SSOm меньше SS'om, поскольку модель A5.1) со- содержит дополнительные параметры {т*} и разность SS'Om—SSOm равна величине уменьшения суммы квадратов за счет {т*}. По- Поэтому разность между SS'om и SSoiu, т. е. SS'Oiu—SSom, дает сумму квадратов с а—1 степенью свободы для проверки гипо- гипотезы об отсутствии эффекта обработок. Следовательно, для про- проверки Яо: т; = 0 вычисляется значение статистики SSom/[a(n-1)- A5.16) которая при истинности нулевой гипотезы подчиняется F-pac- пределению с а—1 и а(п—1) — 1 степенью свободы. Таким обра- образом, мы отклоняем Но: тг = 0, если Fo>Fa;a-i-,a(n-i)-i- Поучительно рассмотреть табл. 15.1, в которой мы предста- представили ковариационный анализ в виде «исправленного» ДА. Об- Общая изменчивость измеряется величиной Syy с an—1 степенью свободы. Источнику «регрессия» соответствует сумма квадра- квадратов (SxyJ/SXx с одной степенью свободы. При отсутствии сопут- сопутствующей переменной было бы Sxy = Sxx=Exy=Exx = 0, и тогда сумма квадратов ошибки равнялась бы просто Еуу, а сумма квадратов для обработок Syy—ЕУУ=ТУУ. Но сопутствующая пе- переменная присутствует, и мы должны поэтому «исправить» Syy и Еуу на регрессию у по х (см. табл. 15.1). Исправленная сумма квадратов ошибки обладает а(п—1) — 1 степенью свободы, а не а(п—1), поскольку при подборе модели введен дополнительный параметр (угловой коэффициент Р). Таблица 15.1 Ковариационный анализ в виде «исправленного» дисперсионного анализа Источник изменчивости Регрессия Обработки Ошибка Сумма Сумма квадратов SSoui ~~ SSoui = Syy — -SySxlc-[Eyy-EljExx] 5Som = Eyy ~~ Exy'Exx Syy Степени свободы 1 a— 1 а (я— 1)— 1 an — 1 344 Продолжение табл. 15.1 Источник изменчивости Регрессия Обработки Ошибка Сумма Средний квадрат 1 , , ^ . п 1 ^ ' ssom а(п— 1) — 1 {SS'0U1-SSoul)/(a-\) MSoal Вычисления обычно оформляются в виде таблицы ковариа- ковариационного анализа (табл. 15.2). Такая схема используется по- потому, что с ее помощью удобно представлять все необходимые суммы квадратов и смешанных произведений, а также суммы квадратов для проверки гипотез относительно эффекта обрабо- обработок. Помимо проверки гипотезы об отсутствии различий между эффектами обработок при интерпретации данных часто оказы- оказывается полезным приводить и исправленные средние по обработ- обработкам; эти величины находятся в соответствии с выражением исправленное г/.-.=^. — р(ж?.— х..), i = l, 2,. . . , a, A5.17) А где $=Еху/Ехх. Это среднее по обработке является МНК-оцен- кой величины ц+л, i=\, 2, ..., а, в модели A5.1). Стандарт ошибки любого исправленного среднего по обработке имеет вид испр у yt.-[ MS [ — + "]1/2 A5.18) Наконец, вспомним, что в модели A5.1) коэффициент ре- регрессии р считался отличным от нуля. Мы можем проверить ги- гипотезу Яо: р = 0, используя статистику Га — " Е MSom A5.19) которая при истинности нулевой гипотезы подчиняется F-pac- пределению с 1 и а(п— 1) — 1 степенью свободы. Таким образом, мы отклоняем Яо: Р = 0, если F0>Fa;i.aCn_l)_u 345
Таблица 15.2 Ковариационный анализ для однофакторного эксперимента с одной ковариатой Источник изменчивости Обработки Ошибка Сумма «Исправленные» обработки Степени свободы а—1 а (п—1) an—1 Суммы квадратов и произведений X Тхх Ехх Sxx ХУ Тху Еху Sxy У Туу ЕУУ Syy Продолжение табл Источник изменчивости Обработки Ошибка Сумма «Исправленные» обработки 15.2 Исправленные на регрессию У ^ОШ = Еуу~ с2 In аху' пхх SSom=zSSyy — -s2jsxx SSom ~~ 55ош Степени свободы а (п— 1)—1 an—2 a—I Средний квадрат ,,о SSoni e(n-l)—1 Пример 15.1. Рассмотрим эксперимент, описанный в 15.1. Для текстильной компании на трех различных машинах изготавливается моноволокно. Инже- Инженеру-технологу интересно установить, существуют лн различия в прочности волокна на разрыв, изготовленного на этих трех машинах. Прочность волокна связана, однако, с его диаметром, причем более толстое волокно прочнее, чем тонкое. С каждой машины берется случайная выборка из пяти образцов во- волокна. Прочность волокна на разрыв у н соответствующий диаметру х для каждого образца приведены в табл. 15.3. 346 Таблица 15.3 Данные по пределу прочности для примера 15.1 Машина 1 У 36 41 39 42 49 207 1 * 20 25 24 25 32 126 Машина 2 У 40 48 39 45 44 216 * 22 28 22 30 28 130 Машина 3 У 35 37 42 34 32 180 1 * 21 23 26 21 15 106 График зависимости прочности на разрыв от диаметра приведен на рнс. 15.1. Его вид ^ позволяет предположить, что между прочно- g стью на разрыв и диаметром существует лн- о нейная связь, и кажется уместным для нсклю- ¦? чения влияния диаметра на прочность приме- ° нить ковариационный анализ. В предположе- с нии, что справедлива линейная зависимость g прочности волокна от его диаметра, модель <g имеет вид о- ,c j=l, 2, 3; /=1, 2, ..., 5. С помощью выражений A5.3) — A5.11) можно найти 10 20 JO Диаметр,х Рнс. 15.1. Зависимость прочности волокна у от его диаметра х, пример 15.1. 3 5 :—-6032 = 346,40; 3-5 *„ = .2 24-^г-?. = 2°2 + 252+ • • • +^2- 3 3 - 5 S*»=2 2 х</^/--7Г *••*'•• = 20>36 + 25-41+ • • • +15-32- 1= 1 /= 1 "" 1 — 362-603 = 282,60; о • О о Туу 4.2 У1 —?Г*-=-Г B07* + 216* + 184») - i=i 347
;=i Т = 1 ху 3-5 з 2*. i an 1 = —A26-207+ 130-216 5 106-184) — х..У..= 1 о • 5 362-603 = 96,00; Еуу = Syy - ТуУ = 346,40—140,40 = 206,00; Ехх = Sxx — Тхх = 261,73 — 66,13 = 195,60; Exy = Sxy-Txy = 282,60 — 96,00=186,60. Из выражения A5.15) получаем SS om = Syy - S2xy/Sxx = 346,40 - B82 ,60J/261,73 = 41,27. с an — 2=3-5 — 2=13 степенями свободы, а из выражения A5.13) SSom = Еуу - Е2ху/Ехх = 206,00 - A86,60O195,60 = 27,99 с а(п—1) — 1=3E—1) — 1 = 11 степенями свободы. Сумма квадратов, используемая при проверке Но'- Т; = 0,— SS'om-SSom =41,27-27,99= 13,28 обладает а—1=3—1=2 степенями свободы. Результаты этих вычислений сведены в табл. 15.4. Таблица 15.4 Ковариационный анализ данных по прочности на разрыв Источник изменчивости Станки Ошибка Сумма «Исправ- «Исправленные» станки Степеин свободы 2 12 14 Суммы квадратов и ведений X 66,13 195,60 261,73 ху 96,00 186,60 282,60 произ- У 140,40 206,00 346,40 Исправленные на регрессию _ У 27,99 41,27 13,28 Степени свободы 11 13 2 Средний квадрат 2,54 6,64 Для проверки гипотезы о том, что различия машин по прочности изго- изготавливаемого на них волокна существуют, а именно, Но: т,=0, найдем, в соответствии с выражением A5.16), значение статистики (SS'om-SSom)/(a-l) SSom/[a(n-\)-l]' 13,28/2 6,64 27,99/11 ~~ 2,54 = 2,61. 348 Сравнение этого выражения с Fo.io,; 2; п = 2,8б показывает, что нулевую гипо- гипотезу отклонить нельзя. Другими словами, нет данных в пользу того, что во- волокна, изготавливаемые на трех машинах, различаются по прочности на разрыв. С помощью выражения A5.12) найдем оценку коэффициента регрессии = 0,95. помощью выражения A5.19). ft- ?*y 186,60 ~~ Ехх ~ 195,60 Гипотезу //0: f} = 0 можно проверить с Найдем значение этой статистики F _ ЕУЕхх _A86,60)У195,60_700В ° MS0U1 2,54 и, поскольку fо,01; 1,-11 = 9,65, то мы отклоняем гипотезу Но'- Р=0. Следова- Следовательно, линейная зависимость между прочностью на разрыв и диаметром существует, н внесение исправления прн помощи ковариационного анализа было необходимо. Исправленные средние по обработкам можно найти из соотношения A5.17): исправленное </|. =]/,. — |H*i. — X.) =41,40 — 0,95B5,20 — 24,13) =40,38; исправленное ~У2.=Ъ- — р"(*2. — х~.) =43,20 — 0,95B6,00 — 24,13) =41,42; исправленное ~у3- = Уа- ~ Р(*з. — X.) =36,00 — 0,95B1,20— 24,13) =38,78. Сравнивая исправленные средние по обработкам с неисправленными (/,., замечаем, что исправленные средние значительно ближе друг к другу, что еще раз свидетельствует о необходимости проведения ковариационного анализа. Одним из основных допущений в ковариационном анализе является то, что обработки не оказывают влияния на коварианту х, так как этот метод исключает эффект вариаций величины xt.. Однако если изменчивость Xi. ча- частично обусловлена обработками, то ковариационный анализ исключает и часть эффекта обработок. Таким образом, мы должны быть достаточно уве- уверенными в том, что обработки не влияют на значение Хц. В одних экспе- экспериментах это может быть очевидно из самой природы сопутствующей пе- переменной, в других — может вызвать определенные сомнения. В нашем примере могут быть различия в диаметре волокон хц. изготавливаемых на каждой из трех машин. В таких случаях, как полагают Кокрен н Кокс [20], прн определении справедливости данного допущения может оказаться полезным ДА величин хц. Для нашей задачи эта процедура дает 66,13/2 33,07 195,60/12 16,30 = 2,03, что меньше ^о.ю; 2; 12=2,81; следовательно, нет оснований считать, что ма- машины дают волокно различного диаметра. Интересно посмотреть, каковы были бы результаты этого эксперимента без проведения ковариационного анализа, т. е. если бы данные по прочности на разрыв у анализировались как данные однофакторного эксперимента. ДА данных в этом предположении приведен в табл. 15,5. Поскольку ^о,о5; 2; 12 = 3,89, то мы прншлн бы к выводу, что машины обладают значи- значимыми различиями в прочности изготовляемого на них волокна, и обычным образом попытались бы уравнять показатели машин по прочности. Однако после исключения линейного эффекта диаметра оказывается, что машины не различаются по прочности изготавливаемого волокна. Может быть, полезно уменьшить изменчивость диаметра в пределах одной машины. 349
Таблица 15.5 Некорректный анализ данных по прочности как данных однофакторного эксперимента Источник изменчивости Машины Ошибка Сумма Сумма квадратов 140,40 206,00 346,40 • Значимо прн 5 процентах. Степени свободы 2 12 14 Средний квадрат 70,20 17,17 4,09 * 15.3. ДРУГИЕ КОВАРИАЦИОННЫЕ МОДЕЛИ Общая процедура ковариационного анализа может быть включена в любую модель эксперимента. Например, рассмотрим рандомизированный полноблочный план с одной сопутствующей переменной: yij = li+Ti + yj+$(Xij—x..)+e.ij, J=l, 2, ..., а; /=1, 2, ..., Ь, A5.20) где уц — наблюдение при i-й обработке в j-u блоке; jj, — мате- математическое ожидание общего среднего; п — эффект 1-й обра- обработки; уз — эффект /-го блока; р — коэффициент регрессии; Хц — ij-e наблюдение ковариаты; Zij~NID @, о2)—случайная ошибка. Детали вычислений для рандомизированного полноблочного плана приведены в табл. 15.6; ниже даны определения исполь- использованных в ней величин: ab — _ V — у ___ v2 ab *•¦ = — V ifl ^ цЧ = S 23 хчУч хх — "ж* °д;ж 1 ab " "' о r> T ¦ /¦— °w *\w *¦ yy< f •J 1 у III 350 at Я 4 3 о чно нобло § ного п в зиро 1ДОМИ I п I X at =я я - Таблица 15.6 Ковариационн ? а и % в. fc a а a) еин к ю а. g оизвед а атов и адр г Сумм аЯ ? с S® О о f- сд о. ч ква а к & о. и «г Н ш U° а, Источник изменчи- изменчивости 1 | 1 1 § ft; _ Блоки 1 1 1 I | 1 a Обработки | со I -о | a i -с a I СО = 1 -о 1 1 1 а и 1 ° СО - 1 т X Ошибка -О 1 Г с| СО СО 7 1 _ Сумма i 1 1 1—1 -о СО -^ || Г^> 3 - о со II ^)[у 00 II fl ^ ^+ СО || + -о Обработки плюс ошибка 1 а о СО || СО - 1 СО\ | ° СО II II —' 1 a а о СО СО 1 а * о СО СО «Исправлен- «Исправленные» обра- обработки 351
Отметим, что эта процедура сходна с обычным ДА, за ис- исключением поправки, вносимой на регрессию. Сравнивая табл. 15.6 и 15.2, мы видим, что в рандомизированном полно- полноблочном плане мы уменьшили остатки Evv, Ехх и Еху на сумму квадратов или произведений, обусловленную блоками. Кроме того, сумма квадратов исправленных обработок находится как разность между исправленной суммой квадратов для «обрабо- «обработок плюс ошибка» и исправленной суммой квадратов ошибки, что позволяет исключить эффекты блоков. Коэффициент регрес- регрессии оценивается выражением Р = -^2-, A5.21) а соответствующая статистика для проверки Яо: р = 0, имеет вид A5.22) MSoai где iVISom определено в табл. 15.6. При нулевой гипотезе Fo под- подчиняется F-распределению с 1 и ab—а—Ь степенями свободы, поэтому Но: р = 0 отклоняется, если Fo>Fa;i-ab-a-b- Ковариационный анализ можно распространить на латин- латинские квадраты, неполноблочные, факторные, гнездовые планы и т. д. Его также можно использовать для сравнения угловых коэффициентов нескольких линий регрессии. Наконец, могут возникнуть ситуации, где необходима множественная ковариа- ковариационная структура, т. е. либо у связано с х нелинейным образом (скажем, y=Pi* + p2*2), либо сопутствующих переменных две или более. Эти и связанные с ними вопросы обсуждают Дункан [28], Осл [55], Кокрен [20] и Федерер [31]. Последние две работы можно найти в третьем томе Biometrics A957), который почти целиком посвящен ковариационному анализу. 15.4. ЗАДАЧИ 15.1. Исследуется эффективность методов транспортировки продукции. В лаборатории рационализации методов работы проводится эксперимент с тремя типами ручных тележек. Исследуемая величина у — время транспор- транспортировки в минутах — заметным образом связана с числом ящиков х транс- транспортируемой продукции. Каждая ручная тележка используется по четыре раза; полученные данные приведены ниже. Проведите анализ этих данных н сделайте соответствующие выводы. Тип ручной тележкн 1 У 27 44 X 24 40 2 У 25 35 X 26 32 3 у 40 22 X 38 26 Тип ручной тележки 1 У 33 41 X 35 40 2 У 46 26 X 42 25 3 у 53 18 X 50 20 15.2. Найдите исправленные средние по обработкам и стандартные от- отклонения для ннх, использовав данные задачи 15.1. 15.3. Исследуются четыре формулы приготовления промышленного клея. Прочность клея связана с толщиной слоя. Для каждой формулы произво- производится пять измерений прочности у, в кг, и толщины х, в мм, их результаты приведены ниже. Проведите анализ этих данных и сделайте соответствующие выводы. Формула клея 1 У 21,5 20,9 24,8 21,1 19,3 X 3,3 3,6 3,0 3,0 3,6 2 У 23,7 24,0 25,1 23,5 20,2 X 3,0 2,5 2,8 3,0 3,6 3 У 21,3 22,1 23,9 23,2 25,3 X 3,8 3,6 2,8 2,8 2,5 4 У 19,7 18,0 26,0 23,1 23,6 X 4,1 3,8 2,5 3,0 2,8 15.4. Покажите, что в однофакторном ковариационном анализе с одной сопутствующей переменной 100A — а) —процентный доверительный интер- интервал для исправленного среднего по t-й обработке нмеет внд h - Ь (*,. - *..) ± ta/2. а (я _ „ _, \м som {±-+ Воспользовавшись этой формулой, постройте 95-процентный доверитель- доверительный интервал для исправленного среднего по станку I из примера 15.1. 15.5. Ниже приведена таблица скорректированных сумм квадратов и про- произведений для раидомизнрованного полноблочного плана с одной сопутствую- сопутствующей переменной. Закончите ковариационный анализ и сделайте соответствую- соответствующие выводы. Источник изменчивости Блоки Обработки Ошибка Степени свободы 8 4 32 Суммы квадратов н произведений X isi ХУ 600 300 700 У 1200 800 1400 352 12 Д. К. Монтгомери .353
s О — CM CO ¦* Ю СО t^ 00 еЛ_ °.~„ СО -^ (Уз (. - - - 00 СО О N (Уз CON—ЮСО Ю Ю СО СО СО о о со t*~ ^^ •* СТ! СМ СМ СТ! t^- t^- со ел СЛ ¦* t^ 00 00 00 N СМ О см ю оо — со со оо о «—-со NNN¦0000 00 00 (Уз (Уз СГ> *СООШ ЮСО t- t— <У <У <У <У < Ю О N СО > N СО Ю "<f см ю _ СТ>~^СМОСО О) —•¦ C7i СО О . _ , -м ^ 00 —Ю00 — СО ЮОО СП — СО )ЮСОСОСО N_N_ N0000 00 00 00 СТ) С7> ю см со ю ю СЛ Ю ¦* СЛ —¦ см со см ел со tJ< ЮСО СО t- СТ> СТэ СТэ СТ5 СЛ 354 О О) СМ — СМ СЛ -^ -^ СО 00 см со о -* < ююсо со с ю оо о) t— со ^осо (Уз О СО Ю СМ (О О С7> CD CM N (У> N "^f О) Ю N О) -н СМ СО 00 <Х> (У> (У> S ЮСО СМ Ю — СМ — СП Ю -ф ЮСО СО t— СЛ СТ5 СТ) СТ) стэ СМ СО N 00 -^f O^j Ю Ю Ю СМ Si ю>  ¦Ф t— 3 СО СО см со со — - см ю со ю — :88 СО t^ СО 00 Ю -ф СП —• О 00 ю со со со г*~ Ю Г*~ СТ) — СМ 00 00 00 СП О) см ¦* о со о со юоо юо о — о сою -ф ЮСО СО t— СЛ СТэ СТ СТ СТ тР СМ — СО -Ф СП СО t— 00 СО О) О) 00 СО И — Ю СП СО Г*~ юююю со 00 — И СО О) 00 СМ СО СМ 00 О -ф ["- О СМ t— t-- t— 00 00 ¦ф СО Ю СП t^ —• СП СО -ф "ф Ю t^ СП ¦ 00 00 00 СП О) О) О СП ["- ¦* со ю ю со t^ ст ст ст ст СТ ю t- со t>- со О) СО 00 О О Ю Ю ^р СО О '—' ю сь со t^- ю ю ю со со О — Ю ¦* О) ¦* О) СОЮСО ЮОО О О) СО О О [ О СМ ЮОО О О) СО О СО ["- О) СМ t t f- t 00 СО Ю ^- 00 СО 00 СОЮ 00 О О СМ СМ О) Ю Ю t-- О) О СМ 0 0 00 СТ) t^ 00 00 00 00 СП СП СМ Ю О -нОО оо а> о) t- со СО Tt> Ю СО ["- О^ С75 СТ) СТ) СТ) —• — О О) СО —.1ОО1 CM CD ¦* Ю О СО -н ет> со со t^ оо — ю t^ со со О СО СО СТ! СМ О) СО Ю ¦* ¦* ¦* [^ СО СМ СО 00 О О 00 СО ¦* t- о> о см 00 00 00 О СО 00 00 СО СО СО ¦*!< Ю СО Г^ О^ СГ СТ СТ О^ 00 СО СО — СО О ¦* 00 СМ СО Ю Ю Ю СО СО 00 СМ ¦* СО —• С7> СО СО СТ) СМ со t>-1- t- оо со -^ t^ оо ет> —. СО t^ Ю "-¦ СО 00 00 СО СМ ¦* СО 00 О СМ оо оо оо ст> ет> ¦* 00 00 СМ [^ [^ СО СМ СО Ю 1ONN1OCN со ¦* юсо t- СТ) О^ СТ) СТ) СТ) СТ) СТ) t^ СМ О cr^ t— ^—¦ t^ "—' СО СО СО *— С7> О ¦* 00 СМЮ ЮЮЮ СО t t- ЮСО О> О) О — О Ю ¦*f CT) "-¦ ^- 00 СЛ СМ СО О) —• СО t^ t^ t^ 00 Ю О СО ОСО t^ Ю 00 С7> t^ со со со ¦* о ¦* СО 00 О СМ 00 00 00 СТ! СТ! 00 I > t^ ю со ) СО 00 О) ¦^ со со -^ ^^ со тр ю со t^ СТ О ^ О^ О^ 8 coco — см 00 СМ СЛ ¦* О О) СЛ t- Ю О СО ["- —• Ю Ю Ю Ю СО СО СО ЮСО ¦* т*< ¦* t^ о — ел "-¦ Ю 00 00 Ю ел см юоо — СО t- t- t- 00 ¦* со со о ¦* со со ел см см ^- тр -*р со ел ¦* СО 00 О — 00 00 00 СЛ СЛ ело со t- оо — см ¦* о см СО Ю Ю -^ "-¦ со -^ ю со t^ СТ СГ СТ СТ СТэ ЮСОГ^ООСЛ О'-'С^СО^' о — см та ¦Ф 1О со t~- оо_ сп_ о_ —_ см_ та_ ¦*_ ю_ со_ [-._ с» ел_ см" см" см" см" см" см" см" см" <м" см" та" та" со' та" та" та" та" со" та" со" СП ¦* СП 00 — СО [— СП Ю СО — ЮОО — СО Ю СО N СО 00 ооооооспсо спспспспсп СПСПСПСЛСЛ СЛСПСП СП_ СП о" о" о" о" о" о" о" о" о" о" о я со N - оелоюсо см^таосо о CNioto s СО О) И Ю N оо оо ел ел ел ел ел ел о о о о о о о о о" о" ¦* t- о ¦* та см та t~- та ¦* —• ю оо — та оо оо оо ел ел ел ел ел ел ел ооооо СО СМ 00 — СО о та см о ю Ю Ю N 00 00 zy> <у> <у> <у> <у> (У> СЛ СТ) СТ) СТ) о' о" о" о" о" [^ СО 00 СП СМ ¦* 00 СМ Ю t- 00 СП СП СП 8 СП СП СП ооооо (У> (У> СТ) СТ) СТ) о" о" о" о" о" t- о о — ¦* t- о .¦* — см о ю оо — та оо оо оо ел ел сл^ ел ел ел ел о" о" о" о" о" см — о ю — ел см см ел ю ¦* со t^ t^ оо ст ст ст ст ст оо ел ел ел ст ст ст ст СМ 00 СМ Ю СО 00 00 (Уз (Уз (Уз О"э О"э О"э О^ О^ О^ О^ О"э О^ О^ О^ О^ О"э О^ О^ о о о о о ооооо ооооо о —• ел та со о со оо ел О — оо со — 00 ¦* ел — -^ 00 СМ ¦* о оо ¦* со ел ел ел ел ел —• t- см ^г со оо оо ел ел ел о о о о о ооооо ооооо ооооо — СО СО 00 ел ¦* t^ t- 00 00 ел ел ел о" о о о о — 00 СМ — — СО (Уз О 00 ¦* ¦* Ю NN 00 О^ О) О) (Уз (Уз Оъ Оъ (Уз (Уз (Уз о" о" о" о" о" со оо см X -н tJ- 00 СТ) СТ) о см CO N —• t^ —' ¦* CO оо оо ел ел ел o o o" o" o" ООООО со со СО СО Ю 00 О- 00 N о" о о 00 (Уз (Уз (Уз О) (Уз (Уз О) (Уз СО — ^f СО 00 (Уз (Уз СТ> СТ> СТ> сТ> СТ> О"э СТ> сТ> СТ> СТ> О} О"э СТ> ооооо ооооо ооооо см — та 00 ¦*—¦ оо та t^ t^ оо оо ел ел ел см ел 1 о о" о о о" О СО СО N —< СО N 00 СО СО ¦^f Ю СО N 00 СГ) О"э сТ> СТ> СТ> СТ> О"э сТ> СТ5 СТ> о" о" о" о" о" оо ел ел ел оо ел ел ооооо о о о о о та о ¦* о ю —• со t>- со сч ю ел ю со оо t со ел см t^ оо оо оо ел ел ел ел ел ел о" о" о" о" о" оо ел ел (У> ел Ст5 ел (У> Ст5 00 Ю О СО СО N 00 СТ) О^ О^ О"э О"э СТ> СТ> 0} О"э СТ> СТ> СТ> 0} О"э СТ> СТ> СТ> CTJ ооооо ООООО ООООО 00 [^ Ю СО СМ t^ Ю ¦тр Ю О t^ см со ел см t^ оо оо оо ел СТ У У У У со t>- ¦* см ел ел -^ со ю — со ю со t^ оо ел ел ел ел ел ел ел ел ел ел ел со ¦* со о та 00 Ю О СО Ю г^ оо ел ел ел ооооо ооооо ооооо о о о" о" о" О О) ¦* СО ¦* СО 00 N СО Ю 4f —< СО Ю СО N 00 Оъ Оъ Оъ (Уз (Уз сч со ю со ^ аз со ю 00 00 (Уз (Уз 00 (У> (Уз О) (Уз (Уз О) (Уз (Уз ооооо о о о о о ооооо ооооо О_ —_ СМ_ СО -^ 1С СО_ N 00^ (Уз^ О_ — СМ_ СО^ "^ см см" см" см" см* см" см" см" см" см" со" со" со" со* со" lo co_ t~_ oo_ ел та" та" со" та" со" 355
Приложение III Процентные точки ^-распределения 0,1; vt, SttE 5 о x l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 oo 1 39,86 8,53 5,54 4,54 4,06 3,78 3,59 3,46 3,36 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01 2,99 2,97 2,96 2,95 2,94 2,93 2,92 2,91 2,90 2,89 2,89 2,88 2,84 2,79 2,75 2,71 2 49,50 9,00 5,46 4,32 3,78 3,46 3,26 3,11 3,01 2,92 2,86 2,81 2,76 2,73 2,70 2,67 2,64 2,62 2,61 2,59 2,57 2,56 2,55 2,54 2,53 2,52 2,51 2,50 2,50 2,49 2,44 2,39 2,35 2,30 3 53,59 9,16 5,39 4,19 3,62 3,29 3,07 2,92 2,81 2,73 2,66 2,61 2,56 2,52 2,49 2,46 2,44 2,42 2,40 2,38 2,36 2,35 2,34 2,33 2,32 2,31 2,30 2,29 2,28 2,28 2.23 ' 2.18. 2,13 2,08 4 55,83 9,24 5,34 4,11 3,52 3,18 2,96 2,81 2,69 2,61 2,54 2,48 2,43 2,39 2,36 2,33 2,31 2,29 2,27 2,25 2,23 2,22 2,21 2,19 2,18 2,17 2,17 2,16 2,15 2,14 2,09 2,04 1,99 1.94 5 57,24 9,29 5,31 4,05 3,45 3,11 2,88 2,73 2,61 2,52 2,45 2,39 2,35 2,31 2,27 2,24 2,22 2,20 2,18 2,16 2,14 2,13 2,11 2,10 2,09 2,08 2,07 2,06 2,06 2,03 2,00 1,95 1,90 1,85 6 58,20 9,33 5,28 4,01 3,40 3,05 2,83 2,67 2,55 2,46 2,39 2,за 2,28 2,24 2,21 2,18 2,15 2,13 2,11 2,09 2,08 2,06 2,05 2,04 2,02 2,01 2,00 2,00 1,99 1,98 1,93 1,87 1,82 1,77 7 58.91 9,35 5,27 3,98 3,37 3,01 2,78 2.62 2,51 2.41 2,34 2,28 2,23 2,19 2,16 2,13 2,10 2,08 2,06 2,04 2,02 2,01 1,99 1,98 1,97 1,96 ' 1,95 1,94 1,93 1,93 1,87 1,82 1,77 1,72 Степени 8 59,44 9,37 5,25 3,95 3,34 2,98 2,75 2,59 2,47 2,38 2,30 2,24 2,20 2,15 2,12 2,09 2,06 2,04 2,02 2,00 1,98 1,97 1,95 1,94 1,93 1,92 1,91 1,90 1,89 1,88 1,83 1,77 1,72 1,67 свободы 9 59,86 9,38 5,24 3,94 3,32 2,96 2,72 2,56 2,44 2,35 2,27 2,21 2.16 2.12 2,09 2,06 2,03 2,00 1.98 1,96 1,95 1,93 1,92 1,91 1,89 1,88 1,87 1,87 1,86 . 1,85 1,79 1,74 1,68 1,63 356 числителя (vj 10 60,19 9,39 5,23 3,92 3,30 2,94 2,70 2,54 2,42 2,32 2,25 2,19 2,14 2,10 2,06 2,03 2,00 1,98 1,96 1,94 1,92 1,90 1,89 1,88 1,87 1,86 1,85 1,84 1,83 1,82 1,76 1,71 1,65 1,60 12 60,71 9,41 5,22 3,90 3,27 2,90 2,67 2,50 2,38 2,28 2,21 2,15 2,10 2,05 2,02 1,99 1,96 1,93 1,91 1,89 1,87 1,86 1,84 1,83 1,82 1,81 1,80 1,79 1,78 1,77 1,71 1,66 1,60 1,55 15 61,22 9,42 5,20 3,87 3,24 2,87 2,63 2,46 2,34 2,24 2,17 2,10 2,05 2,01 1,97 1,94 1,91 1,89 1,86 1,84 1,83 1,81 1,80 1,78 1.77 1,76 1,75 1.74 1,73 1,72 1,66 1,60 1,55 1,49 20 61,74 9,44 5,18 3,84 3,21 2,84 2,59 2,42 2,30 2,20 2,12 2,06 2,01 1,96 1,92 1,89 1,86 1,84 1,81 1,79 1,78 1,76 1,74 1,73 1,72 1,71 1,70 1,69 1,68 1,67 1.61 1.54 1.48 1.42 24 62,00 9,45 5,18 3,83 3,19 2,82 2,58 2,40 2,28 2,18 2,10 2,04 1,98 1,94 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,72 1,70 1,69 1,68 1,67 1.66 1.65 1,64 1,57 1,51 1.45 1,38 30 62,26 9.46 5,17 3,82 3,17 2,80 2,56 2,38 .2,25 2,16 2,08 2,01 1,96 1,91 1,87 1,84 1,81 1,78 1,76 1,74 1,72 1,70 1,69 1,67 1,66 1,65 1,64 1,63 1,62 1,61 1,54 1,48 1,41 1,34 40 62,53 9,47 5,16 3,80 3,16 2.7S 2,54 2,36 2,23 2,13 2,05 1,99 1,93 1,89 1,85 1,81 1,78 1,75 1,73 1,71 1,69 1,67 1,66 1,64 1,63 1,61 1,60 1,59 1,58 1,57 1,51 1.44 1,37 1,30 60 62,79 9,47 5,15 3,79 3,14 2,76 2,51 2,34 2,21 2,11 2,03 1,96 1,90 1,86 1,82 1,78 1,75 1,72 1,70 1,68 1,66 1,64 1,62 1,61 1,59 1,58 1,57 1,56 1,55 1,54 1,47 1,40 1,32 1,24 120 63,06 9,48 5,14 3,78 3,12 2,74 2,49 2,32 2,18 2,08 2,00 1,93 1,88 1,83 1,79 1,75 1,72 1,69 1,67 1,64 1.62 1,60 1,59 1,57 1,56 1,54 1,53 1,52 1,51 1,50 1,42 1,35 1.26 1,17 оо 63,33 9,49 5,13 3,76 3,10 2,72 2,47 2,29 2,16 2,06 1,97 1,90 1,85 1,80 1,76 1,72 1,69 1,66 1,63 1,61 1,59 1,57 1,55 1,53 1.52 1,50 1,49 1,48 1,47 1,46 1,38 1,29 1,19 1,00 357
Продолжение прилож. Ill *0,05; v,, v3 К CD (С н о rt Ос к 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 оо 1 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4.00 3,92 3,84 2 199,5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3.59 3.55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,15 3,07 3,00 3 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,88 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3.16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,76 2,68 2,60 4 224,6 19,35 9,12 6,39 5,19 4,53 4,12 3,84 3.63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2.73 2,71 2,70 2,69 2,61 2,53 2,45 2.37 5 230,2 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3.11 3,03 2,96 2,90 2,85 2,81 2.77 2,74 2,71 2,68 2,66 2.64 2,82 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,37 2,29 2,21 6 234,0 19,33 8,94 6,16 4.95 4,28 3.87 3,58 3,37 3,22 3.09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2.63 2,60 2,57 2,55 2.53 2,51 2,49 2,47 2,46 2.45 2,43 2,42 2.34 2.25 2,17 2.10 7 236,8 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2.61 2,58 2,54 2,51 2,49 2.46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,25 2.17 2,09 2,01 Степени 8 238.9 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2.64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,38 2,34 2,32 2,31 2.29 2,28 2,27 2,18 2,10 2,02 1,94 свободы 9 240,5 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3.18 3,02 2,90 2,80 2,71 2.65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2.28 2,27 2,25 2,24 2,22 2,21 2,12 2,04 1,96 1,88 358 числителя (V,) 10 241,9 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 1,99 1,91 1,83 12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2.42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,92 1,83 1,75 15 245,9 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,84 1,75 1,67 20 248,0 19,45 8,66 5,80 4,56 3,87 3.44 3,15 2,94 2,77 2,65 2.54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 3,01 1,99 1,97 1,96 1,94 - 1,93 1,84 1,75 1,66 1,57 24 249,1 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2.05 2,03 2,01 1.98 1,96 1.95 1.93 1,91 1,90 1,89 1,79 1,70 1,61 1,52 30 250,1 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,65 1,55 1,46 40 251,1 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,85 1,64 1.82 1,81 1,79 1,69 1,59 1,49 1,39 60 252,2 19,48 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,79 1,77 1,75 1,74 1,64 1,53 1,43 1,32 120 253,3 19,49 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,58 1,47 1,35 1,22 оо 254,3 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,39 1,25 1,00 359
Продолжение прилож. Ill 0,025; v,, v2 J2 il Ю в 1 2 3 4 5 6 7 Степени 8 свободы 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 647,8 38,51 17,44 12,22 10,01 8,81 8,07 7,57 7.21 6,94 6,72 6,55 6,41 6,30 6,20 6,12 6,04 5,98 5,92 5,87 5,83 5,79 5,75 5,72 5,69 5,66 5,63 5,61 Б,59 5,57 5,42 5,29 5,15 5,02 799,5 39,00 16,04 10,65 8,43 7,26 6,54 6,06 5.71 5,46 5,26 5,10 4,97 4,86 4,77 4,69 4,62 4,56 4,51 4,46 4,42 4,38 4,35 4,32 4,29 4,27 4,24 4,22 4,20 4,18 4,05 3,93 3,80 3,69 864,2 39,17 15,44 9,88 7,76 6,60 5,89 5,42 5,08 4,83 4,63 4,47 4,35 4,24 4,15 4,08 4,01 3,95 3,90 3,86 3,82 3,78 3,75 3,72 3,69 3,67 3,65 3,63 3,61 3,59 3,46 3,34 3,23 3,12 899,6 39,25 15,10 9,60 7,39 6,23 5,52 5,05 4,72 4,47 4,28 4,12 4,00 3,89 3.8Q 3,73 3,66 3,61 3,56 3,51 3,48 3.44 3,41 3,38 3,35 3,33 3,31 3,29 3,27 3,25 3,13 3,01 2.89 2,79 921,8 39,30 14.88 9,36 7,15 5,99 5,29 4,82 4,48 4,24 4.04 3,89 3,77 3,66 3,58 3,50 3,44 3,38 3.33 3,29 3,25 3.22 3,18 3,15 3,13 3,10 3,08 3,06 3,04 3,03 2,90 2,79 2,67 2,57 937,1 39,33 14,73 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,88 3,73 3,60 3,50 3,41 3,34 3,28 3,22 3,17 3,13 3,09 3,05 3,02 2,99 2,97 2,94. 2,92 2,90 2,88 2,87 2,74 2.63 2,52 2,41 948,2 39,36 14,62 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,76 3,61 3,48 3,38 3,29 3,22 3,16 3,10 3,05 3,01 2,97 2,93 2,90 2,87 2.85 2,82 2,80 -. 2,78 2.76 2,75 2,62 2.51 2,39 ¦2,29 956,7 39,37 14,54 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,66 3,51 3,39 3,29 3,20 3,12 3,06 3,01 2,96 -2.91 2,87 2,84 2,81 .2,78 2.75 2,73 2,71 2,69 2,67 2,65 2,53 2,41 2,30 2,19 963,3 39,39 14,47 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,59 3,44 3,31 3,21 3,12 3,05 2,98 2,93 2,88 2,84 2,80 2,76 2,73 2,70 2.68 2,65 2,63 2,61 2,59 2,57 2,45 2,33 2,22 2,11 360 числителя (v,) 10 958,6 39,40 14,42 8,84 6,62 5,46 4,76 4,30 3,96 3,72 3,53 3,37 3,25 3,15 3,06 2,99 2,92 2,87 2,82 2,77 2,73 2,70 2,67 2,64 2,61 2,59 2,57 2,55 2,53 2,51 2,39 2,27 2,16 2,05 12 976,7 39,41 14,34 8,75 6,52 5,37 4,67 4,20 3,87 3,62 3,43 3,28 3,15 3,05 2,96 2,89 2,82 2,77 2,72 2,68 2,64 2,60 2,57 2,54 2,51 2,49 2,47 2,45 2.43 2,41 2,29 2,17 2,05 1,94 15 984,9 39,43 14,25 8,66 6,43 5,27 4,57 4,10 3,77 3,52 3,33 3,18 3,05 2,95 2,86 2,79 2,72 2,67 2,62 2,57 2,53 2,50 2,'47 2,44 2,41 2,39 2,36 ' 2,34 2,32 2,31 2,18 2,06 1,94 1,83 20 993,1 39.45 14,17 8,56 6,33 5,17 4,47 4,00 3,67 3,42 3,23 3,07 2,95 2,84 2,76 2,68 2,62 2,56 2,51 2,46 2,42 2,39 2,36 2,33 2,30 2,28 2,25 2,23 2,21 2,20 2,07 1,94 1,82 1,71 24 997,2 39,46 14,12 8,51 6,28 5,12 4,42 3,95 3,61 3,37 3,17 3,02 2,89 2,79 2,70 2,63 2,56 2,50 2,45 2.41 2,37 2,33 2,30 2.27 2,24 2,22 2,19 2,17 2,15 2,14 2,01 1,88 1,76 1,64 30 1001 39,46 14,08 8,46 6,23 5,07 4,36 3,89 3,56 3,31 3,12 2,96 2,84 2,73 2,64 2.57 2,50 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,18 2,16 2,13 2,11 2.09 2,07 1,94 1,82 1,69 1,57 40 1006 39,47 14,04 8,41 6,18 5,01 4,31 3,84 3,51 3,26 3,06 2,91 2,78 2,67 2,59 2,51 2,44 2,38 2,33 2,29 2,25 2,21 2,18 2,15 2,12 2,09 2,07 2,05 2,03 2,01 1,88 1,74 1,61 1,48 60 1010 39,48 13,99 8,36 6,12 4,96 4,25 3,78 3,45 3,20 3,00 2,85 2,72 2,61 2,52 2,45 2,38 2,32 2,27 2,22 2,18 2,14 2,11 2,08 2,05 2,03 2,00 1,98 1,96 1,94 1,80 1,67 1,53 1,39 120 1014 39,49 13,95 8,31 6,07 4,90 4,20 3,73 3,39 3,14 2,94 2,79 2,66 2,55 2,46 2,38 2,32 2,26 2,20 2,16 2,11 2,08 2,04 2,01 1,98 1,95 1,93 1,91 1,89 1,87 1,72 1,58 1,43 1,27 СО 1018 39,50 13,90 8,26 6,02 4,85 4,14 3,67 3,33 3,08 2,88 2,72 2,60 2,49 2,40 2,32 2,25 2,19 2,13 2,09 2,04 2,00 1,97 1,94 1,91 1,88 1,85 1,83 1,81 1,79 1,64 1,48 1,31 1,00 361
Продолжение прилож. Ill 0,01; v,, к si' Степей боды з нателя v2 1 2 3 4 5 6 7 Степени 8 свободы 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 4052 98,50 34,12 21,20 16.26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,18 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,08 6,85 6,63 4999,5 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 4,98 4,79 4,61 5403 99,17 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5.29 5,18 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4.60 4,57 4,54 4,51 4,31 4,13 3,95 3,78 5625 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,65 3,48 3,32 5764 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,51 3,34 3,17 3,02 5859 99,33 ' 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3.53 3,50 3,47 3,29 3,12 2.96 2,80 5928 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,42 3,39 3,36 3,33 3,30 3,12 2.95 2,79 2,64 5982 99,37 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4Л4 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,82 2,66 2,51 6022 99,39 27,35 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,18 3,15 3,12 3,09 3,07 2,89 2,72 2,56 2,41 362 числителя 10 12 15 20 24 30 40 60 120 6056 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3.31 3,26 3,21 3.17 3,13 3,09 3,06 3,03 3,00 2,98 2,80 2.63 2,47 2,32 6106 99,42 27,05 14,37 9,89 7,72 6,47 Б.67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,96 2,93 2,90 2,87 2,84 2,66 2,50 2,34 2,18 6157 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,81 2.78 2,75 2,73 2,70 2,52 2,35 2,19 2,04 6209 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2.78 2,74 2,70 2,66 2,63 2.60 2,57 2,55 2,37 2,20 2,03 1,88 6235 99,46 26,00 13,93 9,47 7,31 6,07 5,28 4.73 4,33 4,02 3.78 3.59 3,43 3,29 3,18 3.08 3,00 2,92 2,86 2,80 2,75 2,70 2,66 2,62 2,58 2.55 2.52 2,49 2,47 2,29 2,12 1,95 1,79 6261 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2.78 2,72 2,67 2,62 2,58 2,54 2,50 2,47 2,44 2,41 2,39 2,20 2,03 1,86 1,70 6287 99,47 26,41 13,75 9,29 7.14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2.69 2,64 2,58 2,54 2,49 2,45 2,42 2,38 2,35 2.33 2,30 2,11 1,94 1,76 1,59 6313 99,48 26,32 13,65 9,20 7,06 5,82 5,03 4,48 4,08 3,78 3,54 3,34 3,18 3,05 2,93 2,83 2,75 2,67 2,61 2,55 2,50 2,45 2,40 2,36 2,33 2,29 2,26 2,23 2,21 2,02 1,84 1,66 1,47 6339 99,49 26,22 13,56 9,11 6,97 5,74 4,95 4,40 4,00 3,69 3,45 3,25 3,09 2,96 2,84 2,75 2,66 2,58 2,52 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,17 2,14 2,11 1,92 1,73 1,53 1,32 6366 .99,50 26,13 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,17 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,60 1,38 1,00 363
wgogogo пнаиэшэ=Ч'к1/аштэпн /чдоцода ¦/? ? z /-• >- ? Z аохнэффе хмнивь/Сь-э qiraffow олонноиэйэиэиН Birtf инихэиAэхнвAвх Al ОООСЛО СП^СОЮ— СП 4^ 00 Ю ^~ ,0^0 ^OJD О О jC> ООООО ООООО ООООО "Sfofofo §§§§§ §g§iS ^si^fei рр ррррр оорор ороро ,_.-._КЭКЭ КЭ КЭ КЭ КЭ КЭ сл елелелелст) cdcdcdcdcd оэ —j —] оо кэ оооососоо о — кэ со сл —з — - О X е % ж о оо ооооо оррор ооооо ооооо С^О h^^ f^^ f^^ f^^ f^^ ^^^ pn o — (o*- юю oooo^SS cpScpcocp cpScopo о-гкэ*. СЛ CD SOOtDO" K3CO4^enCD ~J00COK34^. 00 4*. 4^. СЛ О X оо ооооо оopop ооооо opооо ЪтЪт ЪтЪтЪтЪтЪ! 'ел'Сл'слЪтЪ! Ъ^ЪгЪт^Ъ! ЪтЪтЪлЪ^*--! '"'" --'--- со СО СОСОСОСО4^- 4^4^4^.4^ел елО500^-КЭ ^^СО СП —^ 00 СО О K3COCDCOCO COCOi+^"^"^J ел ел cd cd --^ "-^ оо о en кэ ~q соооел ) КЭ КЭ КЭ КЭ КЭ КЭ >— кэ г- - — ^ )СЛ —< КЗ КЭ КЗ КЗ CD CDCD CD CD СТЗ -vj ->^ —^ —^ —1 —^ —3 00000000СО О1—'СОСОСО 4^СЛ —J 00 СО О КЭ СЛ CD —] 00 СО ^~СОСНСО4^ |—'СОСЛКЭ^— елоо ^-4^-^ооел co^-^-*k3Cd сосооелсо елкэсоо4^ _~ — JO JO JOJOJO КЭ КЭ КЭ КЭ КЭ _КЭ КЭ КЭ КЗ КЗ ^о'со "о~о^э"с 500 ОЮ»1 >О О— КЭ с > о — — »-»- кэ ) 00 СО 4^. СП -1 О > CD КЭ СЛ О СО — 3 КЭ Э CD э кэ №$ 2388^ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ КЭ . _ . _._-. ----. С0СО4»О5СЛ >сососо4ь. 4^елелслсл cncn-jooco "_"j^." ". ЭКЭСТ)ООКЭ СО ^~ СО CD СО "*.^лл/-л.^^^ ^—»t^^— I зсооелсо оосоосо IggSg gjo-soo. КЭ КЭ КЭКЭКЭ КЭКЭ КЭКЭСОСОСО —1^— CDOCn004^- 4^S •—СЛО О) Z -] оспо-^ел -g -q кэ сл cd сое CD ^4» *. ел cojio ocoo"tocn СО О*». КЭ СП КЭ 4» — СЛ КЭ КЭ КЭКЭСОСОСО СО СО СО СО СО 0ОСОСО4^4» <оЪоо"«- lo'co'coVcn сл'сп'ооЪсо .*"¦ ^"J^1 ."*-.¦ ss?oso! оркэг^кэо оо "- — — ~-1 со *-j сл оо кэ-ч кэ о Оо со со кэ — *-лел4^осо СЛ —SOOCO СПСПСОООО —ОСОСО--1 -ЗсОСЛ(О СО 00 СО
Вероятность принятия гипотезы Вероятность принятия гипотезы I ¦о Вероятность принятия гипотезы Вероятность принятия гипотезы ж 8?
Продолжение прилож. IV 1 2 <Р(для cl=Oj Ф(для а = 005) 2 3 Приложение V Оперативные характеристики для дисперсионного анализа, модель случайных эффектов 020 \\- \I Л — vh \\- 1 ~г~ —< 3 ^1 20' Г" г=—г ш 7*- щ щ С —у 8 т '/о т т »2 as i Ш 10 30 50 70 Х(дпн<1=0/I)-ЧО 30 50 90 70 110 130 150 ПО 190»Х(дляы.-0Л5) SO 110 130 150 ПО 190 °-°1 3 5 7 \(дляа.=0,01)~1 3 9 5 13 15 17 9 11 13 19 21 23-~-К( .5) 15 11 19 21 23 25 369
со о Вероятность принятия гипотезы 9> Сэ ОЭОй? N> Вероятность принятия гипотезы Si I Вероятность принятия гипотезы Вероятность принятия гипотезы 3 I я то ¦§ к ^
OS to Вероятность принятия гипотезы.. ' Вероятность принятия гипотезы сэ I г N>O3 я 5^5 I ft 0 сэ \N I О — Л л *-• *-" -"¦- ^ **• % )\ о \ N \ H \ i ^. ^> ^> g \ о- \ <•• •"' -•' " .«с 1 т ( 1 \ Оо р ^ II >.^ я к 8 озч~ / щ -^ ^^ 1 i 1 у^ 1 t it \ \ 1 s \ \ \ \ 1 \ ^ \ > I \ ^^ » а Ш f Приложение VI Значимые размахи для множественного критерия размахов Дункана Г0,01 (Р. /) 373 г* 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 30 40 60 100 оо 2 90,0 14,0 8,26 6,51 5,70 5,24 4,95 4,74 4,60 4,48 4,39 4,32 4,26 4,21 4,17 4,13 4,10 4,07 4,05 4,02 3,89 3,82 3,76 3,71 3,64 3 90,0 14,0 8,5 6,8 5,96 5,51 5,22 5,00 4,86 4,73 4,63 4,55 4,48 4,42 4,37 4,34 4,30 4,27 4,24 4,22 4,06 3,99 3,92 3,86 3,80 * / — степени свободы. 4 90,0 14,0 8,6 6,9 6,11 5,65 5,37 5,14 4,99 4.88 4,77 4,68 4,62 4,55 4,50 4,45 4,41 4,38 4,35 4,33 4,16 4,10 4,03 3,98 3,90 5 90,0 14,0 8,7 7,0 6,18 5,73 5,45 5,23 5,08 4,96 4,86 4,76 4,69 4,63 4,58 4,54 4,50 4,46 4,43 4,40 4,22 4,17 4,12 4,06 3,98 6 90,0 14,0 8,8 7,1 6,26 5,81 5,53 . 5,32 5,17 5,06 4,94 4,84 4,74 4,70 4,64 4,60 4,56 4,53 4,50 4,47 4,32 4,24 4,17 4,11 4,04 f 7 90,0 14,0 8,9 7,1 6,33 5,88 5,61 5,40 5,25 5,13 5,01 4,92 4,84 4,78 4.72 4,67 4,63 4,59 4,56 4,53 4,36 4,30 4,23 4,17 4,09 8 90,0 14,0 8,9 7,2 6,40 5,95 5,69 5,47 5,32 5,20 5,06 4,96 4,88 4,83 4,77 4,72 4,68 4,64 4,61 4,58 4,41 4,34 4,27 4,21 4,14 9 90,0 14,0 9,0 7,2 6,44 6,00 5,73 5,51 5,36 5,24 5,12 5,02 4,94 4,87 4,81 4,76 4,73 4,68 4,64 4,61 4,45 4,37 4,31 4,25 4,17 10 90,0 14,0 9,0 7,3 6,5 6,0 5,8 5,5 5,4 5,28 5,15 5,07 4,98 4,91 4,84 4,79 4,75 4,71 4,67 4,65 4,48 4,41 4,34 4,29 4,20 20 90,0 14,0 9,3 7,5 6,8 6,3 6,0 5,8 5,7 5,55 5,39 5,26 5,15 5,07 5,00 4,94 4,89 4,85 4,82 4,79 4,65 4,59 4,53 4,48 4,41 50 90,0 14,0 9,3 7,5 6,8 6,3 6,0 5,8 5,7 5,55 5,39 5,26 5,15 5,07 5,00 4,94 4,89 4,85 4,82 4,79 4,71 4,69 4,66 4,64 4,60 100 90,0 14,0 9,3 7,5 6,8 6,3 6,0 5,8 5,7 5,55 5,39 5,26 5<15 5,07 5,00 4,94 4,89 4,85 4,82 4,79 4,71 4,69 4,66 4,65 4,68
g о о о 00 со ¦о СО сч - og 00 СС СП о о оо tc og со to Oi о о 00 СО og оо to ф оо to оо" to" Oi о о 00 CD о о оо to og 00 CD og CO CD о о oo to о см со 1Л О 00 -* -* CO Л О 00 ¦* ¦* rt О СЧ ГО Ю О 00 ¦* -* СО ю о со "* "* СО о см сз Й О 00 ^. ^. СО ¦* * СЧ о см со ю о оо ^« ^. сз Ю О 00 ¦^ -* сз SSS тр 4j« СО о см о> 1Л О t-» ¦* ^ со О н ^« 1Л О t^ -* тр CO о со -* Щ CD w TJ" СО СЗ СО -^ 1Л to CD u СЧ 00 ю ¦* СО СО СО СО СО со со С" 00 "^ tO сз со сз to to и: СО СО СО 00 — СО tO tO 1Я со сз со 00 — СО tO tO U5 СО СО СО 00 — СО со сз со to to иэ СО СО СО 00 00 СМ to 25 1Я СО СЗ СО ¦tf ^ b- «Ь in -* СО СО СО S3 ^* со СО СО СО « 88 СО СО СО to i-- оо S3 5 СО СО СЧ 00 1Я -*- со со СМ N. СО СО сч t^ со сз сч ь- 1Л "Ф СО СО СЧ К СО СО г« сз со 5 3 СО СО СО СО СО СО СО СО О U5 сч —¦ СО СО - t- . ь- со со сз со со % е- 9 с to СО to СО сз СО сз СО 8 СО я СО сч со СО - р- с to сз СО ^" СО сч сз о СО 8 СО СО сз СО СО сч СО о СО см n  N. СО СО СЗ $ с- ш с СО гм СО СО s СО я СО о СО СО сч СО S СО СО г. с^ -ф СО см СО со СО СО СО СО сз сч СО 00 СО 2 СО со СО СО см СО о СО S сз 36 СО 31 СО сч СО to со о сз  со с- г*. СО СО со сз СО СО Й СО СО о со со а сз со о о со to 47 со 47 СО сч СО о СО 0П СО сз 8 СО сз сз СО . сз сч сч СО СО СО сч ¦>. f- с- СО N. СО СО О1 СО г* со я СО ом со t-. см СО СО см СО & см СО СО * !? СО СО N. (^ СО СО „о СО СО О1 00 СО СО СО СО СО СО СО СЗ СО СО —. о СЗ СО со сз tO 1Л сч сч СО СО Oi 00 СО СО — о сз со ,D 1Л сч сч N. СО 47 СО сз S3 сз ю сз СО со 8 СО о сч СО см сз в со о> 00 сч S3 СО СО N> ОС СЗ СО СО СО 1Л СО сз сз СО СО СО — СО СО О 00 СО СО сч сч СО СО as со сз N. *. СЗ СО О 00 —• о СЗ СО -- 00 "О СЧ О СО в 00 *¦) СЧ с 1Г со 47 СО СО СП СО tn сч СО сч сч сз 00 сз см СО СО 1Й сч i м о о о о 67 со to CO N. СО а сз 8 СО СО сч СО О) СО ю со S сз а со сч см 8 374 I I о. о ^. 3 со 3 5 1) I ¦в" II ? СО II С II с II с со [1 II S а. аГ аГ аГ а. аГ а? аГ аГ аГ аГ аГ аГ аГ аГ аГ . аГ а7 _ 1 i со 7 ю со 1 1 7 ю ю _, см о со 1 1 _^ ^^ 1 со - 1 •*¦ 1 - о см 1 ю со 7 со ¦* 1 см 7 7 со 7 1 1 см 1 о сч ю ю 1 1 — - со _ 1 о 7 см •*¦ •*¦ 7 со о см о 7 7 - ( го -20 о со о 7 о о см 7 7 •*¦ с - 1 ' со ю _ 7 со ш 1 7 7 го | ^^ СО . ¦* — 1 1 t^ со 1 7 о ш см со — ш ю ю * Ш CO N- 924 00 ю CD ¦* 00 00 сч 252 00 сч 180 00 о , о о ¦* о о см о см CD сч •к N. о CD ^- 1 § N. | СЧ ~|CD —' сч о N-ICM ю | со со | см см 8IS m СО - о СО — см со 375
OOtNNWOO —. СМ —< -н ^ - со со - — m re •- *—t .-Л, CO Ю C*- Oi о. «о о. о. I t— CM — О i- CM CM -T COt-»NOSOO „ , - см - I 111 7 О ^ <N CO t-. — со ю 10 i— ю со i— I I I I со .— — со ю s со CM CO о 00 Ci со со 00 00 со _. I о I" ¦* CM -2 = s — о — (О УКАЗАТЕЛЬ ЛИТЕРАТУРЫ 1. Anderson V. L. and McLean R. A. Design of Experiments: A Realistic Approach. Marcel Dekker Inc., New York, 1974. 2. Anscombe F. J. Rejection of Outliers.— Technometrics, Vol. 2, 1960, p. 123—147. 3. Anscombe F. J. and Tukey J. W. The Examination and Analysis of Re- Residuals.—Technometrics, Vol. 5, 1963, p. 141—160. 4. Bartlett M. S. The Use of Transformations,—Biometrics, Vol. 3, 1947, p. 39—52. 5. Bennett С A. and Franklin N. L. Statistical Analysis in Chemistry and the Chemical Industry. Wiley, New York, 1954. 6. Bose R. C. and Shimamoto T. Classification and Analysis of Partially Balanced Incomplete Block Designs with Two Associate Classes.— Journal of the American Statistical Association, Vol. 47, 1952, p. 151—184. 7. Rose R. C, Clatworthy W. H. and Shirkhande S. S. Tables of Partially Balanced Designs With Two Associate Classes. Technical Bulletin. N 107, North Carolina Agricultural Experiment Station, 1954. 8. Bowker A. H. and Lieberman G. J. Engineering Statistics. 2nd Edition Prentice-Hall, Englewood Cliffs, N. J., 1972. 9. Box G. E. P. and Wilson K. G. On the Experimental Attainment of Optimum Conditions.—Journal of the Royal Statistical Society, B, Vol. 13, 1951, p. 1—45. 10. Box G. E. P. Some Theorems on Quadratic Forms Applied in the Study of Analysis of Variance Problems: I. Effect of Inequality of Variance in the One-Way Classification.—Annals of Mathematical Statistics, Vol. 25, 1954a, p. 290—302. 11. Box G. E. P. Some Theorems on Quadratic Forms Applied in the Study of Analysis of Variance Problems: II. Effect of Inequality of Variance and of Correlation of Errors in the Two-Way Classification.—Annals of Mathe- Mathematical Statistics, Vol. 25, 1954b, p. 484—498. 12. Box G. E. P. Evolutionary Operation: A Method for Increasing Indu- Industrial Productivity.—Applied Statistics, Vol. 6, 1957, p. 81—101. 13. Box G. E. P. and Hunter J. S. Multifactor Experimental Designs for Exploring Response Surf aces.—Annals of Mathematical Statistics, Vol. 28, 1957, p. 195—242. 14. Box G. E. P. and Hunter J. S. The 2*-? Fractional Factorial Designs, Part I.—Technometrics, Vol. 3, 1961a, p. 311—352. 15. Box G. E. P. and Hunter J. S. The 2*-* Fractional Factorial Designs, Part П.— Technometrics, Vol. 3, 1961b, p. 449—458. 16. Box G. E. P. and Cox D. R. An Analysis of Transformations. Journal of the Royal Statistical Society, B, Vol. 26, 1964, p. 211—243. 17. Box G. E. P. and Draper N. R. Evolutionary Operation. Wiley, New York, 1969. 18. Carmer S. G. and Swanson M. R. Evaluation of Ten Pairwise Multi- Multiple Comparison Procedures by Monte Carlo Methods.—Journal of the Ame- American Statistical Association, Vol. 68, N 314, 1973, p. 66—74. 19. Cochran W. G. Some Consequences When the Assumptions for the Ana- Analysis of Variance are not Satisfied.—Biometrics, Vol. 3, 1947, p. 22—38. 377
20. Cochran W. G. Analysis of Covariance: Its Nature and Uses.— Bio- Biometrics, Vol. 13, N 3, 1957, p. 261—281. 21. Cochran W. G. and Cox G. M. Experimental Designs. 2nd Edition. Wiley, New York, 1957. 22. Connor W. S. and Zelen M. Fractional Factorial Experimental De- Designs for Factors at Three Levels. National Bureau of Standards, Washington, D. С Applied Mathematics Series, ,N 54, 1959. 23. Daniel С Use of Half —Normal Plots in Interpreting Factorial Two Level Experiments.—Technometrici Vol. 1, 1959, p. 311—342. 24. Davies O. L. Desiga_afra Analysis of Industrial Experiments. 2nd Edition. Hafner Publishing Company, New York, 1956. 25. Dolby J. L. A Quick Method for Choosing a Transformation.— Techno- metrics, Vol. 5, 1963, p. 317—326. 26. Draper N. R. and Smith H. Applied Regression Analysis. Wiley, New York, 1966. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Пер. с англ. Под ред. Ю. П. Адлера, В. Г. Горского. М., Статистика, 1973. 27. Draper N. R. and Hunter W. G. Transformations: Some Examples Revisited.—Technometrics, Vol. 11, 1969, p. 23—40. 28. Duncan A. J. Quality Control and Industrial Statistics. 4th Edition: Richard D. Irwin, Inc., Homewood, III, 1974. 29. Duncan D. B. Multiple Range and Multiple F Tests. Biometrics, Vol. 11, 1955, p. 1—42. 30. Eisenhardt С The Assumptions Underlying the Analysis of Vari- Variance.— Biometrics, Vol. 3, 1947, p. 1—21. 31. Federer W. T. Variance and Covariance Analysis for Unbalanced Classifications — Biometrics, Vol. 13, 1957, p. 333—362. 32. Fisher R. A. and Yates F. Statistical Tables for Biological, Agricul- Agricultural, and Medical Research. 4th Edition Oliver and Boyd, Edinburgh, 1953. 33. Fisher R. A. Statistical Methods for Research Workers. 13th Edition. Oliver and Boyd, Edinburgh, 1958. Фишер Р. А. Статистические методы для исследователей. Пер. е англ. В. Н. Перегудова. М., Госстатиздат, 1958. 34. Fisher R. A. The Design of Experiments. 8th Edition. Hafner Publi- Publishing Company, New York, 1966. 35. Gaylor D. W. and Hartwell T. D. Expected Mean Squares for Nested Classifications.—Biometrics, Vol. 25, 1969, p. 427—430. 36. Gaylor D. W. and Hopper F. N. Estimating the Degrees of Freedom for Linear Combinations of Mean Squares by Satterthwaite's Formula.— Te- Technometrics, Vol. II, N 4, 1969, p. 69—706. 37. Good I. J. The Interaction Algorithm and Practical Fourier Analysis.— Journal of the Royal Statistical Society, B, Vol. 20, 1958, p. 361— 372. 38. Good I. J. Addendum to The Interaction Algorithm and Practical Fourier Analysis.—Journal of the Royal Statistical Society, B, Vol. 22, I960, p. 372—375. 39. Graybill F. A. An Introduction to Linear Statistical Models. Vol. 1. McGraw-Hill, New York, 1961. 40. Graybill F. A. and Weeks D. L. Combining Interblock and Intrablock Information in Balanced Incomplete Blocks.— Annals of Mathematical Sta- Statistics, Vol. 30, 1959, p. 799—805. 41. Hicks C. R. Fundamental Concepts in the Design of Experiments. 2nd Edition. Holt, Rinehart and Winston, New York, 1973. Хикс Ч. Основные принципы планирования эксперимента. Пер. с аигл. Под ред. В. В. Налимова. М., Мир, 1967. 42. Hines W. W. and Montgomery D. С. Probability and Statistics in En- Engineering and Management Science. The Ronald Press, New York, 1972. 43. Hocking R. R. A Discussion of the Two-Way Mixed Model.— The American Statistician, Vol. 27, N 4, 1973, p. 148—152. 378 44. Jopn P. W. M. The Three, Quarter Replicates of 24 and 25 De- Designs.—Biometrics, Vol. 17, 1961, p. 319—321. 45. John P. W. M. Three, Quarter Replicates of 2n Designs.—Biometrics, Vol. 18, 1962, p. 171—184. 46. John P, W. M. Blocking a 3B"-fc) Designs.—Technometrics, Vol. 6, 47. John P. W. M. Statistical Design and Analysis of Experiments. The MacMillan Company, New York, 1971. 48. Kempthorne O. The Design and Analysis of Experiments Wilev, New York, 1952. У 49. Keuls M. The Use of the Studentized Range in Connection with an Analysis of Variance.— Euphytica, Vol. 1, 1952, p. 112—122. 50. Margolin В. Н. Systematic Methods of Analyzing 2n3m Factorial Ex- Experiments with Applications.— Technometrics, Vol. 9, 1967, p. 245—260. 51. Margolin В. Н. Results on Factorial Designs of Resolution IV for the 2n and 2m Series.—Technometrics, Vol. 11, 1969, p. 431—444. 52. Miller R. G. Simultaneous Statistical Inference. McGraw-Hill, New York, 1966. i 53. Myers R. H. Response Surface Methodology. Allyn and Bacon, Inc, Boston, 1971. 54. Newman D. The Distribution of the Range in Samples from a Normal Population, Expressed in Terms of an Independent Estimate of Standard De- Deviation.— Biometrika, Vol. 31, 1939, p. 20—30. 55. Ostle B. Statistics in Research. 2nd Edition. Iowa State Press, Ames, Iowa, 1963. 56. Plackett R. L. and Burman J. P. The Design of Optimum Multifacto- rial Experiments.— Biometrika, Vol. 33, 1946, p. 305—325. 57. Rayner A. A. The square Summing Check on the Main Effects and Interactions in a 2n Experiment as Calculated by Yates' Algorithm.— Biome- Biometrics, Vol. 23, 1967, p. 571—573. 58. Satterthwaite F. E. An Approximate Distribution of Estimates of Va- Variance Components.—Biometrics Bull., Vol. 2, 1946, p. 110—112. 59. Scheffe H. A Method for Judging all Contrasts in the Analysis of Variance.—Biometrika, Vol. 40, 1953, p. 87—104. 60. Scheffe H. A'Mixed Model' for the Analysis of Variance.—Annals of Mathematical Statistics, Vol. 27, 1956a, p. 23—36. 61. Scheffe H. Alternative Models for the Analysis of Variance.— An- Annals of Mathematical Statistics, Vol. 27, 1956b, p. 251—271. 62. Scheffe H. The Analysis of Variance. Wiley, New York, 1959. Шеффе Г. Дисперсный анализ. Пер. с аигл. Б. А. Севастьянова и В. П. Чи- Чистякова. М., Физматгиз, 1963. 63. Searle S. R. Linear Models. Wiley, New York, 1971a. 64. Searle S. R. Topics in Variance Component Estimation. Biometrics, Vol. 27, 1971b, p. 1—76. 65. Searle S. R. and Fawcett R. F. Expected Mean Squares in Variance Component Models having Finite Populations. Biometrics, Vol. 26, 1970, p. 243—254. 66. Smith C. A. B. and Hartley H. O. Construction of Youden Squares.— Journal of the Royal Statistical Society, B, Vol. 10, 1948, p. 262—264. 67. Tukey J. W. One Degree of Freedom for Non-Additivity. Biometrics, Vol. 5, 1949a, p. 232—242. 68. Tukey J. W. The Problem of Multiple Comparisons.—Unpublished Notes, Princeton University, 1953, p. 396. 69. Winer B. J. Statistical Principles in Experimental Design. 2nd Edi- Edition. McGraw-Hill, New York, 1971. 70. Yates F. Design and Analysis of Factorial Experiments. Tech. Comm. No. 35, Imperial Bureau of Soil Sciences, London, 1937. 71. Yates F. The Recovery of Inlfidri*9HBw&$»&ion in Balanced Incom- Incomplete Block Designs,— Annals p. 317—325. 379
ОГЛАВЛЕНИЕ Предисловие . . -. Глава первая. Введение 1.1. Необходимость планирования экспериментов . . 1.2. Основные принципы планирования эксперимента 1.3. Исторический обзор 1.4. Пример планирования эксперимента Глава вторая. Основные понятия статистики 2.1. Введение ........ 2.2. Выбор н выборочные распределения 2.3. Оценивание 2.3.1. Точечное оценивание . 2.3.2. Интервальное оценивание . . ... 2.4. Проверка гипотез 2.4.1. Проверка гипотез относительно средних 2.4.2. Проверка гипотез относительно дисперсий 2.4.3. Вероятность ошибки II рода 2.5. Задачи Глава третья. Одиофакториые эксперименты 3.1. Введение 3.2. Однофакторный дисперсионный анализ (классификация по одному признаку) . 3.3. Модель постоянных эффектов *. . 3.3.1. Статистический анализ 3.3.2. Оценивание параметров модели 3.3.3. Несбалансированный случай 3.4. Сравнение отдельных средних по обработкам . : . . . 3.5. Модель случайных эффектов 3.6. Подбор кривой отклика при однофакторном анализе . . . 3.7. Мощность дисперсионного анализа 3.8. Отклонения от допущений, принятых в дисперсионном ана- анализе 3.9. Проверка равенства нескольких дисперсий 3.10. Регрессионный подход к дисперсионному анализу . . . 3.11. Задачи . . ¦. : . . : Глава четвертая. Рандомизированные блоки, латинские квадраты и связанные с ними планы 4.1. Рандомизированное полноблочное планирование 4.1.1. Статистический анализ . 4.1.2. Оценивание недостающих данных 5 6 6 7 10 .11 15 15 17 22 22 24 25 26 30 32 34 36 36 36 38 38 45 47 48 54 59 62 64 66 67 70 73 73 74 82 380 4.1.3. Оценивание параметров модели и общий регрессион- регрессионный критерий значимости 84 4.2. Латинские квадраты . ! 86 4.3. Греко-латинские квадраты . .... 93 4.4. Задачи . . , .96 Глава пятая. Неполноблочные планы 98 5.1. Введение 98 5.2. Сбалансированные неполноблочные планы . .... 99 5.2.1. Статистический анализ 100 5.2.2. МНК-оценивание параметров 105 5.3. Использовние информации между блоками в сбалансированном неполноблочном плане 106 5.4. Частично сбалансированные неполноблочные планы . . .110 5.5. Квадраты Юдена 113 5.6. Решетчатые планы 115 5.7. Задачи . . . . 117 Глава шестая. Введение в факторные эксперименты 118 6.1. Элементарные определения и принципы 118 6.2. Преимущества факторных экспериментов 120 6.3. Двухфакторный дисперсионный анализ (классификация по двум признакам) . . . . 121 6.3.1. Статистический анализ модели постоянных эффектов 6.3.2. Оценивание параметров модели 122 6.3.3. Мощность критерия 128 6.4. Случайные и смешанные модели 129 6.4.1. Модель случайных эффектов 130 6.4.2. Смешанные модели . 133 6.4.3. Мощность критерия при случайной и смешанной мо- моделях 138 6.5. Общий случай факторного эксперимента 138 6.6. Полиномиальные эффекты количественных факторов . . . 144 6.7. Одно наблюдение в ячейке 150 6.8. Задачи .153 Глава седьмая. Правила нахождения сумм квадратов и математи- математических ожиданий средних квадратов 156 7.1. Правила для сумм квадратов 157 7.2. Правила для математических ожиданий средних квадратов 159 7.3. Приближенные F-критерии 163 7.4. Задачи 168 Глава восьмая. Факторные планы типов 2* и 3* 168 8.1. Введение 168 8.2. Анализ факторного плана типа 2* 169 8.2.1. План 22 , 169 8.2.2. План 23 174 8.2.3. Общий случай плана типа 2* 178 8.2.4. Единственная реплика плана типа 2* 180 8.2.5. Алгоритм Иейтса для плана типа 2* 185 8.3. Анализ факторного плана типа 3* 186 8.3.1. Обозначения для планов типа 3* ....... 186 8.3.2.. План З2 186 8.3.3. План З3 190 8.3.4. Общий случай плана типа 3* 193 8.3.5. Алгоритм Иейтса для плана типа 3* 195 8.4. Задачи 197 Глава девятая. Смешивание 200 381
9.1. Введение 200 9.2. Смешивание в факторном плане типа 2* 200 9.2.1. План факторного эксперимента типа 2к в двух бло- блоках 200 9.2.2. План факторного эксперимента типа 2* в четырех блоках . . 206 9.2.3. План факторного эксперимента типа 2к в 2? блоках 208 9.3 Смешивание в факторном плане типа 3* 209 9.3.1. План факторного эксперимента типа Зк в трех бло- блоках 209 9.3.2. План факторного эксперимента типа 3* в девяти 'блоках . . . . 213 9.3.3. План факторного эксперимента типа 3* в Зр блоках 215 9.4. Частичное смешивание 215 9.5. Другие системы смешивания 219 9.6. Задачи 221 Глава десятая. Дробные реплики 221 10.1. Введение 221 10.2. Дробные реплики факторного плана типа 2* 222 10.2.1. Полуреплика плана типа 2* 222 10.2.2. Четвертьреплика плана типа 2* 227 10.2.3. Общий случай дробного факторного плана типа 2к~р 230 10.3. Частные типы дробных факторных планов 2h~* 231 10.3.1. Планы типа 2к~р с разрешающей способностью III 233 10.3.2. Планы разрешающей способности IV и V . . . 240 10.4. Дробные реплики факторного плана типа Зк 241 10.4.1. Третьреплика плана типа 3* . : : : 242 10.4.2. Другие дробные факторные планы типа Зк~Р . . 244 10.5. Задачи 245 Глава одиннадцатая. Гнездовые, или иерархические, планы . . 247 11.1. Введение -247 11.2. Анализ гнездовых планов 248 11.3. Общий случай m-ступенчатого гнездового плана .... 255 11.4. Планы с группированными и пересекающимися факторами 257 11.5. Задачи 261 Глава двенадцатая. Миогофакториые эксперименты с ограниче- ограничениями на рандомизацию 263 12.1. Рандомизированные блоки и латинские квадраты как мно- многофакторные планы 264 12.2. План с расщепленными делянками 270 12.3. План с дважды расщепленными делянками 276 12.4. Задачи 280 Глава тринадцатая. Регрессионный анализ 281 13.1. Введение 281 13.2. Простая линейная регрессия 282 13.3. Проверка гипотез при использовании простой линейной ре- регрессии 288 13.4. Интервальное оценивание при простой линейной регрессии 291 13.5. Множественная линейная регрессия 294 13.6. Проверка гипотез при использовании множественной линей- линейной регрессии 301 13.7. Другие модели линейной регрессии 306 13.8. Исследование уравнения регрессии 309 13.8.1. Анализ остатков 309 13.8.2. Проверка качества подбора 310 13.8.3. Множественный коэффициент детерминации . . . 313 13.9. Задачи 313 382 Глава четырнадцатая. Методология поверхности 14.1. Введение 14.2. Метод крутого восхождения 14.3. Анализ моделей второго порядка 14.4. Планы для изучения поверхности отклика 14.4.1. Планы для подбора модели 14.4.2. Планы для подбора модели 14.5. Эволюционное планирование 14.6. Задачи отклика первого второго порядка порядка Глава пяти адцатая. Ковариационный анализ 15.1. Введение 15.2. Однофакторный анализ с одной сопутствующей переменной 15.3. Другие ковариационные модели 15.4. Задачи Приложения ¦ Указатель литературы 316 316 318 321 328 328 329 332 338 341 341 341 350 352 377