Текст
                    С.Л.Ахназарова
В.В.Кафаров
Методы
оптимизации
эксперимента
в химической
технологии
учебное пособие
для студентов
химико-техно погическ и х
специальностей вузов


С.Л.Ахназарова В.В.Кафаров Методы оптимизации эксперимента в химической технологии ИЗДАНИЕ 2-е, ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов химико-технологических специальностей высших учебных заведений Москва «Высшая школа» 1985
ББК. 24.1 + 35 А 95 УДК 54:66.01 Рецензент; доц. Евикеев III. К. (Казанский химико-технологиче- ский институт им. С. М. Кирова) Ахназарова С. Л., Кафаров В. В. А95 Методы оптимизации эксперимента в химической техно- логии: Учеб, пособие для хим.-технол. спец, вузов.— 2-е изд., перераб. и доп. — М.: Высш, шк., 1985.-327 с., ил. В пер.: 1 р. 20к. Учебное пособие посвящено статистическим методам оптимизации эксперимен- тальных исследований в химии и химической технологии. Излагаются способы определения параметров законов распределения, проверки статистических гипотез, методы дисперсионного, корреляционного и регрессионного анализов и фланирования экстремального эксперимента. В отличие от предыдущего издания (1978) несколько изменено название, расширены примеры использования рассматриваемых методов, переработан и дополнен раздел, посвященный корреляционному и регрессионному анализу, рассмотрены методы планирования промышленных экспериментов. 4 1502000000—086 ае А----------------- 56—85 001(01)—85 ББК.24.1 4- 35 540 + 6П7 © Издательство «Высшая школа», 1978 © Издательство «Высшая школа», 1985, с изменениями
ПРЕДИСЛОВИЕ Методы оптимизации экспериментальных исследований за прошед- шие годы получили дальнейшее развитие и стали одним из ведущих курсов при подготовке специалистов в области кибернетики, модели- рования и вычислительной техники. Интерес к науке об эксперименте связан с широкими масштаба- ми экспериментальных исследований и значительным экономическим эффектом от оптимальной организации эксперимента. В связи с важностью практического применения методов опти- мального эксперимента в новом издании расширены примеры конкрет- ного использования рассматриваемых методов в тех отраслях хими- ческой технологии, где экспериментально-статистическое моделиро- вание является мощным средством для повышения эффективности эксперимента. В гл. I включен раздел, посвященный системе двух случайных величин, в гл. IV—раздел, посвященный методу группового учета аргументов, методу главных компонент; в гл. V даны методы планирования промышленных экспериментов. В книгу внесен ряд исправлений и уточнений в связи с изда- нием ее на английском и польском языках. Авторы выражают глубокую признательность рецензентам и всем читателям, замечания которых по первому изданию способствовали улучшению содержания книги. Авторы
ВВЕДЕНИЕ Для реализации решений XXVI съезда КПСС и июньского (1983 г.) Пленума ЦК КПСС по повышению эффективности научных исследований в химии и химической технологии необходимо макси- мальное сокращение сроков перехода от лабораторных исследований к промышленной реализации. Методы кибернетики позволяют не только сократить этот путь, но и резко уменьшить число необхо- димых опытов, быстро выявить оптимальный вариант осуществления процесса. Использование методов кибернетики и вычислительной техники изменяет старые традиционные методы проведения экспери- мента—от ручного управления, контроля, сбора и обработки информа- ции дает возможность перейти к диалоговой системе: эксперимента- тор — электронная управляющая машина. Система автоматизированного эксперимента включает в себя следующие элементы: экспериментальное оборудование, измеритель- ное оборудование, методики планирования, проведения и обработки результатов эксперимента. В системе автоматизированного эксперимента экспериментатор выполняет следующие функции: 1) введение исходной информации для проведения экспериментов; 2) введение априорных директив для выполнения этапов экспериментирования; 3) внесение изменений в ходе процесса экспериментирования; 4) контроль правильности хода процесса; 5) контроль достоверности получаемой количествен- ной информации. Многогранность изучаемых явлений, сложность и высокая стои- мость оборудования, острая нехватка времени—все это вынуждает исследователя продумывать план предстоящих экспериментов. Экспе- римент становится объектом изучения, объектом оптимизации. Оптимальный эксперимент—это путь к экономии времени и средств, увеличению надежности и достоверности результатов. Вопрос об оптимальности эксперимента тесно связан с предлагае- мой (или предполагаемой) исследователем математической моделью объекта. Процедура построения математической модели во многом зависит от ее целевого назначения, свойств объекта, от количества и качества имеющейся информации. Наличие достаточной информации о механизме процесса позволяет составить детерминированную мате- матическую модель процесса. Детерминированную математическую модель составляют на основе теоретического анализа физико-химиче- ских процессов, происходящих в объекте. При выводе уравнений 4
х, 1L Рис. 1. Схема объекта У? Ут z/r математических моделей технологи- ческих процессов учитывают гидро- динамические режимы перемещения ве- ществ, скорости химических реакций, диффузии, теплопередачи и т. д., мате- риальный и тепловой балансы, фазовые превращения. Все это требует углублен- ного изучения объекта моделирования. Современная химическая промышленность выпускает несколько десятков тысяч'наименований продуктов. В лабораториях разрабатываются сотни новых технологических процессов. Ставить задачу изучения механизма протекания всех этих процессов нереально, между тем зада- чу оптимизации и управления этими процессами решать необходимо. Для этих целей успешно применяются экспериментально-статисти- ческие методы, с помощью которых составляют математическую мо- дель, при неизвестном механизме протекающих в объекте процес- сов, изучая зависимость отклика системы на изменения входов. На рис. 1 xv...,xk~ входные измеряемые и регулируемые параметры объекта; — неконтролируемые, случайным образом изменяющие- ся параметры, «шум» объекта; уь..., ут— выходные параметры. В ка- честве случайных рассматриваются обычно параметры, которые по тем или иным причинам невозможно (или очень трудно) учесть, напрймер, падение активности катализатора, изменение состояния поверхности теплообменной аппаратуры, колебания наружной темпе- ратуры воздуха и т. п. Комплекс параметров xt,...,xk называют основ- ным, он определяет условия эксперимента. Такое подразделение входных параметров на основные и случайные условно. Случайным будет любой параметр, не вошедший в основной комплекс входных параметров, даже если он хорошо изучен. В зависимости от поста- новки задачи и технических возможностей некоторые измеряемые параметры относят к «шуму» объекта. Однако при этом уменьшается точность математической модели. В качестве выходных величин рас- сматривают любые технологические или экономические показатели процесса. Математической моделью объекта служит функция отклика, связывающая выходной параметр, характеризующий результаты экспе- римента, с переменными, которые варьируют при проведении опытов: </ = tf(Xi, х2, хк). (1) Принято называть независимые переменные х2,...,хк факторами, пространство с координатами хр х2,...,хк — факторным пространством, а геометрическое изображение функции отклика в факторном простран- стве — поверхностью отклика. При использовании статистических методов математическая мо- дель статики процесса часто представляется в виде полинома: отрезка ряда Тейлора, в который разлагается неизвестная функция (1): А А А = S ^ujXaXj+ +..., (2) j=i и, j=i /=i «¥=/ 5
где dxj ач(О) . я _ d^(Q) Uj^ дхидх} ' 2д^- " J ! Результат эксперимента на сложном объекте обычно есть вели- чина случайная. Существует много причин, приводящих к тому, что результаты наблюдения и измерения, сделанные в экспериментах, оказываются случайными величинами. Иногда случайность предопре- деляется самой физической сущностью явлений: процессы происходят на молекулярном или атомном уровнях, а измеряются макроскопи- ческими приборами. Неучтенные факторы, «шум» объекта также при- водят к тому, что в результате повторных измерений в большинстве реальных экспериментов получаются отличающиеся друг от друга значения измеряемых величин. Поэтому при обработке и анализе экспериментальных данных используют методы математической статистики. Так, для полиномиальной модели (2) получают так называемые выборочные коэффициенты регрессии b0, b,. bui, Ьп, являющиеся оценками теоретических коэффициентов 0О, р , , р/;. Уравнение регрессии, полученное на основании экспериментальных данных, запишется следующим образом: k k k У = b0 + у, bjXj + У buj хи Xj + У bjj xj + /=1 и, i=l j = \ k + У b[uj Xi Xj xu + ..., (3) где b0 — свободный член уравнения регрессии; Ь,— линейные эффек- ты,/ = 1,2,...Л; Ьп - квадратичные эффекты; Ьи/ - эффекты парного взаимо- действия; Ьиц — эффекты тройного взаимодействия. С познавательной точки зрения полиномиальная (регрессионная) модель не представляет особого интереса. Зная оценки коэффициен- тов отрезка ряда Тейлора, нельзя восстановить исходную функцию, аналитическое выражение которой остается неизвестным исследовате- лю, и, следовательно, невозможно получить информацию о механиз- ме процесса. Полиномиальные модели справедливы только для объекта, на котором проводился эксперимент. В практическом отноше- нии полиномиальные модели очень полезны и широко используют- ся при решении задач оптимизации и управления химико-техноло- гическими процессами. Следует также иметь в виду при применении экспериментально- статистических методов, что в ряде случаев экспериментатор распола- гает определенной априорной информацией о физической сущности исследуемого процесса, пользуясь которой можно получить представле- ние о структуре модели. Эффективность экспериментов в большой степени зависит от ме- тодов их проведения. Различают пассивный и активный эксперименты. Пассивный эксперимент является традиционным методом, когда 6
ставится большая серия опытов с поочередным варьированием каждой из переменных. К пассивному эксперименту относится также сбор исходного статистического материала в режиме нормальной эксплуа- тации на промышленном объекте. Обработка опытных данных для получения математической модели проводится статистическими мето- дами. Методы математической статистики позволяют в этом случае извлечь максимум информации из имеющихся экспериментальных данных — оптимизировать процедуру обработки и анализа эксперимента. Используя активный эксперимент (планирование эксперимента), мож- но достичь существенно большего — оптимизировать и стадию постанов- ки эксперимента. Планирование эксперимента—это оптимальное управление экспе- риментом в условиях неполной информации о механизме процесса. Развитие концепции планирования эксперимента связано с работами английского статистика Р. Фишера. В концепции Фишера главная цель планирования эксперимента состоит в раздельной оценке эф- фектов в многофакторной ситуаций. Широко применяемое в настоя- щее время планирование эксперимента при поиске оптимальных условий процесса связано с работой американских ученых Бокса и Уилсона, предложивших последовательную стратегию решения экстремальных задач. Работы Бокса и его школы нашли широкое применение в практике. Одновременно с эмпирико-интуитивным подходом Бокса стало развиваться чисто теоретическое направление в планировании эксперимента. Наибольший вклад в развитие этого направления внес американский математик Кифер. Среди предложен- ных критериев оптимальности планов наиболее распространен крите- рий £)-оптимальности, связанный с минимизацией ошибок всех коэффициентов модели. В нашей стране применение и развитие идей и методов плани- рования эксперимента связано с работами В. В. Налимова и его школы. В настоящее время методы планирования эксперимента, широко применяемые для изучения процессов в лабораторных и полузавод- ских условиях, в промышленных условиях применяются редко. Одна- ко развитие методов планирования эксперимента применительно к промышленным условиям и технический прогресс производства несомненно создадут предпосылки оптимизации эксперимента на всех стадиях изучения процесса.
часть Методы статистического анализа эксперимента ГЛАВА I ОСНОВНЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 1. Случайные Величины. Аксиомы теории вероятностей. Законы распределения. Под случайной величиной понимают величину,' при- нимающую в результате испытания значение, которое принципиально нельзя предсказать, исходя из условий опыта. Случайная величина обладает целым набором допустимых значений, но в результате каждого отдельного опыта принимает лишь какое-то одно из них. В отличие от неслучайных величин, изменяющих свое значение лишь при изменении условий испытания, случайная величина может принимать различные значения даже при неизменном комплексе основных факторов Изменение случайной величины от опыта к опыту связано с неучитываемыми (случайными) факторами. Чтобы охарактеризовать случайную величину, нужно прежде всего задать набор ее допустимых значений. Различают дискретные и непрерывные случайные величины. Возможные значения дискретных случайных величин можно заранее перечислить. Значения непрерывной случайной величины не могут быть заранее перечислены, они не- прерывно заполняют некоторый промежуток. Набор допустимых значении сам по себе слабо характеризует случайную величину. Чтобы полностью охарактеризовать случайную величину, необходимо не только указать, какие значения она может принимать, но и как часто. Пусть дискретная случайная величина X может принимать в результате опыта значения х,, х2,...,хА. Отношение числа опытов и,, в результате которых случайная величина X приняла значение х,, к общему- числу произведенных опытов п называется частотой появления события X—xt. Частота rm/п сама является случайной величиной и меняется в зависимости от количества произведенных опытов. Но при большом числе опытов она имеет тенденцию стабилизироваться около некоторого значения р„ называемого вероят- ностью события X =х. (статистическое определение): Pi = Р (X = Xi) А! пц/п. (1-1) 8
Можно доказать (теорема Бернулли), что каково бы ни было на- перед заданное положительное число е , вероятность того, что частота события отличается от его вероятности больше, чем на е , стремится к нулю при неограниченном числе испытаний. Следующие аксиомы теории вероятностей были сформулированы А. Н Колмого- ровым. 1. Вероятность появления случайного события А является не- отрицательным числом: Р(Л)>0. (1.2) 2 Вероятность достоверного события U равна единице: Р(С)=1, (1.3) а вероятность невозможного события И—нулю: P(V) = 0. (1.4) Таким образом, 0<Р<1. (1.5) Суммой нескольких событий (А} + Л2+... + А„) называют событие, состоящее в появлении хотя бы одного из этих событий. 3. Вероятность того, что наступит хотя бы одно из нескольких несовместных событий А}, А2,...,Ап, равна сумме вероятностей этих событий (теорема сложения вероятностей): Р(Л1 + Л2+ ... + А„) = Р (Л^ + Р (А2) + ... + Р(Л„). (1.6) Произведением нескольких событий (А} • Л2-....А„) называется событие, состоящее в совместном появлении всех этих событий. Случайные события Ль А2,...,Ап называются независимыми, если вероятность любого из них не зависит от того, произойдет или нет любое из остальных событий. Вероятность произведения не- скольких независимых событий равна произведению вероятностей этих событий; Р(ЛгЛг ... Ап) = Р (АА Р (А2) ... Р(Ап). (1.7) Событие А называется зависимым от события В, если вероятность события А меняется в зависимости от того, произошло событие В или нет. Вероятность события А, вычисленная при условии, что произошло другое событие В, называется условной вероятностью события А и обозначается Р (А /В). Для зависимых событий вероят- ность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную при условии, что первое произошло: Р(ЛВ) = Р(Л)Р(В/Л). (1.8) Аналогично, если событие В предшествует событию А и опреде- ленным образом влияет на него, то Р(ЛВ) = Р(В)Р(Л/В). (1.9) 9
Пример 1. Вероятность безотказной работы вычислительного устройства зависит от трех узлов, соединенных последовательно, каждый из которых независимо от других может выйти- из строя. Вероятность безотказной работы первого узла равна Р(А,) — 0,9, второго />Щ3;==0.8 и третьего Р(А3) — 0,8. Найти надежность вычислительного устрой- ства в целом. Решение. По теореме умножения для независимых событий (1.7) Р (Л) = Р (Л) Р (Аг)Р(Аз) = 0,9 0,8.0,8 = 0,576. Сумма вероятностей всех возможных значений случайной величины равна единице: п 2 Л = 1. (1.10) так как тот факт, что случайная величина примет в результате опыта одно из своих значений, есть достоверное событие. Эта суммарная вероятность распределена определенным образом между отдельными значениями. Дискретную случайную величину можно полностью задать вероят- ностным рядом, указав вероятность д для каждого значениях, : Всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятно- стями, называется законом распределения. Вероятностный ряд является одним из видов законов распределения случайной величины. Распределение непрерывной случайной величины нельзя задавать при помощи вероятностей отдельных значений. Число значений так велико, что для большинства из них вероятность принять эти значения равна нулю, т. е. событие может произойти, а вероятность его равна нулю. Для непрерывных случайных величин изучается вероятность того, что в результате опыта значение случайной вели- чины попадет в некоторый интервал. Рис. 2. Функция распределения непрерывной случайной величины (а) и дискретной случайной величины (б) Удобно пользоваться вероятностью событий Х<х, где х— произ- вольное действительное число, а X — случайная величина. Эта вероят- ность является функцией от х P(X<x) = F(x) (1.11) и называется функцией распределения случайной величины. ю
В виде функции распределения можно задать распределение как непрерывной, так и дискретной случайной величины. Как видно из определения, F(x) есть неубывающая функция х; если х,< х2, то F(x,)tF F(x2) (рис. 2, а). Ордината этой кривой, соответствующая точке х,, представляет собой вероятность того, что случайная величина X при испытании окажется <х,. Разность двух ординат, соответ- ствующая точкам х, и х2, дает вероятность того, что значения случайной величины будут лежать в интервале между х, и х2: Р (*! < X < хг) = F (хг) — F (х,). (1.12) Значения функции распределения при предельных значениях аргумента соответственно равны 0 и 1: F(—оо) = 0, F(-f-oo)= 1. (1.13) Функция распределения дискретной случайной величины всегда есть разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины, и равны вероятностям этих значений (рис. 2, б). Сумма всех скач- ков равна 1. Для непрерывной случайной величины наиболее часто употребляет- ся производная функции распределения—плотность распределения случайной величины X. Если F(x) непрерывна и дифференцируема, то = (1-14) Задание f(x) тоже полностью определяет случайную величину. Плотность распределения является неотрицательной функцией (рис. 3). Площадь, ограниченная осью х, прямыми х = х, и х=х2 и кривой плотности распределения, равна вероятности того, что случайная величина примет значения из интервала х, 4-х2: х? P(Xi< Х< хг) = j f (x)dx= F (x2) — F (xj, (Ei5) в частности x F (x) = P (—oo < X < x) => J f(x)ix. (1.16) — GO Отсюда же выводится еще одно важное свойство плотности рас- пределения: оо p(x)dx= 1, —(30 гак как попадание случайной величины в интервал -°°<Х< + О° есть достовер- ное событие. 2. Числовые характеристики. Вместо полного определения случайной величи- (1-17) Рис. 3. Плотность распределения не- прерывной случайной величины 11
ны в виде законов распределения вероятностей в прикладных за- дачах ее часто определяют при помощи числовых характеристик — чисел (вещественных), выражающих характерные особенности случай- ной величины, называемых моментами случайной величины. Для дис- кретной случайной величины начальный момент k-го порядка опрё- деляется формулой п mk = %х*Р1, k = 1, 2,..., (1.18) (=1 для непрерывной случайной величины — формулой 00 mk — §xkf(x)dx. (1.19) —ао Начальный момент первого порядка (7с=1) называется математиче- ским ожиданием (средним значением) случайной величины. Математи- ческое ожидание принято обозначать различным образом: А4 [X], тх, т. Для дискретных случайных величин т1 = Л1[Х] = XiPi- (1.20) i=i Для непрерывных случайных величин математическое ожидание выражается интегралом: тд. = Л1[Х]= Jx/(x)dx. (1-21) •—оо Чаще, чем начальные моменты, применяются центральные момен- ты. Центральный момент к-го порядка для дискретной случайной величины определяется формулой п = — Pl, (1.22) I—I для непрерывной случайной величины — формулой 00 РЛ = J (x—mx)hf(x)ix. (1.23) —оо Первый центральный момент всегда равен О, щ =0. Второй централь- ный момент называется дисперсией. Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания, т. е. D[X] = Af [(X — тх)2]. (1.24) Для дискретной случайной величины D [X] = (12= 2 (xi — тх)2 Pi> О-25) 1=1
для непрерывной оо В[Х] = J (х —mJ2/(x)dx. —оо (1-26) Другие обозначения для дисперсии Dx, ст Л о2. Корень квадратный из второго центрального момента называется средним квадратичным отклонением (или стандартом)'. ~х = Vd[X] — V7T. (1-27) Третий центральный момент, разделенный на стх3, называется коэф- фициентом асимметрии: •> 71 = Нз/°л: • (1.28) Через начальные моменты Цз выражается следующим образом: Р-з = «з —3mi«2+ 2т^ . (1.29) Четвертый центральный момент вычисляется по формуле Й4 = «4 — 4mjm3 + 6m2 т2 — Зт* . (1.30) Величина 72 = (Й4/°х)-3 (1.31) называется коэффициентом эксцесса. На рис. 4 приведены примеры плотностей распределений с не- нулевыми коэффициентами асимметрии и эксцесса. Для сравнения штриховой линией изображена кривая с тем же математическим ожиданием тх и дисперсией ст2, но с нулевыми значениями коэф- фициентов эксцесса и асимметрии. Моменты существуют, если соответствующие интегралы или ряды для дискретных величин сходятся. Для случайных величин, значе- ния которых ограничены, моменты всегда существуют. Если у случайной величины X суще- ствуют первый и второй момен- 1ы, го можно пос 1 роить норми- рованную случайную величину: Хо = (X— mx)hr. (1-32) Для нормированной случайной величины М[Хо]=0, D[XOJ=1. (1.33) Многие таблицы распреде- лений построены именно для нормированных случайных ве- личин. Существуют следую- щие соотношения между функ- циями распределения, соответ - Рис. 4. Плотность распределения с ненуле- выми коэффициентами асимметрии и эксцесса 13
ствующими нормированной величине Хо и ненормированной Х\ 1 1 / х—тх \ f(x)=—f1(xt) = —f1[----------- , (1.34) °х / fi(^o) = °x/(JC) = ax/(«x + ox^o)- (I-35) F (х) = Л (х0) = Л ( * Х~ОТх ) , (1.36) \ ах / Л(*о) = F (*) = F (тх + ахХ0). (1.37) Моменты являются общими (интегральными) характеристиками распре- деления. Вторая группа параметров характеризует отдельные значения функции распределения. К ним относятся квантили. Квантилем хр распределения случайной величины X с функцией распределения F(x) называется решение уравнения F(xp)^p, (1.38) т. е. хр есть такое значение случайной величины, что Р(Х<хр) = Р. (1.39) Если известны два квантиля хр и х9, то Р (хр< Х< xQ) = q — p. (1.40) Наиболее важное значение имеет квантиль х^, называемый медианой распределения (рис. 5). Ордината медианы рассекает площадь между кривой плотности вероятности и осью абсцисс пополам. Если распре- деление симметрично, = (1.41) Квантили хр и Х|_. р называются симметричными. Для симметричного относительно нуля распределения всегда хр = — х1_р. (1.42) Наиболее часто в приложениях математической статистики исполь- 5уют математическое ожидание (характеристику положения значений случайной величины на числовой оси) и дисперсию (или среднее квадратичное отклонение), определяющую характер разброса значений случайной величины. 3. Свойства математического ожидания и дисперсии. Примем без доказательства следующие свойства математического ожидания и дисперсии случайных величин: 1. Математическое ожидание неслу- чайной величины равно значению этой величины: Л4 [с] = с. (1.43) Неслучайную величину можно вы- - носить за знак математического ожидания: Х//2 Л Рис. 5. Медиана распределения 14 Л4[сХ] = сЛ4[Х]. (1.44)
3. Математическое ожидание суммы случайных величин равно сумме математических ожиданий этих случайных величин: М [Xj + Х2 + ... + Х„] — М [XJ + М [Х2] + ... + Л4[ХЛ]. (1.45) 4. Математическое ожидание произведения независимых случайных величин равно произведению математических ожиданий сомножителей: М[Х1-Х2 ... X„l = Af[X1] M[X2] ... А4[ХЛ]. (1.46) Случайные величины называются независимыми, если каждая из них имеет самостоятельное распределение, не зависящее от воз- можных значений других величин. Свойства дисперсии: 1. Дисперсия неслучайной величины равна нулю: £[с] = 0. (1.47) 2. Неслучайную величину можно выносить за знак дисперсии, возведя ее в квадрат: В [сХ] =?Р[Х]. (1.48) 3. Дисперсия случайной величины равна математическому ожида- нию квадрата случайной величины минус квадрат ее математического ожидания: D [X] = М [X2] — т2х . (1.49) 4. Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин: ^[Xi + X2+ ... +X„1 = D[X1J+D[X2]+ ... +D[X„J. (1.50) Используя свойства математического ожидания и дисперсии, покажем, что для нормированной случайной величины справедливо утверждение (L33), т. е. если Хо =(Х~тх)! ах, то Л4[Хо] = О, В[Х0]=1, М [Хо] = М ) = — М (X — тJ = — Гм (X) — тх 1 = 0, \ ах 1 °х ах L J В[Хд] = в/- ~М=-уВ(Х-тД = ^-Гв(Х)-о] = ^-=1. \ ах I а* а* L Jo* \ / X X х Пример 2. В результате испытаний двух расходомеров установлена вероятность наблюдения помех, оцениваемых по двухбалльной системе: Уровень помех, балл Вероятность наблюдения помех данного уровня расходомер 1 расходомер 2 1 0,20 0,03 2 0,065 0,15 15
По приведенным данным выбрать расходомер, который в среднем имеет меньший уровень помех и более устойчивые показания. Решение. Обозначим через X случайный уровень помех расходомера. Определим средний уровень помех для каждого расходомера по формуле (1.20): м1 [X] = 0,20-1 4-0,065-2 = 0,33, М2 [X] = 0,03-1 4- 0,15-2 = 0,33. Таким образом, средний уровень помех у обоих расходомеров одинаков и по этому показателю нельзя выбрать лучший прибор. Определим устойчивость показаний, для этого по формуле (1.25) посчитаем дисперсии уровня помех для каждого расходомера: Di [X] = (1 — 0,33)*-0,2 4- (2 — 0,33)*-0,065 = 0,11; DS[X] = ( 1— 0,ЗЗ)2-0,03 4~ (2 — 0,33)2-0,15 = 0,43. Следовательно, лучшим является первый расходомер. Рис. 6. Плотность вероятности равномерного распределения Рис. 7. График функции F(x) рав- номерного распределения 4. Равномерное распределение. Определим основные числовые характеристики одного из простейших непрерывных распределений — равномерного распределения. Равномерным распределением называется распределение, для которого плотность вероятности постоянна в определенных пределах и равна нулю вне этих пределов (рис. 6). Плотность f(x) постоянна и равна с на отрезке [а, й]; вне этого отрезка она равна нулю: {с при а < х < Ъ, 0 при х < а или х>Ь. Так как площадь, ограниченная кривой распределения, равна едини- це: c(b - а) = 1, то с = М(Ь-а), и плотность распределения f(x) имеет вид f (х) = -------- при а < х < Ь, о — а f (х) = 0 при х < а или х > Ь. (1-51) Функция распределения выражается площадью кривой распределе- ния, лежащей левее точки х. Следовательно, 0 при х < а, F(x) = х — а ----- при а <: х < о, Ь — а 1 при х > Ъ. (1-52) 16
График функции F(x) приведен на рис. 7. 'Математическое ожидание случайной величины X, имеющей равномерное распределение на отрезке [а, 7>], равно ь (* х а + Ь т^\—аАх~-~Г- <’-53) а В силу симметричности равномерного распределения медиана вели- чины X также равна (а + Ь)/?.. По формуле (126) определим дисперсию случайной величины X: ь Па + Ь\2 (Ь — а)2 )dx = -L_L. . (1.54) а Коэффициент асимметрии ц3/стх3 равен нулю (распределение симметрично). Для определения коэффициента эксцесса найдем четвертый центральный момент: ь I Г/ а + &\\ (Ь-«)4 = dx = —“ а отсюда 72 = — — 3 = — 1,2. Вероятность попадания равномерно распределенной случайной величины X на отрезок [а, р ], представляющий собой часть от- резка [а, 6] (рис. 8), определяется отношением длины отрезка [ а, р ] к длине всего отрезка [а, Ь]; 3 — а Р (а < X < р) = ------------ . О — а (155) 5. Нормальное распределение. Непрерывная случайная величина X называется распределенной по нормальному закону, если ее плотность распределения имеет вид (х—тх)2 , 1 f (х) = е у 2г. <3Х где тх и ст3 —математическое ожи- дание и дисперсия случайной вели- чины X. Функция распределения равна: (X—tn )2 1 f 2>* F (х) -=—-------— 1 е dx (1.57; 1'2~ а- 1 -X —сю Рис. 8. Определение вероятности попадания равномерно распреде- ленной случайной величины на заданный участок 17
Нормальное распределение наиболее часто встречается на практике и теоретически наиболее полно разработано. Нормальный закон при некоторых условиях является предельным законом для суммы боль- шого числа п независимых случайных величин, каждая из которых подчинена какому угодно закону распределения (теорема Ляпунова). Основное ограничение состоит в том, чтобы все слагаемые играли в общей сумме относительно малую роль. Множество событий происходит случайно вследствие воздействия на них большого числа независимых (или слабо зависимых) возмущений. У таких явлений закон распределения близок к нормальному. Нормальный закон распределения широко используется при обработке наблюдений. Пользуясь методами теории информации, можно показать, что нор- мальное распределение содержит минимум информации о случайной величине по сравнению с любыми распределениями с той же дисперсией. Следовательно, замена некоторого распределения экви- валентным нормальным не может привести к переоценке точности наблюдений. График плотности нормального распределения называет- ся нормальной кривой или кривой Гаусса (рис. 9). Рис. 9. Кривая Гаусса Рис. 10. График функции Fq(x) стандартного нормального рас- пределения Нормальное распределение нормированной случайной величины называется стандартным. Его функция распределения имеет вид Fo (х) — —----i е Х'2 6х. (1.58) г —оо График этой функции представлен на рис. 1Q Для такой величины Р (xt < Хо < х2) = F0 (хг) — F 0 (xt). (1.59) Функция Ф (х) = F„ (х) - -у (1.60) называется функцией Лапласа: X Ф (*) = Fo (*) — F о (°) = J: \ е х/2 dx. Г 2л о (Е61) 18
Значения этой функции приводятся в табл. 1 приложения. Функция Лапласа — нечетная функция, т. е. Ф(— х) = — Ф(х), (1.62) поэтому таблицы значений Ф(х) составлены лишь для х>0. Для нормированной случайной величины, учитывая (1.59) и (1.60), имеем Р(Х!<ХО<Х2) = Ф(Х2) + 1/г-Ф(х1)-1/г = Ф(х2)-Ф(*1). (I 63) В общем случае Во многих практических задачах х, и х2 симметричны относитель- но математического ожидания, в частности в задаче об абсолютном отклонении. Абсолютным отклонением называется величина ДХ = |Х —тх|. (1.65) Требуется найти вероятность того, что абсолютное отклонение случайной величины не превзойдет некоторого заданного числа е: Р (АХ < е) = Р (тх— i < X < тх + е). (1.66) В частности, для нормированной случайной величины Р (ДХ„ < е) = Р (- е < Хо < + е) = Ф(е) - Ф (- е) = 2Ф (г). (1.67) Для случайной величины, имеющей нормальное распределение, с параметрами тх и ол , Р(ДХ < е) = Р ЛХ, <— 'l = 2Ф —) . (1.68) \ °х 1 \ах/ Обозначив е/Ол = к, получим из (1.68) следующее соотношение: Р(ДХ<йзх) = 2Ф(й), (1.69) отсюда Р (ДХ < ах) = 2Ф (1) = 0,6826, Р (ДХ < 2ах) = 2Ф (2) = 0,9544, (1.70) Р (ДХ < Зах) = 2Ф (3) = 0,9973. Таким образом, отклонения больше чем утроенный стандарт (средне- квадратическое отклонение) практически невозможны. Нормальное распределение обладает свойством линейности: если независимые случайные величины X, и Х2 имеют нормальные распределения, то для произвольных чисел а и Р величина Г = аХ1 + ₽Х2 (1.71) также имеет нормальное распределение, причем из свойств математи- ческого ожидания и дисперсии следует 19
ту = amXi + ?тХ2 (1.72) И ______________ °У = V *4 +РЧ • (1-73) z г Xt ‘ Xt Пример 3. Толщину керамической глазурованной плитки h можно считать нормально распределенной случайной величиной со стандартом а = 0,3 мм. Какова вероятность брака, если бракуются плитки, толщина которых отклоняется от номинала (математи- ческого ожидания) более чем на 0,5 мм. Решение. Определение вероятности брака сводится к решению задачи об абсо- лютном отклонении для случайной величины h — толщины плитки. Необходимо опре- делить P(&h > 0,5). Найдем вероятность противоположного события по формуле (1.68): /’(ЛЛ <0,5) = 2Ф(0,5/0,3) = 2Ф (1,67) = 2 0,4525 = 0,905, откуда /’(ЛЛ>0,5) = 1-0,905 = 0,095. 6. Системы случайных величин. В практических приложениях теории вероятностей и математической статистики очень часто при- ходится иметь дело с задачами, в которых результат эксперимента описывается не одной случайной величиной, а двумя или более случайными величинами, образующими систему. Свойства системы нескольких случайных величин не исчерпывают- ся свойствами отдельных величин ее составляющих: помимо этого, они определяются также взаимными связями (зависимостями) между случайными величинами. Информация о случайных величинах содер- жится в законах распределения. Рассмотрим систему из двух случай- ных величин (X У). Функцией распределения системы двух случайных величин (X, Y) называется вероятность совместного выполнения двух неравенств: F (х, у) = Р (X < х, Усу). (1.74) В § 1 приведены основные свойства функции распределения F(xJ для одной случайной величины. Сформулируем аналогичные свойства для функции распределения системы (X, Y). 1. Функция распределения F(x, у) есть неубывающая функция обоих аргументов, т. е. при х2 > xt F (хг, y)^F(xlt у)-, (1-75) приу2>Уз F (х, уг) ^F (х, (/J. 2. Всюду на — °° функция распределения равна нулю: F (х, —ос) — F (—оо, у) = F (—оо , —оо) = 0. (1.76) 3. При одном из аргументов, равном +°°, функция распределения системы превращается в функцию распределения случайной величины, соответствующей другому аргументу: F(x, + oo) = Fi(x), (1.77) F (+ оо, У) = рг (у), где F} (х), F2(у) — соответственно функции распределения случайных величин X и У. 20
4. Если оба аргумента равны +°°, то системы равна единице: F (+ ОО, оо) = 1 . функция распределения (1.78) Зная функцию распределения системы F(x, у), можно определить вероятность попадания случайной точки (X, Y) в прямоугольник R, ограниченный абсциссами а и 0 и ординатами у и 5 (рис. 11): Р[(Х, Y)cR] = F('y б)-Е(а, B)-F(?, 7) + F(a, у). (1.79) Если функция F(x, у) непрерывна и дифференцируема, то можно определить плотность распределения системы f(x, у) как вторую смешанную производную функции F(x, у): f (х, у) = d*F (х, у) дхду (1.80) Вероятность попадания случайной точки (X, Y) в произвольную область D выражается интегралом от элементов вероятности f(x, у) по области D: Р[(Х, Y) с D] = JJ f(x, y)dxdy. (1.81) (О) В соответствии с (1.81) вероятность попадания в прямоугольник R определяется следующим образом: 3 5 Р[(Х, Y) с /?] =J j f (х, y)dxdy. (I 82) Плотность распределения системы есть функция неотрицательная: /(*, </)>0. (1.83) Двойной интеграл в бесконечных пределах от плотности распределе- ния системы равен единице ОО 00 f J f (х, у)йхйу = 1 (1.84) —оо — оо и представляет собой вероятность попадания на всю координатную плоскость, т. е. вероятность достоверного события. Функция распреде- ления F(x, у) выражается через плотность распределения следующим образом: F (х, у) = J J f(x, y)dxdy. Зная плотность распределения системы, мо- жно получить плотности распределения каж- дой из величин: F (х) = F (х, оо)— (1.85) ос р х Рис. 11. Прямоугольник Л (1.86) 21
откуда, дифференцируя по х, имеем СО fi(x) = = §f(x,y)dy, (1.87) —оо аналогично оо fi(y) = = Г/(х, у) dx. (1-88) ^У V —оо Формулы (1.77) и (1.86) — (1.88) дают возможность по известному 5акону распределения системы найти законы распределения отдель- ных величин, входящих в систему. В то же время для того чтобы исчерпывающим образом охаракте- ризовать систему, получить ее закон распределения, недостаточно знать распределение каждой из величин, нужно еще знать зависимость между величинами, входящими в систему. Наиболее полно эта зависимость может быть охарактеризована с помощью так называе- мых условных законов распределения. Условным законом распределения величины У, входящей в систему (X, У), называется ее закон распределения, вычисленный при условии, что другая случайная величина X приняла определен- ное значение х. Условная функция распределения обозначается F(y | х), условная плотность распределения f(y | х). Можно показать, что плотность распределения системы двух величин равна плотности распределения одной из величин, входящих в систему, умноженной на условную плотность распределения другой величины, вычисленную при условии, что первая величина приняла шданное значение: /(*, 0) = fi <x)f(y |х) (1.89) или f (х, у) = f2(y) f (х\у). (1.90) Формулы (1.89) и (1.90) часто называют теоремой умножения законов распределения. Из (1.89) и (1.90) следует: f(</|^)=У) , (1.91) /1 Iх) f(xly)=-f(X' У) , (1.92) ft (У) или, с учетом (1.87) и (1.88). ЦТ - , <1.93) ОО Jf (X, У) dy —оо f (у | х)= — ---- . (1.94) Jflx, у) dx 22
7. Стохастическая связь. Между случайными величинами обычно существует такая связь, при которой с изменением одной величины меняется распределение другой. Такая связь называется стохастической. В отличие от функциональной зависимости, при которой, зная значение одной из величин, можно точно указать значение другой, при стохастической связи с изменением величины X величина У лишь имеет тенденцию также изменяться (например, возрастать или убывать при возрастании X). Эта тенденция соблюдается лишь в сред- нем, в общих чертах и в каждом отдельном случае от нее возмож- ны отступления. Стохастическая связь может быть более или менее тесной, по мере увеличения тесноты стохастической зависимости она все более приближается к функциональной. Таким образом, функциональную зависимость можно рассматривать как предельный случай наиболее тесной стохастической связи. Другой крайний случай —полная неза- висимость случайных величин. Для непрерывных случайных величин условие независимости может быть записано в виде f(y\x)~fi(y) (1.95) или f ( х\у) = ( х). (1.96) Для независимых непрерывных случайных величин теорема умноже- ния законов распределения принимает вид f(x,y) = К (х) }г (у), (1.97) т. е. плотность распределения системы независимых случайных вели- чин равна произведению плотностей распределения отдельных вели- чин, входящих в систему. Условие (1.97) может рассматриваться как необходимое и достаточное условие независимости случайных величин. Изложенный выше критерий суждения о независимости или зависимости случайных величин исходит из предположения, что закон распределения системы нам известен. На практике обычно закон распределения системы не известен. Задача выявления и оценки тесноты стохастической связи решается с помощью некоторых показателей, оценивающих те или иные стороны стохастической связи. Из них важнейшим в силу простоты его определения по экспериментальным данным является коэффициент корреляции. Если две случайные величины Y и X независимы, то дисперсия суммы этих величин равна сумме дисперсий (см. 1.50): D(X+Y) = D(X)+D(Y). Если данное равенство не соблюдается, это признак зависимости. Из определения дисперсии (1.24) и свойств математического ожида- ния (1.45) следует: D{X+Y} =М [Х + У-М(Х + У)Г = М [Х-М(Х)]* + + 2М {[X — М (X)] [Y — M (У)} + М [У — М (У)]2 = = Р(Х) + 2Л1 {[Х-М (X)] (У — М (ЕЦ}+Р(Е). (1.98) 23
Зависимость между X и Y существует, если М[(Х-тд)(У-ту)]=#0. (1.99) Величина (1.99) называется корреляционным моментом, моментом связи или ковариацией cov {ХУ}. (соудД случайных величин X и У. Из (1.99) видно, что ковариация характеризует не только зависи- мость величин, но и их рассеяние. Действительно, если одна из величин X, У мало отклоняется от своего математического ожидания, то ковариация будет мала, какой бы тесной зависимостью ни были связаны величины X и У. Поэтому для характеристики связи между случайными величинами X и У в чистом виде переходят от соул> к безразмерному показателю: covXy М [(X — тх) (У — /пу)] гху =----- = ------------------У— , (1.100) Од. Оу Од Оу где с>д , с^—средние квадратичные отклонения величин X и У. Этот показатель называется коэффициентом корреляции величин X и У. Для независимых случайных величин коэффициент корреляции равен нулю, однако обратное утверждение несправедливо — коэффициент корреляции (и ковариация) могут быть равны нулю, а случайные величины зависимы: связь, не сказываясь на дисперсиях, проявляет- ся в моментах более высокого порядка. В общем случае справедливо более слабое утверждение: случайные величины, для которых кова- риация (а значит, и коэффициент корреляции) равна нулю, называют- ся некоррелированными. Таким образом, независимые случайные величины всегда являются некоррелированными, однако из некоррелированности величин в общем случае еще не следует их независимость. И только в случае нормального распределения равенство нулю коэффициента корреляции однозначно свидетельствует об отсутствии связи между случайными величинами. Плотность нормального распределения двух случайных величин выражается формулой f (*> У)=-------------TZZL-’: ехр 2it ад У I — гг 2г(х — тх) (у — ту) Од Оу (1.101) где г—коэффициент корреляции. Предположим, что случайные величи- ны X, У, подчиняющиеся закону распределения (I. 101), некоррелиро- ваны, т. е. г = 0. Получим ft*, у)=-9------ехр ar av (х — тх)г (у — ту)2' 2sx 24
1 exp (x —mx)a~] 1 (у — ту)г- ] КгТОу ехр [ “ 2а? = fi (*) ft (У), (I • 102) т. е. плотность распределения системы равна произведению плотностей распределения отдельных величин, входящих в систему, а это значит, что случайные величины X и У независимы. Таким образом, для системы случайных величин, подчиненных нормальному закону, равенство нулю коэффициента корреляции свидетельствует не только о некоррелирован- ности, но и о независимости случайных величин, поэтому важность роли коэффициента корреляции как показателя связи в этом случае существен- но возрастает. Отметим следующие свойства коэффициента корреляции. Коэффи- циент корреляции не меняется от прибавления к X и Y каких-либо неслучайных слагаемых, от умножения X и У на положительные числа. Если одну из величин, не меняя другой, умножить на -1, то на -1 умножится и коэффициент корреляции. Поэтому коэффициент корреляции гху не изменится, если от исход- ных случайных величин перейти к нормированным: X — тх У — Шу На основании (1.98) и (1.100) имеем D (X + У) = D (X) + D (У)+ 2гуХ VrD(X)D(Y) . (1.103) Аналогично для дисперсии разности двух случайных величин можно записать ___________ D (X - У) = D (X) + D (У) - 2гух V D (X) D (Y) . (1.104) Выражения (1.101) и (1.102) для нормированных случайных величин с учетом того, что D(X0)=D(Y0) = 1, примут вид D(X0+Y0) = 2 + 2ryX, О(Х-У„) = 2-2гух. (1.105) Так как дисперсия —величина неотрицательная, имеем 2 + 2rv,>0; 2 —2rv,>0; Гух^ 1> и окончательно - 1<гух< + 1. (1.106) Крайние значения коэффициента корреляции гух =±1 соответствуют линейной функциональной зависимости У = Ьл + biX, причем знак коэффициента Ь. соответствует знаку коэффициента корре- ляции. В общем случае, когда величины Хи Усвязаны произвольной стохасти- ческой зависимостью, коэффициент корреляции может иметь значение в пределах - 1 < rxy < 1. 25
При гху>0 существует положительная корреляционная связь между величинами X и У, при гху< 0 — отрицательная. Коэффициент корреляции характеризует не всякую зависимость, а только линейную. Линейная вероятностная зависимость случайных вели- чин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или убывать) по линейному закону. Коэффициент корреляции характеризует степень тесноты линейной зависимости. Определим условные законы распределения f(y | х) и f(x | у) по фор- мулам (1.91) и (1.92) для системы случайных величин, подчиняющихся нормальному закону распределения (1.101): (1.107) 1 f (х\У) =-----.. " " - ехр ах И1-Г2 V2л Из (1.107) имеем 1 f (У 1 х) =--- _ - ехр □у И 1-г2 У2л 1 / х — тх у — ту \2" 2(1-гЦ~ ~Г I • (1.108) Очевидно, (1.109) есть выражение для плотности нормального закона распределения с математическим ожиданием у ту\х = ту + г ~(х-тх) (1.110) и средним квадратичным отклонением °g|x = =у (1 - f2) • (1-111) Величина ту1х называется условным математическим ожиданием величи- ны Y при данном X. Линейная зависимость (1.110) называется регрессией У на X. Аналогично, прямая а, тх\у= тх + г—(У—ту) (1.112) °у есть регрессия X на У. Линии регрессии совпадают только при наличии линейной функциональной зависимости У от X. При независимых X и У линии регрессии параллельны координатным осям. В этой главе были рассмотрены основные характеристики случайных величин. Полная информация о случайных величинах содержится в законах распределения. Рассмотрены равномерный и нормальный законы распределения вероятностей. Во многих прикладных задачах нет необходимости использовать законы распределения. Вместо них можно воспользоваться числовыми 26
характеристиками случайной величины, в сжатой форме выражающими наиболее существенные особенности распределения. В теории вероят- ностей и математической статистике применяется большое количество числовых характеристик. В настоящей главе введены понятия о момен- тах распределения, отмечены свойства наиболее часто применяемых моментов — математического ожидания и дисперсии. Введено понятие о стохастической связи между случайными величи- нами и коэффициенте корреляции, характеризующем тесноту линейной зависимости между случайными величинами. Исследование зависимости между случайными величинами — важная прикладная задача. Упражнения 1. Сто стержней из нового полимера подвергаются выборочному контролю на прочность. Условием непригодности всей партии является наличие хотя бы одного недостаточно прочного стержня среди пяти проверяемых. Какова вероятность для данной партии быть непринятой, если она содержит 5% недостаточно прочных стержней? 2. Случайная величина X подчинена закону распределения, плотность вероятности которого имеет вид ( ах при 0 < х < 1 /(*)={ I 0 при х < 0 и х > 1 Определить математическое ожидание, дисперсию, среднее квадратичное отклонение и асимметрию распределения. 3. Функция распределения непрерывной случайной величины X задана выражением FW = О при х< О ах1 2 при 0 < х < 1 1 при х > 1 Найти: а) коэффициент а; б) плотность распределения f(x)\ в) вероятность попадания величины X в интервал (0,25; 0,5). 4. Ошибки измерения есть случайная величина, подчиненная нормальному закону с параметрами т — 1,2; ° = 0,8. Найти вероятность попадания этой величины в интер- вал (-1,6; +1,6). 5. В результате проверки точности работы прибора установлено, что 80% ошибок не выходит за пределы ±5°С. Определить среднюю квадратичную ошибку прибора, если известно, что систематических ошибок прибор не имеет, а случайные ошибки распре- делены по нормальному закону. ГЛАВА II ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 1. Генеральная совокупность и случайная выборка. На практике ис- следователь всегда располагает лишь ограниченным числом значений случайной величины, представляющим собой некоторую выборку из генеральной совокупности. Под генеральной совокупностью понимают все допустимые значения случайной величины. При анализе какой-либо технологической случайной величины, непрерывно изменяющейся по времени (например, температура, давление и т. п_), под наблюдаемыми значениями случайной величины понимают значения технологического 27
параметра в дискретные моменты времени, разделенные таким интер- валом, при котором соседние значения можно считать полученными из независимых опытов. Выборка называется репрезентативной (представительной), если она дает достаточное представление об особенностях генеральной совокуп- ности. Если о генеральной совокупности ничего не известно, единствен- ной гарантией репрезентативности может служить случайный отбор. В очень многих исследованиях случайный отбор или случайное пере- мешивание {рандомизация) данных необходима. Для имитации случай- ного отбора можно использовать таблицы случайных чисел. Допустим, необходимо отобрать 10 элементов из совокупности, содержащей 100 элементов. Для этого надо пронумеровать элементы генеральной сово- купности от 00 до 99. Затем, начиная с любого места таблиц, выписать две последние цифры десяти идущих подряд чисел. Например, начиная с первого числа получились номера 82 49 18 4 8 09 50 17 10 37 51 (если числа повторяются, их надо опустить). Полученные номера показывают, какие элементы надо отобрать. Выбранную последователь- ность изменять нельзя. Нарушение случайности, как правило, ведет к искажению результатов. Аналогично отбору производится рандомиза- ция элементов. При этом нужно выписывать случайные номера до тех пор, пока они не охватят все заданные элементы. Из случайного характера выборок немедленно вытекает, что любое суждение о генеральной совокупности по выборке само случайно. Пред- положим, что в результате эксперимента получена выборка х}, х2, ..., х„ значений случайной величины X. Пусть х— некоторая точка числовой оси х; обозначим через пх число выборочных значений, расположенных левее х на той же оси. Отношение пх/п представляет собой частоту полученных в выборке значений случайной величины X, меньших х. Эта частота есть функция от х. Обозначим ее F„(x): Fn(x) = nx/n. (HI) Функция распределения Fn(xy получаемая по выборке, называется эмпирической или выборочной функцией распределения (в отличие от рас- пределения генеральной совокупности, или теоретического распределе- ния). Для каждой выборки эмпирическая функция распределения будет своей, но все эмпирические функции распределения одной и той же случайной величины будут иметь нечто общее, что является информа- цией о функции распределения этой случайной величины. Можно доказать (теорема Гливенко), что с вероятностью 1 при п—> 00 максимальная разность между функциями распределения слу- чайных величин F„(x) и F(x) стремится к 0: P(sup |F(x)-Fn(x)| -> 0) = 1, (II.2) Л—>ОО —ОО<.Л<^4~ОО Практически это означает, что при достаточно большой выборке функцию распределения генеральной совокупности приближенно можно заменять выборочной функцией распределения. Пусть х, < х2< х3< ... < х„—упоря- 28
доченная по величине выборка из генеральной совокупности случайной величины X, или вариационный ряд. Все элементы выборки имеют одинаковую вероятность, равную 1/я. Поэтому, согласно определению функции F„(x)t имеем; Fn (*) = 0 при х < h Fn (х) = — ПРИ xk< х< xk+l, k = 1,2..........п — Г, (Н .3) п Гя(х)=1 при х>хп. На рис. 12 приведен график функции Fn(x). Все элементы выборки оказываются точками разрыва этой функции. В точке разрыва х = хк функция Fn(x) скачком переходит от значения (к-1)/п (в интервале х< хк) к значению к/п, удерживая последнее значение в следую- щем интервале. При обработке выборок больших объемов используют метод «сгруп- пированных данных»: выборка объема п преобразуется в статистический ряд. Для этого весь диапазон изменения случайной величины в выборке xmin-r xmax делится на к равных интервалов. Число интервалов можно выбирать по полуэмпирической формуле I +3,21gn (II-4) с округлением до ближайшего целого. Длина интервала h равна к — (*max (II-5) Число элементов выборки, попавших в ;-й интервал, обозначим через п,-. Величина, равная p’=nz/n, (II .6) определяет относительную частоту попадания случайной величины в ьй интервал. Все точки, попавшие в ;-й интервал, относят к его сере- дине х*: х' = (xz_1 + xz)/2. (II. 7) Статистический ряд записывается в виде табл. 1. График, построенный по данным табл. 1 (рис. 13), называется гисто- граммой эмпирического или выборочного распределения. На рис. 14 приве- ден график функции Fn(x)y построенный по сгруппированным данным. При обработке наблюдений обычно не удается получить эмпи- рическую функцию распределения. Даже простейший анализ условий проведения опытов позволяет с достаточной степенью уверенности определять тип неизвестной функ- ции распределения. Окончательное уточнение неизвестной функции рас- пределения сводится к определению Рис. 12. Выборочная функция распреде- ления некоторых числовых параметров рас- пределения. По выборке могут быть 29
рассчитаны выборочные статистические характеристики (выборочное среднее, дисперсия и т. д_), которые являются оценками соответствующих генеральных параметров. Оценки, получаемые по выборке, сами являют- ся величинами случайными, но нужная точность при этом достигается при меньших и, чем при непосредственном использовании теоремы Рис, 13. Гистограмма распределе- ния Рис. 14. График функции Fn(x)y по- строенный по сгруппированным дан- ным Гливенко. К оценкам обычно предъявляются требования состоятель- ности и несмещенности. Оценка а*(х}, хг, .... х„) называется состоятель- ной, если с увеличением объема выборки п она стремится (по вероят- ности) к оцениваемому параметру а. Эмпирические (выборочные) момен- ты являются состоятельными оценками теоретических моментов. Оценка называется несмещенной, если ее математическое ожидание при любом объеме выборки равно оцениваемому параметру Mia*] = а. Еще одной важной характеристикой оценок генеральных параметров является их эффективность^ которая для различных несмещенных оценок одного и того же параметра при фиксированном объеме выборок обратно пропорциональна дисперсиям этих оценок. 2. Метод максимального правдоподобия. Для получения оценок используют различные методы. Широко применяется метод максималь- Таблица 1. Статистический ряд Интервал Длина интервала Середина интервала Число точек в интервале Относительная частота 1 (*min< *') X* Пу р* 2 (Xi, Х2) 4 П2 р* / (Ъ -/, ) X) ni р* к Л’тах) х*к пк рк п 1 30
ного правдоподобия. Оценки, полученные при помощи этого метода, отвечают большинству изложенных требований. Сущность метода максимального правдоподобия заключается в нахождении таких оценок неизвестных параметров, для которых функция правдоподобия при случайной выборке объема п будет иметь максимальное значение. Пусть известен общий вид плотности вероятности f(x, а) теоретического распределения; а — неизвестный параметр, входящий в выражение закона распределения. На опыте получена выборка значений случайной вели- чины х2, .... хп. Окружим каждую точку х,- окрестностью длины е. е е Вероятность попасть в интервал с границами х/------xt + — при- ближенно равна f(xh а)е. Если произведено п наблюдений, то ве- роятность того, что одновременно первое наблюдение попадает в пер- вый интервал, второе —во второй и т. д_, есть вероятность совмест- ного осуществления событий и в силу независимости событий равна произведению вероятностей; Р(х, а) = f (xt)f (х2) ... f(xn)in. (П.8) Событие с вероятностью Р осуществилось на самом деле. Естественно ожидать, что событию, осуществившемуся при первом же испытании, со- ответствует максимальная вероятность. Поэтому в качестве оценки для а следует взять то значение а* из области допустимых значений параметра а, для которого эта вероятность принимает наибольшее воз- можное значение, т. е. корень уравнения дР(х, «) I да |а=а* (И .9) представляющего собой необходимое условие экстремума вероят- ности Р. Достаточным условием максимума при этом является выпол- нение неравенства Если максимумов несколько, необходимо выбрать среди них наиболь- ший. Решение проще получить, если перейти к функции Р(х, а) 'ЧТ! £(х,а) = 1п--—----= ^К1п/(хг, а), (П.11) которая называется функцией правдоподобия. Вероятность Р и функ- ция L имеют максимумы при одних и тех же значениях определяемых параметров, так как д „ 1 дР -— 1п Р=-------- да Р да Р>0. (П.12) В общем случае требуется оценить одновременно несколько пара- метров одномерного или многомерного распределения. Если а и х понимать как векторы, то формулировка принципа максимального правдоподобия сохранится; надо найти такую совокупность допустимых значений параметров а^ , а* , .... , которая обращает функцию правдо- 31
подобия в максимум. Необходимые условия экстремума дает система уравнений дЦх, а!.....ак) = daj ’ I а неотрицательная определенность матрицы (П.13) dai да у i, j= 1.2, (П.14) является достаточным условием того, чтобы локальный экстремум был максимумом функции правдоподобия. Найдем методом максимального правдоподобия оценку парамет- ра А. показательного распределения с плотностью / (х) = ке х, 0<х<оо по выборке xv х2, .... х„. Для этого распределения функция правдоподобия имеет вид L = 2ln( = п,пХ — (П.15) <=1 <=1 Дифференцируя (11.15) по А. и приравнивая производную нулю, получим уравнение откуда находим оценку А* параметра А.: к* = п r=i (П.16) или А* = 1/х, где х—среднее выборки. Пусть распределение случайной величины X подчинено нормальному закону: f(x) = ехр — (х —m)2 1 2а2 | 1 V 2r.32 Тогда вероятность совместного осуществления п независимых собы- тий X=Xj(j = 1, 2, ..., п) равна Р (х, т, о2) =-----------------ехр (2г.з2)"/2 п - i J/xz-/n)2 е" <•=1 (П.17) и функция правдоподобия р п L(x, т, о2) = |п — =- -ln2ic — - In а2 — - V(xz-m)2. (И.18) СП L iz* <3=1 32
Продифференцируем (11.18) по т и С2'. dL dm п ^-^(xz-m) = 0. 2^1 (11.19) n Так как 1/о2^0, из (11.19) имеем (xz — m) = 0, откуда находим оценку — (""1 х для параметра т\ Дифференцируя функцию правдоподобия по о2, получим (П.20) dL п 1 1 TV+(*-m) =0’ r=i Так как 1/(2 о2)=^0, имеем п "--у (xz-m)’ = 0, 1=1 откуда находим оценку п 2=1 (П.21) 3. Оценка математического ожидания и дисперсии. Метод максималь- ного правдоподобия всегда приводит к состоятельным, хотя иногда и смещенным оценкам, имеющим наименьшую возможную дисперсию при неограниченном возрастании объема выборки. Для нормально распределенной случайной величины получают оценки следующего вида: среднее арифметическое ~х для математического ожидания тх п х— У, Xi/n 2=1 и выборочную дисперсию л2 для дисперсии Д [X] п ?= 2и-7)2/п. 1=1 Последняя оценка получается несколько смещенной: M[S2] = —- Д[Х]. л п (П.22) 2-529 33
Для получения несмещенной оценки 52 надо умножить на л/(и—): п п s2 = si —Г= 2 U-*)2/(л-1). (Н.23) " 1 i=i Уменьшение знаменателя в (11.23) на единицу непосредственно свя- зано с тем, что величина х, относительно которой берутся отклонения, сама зависит от элементов выборки. Каждая величина, зависящая от элементов выборки и входящая в формулу выборочной дисперсии, называется связью. Можно доказать, что знаменатель выборочной дисперсии всегда равен разности между объемом выборки п и числом связей /, наложенных на эту выборку. Эа разность f = n — l (11.24) называется числом степеней свободы выборки. В практических вычисле- ниях для дисперсии № часто удобна формула легко вытекающая из (11.23): п — 1 п — (11.25) = [ [( — 2xiX + х2) + ( х| — 2х2 х + х2) +-1- + (х2-2хп7+^)] =[( + ••• +^)- — 2х (xj + х2 +----------1- хп) + (х2 + х2 Н------+ х2)] = Преимущество формулы (11.25) в том, что в ней нет операций вычита- ния близких чисел, как в формуле (11.23), что приводит к потере точ- ности. В формуле (11.25) эта операция применяется только один раз. Среднее и дисперсию выборки по сгруппированным данным табл. 1 вычисляют по формулам k k S я^* = 2₽*х*’ 1=1 1=1 (11.26) 34
k k s'= У 7)! —i?’7ГТ S(<->)’• 4 —i 4 — 1 (11.27) Величина № 112 называется поправкой Шеппарда, она связана со смеще- нием дисперсии при группировании. 4. Классификация ошибок измерения. Каждый результат измерения — случайная величина. Отклонение реального результата от истинного называется ошибкой наблюдения. Ошибка наблюдения также есть слу- чайная величина — она является результатом действия только случайных (неучитываемых) факторов. Если обозначить истинный результат через а, ошибку — через Ай", результат измерения — через X, то Х — а = ЬХ. (11.28) Различают ошибки трех видов. 1. Грубые ошибки возникают вследствие нарушения основных усло- вий измерения. Результат, содержащий грубую ошибку, резко отличает- ся по величине от остальных измерений. На этом основаны некоторые критерии исключения грубых ошибок. 2. Систематические ошибки постоянны во всей серии измерений или изменяются по определенному закону. Выявление их требует спе- циальных исследований, но как только систематические ошибки обна- ружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения. 3. Случайные ошибки — ошибки измерения, остающиеся после устране- ния всех выявленных грубых и систематических ошибок. При таком определении к случайным факторам, порождающим случайную ошибку, не относят факторы с постоянным действием (систематические ошиб- ки) и факторы с однократным, но очень сильным действием (грубые ошибки). Случайные ошибки вызываются большим количеством таких факторов, эффекты действия которых столь незначительны, что их нельзя выделить в отдельности (при данном уровне техники измерения). При этом распределение случайных ошибок симметрично относительно нуля: ошибки, противоположные по знаку, но равные по абсолютной величине, встречаются одинаково часто. Из симметрии распределения ошибок сле- дует, что истинный результат наблюдения есть математическое ожидание соответствующей случайной величины. Так как из (11.28) Х= а +АХ и при отсутствии грубых и систематических ошибок М [ДХ] = 0 , (11.29) то Л4[Х] = а. (11.30) В дальнейшем будут рассматриваться только случайные ошибки измере- ний. 5. Закон сложения ошибок. Для независимых случайных величин свойством аддитивности обладают дисперсии, а не среднеквадратичные ошибки. Если Хр Х2, ..., Х„ — независимые случайные величины; а}, а2,..., а„ — неслучайные величины и Z — aiXl -f-агХг + • • • + anXn, (П.31) г 35
то выборочная дисперсия величины Z определится следующим образом: .2 — „2,2,2,21 | „2 -2 SZ — “1 SX, + а2 SX, + + ап SX (11.32) Если положить а, =а2 =... = = 1/л, то В этом случае 2 —2 i=l 1 где sx= ---------- Xi + -Ха • • • +Х;1 — — А < П (11.33) Если величины Xv Х2, .... Х„ интерпретировать как п независимых на- блюдений одной и той же случайной величины X, то = й =... = й = й. Тогда получим s?_=s2x/n. (11.34) Из выражения (11.34) следует практический вывод: при оценке точности двух методов следует учитывать длительность анализа. Применяя менее точный экспресс-метод, можно сделать за то же время значительно большее число опытов и добиться более высокой точности, чем дает трудоемкий точный метод. 6. Ошибки косвенных измерений. Измерения делят на прямые и . косвенные. В первом случае непосредственно измеряется определяемая величина, при косвенных измерениях она задается некоторой функцией от непосредственно измеряемых величин. Пусть случайная величина z зависит от наблюдений xt, х„ по известному закону: Z = /(*!, х1у ... , хп). Истинное значение величины z может не совпадать с математическим ожиданием Mz, а определяться тем же законом: тх......т*п)- Величина az называется средним косвенного измерения. Дисперсия косвенного измерения 02 определяется так же, как обычная дисперсия, только отклонения берутся от среднего косвенного измерения az. Ее можно найти, зная дисперсии отдельных наблюдений и вид функции f На практике определяют выборочные дисперсии 4.. и по ним выборочную дисперсию косвенного измерения й, которая служит оценкой генеральной дисперсии а? . Чтобы найти й , разложим функцию z=f(xv х2, .... х„) в ряд Тейлора в точке (тх<, тХг,...,тХп), ограничиваясь членами первого порядка , df тх,.....+ + + (IL35) 36
и определим Q по закону сложения дисперсий: Выражение (11.36) называют законом накопления ошибок. Пример 1. Оценить ошибку определения линейной скорости движения газа в трубо- проводе о, пользуясь следующими результатами измерений: количество газа G — 3000 мз/ч; ошибка измерения sG —10 мз/ч; сечение трубопровода F— 0,1 м< ошибка измерения sF — 1 см2. . Решение. Рассматривая линейную скорость как результат косвенного измерения G 3000 v = — =---------= 30000 м/ч = 8,82 м/с, г 0,1 определим sv по формуле (11.36): у 1 • 10"2 • 102 + 9 • 10е • 10-8 = 0,03 м/с. 1 • 10~2 • 3600 7. Определение дисперсии по текущим измерениям. Математическое ожидание (среднее) и дисперсия генеральной совокупности оцениваются средним и дисперсией выборки тем точнее, чем больше объем выборки. При этом среднее характеризует результат измерений, а дисперсия — точность этого результата {дисперсия воспроизводимости) (см. гл. П, §4). Если проделано т параллельных опытов (опытов, проведенных при неизменном комплексе основных факторов) и получена выборка у у2, ..., ут значений измеряемой величины, то дисперсия воспроизводи- мости равна 2 S воспр tn tn У (уи - у)2 2 Уи и=1— и=1 и ошибка опыта (ошибка воспроизводимости) sBOCnp "|/ SBOcnp * Часто для оценки точности применяемой методики ставят специаль- ную серию опытов, многократно повторяя анализ одной и той же пробы. На проведение большой серии опытов требуется много времени, в течение которого может неконтролируемым образом измениться сред- нее значение результатов анализа. Значительно проще и удобнее опреде- лять ошибку воспроизводимости по текущим измерениям. Предположим, анализируются п проб. При анализе каждой пробы делается различное число параллельных опытов; m]t т2, .... тп. Вычис- лим частные дисперсии з? , з? , $ для каждой такой выборки в от- дельности. Число степеней свободы частных дисперсий соответственно 37
равно: J\ - 1, f2 = m2 - 1, fn=mn - 1. Общая дисперсия воспроиз- водимости всех опытов будет равна средневзвешенному значению част- ных дисперсий (в качестве весов берутся степени свободы): , fi^+f2s2 + +fns2n воспр Л + /2-|--Н/п (ffli —l)sf+(ma—l)s^ + • + (ff»n —l)Sn тг +m2+ • • + mn — n (11.37) Число степеней свободы общей дисперсии равно общему числу изме- рений минус число связей, использованных для определения п средних: п /воспр = mi + w2+ п= — (11.38) i=l Учитывая, что частные дисперсии определяются по результатам парал- лельных опытов по формуле mi 2 (ytu — yi)2 2 М=1 из (11.37) имеем 2 (ff»i — 1) + (rna — 1) ----н (тп — 1) s; Хвоспр mt + т2 + • • + тп — п mi п 2 „ У (mt — 1) S- 2 (т‘ “ U~l т._ ]------------------- п п ^mi — n ^mi — n i = l 1=1 2 2Gi«-^)2 1 = 1 u=l 2 (11.39) Если число параллельных опытов при анализе каждой пробы одина- ково ту=т2 = ...=тп=т, формулы для расчета дисперсии воспроиз- водимости упрощаются. При этом 2 Авоспр (т 1) ( $2 + s2 + • • • 4- тп — п 2 2 (т — 1) 2 si 2 Si ________1=1_____i=i п(т — 1) п (11.40) Таким образом, при равном числе параллельных опытов общая дисперсия воспроизводимости равна среднеарифметическому значению частных дисперсий. Число степеней свободы общей дисперсии при 38
этом равно /воспр — п(т —1). (П.41) И окончательно л т 2 S Gia —~yi)2 2 i=I а=1 5воспр“ п(т-1) ' <П'42> Число степеней свободы у общей дисперсии воспроизводимости, определяемой по формулам (11.39) и (11.42), гораздо больше, чем у каждой частной дисперсии в отдельности. Поэтому общая дисперсия воспроиз- водимости намного точнее оценивает дисперсию генеральной совокуп- ности ств2оспр. При вычислении дисперсии воспроизводимости по текущим измере- ниям объединяют между собой только те пробы, которые можно рас- сматривать как выборки из генеральных совокупностей с равными дисперсиями. При этом каждое из значений , •••, можно рас- сматривать как оценку одной и той же генеральной дисперсии. Пример 2. Результаты определения концентрации (%) Р2О5 в системе (NH^sHPCH - - К2СО3 - Н2О колориметрическим методом приведены в таблице. Определить ошибку колориметрического метода по текущим измерениям. Номер Номер пробы 1 2 3 4 5 6 7 8 1 27,9 19,3 4,5 22,3 10,8 16,3 8,8 12,6 2 27,2 19,7 5,2 23,5 8,9 15,8 8,7 13,5 3 26,8 — 4,8 21,7 — 17,2 9,2 13,3 %Уи 81,9 39,0 14,5 67,5 19,7 49,3 26,7 39,4 2236,49 760,58 70,69 1520,43 195,85 811,17 237,77 517,90 т1 3 2 3 3 2 3 3 3 Решение. По данным таблицы вычислим т? по формуле т- \2’ 2 у и) и=1 / 1 т,— 1 2 Уи~ ГП} Для вычисления общей дисперсии по формуле (11.37) понадобятся слагаемые вида 2 Si (mi — т1 / mi 2Уи 2 \u=l Уи—--------- mi 39
Для первой пробы имеем (mj—1)^ = 2236,49- -707’6' = 0,62. Аналогично (m2 — 1) «2 -= 0,08; (m3 — 1) s| = 0,61; (m4 — 1) = 1,68; (m5—l)sj= 1,805; (m, — 1) sg = 1,01; (m, — 1) = 0,14; (me — l)s| = 0,045. Число степеней свободы общей дисперсии воспроизводимости равно 8 8 /воспр=2А= 2 mi-8=22-8= 14- i=i »=1 И дисперсия воспроизводимости 8 2 2 si f I 2 " 5,99 s2 = —-----------= —-----= 0,4279. ВОСПР /в ос пр 14 Ошибка колориметрического метода, определенная по текущим измерениям, равна saocnp = SBocnp = V 9>4279 = 0,654. 8. Доверительные интервалы и доверительная вероятность. Выбороч- ные параметры являются случайными величинами, их отклонения от генеральных (погрешности) также будут случайными. Оценка этих отклонений носит вероятностный характер — можно лишь указать вероят- ность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероят- ностями. Пусть для генерального параметра а получена из опыта несмещен- ная оценка а*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность 0 — такую, что событие с вероят- ностью р можно считать практически достоверным, и найдем такое значение е =/( р ) = , для которого Р( | а*-а | <е?) = ?. (11.43) При этом диапазон практически возможных значений ошибки, возни- кающей при замене а на а*, будет ± большие по абсолютной величине ошибки будут появляться только с малой вероятностью р = 1 — р, (11.44) называемой уровнем значимости. Уровень значимости часто выражают в процентах. Иначе выражение (11.43) может быть интерпретировано как вероятность того, что истинное значение параметра а лежит в пре- делах а* — < а < а* + . (11.45) 40
Вероятность р называется доверительной вероятностью, она характе- ризует надежность полученной оценки. Интервал iv = а* ± £р называется доверительным интервалом. Границы интервала а'=а*- £р и а" = а* + + £р называются доверительными границами. Доверительный интервал при данной доверительной вероятности определяет точность оценки. Величина доверительного интервала зависит от доверительной вероят- ности, с которой гарантируется нахождение параметра а внутри дове- рительного интервала: чем больше величина р, тем больше и величина £р (т. е. чем с большей надежностью хотим гарантировать полученный результат, тем в большем интервале значений он может находиться). Увеличение числа опытов проявляется в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероятности при сохранении доверительного интервала. Обычно на практике фиксируют на определенном уровне значение до- верительной вероятности (0,9, 0,95 или 0,99) и исходя из этого опреде- ляют доверительный интервал результата /р. При построении довери- тельного интервала решается задача об абсолютном отклонении: +*р Р( I «* — « I < е₽) = р (Л«< е₽) = F( е₽) — F(~ е₽)= J /(x)dx= р. -‘3 (11.46) Таким образом, если бы был известен закон распределения оценки а*, задача определения доверительного интервала решалась бы просто. Рассмотрим в качестве такого примера построение довери- тельного интервала для математического ожидания нормально распре- деленной случайной величины X с известным генеральным стандартом, равным . Пусть имеется выборка объема п значений этой случайной величины. Наилучшей оценкой для тх является среднее выборки х: п У Xi - 1=1 х = -----• п Для построения доверительного интервала необходимо знать рас- пределение этой оценки. Для выборок из генеральной совокупности, распределенной нормально, можно показать (например, используя свой- ство линейности нормального распределения), что х также имеет нор- мальное распределение с математическим ожиданием тх и средним квадратическим отклонением ах = <зх/~/~п. Тогда, используя функцию Лапласа согласно (1.68), получим (е- X . (И.47) X / Задавшись доверительной вероятностью 0, определим по таблицам функции Лапласа /ср= ер/ от. Тогда доверительный интервал для математического ожидания будет иметь вид х — kR а- < т < х + кЙ а- Р х х Р х ’ 41
или _ а _ х~ k& TZZ <«ж< х+*р т П а (11.48) Из этой оценки видно, что уменьшение доверительного интервала об- ратно пропорционально корню квадратному из числа наблюдений. Сле- довательно, если надо уменьшить возможную ошибку в два раза, необ- ходимо увеличить число наблюдений в четыре раза. Знание генеральной дисперсии о2 позволяет оценивать математи- ческое ожидание даже по одному наблюдению. Если для нормально распределенной случайной величины X в результате эксперимента по 1учено значение х,, то доверительный интервал для математического ожидания с доверительной вероятностью [3 = 1 -р имеет вид *1 — ’“|_р/2 < тх < Х1 + ’“l-p/2, (11.49) где квантиль стандартного нормального распределения. Стан- дартное нормальное распределение симметрично относительно нуля, ПОЭТОМУ Up/2 = - U\-р/2 . Пример 3. Среднее значение температуры печи, полученное по четырем независимым измерениям оптическим пирометром, 2250°С. Ошибка при этом методе измерения Ю°С. Найти с надежностью 95% доверительные границы, внутри которых лежит истинное значение измеряемой температуры. Решение. Полагая, что ошибка измерения — это известный генеральный стандарт — 10°С и что случайная величина X (температура печи) распределена нормально, по формуле (11.49) имеем 2250 - k6 ~—<.т < 2250 + k. — • В /4 х ₽ /Г (11.50) При р = 95% “ 1,96 и, следовательно, истинное значение измеряемой температуры находится с надежностью 95% в следующих доверительных границах; 2240,2 2259,8. Закон распределения оценки а* зависит от закона распределения случайной величины X, в частности от самого параметра а. Чтобы обойти это затруднение, в математической статистике применяют обычно два метода: 1) приближенный — при п >50 заменяют в выражении для неизвестные параметры их оценками; 2) от случайной величины а* переходят к другой случайной величине, закон распределения которой не зависит от оцениваемого параметра а, а зависит только от объема выборки п и от вида закона распределения величины X. Такого рода величины наиболее подробно изучены для нормального распределения случайной величины X. В качестве доверительных границ а' и а" берут обычно симметричные квантили “(I—3)/2 а < а(1+3)/2 > (П.51) или с учетом (11.44) а’/2<а<а*_р/2. (11.52) 42
9. Проверка статистических гипотез. Под статистическими гипотезами пони- маются некоторые предположения от- носительно распределений генеральной совокупности той или иной случайной величины. Проверка гипотезы заключа- ется в сопоставлении некоторых стати- стических показателей, критериев про- верки (критериев значимости), вычисляе- мых по выборке, со значениями этих показателей, определенными в пред- положении, что проверяемая гипотеза верна. При проверке гипотез подвергает- ся испытанию некоторая гипотеза Но в сравнении с альтернативной гипотезой Н, которая формулируется или под- Рис. 15. Критическая область гипотезы Рис. 16. Проверка статистических ги- потез разумевается. Альтернативных гипотез может быть несколько. Чтобы принять или отвергнуть гипотезу, еще до получения выборки задаются уровнем значимости р. Наиболее употребительны уровни значи- мости 0,05; 0,02; 0,01; 0,10; 0,001. Уровню значимости соответствует довери- тельная вероятность р =1 -р. По этой вероятности, используя гипотезу о распределении оценки 0* (критерия значимости), находят квантильные доверительные границы, как правило, симметричные 0р/2 и 0i_p/2. Числа Ор/2 и 0i -p/2 называются критическими значениями гипотезы, зна- чения 0 *, меньшие 0р/2 и большие 0! _р/2, образуют критическую область гипотезы, или область непринятия гипотезы (рис. 15). Если найденное по выборке значение 0О попадает между 01/2 и 0|_р/2, то гипотеза допускает такое значение в качестве случайного, и поэтому нет оснований ее отвергать. Если же найденное значение 0О попадает в критическую область, то по данной гипотезе оно является практически невозможным. Но так как оно все-таки появилось, то отвергается гипотеза. При проверке гипотез можно совершать ошибки двух типов. Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность такой ошибки не больше принятого уровня значимости. Например, при р=0,05 можно совершить ошибку первого рода в пяти случаях из ста. Ошибка второго рода состоит в том, что гипотеза принимает- ся, а на самом деле она неверна. Вероятность ошибки второго рода зависит от характера проверяемой гипотезы, от способов проверки и от многих других причин, что сильно усложняет ее оценку. Эта вероятность тем меньше, чем выше уровень значимости, так как при этом увеличивается число отвергаемых гипотез. Одну и ту же статисти- ческую гипотезу можно исследовать при помощи различных критериев значимости. Если вероятность ошибки второго рода равна а, то 1 — а называют мощностью критерия. На рис. 16 приведены две кривые плот- ности вероятности случайной величины 0, соответствующие двум конку- рирующим гипотезам Н(а) и Н(б). Если из опыта получается значение 0 > 0Р, отвергается гипотеза Н и принимается альтернативная гипотеза Н, и наоборот, если 0 < 0 Р. Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Н вправо от 0Р, равна уровню 43
значимости р, т. е. вероятности ошибки первого рода. Площадь под кривой вероятности, соответствующей справедливости Н влево от 0А равна вероятности ошибки второго рода а, а вправо от 0? — мощности критерия. Таким образом, чем больше р, тем больше 1 - а. Для проверки гипотезы стремятся из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода. Например, найдены два значения и а% некоторого выборочного пара- метра. Эти значения можно рассматривать как оценки генеральных пара- метров а, и а2. Высказывается гипотеза, что различие между а) ид* слу- чайное и что генеральные параметры равны между собой, т. е. а, = а2. Такая гипотеза называется нулевой или нуль-гипотезой по терминологии Р. Фишера. Для проверки этой гипотезы нужно выяснить, значимо ли рас- хождение между и ai) в условиях нулевой гипотезы. Для этого обычно исследуют случайную величину Аа* = а* -а% и проверяют, значимо ли ее отличие от нуля. Иногда удобнее рассматривать величину a’f /а\ , сравни- вая ее с единицей. Отвергая нулевую гипотезу, тем самым принимают альтернативную. Альтернативная гипотеза распадается на две: erf > и а* <а% . Если одно из этих неравенств заведомо невозможно, то альтернативная гипо- теза называется односторонней и для ее проверки применяются односто- ронние критерии значимости (в отличие от обычных, двусторонних). При проверке гипотез очень важно учесть априорную информацию о возмож- ных значениях оцениваемых параметров, выяснить, что один из сравни- ваемых параметров не может быть больше другого. Иногда этот факт вытекает из постановки задачи. Например, изучая изменение чистоты реактива, заранее знаем, что в связи с разложением на свету чистота его с течением времени может только уменьшиться. Такая информация даст возможность при проверке гипотезы применить односторонний критерий значимости, который имеет меньшую вероятную ошибку второго рода, чем соответствующий двусторонний. Если известно, что одно из неравенств > (rf или а* < а2 заведомо невозможно, то и рассматривать необходимо лишь одну из половин кри- тической области (см. рис. 15). Например, р=0,05 при двустороннем кри- терии соответствуют критические значения 0О>О25 и 60,975, т-е- значимыми (неслучайными) считаются 0*, принявшие значения 0*< О0,о25 и 0*> > 60,975 • При одностороннем критерии значимости одно из этих нера- венств (например, 0* <00,025) заведомо невозможно и значимыми будут лишь 0*>Оо,э75- Вероятность последнего неравенства равна 0,025, и, следовательно, уровень значимости будет равен 0,025. Таким образом, если при одностороннем критерии значимости использовать те же кри- тические числа, что и при двустороннем, этим значениям будет со- ответствовать вдвое меньший уровень значимости. Обычно для одно- стороннего критерия берут тот же уровень значимости, что и для дву- стороннего. При этих условиях оба критерия обеспечивают одинаковую ошибку первого рода. Для этого односторонний критерий надо выводить из двустороннего, соответствующего вдвое большему уровню значи- мости, чем тот, что принят. Чтобы сохранить для одностороннего кри- терия уровень значимости р = 0,05, для двустороннего необходимо взять р =0,10, что дает критические значения 0О,О5 и 0о95. Из этих критических 44
значений для одностороннего критерия останется какое-нибудь одно, например 0о,э5 • Уровень значимости для одностороннего критерия равен при этом 0,05. Этому же уровню значимости для двустороннего критерия соответствует критическое значение 0О>976 • Но 0О,95 < 0О 975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода. 10. Оценка математического ожидания нормально распределенной случайной величины. При отсутствии грубых и систематических ошибок математическое ожидание случайной величины совпадает с истинным результатом наблюдений. Поэтому оценка математического ожидания имеет важное значение при обработке наблюдений. Легче всего оценить математическое ожидание при известной дисперсии генеральной сово- купности (см. гл. П. 8). Генеральную дисперсию <т2 нельзя получить из наблюдений, ее можно только оценить при помощи выборочной дисперсии №. Ошибка от замены генеральной дисперсии выборочной будет тем меньше, чем больше объем выборки п. На практике эту по- грешность не учитывают при л>50 и в формуле’ (11.49) для довери- тельного интервала генеральный параметр <ух заменяют выборочным стандартом. В дальнейшем предполагается, что наблюдаемая случайная величина имеет нормальное распределение. При небольших объемах выборок для построения доверительного интервала математического ожидания используют распределение Стьюдента, или /-распределение. Распределение Стьюдента имеет случайная величина t: х — т _____ t=-------—/п . (11.53) s х Плотность вероятности ее имеет вид где Г(/) — гамма-функция; /— число степеней свободы выборки. Если дисперсия / и среднее х определяются по одной и той же выборке, то f= п - 1. Таким образом, распределение Стьюдента зависит только от числа степеней свободы / с которым была определена выборочная дисперсия (рис. 17). На рис. 17 приведены графики плотности /-распределения для /=1,/=5 и нормальная кривая. Кривые /-распределения по своей форме напоминают нормальную кривую, но при малых /они медленнее сбли- жаются с осью абсцисс при I/|-*°°. При /-►<» дисперсия выборочная №-*а2, поэтому распределение Стьюдента сближается с нормальным; соответствует нормальному распределению. Вероятность того, что случайная величина попадет в некоторый интервал (tp/2; Zj—д72), опре- деляется выражением Р ( ^₽/2 ^1—р/г) ~ 1—Р ~ (11.55) 45
Рис. 17. Плотность распределения Стьюдента Распределение Стьюдента симме- трично относительно нуля, поэтому ^Р/2 ~ ^~Р/2 (11.56) Учитывая симметрию 7-распреде- ления, часто пользуются обозначени- ем tpf, где /— число степеней свободы, а р — вероятность того, что t находится за пределами интервала(7р/2,7] _.р/2). Подставляя в (11.56) выражение (11.53) для 7, получим неравенство х — т h—p/2 ~ ^1—р/2 > (11.57) X откуда после преобразований получим Х~ G-P/2- (II. 58) у п у п Значения квантилей 7|_p/2 для различных чисел степеней свободы f и уровней значимости р приведены в табл. 3 приложения. В некоторых задачах требуется найти одностороннюю оценку матема- тического ожидания, т. е. оценку только сверху или только снизу. При доверительной вероятности Р = 1 -р оценка для случайной величины 7 сверху имеет вид i h-p, если х — т .— t -----(11.59) X оценка для t снизу имеет вид 1 ~ 11-р, или 7 х — т (11.60) X Из неравенств (11.59) и (11.60) получим односторонние доверительные оценки для математического ожидания сверху: _ s mx<*+~G-p (П.61) V п и снизу: х ~ h-p- (11.62) 46
Пример 4. Вредной примесью в кормовых фосфатах является фтор. Необходимо найти возможный верхний предел содержания фтора в фосфатах по следующим результатам анализов в 100 кг готового продукта (F, %): 0,18; 0,12; 0,13; 0,15. Доверительная веро ятность р —0,95. Решение. Обозначим через X результат анализа содержания фтора в 1Q0 ki кормовых фосфатов. Среднее содержание фтора по четырем параллельным определениям равно х — 0,15%. Ошибка воспроизводимости —0,03%. Число степеней свободы ошибки воспроизводимости равно 3. Для определения возможного верхнего предела содержания фтора в готовом продукте (тх) воспользуемся формулой (11.61). При р —0,95 и f—3 по табл. 3 приложения для 2р — 0,10 имеем То,95 — 2,35. Отсюда тх < 0,15 + 0,03 • 2,35/4 = 0,1676. Пример 5, Диаммонийфосфат «ч.д.а.» должен содержать не менее 99% основного вещества. Требуется проверить гипотезу статистической значимости различия между паспортными данными и следующими результатами трех определений содержания диаммонийфосфата в реактиве: 98,3; 97,3; 97,8%. Решение. Обозначим через X результат анализа. Среднее значение трех парал- лельных измерений равно х —97,8%. Ошибка воспроизводимости равна 0,5%. Число степеней свободы ошибки воспроизводимости /—2. В качестве нулевой гипотезы рас- смотрим гипотезу И0-. тх —99%, т.е. исследуемый реактив доброкачественный. Альтерна- тивная гипотеза Н: mxit99°/<>. Используя распределение Стьюдента, определим вначале критическую область при двустороннем критерии. При р — 0,95 р — 0,05 и квантиль fj-p/2— -4,30 при ffl (табл. 3 приложения). Критические значения нулевой гипотезы согласно (11.58) будут 7>иж+ /]_р/2 sx/pV. Физический смысл имеет только первое неравенство: х< 99 —4,30 0,5/уз" = 97,76. Значение х —97,8 не попадает в эту критическую область, следовательно, двусторонний критерий не позволяет отвергнуть нулевую гипотезу и считать реактив недоброкаче- ственным. По физическому смыслу задачи здесь можно применить односторонний критерий — диаммонийфосфат разлагается при хранении на свету, поэтому выборочную оценку нужно сравнивать только с теми значениями, которые меньше 99%. При р—0,95 и /—2 по табл. 3 приложения для 2р — 0,10 имеем to,95 — 2,92. Критиче- ское значение нулевой гипотезы Х<тх -tx_p sjVT, х<99 — 2,92 • О,5//3" = 98,16. Значение х —97,8, меньше критического значения и, следовательно, попадает в крити- ческую область. Таким образом, односторонний критерий как более точный сумел при тех же исходных данных выявить недоброкачественность реактива. 11. Оценка дисперсии нормально распределенной случайной величины. Дисперсию генеральной совокупности ст 2 нормально распределенной случайной величины можно оценить, если известно распределение ее оценки —выборочной дисперсии 4 . Распределение выборочной диспер- сии можно получить при помощи распределения Пирсона или X2- распределения. Если имеется выборка п независимых наблюдений х(, х2,хп над нормально распределенной случайной величиной, то можно показать, что сумма 47
(11.63) имеет распределение Z2 с /= п - 1 степенями свободы. Плотность X2 распределения зависит только от числа степеней сво- боды/: 1-2 х* Т(х2) = WO72)(XS)2 ' 2' 0<х2<о°- <П<64) где Г(/) — гамма-функция. На рис. 18 приведены кривые плотности вероятности X2-распределе- ния при некоторых значениях / Кривые асимметричны, степень асим- метрии уменьшается с увеличением / При доверительной вероятности р = 1 -р двусторонняя доверительная оценка для X2 имеет вид Хр/2 < X2« Х?_р/2, (11.65) односторонние оценки имеют вид Х2<Х?_р- Х2>Х₽- (11.66) Квантили Z2_p при различных р uf приведены в табл. 4 приложения. Так как выборочная дисперсия з2 через элементы выборки определяется по формуле ’из (11.63) имеем Х2=/«х/’Г (II. 67) Подставляя (11.67) в (11.65), получим 2 2 Х₽/2 < < Х,_ру2 • (11.68) Решая неравенство относительно ст2 , получим доверительные двусто- ронние границы для генеральной дисперсии ст2 ; Рис. 18. Плотность Х2-распределе- ния 2 fSx —-----(И.69) Х|—р/2 ЛР/2 Аналогично получаются односторон- ние доверительные оценки: а Г&х 2 Л* ’^ТГ’ (П-70) Хр А1-р 48
Пример 6. Оценить ошибку воспроизводимости определения усвояемой P2Os в сложном удобрении сернокислотным методом по результатам трех параллельных опытов: 17 2- 16,3; 15,5. Решение. Выборочная оценка для дисперсии воспроизводимости равна Число степеней свободы дисперсии воспроизводимости f — 2. Задавшись довери- тельной вероятностью р—0,90, по табл. 4 приложения при числе степеней свободы /—2 находим Z о,os —6,0 и Хо,96 —0,103. По формуле (11.69) определим двустороннюю доверительную оценку для дисперсии воспроизводимости: 0,73 • 2 , 0,73 • 6 ---------< я < ---------- > 6,0 * 0,103 0,24 14,1. Извлекая из всех частей неравенств квадратный корень, получим оценку для ошибки воспроизводимости 0,49* о** 3,61. В связи с малым числом степеней свободы дове- рительные границы получились резко асимметричными. С ростом числа степеней свободы асимметрия кривых распределе- ния уменьшается, соответственно уменьшается и асимметрия доверитель- ных границ. Можно показать, что при п >30 выборочный стандарт s распределен приближенно нормально с математическим ожиданием ms = и среднеквадратичной ошибкой = ’х//27- (11-71) Неизвестный генеральный стандарт в выражении (П.71) при л >30 заме- няют выборочным; ,s^&xiyTf. (11.72) В соответствии с (11.50) доверительные границы для генерального стан- дарта определяются неравенством s s sx~^7^ и'~р12 * s* + yjj ui-p/2 • (П-73) Пример 7. Оценить ошибку воспроизводимости ох для выборки из 31 наблюдения с выборочным стандартом sx — 0,85. Доверительную вероятность р принять равной 0,9. Решение. Построим доверительный интервал для ошибки воспроизводимости, используя Х2-распределение. По табл. 4 приложения при числе степеней свободы /—30 и доверительной вероятности р—0,9 находимXo.os — 43,8иХо,95 —18,5. По формуле (П.69) определим двустороннюю доверительную оценку для дисперсии воспроизводимости: 0,852 • 30 2 0,852 • 30 43,8 18,5 ’ 0,48 1,13. Доверительные границы для ошибки воспроизводимости определятся неравен- ством 0,69* а** 1,05. Определим доверительные границы для ах, воспользовавшись нормальным распре- делением. По формуле (11.72) определим as: 49
ytf- Г2 • 30 По табл. 2 приложения для доверительной вероятности р—0,9 находим «0,95 — 1,64. В соответствии с (11.73) доверительные границы для ошибки воспроизводимости опре- деляются неравенством 0,85 — 0,11 • 1,64 <<^<0,85+ 0,11 • 1,64; окончательно 0,67 * 1,03. Полученные с использованием нормального распределения доверительные границы мало отличаются от приведенных выше. 12. Сравнение двух дисперсий. При обработке наблюдений часто возни- кает необходимость сравнить две или несколько выборочных дисперсий. Основная гипотеза, которая при этом проверяется: можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генераль- ной дисперсии. Рассмотрим две выборки X], х2 , •. • , xni, *2.....< средние значения которых соответственно равны хти х2. Выборочные дисперсии 2 i= 1 2 i=l S — , .... s — ' - 1 Лд — 1 ’ 2 n2 — 1 определяются co степенями свободы /1 = л1 — 1, fz — пг — 1- Требуется выяснить, являются ли выборочные дисперсии ^2 и 52 значимо различными или же полученные выборки можно рассматривать как взятые, из генеральных совокупностей с равными дисперсиями. Предположим, что первая выборка сделана из генеральной совокупности с дисперсией а 2 , а вторая — из генеральной совокупности с дисперсией <т2 . Прове- ряется нулевая гипотеза о равенстве генеральных дисперсий Яо: 172 =’ ст2 • Чтобы отвергнуть эту гипотезу, нужно доказать значимость различия между и при выбранном уровне значи- мости р.В качестве критерия значимости обычно используется критерий Фишера. Распределением Фишера (^-распределение, ^-распределение) называется распределение случайной величины: ^ = ( 5!/4) = ( 4/°г)- (”-74) Плотность вероятности F-распределения определяется выражением р / Л + As ) г|------- „(71-21/2 <?(F) =------------------ Г/1/2 ------------4 ; 1/, ' ’ (П• 75) ? г (Л/2) г (f2/2) 71 Гг (f2 + ЛГ)(Ь +/>>/2 где Г(/) — гамма-функция. F-Распределение зависит только от числа степеней свободы j\ и 50
f2. На рис. 19 приведены кривые плот- ности вероятности F-распределения для некоторых значенийи/2. Кривые имеют асимметричную форму. В табл. 5 при- ложения приведены квантили FI p для уровня значимости р=0,05 и чисел степе- ней свободы и /2. Для определения квантилей Fp для значений р использует- ся соотношение В условиях нулевой гипотезы = о’ и а’ / а? = 1, и,следовательно, F-распределение может быть непосредственно использовано для оценки отношения выборочных дисперсий $2 / gi . При доверительной вероят- ности 1 - р двусторонняя доверительная оценка величины F имеет вид Fpji^fl’ fz) < F < F]_ р/2 (/1, fz)- С учетом (11.76) (И.77) В условиях нулевой гипотезы /^ , следовательно, с вероят- ностью 1 - р должно выполняться двустороннее неравенство 7^7777<,Lra’ или одно из односторонних неравенств: si/ 4 (Л , fz) (оценка сверху), (И. 79) Л1/ 4 1/Л-р(/2> fl) (оценка снизу). Вероятность неравенств, противоположных (П.78) и (11.79), рав- на уровню значимости р, они образуют критическую область для нулевой гипотезы. Если полученное дисперсионное отношение попадает в критическую область, различие между дисперсиями надо считать значимым. Будем для удобства обозначать через s? боль- шую выборочную дисперсию. При проверке нулевой гипотезы ст,2 = о22 односторонний критерий применяется, если альтернатив- ной гипотезой является гипотеза ст,2>ст22, т. е. если большей выборочной дисперсии 5,2 заведомо не может соответствовать меньшая генеральная. При этом различие между дисперсиями согласно (IL79) следует считать значимым, если *1/ sl > Fl-P (fl - fz)- (П.80) 51
Значение F\..p(fa, fa) для p = 0,05 можно определить по табл. 5 приложения. Двусторонний критерий значимости (IL78) применяется для альтернативной гипотезы <т,2^=<т52, т. е. когда соотношение между генеральными дисперсиями неизвестно. При этом в неравенстве (IL78) надо проверять только правую часть, так как левая часть всегда выполняется: по условию -1>>.а_________________О s| fl) для небольших р. При этом различие между дисперсиями следует считать значимым, если Sf/ 42 > ^1—р/2^1 > ^)- (И-81) Пример 8. При Оценке точности определения содержания усвояемой Р2О5 в сложном удобрении сернокислотным методом дисперсия воспроизводимости составила Я—0,73; f = 2. Требуется сравнить этот метод анализа усвояемой Р2О5 с более точным цитратным методом по результатам четырех параллельных определений Р2О5: 16,5; 15,9; 16,6; 15,8. Решение. Дисперсия воспроизводимости цитратного метода при числе степеней свободы fi-З. По условиям задачи для оценки значимости раз- личия между дисперсиями .у2 и г,2 можно использовать односторонний критерий зна- чимости (11.80). Дисперсионное отношение F— 0,73/0,16 — 4,5 надо сравнить с табличным для уровня значимости р=0,05 и чисел степеней свободы /i = 2 и /2—3 Fi — р()\, /2) — 9,6. Таким образом, выборочное дисперсионное отношение меньше табличного и данные опытов не позволяют считать точность методов значимо различной. Критерий Фишера можно использовать для сравнения диспер- сий, если одна из дисперсий является генеральной. Число степен- ней свободы генеральной дисперсии считается равным 13. Сравнение нескольких дисперсий. При определении оценки дисперсии по текущим измерениям по формуле 2 /й'1 + М2+ ’ ' ' + -I} $ — .. , — ... . У fl + /2 + • + fn f была принята нулевая гипотеза равенства соответствующих гене- ральных дисперсий. Проверить эту гипотезу для выборок разного объема можно по критерию Бартлета. Бартлет показал, что в условиях нулевой гипотезы отношение В/С, где В = 2,303 (/lg^~ 2 ft lg^ ) , \ 1=1 / (11.82) 52
распределено приближенно как X2 с и—1 степенями свободы, если все f > 1 Гипотеза равенства генеральных дисперсий принимается, если Д/С<Х12-Р (11-83) при выбранном уровне значимости р. Различие между выбороч- ными дисперсиями можно считать незначимым, а сами выборочные дисперсии — однородными. Так как всегда С> 1, если окажется В</2_р,нулевую гипотезу следует принять; если B>xf_/), крите- рий Бартлета вычисляют полностью. Пример 9. При получении фосфора возгонкой из фосфатов измерялась степень восстановления фосфата при четырех различных температурах. В таблице приведены результаты статистического анализа однородности дисперсий воспроизводимости резуль- татов при разных температурах. Температура $2 / Л-5? 1 1 1g # 1 Л 1g .7? ' 1 I / Г1 1,72 5 8.60 0,2355 1,177 0,200 ь 1,60 4 6,40 0,2041 0,816 0,250 Тз 1,97 6 11,82 0,2945 1,767 0,167 Г« 2,37 8 18,96 0,3747 2,995 0,125 23 45,78 6,755 0,742 Определить, не меняется ли точность анализа с температурой. Решение. По данным таблицы дисперсия воспроизводимости равна = 45,78/23= 1,99. 1g з* = 0,2889, /lg52 = 23 • 0,2889 = 6,874, !// = 1'23 0,0435. В= 2,303(6,874 — 6,755) = 0,278, 0,742 — 0,0435 С = | + о .077 = 1,077. 3(4—1) По табл. 4 приложения находим при трех степенях свободы и уровне значимости Р = 0,05, Хо,95 = 7,8. Величина ЖХ0.95 и, следовательно, на уровне значимости р = 0,05 можно принять гипотезу о равенстве генеральных дисперсий. Величину С можно было не вычислять. Таким образом, критерий Бартлета позволяет считать, что точность анализа не зависит от температуры. Выборочные дисперсии однородны, поэтому в качестве оценки для дисперсии воспроизводимости можно взять средневзвешенную дисперсию $2 с числом степеней свободы / равным 23. Если выборочные дисперсии получены по выборкам одинаковых объемов тх = т2 =... = т„ = т, для их сравнения используют более Удобный и точный критерий Кохрена. Кохрен исследовал распре- деление максимальной выборочной дисперсии к сумме всех диспер- сий: 2 6 ~ ^тах (1184) 53
Распределение случайной величины G зависит только от числа суммируемых дисперсий п и числа степеней свободы f с которым определена каждая дисперсия: f=m— 1. В табл. 6 приложения приведены квантили G\p для уровней значимости р = 0,05. Если найденное по выборочным дисперсиям значение критерия Кохрена окажется меньше табличного G<G1_p(«, f), (11.85) где «—число суммируемых дисперсий;/= т — 1,расхождение между дисперсиями нужно считать случайным при выбранном уровне значимости р. Если при этом определяется оценка для дисперсии воспроизводимости, однородные дисперсии можно усреднить. Число степеней свободы f среднеарифметической дисперсии равно /= п(т-\). 14. Сравнение двух средних. Для сравнения между собой двух средних, полученных по выборкам из нормально распределенных генеральных совокупностей, применяется критерий Стьюдента, или /-критерий. Пусть заданы две случайные выборки: хь х2,...,хп, и у,, У2>—>У«2- Первая выборка взята из нормально распределенной генеральной совокупности с параметрами тх и ст/, вторая —из генеральной совокупности с параметрами mv и сту2. По выборкам получены оценки для этих параметров: ~х, ./ и у sf. Требуется проверить нулевую гипотезу: тх = ту при условии ст/ = ст/ = ст2. Рассмотрим случайную величину г = х — у. (II 86) По свойству линейности нормального распределения (см. гл. I, 5) z распределена нормально с параметрами: т, = т — т„ г X у > 2 2 2 °Х , °2у , / 1 , 1 \ а=а-+а-=--------1----= а2---- -|-| (11.87) 1 х У п2 \ tii rii ) Составим нормированную случайную величину 2 — т- (х — и) — (тх— ти) ----i- = ——, (11.88) аг Я К1М1 + 1 /«2 которая имеет стандартное нормальное распределение. Если генеральный стандарт ст заменить выборочным, получится величина, имеющая распределение Стьюдента (II.89) S Kl/Л! + I IП2 с числом степеней свободы f, равным/= и, + «22. Однородность выборочных дисперсий sx и у* можно проверить по критерию Фишера. При доверительной вероятности В = 1-р имеем двустороннюю оценку для разности тх-ту: 54
(11.90) или односторонние оценки: < х — у + t^p j 1 /rij + 1 /па , (11.91) тх~ту>-~—У— li-p s /пх + * /«j • (11.92) В условиях нулевой гипотезы тх = ту, и неравенства (1L91) и (II92) дают критерий проверки этой гипотезы. Нулевая гипотеза отвергается при двустороннем критерии, если | х — у / > /(_р/2 л j/l/«J + 1 /п2 ; (11,93) при одностороннем критерии,если | х—у | > p^l/rii + !/л2 , (11.94) Приведенными критериями нельзя пользоваться, если генераль- ные дисперсии <зх и <зу не равны между собой. Для этого случая существует несколько приближенных критериев для сравнения двух средних. При п}=п2 = п можно воспользоваться приближенным /-критерием s2x + s2y с числом степеней свободы (11.95) • <"-9« где с=4/(4‘ 4)- (11.97) Если число степеней свободы si равно = п, — 1, a s? равно /2 = и2_1, можно использовать другой приближенный критерий. Вычислим отношения v^sg/n,, v2= sj /п2. По табл. 3 приложе- ния найдем квантили и h-p/iCfz)- Вычислим величину Vi^—P/2 V^\—p/2 (/») (11.98) ЕЧ + «2 Нулевая гипотеза mx = my отвергается, если |x~!/|>T. (11.99) Сформулированный критерий является двусторонним, он превращает- ся в односторонний при замене р/2 на р. Пример 10. Исследовался процесс радикальной полимеризации солей на основе 4-винилпиридина и двух различных галоидных алкилов: йодистого бутила —C4H9I и бромистого этила — CsHsBr. Сравнить реакционную способность галоидных алкилов, если средний (л — 8) выход полимера при проведении синтеза с C4H9I составил 55
67,72% (х), а средний выход (л —8) с СгНбВг — 91,61% (у). Ошибка воспроизводимости процесса полимеризации равна з — 16,6%. Решение. В качестве нулевой гипотезы рассматривается гипотеза равенства реакционных способностей галоидных алкилов. Число степеней свободы дисперсии воспроизводимости равно /—8 + 8- 2 — 14. Поскольку средние данные позволяют пред- положить, что реакционная способность бромистого этила выше, можно применить для оценки значимости различия односторонний критерий (11.95). При /—14 и р— 0,05 10.95 — 1,76. Поэтому ti.p SУ1/Л1+ 1/п2 = 1,76- 16,6 V1/8+ 1/8= 14,15; у - х — 23,89 > 14,15. Следовательно, при 5%-ном уровне значимости нулевая гипотеза отвергается и разницу реакционных способностей галоидных алкилов следует считать значимой. Если ие делать предположения, что реакционная способность бромистого этила выше, для проверки нулевой гипотезы надо использовать двустороииий критерий (11.94). При/- 14 и р -0,05 fo,976 - 2,15. Поэтому <1_р/г s V1М1+ Пла = 2,15 • 16,6 /1/8 + 1/8= 17,2; у — х = 23,89 > 17,2. Таким образом, и при двустороннем критерии нулевая гипотеза отвергается. Нередко на практике выборка наблюдений составляется из нескольких подгрупп, полученных в том или ином порядке (на- пример, из различных частей генеральной совокупности). Для объединения таких подгрупп в одну выборку необходимо убедиться в однородности средних по подгруппам. Для этого проверяют значимость различия между средними подгрупп и общим средним всей выборки по критерию Стьюдента. Пусть имеется к подгрупп значений случайной величины X объемом тр т2,...,тк. По этим данным определены средние подгрупп хр х2,...,х/,...,^, среднее всей выборки х и среднее квадра- тичное отклонение всей выборки s: rnj п 2 xh 5 * - 1=1 - 1=1 где п = /и, + /и2+...+ тк; Обозначим У3= (*i — x)/s- (II. 100) Можно доказать, что величина tt= (П 101) п — mj — mjy^ имеет распределение Стьюдента с f=n-2 степенями свободы. При помощи этого критерия проверяется нулевая гипотеза Н° равен- 56
ства математического ожидания в у-й подгруппе т, и математиче- ского ожидания всей выборки т: = т. Нулевая гипотеза отвергается, если не выполняются неравенства (II55) для двустороннего критерия или неравенства (1159) и (1160) для одностороннего. Обычно в качестве среднего х) рас- сматривают наибольшее (наименьшее) среднее среди средних подгрупп. 15. Сравнение нескольких средних. При сравнении нескольких средних можно использовать f-критерий, проводя сравнение попарно. Однако для использования при сравнении полной информации о всех средних такое сравнение проводят при помощи множествен- ного рангового критерия Дункана. Пусть по к выборкам разного объема получено к средних значений: Xk. Генеральные дисперсии равны между собой, т. е. При применении критерия Дункана следует: 1) проранжировать к средних значений, расположив их в порядке возрастания; 2) определить ошибку воспроизводимости результатов sx с соответ- ствующим числом степеней свободы fx; 3) определить ошибку для каждого среднего: 5_ = j/" s^j nj , j= 1, 2, , k; 4) выписать из таблицы Дункана (табл. 7 приложения) (к-\) значений рангов с выбранным уровнем значимости, числом nD=fx и р = 2,3,...Л; 5) умножить эти значения рангов на sx. и таким образом определить (к-l) наименьших значимых рангов; 6) проверить значимость различия между средними, начиная с край- них в ранжировочном ряду; разность максимального и минималь- ного значений среднего сравнить с наименьшим значимым рангом при р = к, затем найти разность максимального среднего и второ- го среднего в ранжировочном ряду и сравнить ее с наименьшим значимым рангом при р = к-1 и т. д. Это сравнение продолжить для второго по величине среднего, которое сравнивается с наимень- шим, и т. д., пока не будут исследованы на значимость различия между всеми к(к-1)/2 парами. Пример 11. Исследовался процесс радикальной полимеризации солей на основе 4-вииилпиридииа и различных галоидных алкилов: СНз1, C2H5I, C3H7I, C4H9I, С2Н5В1, СзН?Вг, C4H9CI, C3H7CI. Средний выход полимера по восьми параллельным опытам для каждого галоидного алкила приведен ниже: 57
N« п/п . . Галоидные алкилы Средний выход, % 0 1 2 3 4 5 6 7 СНз! C2H5I C3H7I C4H9I С2Н5Вг СзН?Вг С<Н9С1 СзНтС! 95,12 85,46 87,77 67,72 91,61 76,04 13,28 11,72 Ошибка воспроизводимости при измерении выхода полимера sx — 16,83. Число степеней свободы /х — 56. В соответствии с правилом применения критерия Дункана расположим средние результаты в порядке возрастания: 11,72 13,28 67,72 76,04 85,46 87,77 91,61 95,12 (7) (6) (3) (5) (1) (2) (4) (0) Ошибка среднего равна sx — 16,3 /Z8 - 5,95. Выпишем из таблицы Дункана (табл. 7 приложения) для л2 = 56 и уровня значи- мости 0,05 значимые ранги: р .... 2 3 4 5 <6 7 8 Ранги . . . 2,85 3,0 3,09 3,12 3,21 3,25 3,29 Наименьшие значимые ранги (НЗР), умноженные на ошибку среднего, равны: Р НЗР • sx 2 3 4 5 6 7 8 16,96 17,85 18,39 18,56 19,1 19,34 19,58 (0) — (7) = 95,12 — 11,72 = 83,4 > 19,58— различие значимое (0) — (6) = 95,12 — 13,28 == 81,84 > 19,34 — различие значимое (0) — (3) = 95,12 — 67,72 = 27,4 > 19,1 — различие значимое (0) — (5) = 95,12 — 76,04 = 19,08 > 18,56 — различие значимое (0) — (1) = 95,12 — 85,46 = 9,66 < 18,39 — различие незначимое (0) — (2) = 95,12 — 87,77 < 17,85 — различие незначимое (0) — (4) = 95,12 — 91,61 < 16,96 — различие незначимое (4) — (7) = 79,89 > 19,34— различие значимое (4) — (6) = 78,33 > 19,1 — различие значимое (4) — (3) = 23,89 > 18,56 — различие значимое (4) — (5) = 13,57 < 18,39 — различие незначимое (4) — (1) = 6,16 < 17,85 — различие незначимое (4) — (2) = 3,84< 16,96 — различие незначимое (2) — (7) = 76,05 > 19,1 — различие значимое (2) — (6) = 74,49 > 18,56— различие значимое (2) — (3) = 20,05 > 18,39 — различие значимое (2) — (5) = 11,76 < 17,85 — различие незначимое (2) — (1) = 2,31 < 1 6,96 — различие незначимое (1) _ (7) = 73,74 > 18,56 — различие значимое (1) — (6) = 72,18 > 18,39 — различие значимое (1)_ (3) = 17,74 < 17,85 — различие незначимое (1) — (5) = 9,42 < 16,96 — различие незначимое (5) — (7) = 64,32 > 18,39 — различие значимое (5) — (6) = 62,76 > 17,85 — различие значимое (5) — (3) = 8,32 < 16,96 — различие незначимое (3) _ (7) = 56,00 > 17,85 — различие значимое (3) — (6) — 54,44 > 16,96— различие значимое (6) — (7) = 1,56 < 16,96 — различие незначимое 58
16. Проверка однородности результатов измерений. Грубые измере- ния являются результатом поломки прибора или недосмотра экспериментатора, и результат, содержащий грубую ошибку, резко отличается по величине. На этом основаны статистические критерии оценки и исключения грубых измерений. Наличие грубой ошибки в выборке значений случайной величины X нарушает характер распределения, изменяет его параметры, т. е. нарушается однород- ность наблюдений. Поэтому выявление грубых ошибок можно трактовать как проверку однородности наблюдений, т. е. проверку гипотезы о том, что все элементы выборки х,, х2,...,х„ получены из одной и той же генеральной совокупности. Будем по-прежнему полагать, что случайная величина подчиняется нормальному распре- делению. Для решения этой задачи предложено несколько методов. Имеется выборка хр х^,...,х„ значений случайной величины X. Пусть xmaxfxminj—наибольший (наименьший) результат измерения. Величины или имеют специальное распределение, которое зависит только от числа степеней свободы f=n-2 В табл. 2 приведены значения v(v') для уровней значимости р=0,10; 0,05; 0,025 и 0,01 при числе степеней свободы от 1 до 23. Величина xmax fxmin) исключается из выборки как грубое изме- рение (на уровне значимости р), если определенное по формулам (11.102) и (II. 103) значение v или v' окажется больше табличного. Таблица 2. Значения р (»') для различных уровней значимости Число сте- пеней свободы f Уровни значимости р Число сте- пеней свободы f Уровни значимости р 0,10 0,05 0,025 0,01 0,10 0,05 0,025 0,01 1 1,406 1,412 1,414 1,414 13 2,326 2,493 2,638 2,800 2 1,645 1,689 1,710 1,723 14 2,354 2,523 2,670 2,837 3 1,791 1,869 1,917 1,955 15 2,380 2,551 2,701 2,871 4 1,894 1,996 2,067 2,130 16 2,404 2,577 2,728 2,903 5 1,974 2,093 2,182 2,265 17 2,426 2,600 2,754 2,932 6 2,041 2,172 2,273 2,374 18 2,447 2,623 2,778 2,959 7 2,097 2,237 2,349 2,464 19 2,467 2,644 2,801 2,984 8 2,146 2,294 2,414 2,540 20 2,486 2,664 2,823 3,008 9 2,190 2,343 2,470 2,606 21 2,504 2,683 2,843 3,030 10 2,229 2,387 2,519 2,663 22 2,520 2,701 2,862 3,051 И 2,264 2,426 2,562 2,714 23 2,537 2,717 2,880 3,071 12 2,297 2,461 2,607 2,759 59
Если сомнение вызывают два или три элемента выборки, поступают следующим образом; Для всех сомнительных элементов вычисляют v(v'), и исследование начинается с элемента, имеющего наименьшее значение v(v'). Остальные сомнительные элементы из выборки исключаются. Для этой уменьшенной выборки опреде- ляют х, s и новое значение v(v') для исследуемого элемента. Если исследуемый элемент является грубым измерением, еще с большим основанием можно считать грубыми измерениями ранее исключенные элементы. Если исследуемый элемент не является грубым измерением, его присоединяют к выборке и начинают исследовать следующий по величине v(v') элемент выборки, при этом снова вычисляют новые значения х i и т. п. Пример 12. При пятикратном определении степени извлечения алкалоидов из растительного сырья получено среднее значение степени извлечения х — 85%, причем sx — 2%. Максимальное значение 92%, полученное в одном из параллельных опытов, вызывает сомнение. Проверить, не является ли значение степени извлечения, равное 92%, грубым измерением. Решение. По формуле (11.102) определены г для сомнительного элемента: 92 — 85 7 v = -------=-----------= 3,9. 2/4/5 2 • °.895 По табл. 2 находим для f = п - 2 — 3 го.аа — 1,869 иг — 3,9 > го.вь. Следовательно, на уровне значимости р—0,05 значение степени извлечения, равное 92%, надо считать ошибочным, его следует из выборки исключить и заново пере- считать х и ,sv. 17. Сравнение выборочного распределения и распределения ге- неральной совокупности. Проверку гипотез относительно параметров распределения генеральной совокупности проводили в предполо- жении нормального распределения наблюдаемой случайной величи- ны. Гипотезу о нормальности изучаемого распределения в матема- тической статистике называют основной гипотезой. Проверку этой гипотезы по выборке проводят при помощи критериев согласия. Критерии согласия применяют для проверки гипотезы о предпола- гаемом виде закона распределения. Критерии согласия позволяют определить вероятность того, что при гипотетическом законе распределения наблюдающееся в рассматриваемой выборке отклоне- ние вызывается случайными причинами, а не ошибкой в гипотезе. Если эта вероятность велика, то отклонение от гипотетического закона распределения следует признать случайным и считать, что гипотеза о предполагаемом законе распределения не опроверга- ется. Вероятностный характер критериев не позволяет однозначно принять или отвергнуть проверяемую гипотезу. Критерий позволяет утверждать, что гипотеза не противоречит опытным данным, если вероятность наблюдаемого отклонения от гипотетического закона велика, или что гипотеза не согласуется с опытными данными, если эта вероятность мала. Чаще всего используется один из двух критериев согласия: критерий Пирсона (критерий X2) и критерий Колмогорова. Для применения критерия X2 (хи-квадрат) весь диапазон изме- 6ft
нения случайной величины в выборке объема п разбивается на к интервалов. Число интервалов к берут обычно в зависимости от объема выборки в пределах от 8 до 20. Число интервалов можно определить по полуэмпирической формуле (IL 24). Число элементов выборки, попавших в /-й интервал, обозначим через п,. Построен- ная гистограмма (см. гл. II1) выборочного распределения или об- щие соображения о механизме возникновения случайной величины служат основанием для выбора типа закона распределения. Парамет- ры этого закона могут быть определены или из теоретических соображений, или нахождением их оценок по выборке. На основа- нии принятого закона распределения вычисляются вероятности р, попадания случайной величины X в I-й интервал. Величина, характе- ризующая отклонение выборочного распределения от предполагае- мого, определяется формулой npi <=i где к— число интервалов; л —объем выборки. Сумма (II104) имеет приближенно Х2-распределение с f= к~с-1 степенями свободы, где с—число параметров гипотетического закона распределения, определяемых по выборке. Для нормального распределения с = 2, если и х, и sx определяют- ся по данной выборке. Гипотеза о принятом типе закона распре- деления принимается на данном уровне значимости р, если (11.105) где X2_р определяются по табл. 4 приложения для выбранного уровня значимости и числа степеней свободы f Если X2 >zf делается вывод, гго гипотеза не согласуется с выборочным распре- делением. При использовании критерия X2 желательно, чтобы объем выборки был достаточно велик: п50 < 150, а количество элемен- тов п;>5-^8. Если какое-либо из и;<5, то два или несколько соседних интервалов должны быть объединены в один. При этом соответственно уменьшается число степеней свободы. Вероятности р, попадания значений случайной величины в 1-й интервал для нормального закона распределения можно опреде- лить по формуле (1.64): I Ь — х \ (а — х Р (а < X < 6) = Ф ---------- — Ф ----------- (11.106) При подсчете теоретических вероятностей pt нужно считать, что крайний левый интервал простирается до — °=; крайний правый — до +°°. Для применения критерия согласия Колмогорова необходимо определить наибольшее абсолютное отклонение выборочной функции распределения Fn (х) от генеральной F(x): 61
D = max | Fn (x) — F (x) | . (II. 107) Затем вычисляется величина к: Х = ]/Т D. (11.108) В табл. 3 приведены квантили распределения Колмогорова. Таблица 3. Квантили распределения Колмогорова р Ч-р р Ai - р р А1 - р 0,99 0,44 0,50 0,83 0,15 1,14 0,90 0,57 0,40 0,89 0,10 1,22 0,80 0,64 0,30 0,97 0,05 1,36 0,70 0,71 0,25 1,02 0,02 1,52 0,60 0,77 0,20 1,07 0,01 1,63 Если вь гчисленное значение А. меньше табличного А, то гипотеза о совпадении теоретического закона распределения F(x) с выборочным Fn(x) не отвергается. При А Хи-Р гипотеза откло- няется (или считается сомнительной). Уровень значимости р при применении критерия Колмогорова выбирают обычно равным 0,2 -т-0,3 Критерий Колмогорова может быть применен также для проверки гипотезы о том, принадлежат ли две выборки объемов и п2 одной генеральной совокупности. При этору величина определяется из выражения Dn^ =max|Fni(x)-F„s(x)|, (11-109) где F„(x) и — выборочные функции распределения, построен- ные для первой и второй выборок соответственно, а величина А — по формуле Х= I f П1П'2Dnn (11.110) |/ П1+«2 Для нормального распределения функция F(x) определяется по формуле Е(х) = ф (——'I • (Н.Ш) 2 \ s I В случае выборок небольшого объема л<20 для проверки гипотезы о законе распределения можно использовать простые кри- терии, основанные на сравнении генеральных параметров распре- деления и их оценок, полученных по выборке. В качестве оценивае- мых параметров удобнее всего брать моменты. Нормальное распределение полностью определяется двумя параметрами — математическим ожиданием тх и стандартом <зх. Все остальные моменты нормального распределения выражаются через математическое ожидание и стандарт. Для нормального распределения коэффициент асимметрии, определяемый по формуле (1.28), равен 62
71 = ^з/°х = 0, (11.112) так как ц3 — О Коэффициент эксцесса, определяемый по формуле (1.24), также равен нулю Цд 7г = -^ — 3 = 0, (11.113) так как для нормального распределения |л4 = За;. (11.114) Выборочные коэффициенты эксцесса и асимметрии определяются по формулам: =4=-т- <и-115) * n * 72 = * - , Vu-x)4-3. (11.116) sx nsx Распределения этих оценок сложны и мало изучены. Однако известны дисперсии этих величин: J * , (11.117) v ' (n+ 1) (n + 3) , 24п (п— 2) (п—3) =-----------—------— . (11.118) (п+1)Чп+3)(« + 5)’ ' где п — обьем выборки. Зная дисперсии D(y\) и D(yi), можно оценить, значимо ли выборочные коэффициенты асимметрии и эксцесса отличаются от нуля. Если ______ |7*|<3 у , (11.119) I72I <5 D (7’) , (11.120) то наблюдаемое распределение можно считать нормальным. Пример 13. Размер частицы никелевого катализатора замерен с точностью до 1 мкм. На выборке объема п — 200 проверить, подчиняется ли распределение размеров частиц нормальному закону. В таблице приведены отклонения размеров частиц катализатора от номинального. Результаты сгруппированы в 10 интервалов длиной h — 5 мкм. Интервал h Границы интерва- лов xz+ i-i- x{- Середина интер- вала Число точек в интер- вале tlj Относи- тельная частота Р* Интервал h Границы интерва- лов xi + 1 xi Середин! интер- вала Число точек в интер- вале П/ Относи- тельная частота Р* 1 —20--15 -17,5 7 0,035 6 5 — 10 7,5 41 0,205 2 —15--10 -12,5 11 0,055 7 КН-15 12,5 26 0,130 3 -10^—5 -7,5 15 0,075 8 15—20 17,5 17 0,085 4 5--0 -2,5 24 0,120 9 20 — 25 22,5 7 0,035 5 0+5 2,5 49 0,245 10 25-30 27,5 3 0,015 63
Решение. Проверим гипотезу нормального распределения размера частиц ката- лизатора (случайная величина Л), определив коэффициенты асимметрии и эксцесса. Данные таблицы служат для определения выборочных среднего, дисперсии, третьего и четвертого центрального моментов случайной величины X для сгруппированных -данных по формулам: _ 10 * 10 * _ * 10 * _ X = У Pi Xi, S2 = У, Pi (xi — x)2, |*з = У, Pi {xi — x)3, l==l я 1 = 1 i = l * 10 -* Fi = У Pi (xi — x)\ (=1 где p* — относительная частота, определяемая по формуле (II.6). Необходимые для рас- чета данные (суммы) приведены в таблице. I X/ Р* Xj Xj - X (Xj - хР (х, - х)з (X/ - X/ PfiXf - хр p*fxz - Х)3 P?(xj - х)“ 1 -17,5 -0,6125 -21,8 475,2 -10360 225 853 17,43 -362,6 7904,9 2 -12,5 -0,6875 -16,8 282,2 -4742 79659 15,52 -260,8 4381,2 3 -7,5 —0,5675 -11,8 139,2 -1643 19388 10,44 -123,2 1454,1 4 -2,5 -0,3000 -6,8 46,2 -314 2138 5,54 -37,7 256,6 5 2,5 -0,6125 -1,8 3,2 —6 10 0,78 -1,5 2,4 6 7,5 1,5375 3,2 10,2 30 105 2,09 6,2 21,5 7 12,5 1,6250 8,2 67,2 551 4125 8,74 71,6 587,7 8 17,5 1,4875 13,2 174,2 2300 30300 14,81 195,5 2580,6 9 22,5 0,7875 18,2 331,2 6029 109 720 11,59 211,0 3840,2 10 27,5 0,4125 23,2 532,2 12 487 289702 7,98 187,3 4345,5 Суммы: 4,295 94,92 -114,2 25 3 75 В результате получим х — 4,30 мкм, 9,71 мкм, ц*-----114,2 мкма, д4* — 25 375 мкм4. Определим коэффициенты асимметрии и эксцесса по формулам (11.115) и (11.116): |*о ц! 7? = — = -0.1247, 7* = -т-—3 = —0,1455 sx sx , и их дисперсии — по формулам (П.П7) и (11.118): £>(71)= --------6(29°-~ --------= 0,029; 1/о ( Т|’) — 0,17; ' ,1/ (200 + 1) (200 + 3) ? v 11 ' .. 24-200 (200- 2) (200 -3) V 12' (200 -г I)2 (200 + 3) (200 + 5) / Я(и’2) = 0.34. Таким образом, имеем 3 Уо ( 10 = 0.51 и | | = 0,1247 < 3 ]Л>(тЭ . 5 У£>(tJ) =1,70 и | | = 0,1455 < 5 )Л>(ъ) . Следовательно, наблюдаемое распределение можно считать нормальным. Проверим полученный вывод при помощи критериев Пирсона и Колмогорова Составим для вычисления этих критериев таблицу. 64
i Границы интервалов Ну Ир/ nF(x) nlF„(x)-F(x)\ («3 - npjP npf 1 -~ч--15 7 4,7 7 4Л 2,3 1,12 2 -15 ч--10 11 9,50 18 14,2 3,8 3 -10 - -5 15 19,5 33 33,7 0,7 1,18 4 —5-1-0 24 31,6 57 65,3 8,3 1,81 5 0 ч- 5 49 40,3 106 105,6 0,4 1,87 6 5 + 10 41 38,9 147 144,5 2,5 o,n 7 10 +15 26 29,2 173 173,7 0,7 0,20 8 15 4-20 17 15,6 190 189,3 0,7 0,002 9 20 4-25 7 7,7 197 197,0 0,0 0,001 10 25 4- + ~ 3 3,0 200 200 0,0 Вероятности pt вычислены по формуле (1.64). В качестве параметров взяты их оценки: х —4,3 мкм, зх —2,71 мкм. Например, для второго интервала имеем Р2 = Ф — 10 — 4,3 9,71 — 15 — 4,3 9,71 14,3 9,71 19,3 \ 9,71 ) Ф = Ф(— 1,472) — Ф (— 1,987) = — 0,4292 + 0,4767 = 0,0475, и после умножения прг —200 • 0,0475 — 9,5. Так как для первого и последнего интерва- лов npj <5, первых два и последних два интервала объединены в один. Величина х? определяется следующим образом: 8 1=1 Число степеней свободы /—8-3—5. По табл. 4 приложения Zo,96 —11,1. Так как най- денное по выборке X2 — 6,296 <Хо,95, то критерий Пирсона позволяет наблюдаемое распределение считать нормальным. Для применения критерия Колмогорова определены разности п I Fn(x) - F(x) I . Для данного случая nD = maxn I Fn(x) - F(x) I = 8,3. По формуле (11.108) находим X— nD/-\Tn = = 0,59. По табл. 3 для уровня значимости р = 0,2, Хо,в = 1, 07- Таким образом, найденное по выборке л—О,59<Хо,8, и критерий Колмогорова также позволяет считать рассматрива- емое распределение нормальным. 18. Критерий согласия о2. в отличие от критерия X2 Пирсона критерий со2 (омега-квадрат) основывается на непосредственно полученных в эксперименте (несгруппированных) значениях случай- ной величины X. Пусть имеется выборка объема п случайной величины X. Проверяется гипотеза о том, что функция распределения случайной величины есть F(x). Построим эмпирическую функцию распределе- ния F„(x). Для сравнения эмпирического распределения F„(x) с предполагаемым теоретическим F(x) рассмотрим величину ОО “2= f [Fn(*)-F(*)]adF(x), (11.121) —оо предполагая, что F(xJ имеет производную, т. е. плотность вероят- ности dF (х) = F' (х) dx = f (х) dx. (11.122) 3-529 65
Преобразуем выборку в вариационный ряд Xi < х2 < х3 < ... < хп и разобьем всю область интегрирования на интервалы: (—оо. (xlt х2), , (хп_*, хп) (хп, 4-оо). Тогда, принимая во внимание (II. 121), получим Х1 [О —F(x)]2 dF + — ОО 4-00 J [1 - F (X)P dF, хп (II. 123) f „ F3(x) 7 F3(xj). 7г. П-^п)!3 I [ I — F (х) ]2 dF =--- . ХП Таким образом, имеем + L1—. (11.124) Объединяя члены, зависящие от F(xk) (с данным к= 1,2,.. ,п), находящиеся в двух суммах (11.124), получим Равенство (11.125) показывает, каким образом критерий <в2 за- висит от отдельных членов вариационного ряда. Точное распреде- ление и2 очень сложно, но исследования показали, что уже при «>40 распределение произведения /ко^ близко к некоторому предельному распределению, для которого составлены таблицы. По этим таблицам определены критические значения для величины /ко2. В табл. 4 приведены квантили (п(о2),^р. Если вычисленное значение /ко2 меньше табличного (/ко2),.,,, то гипотеза о совпадении теоретического закона распределения F(x) 66
Таблица 4. Квантили распределения пт'- р р 0,5 0,1184 0,05 0,4614 0,4 0,1467 0,03 0,5489 о,з 0,1843 0,02 0,6198 0,2 0,2412 0,01 0,7435 0,1 0,3473 0,001 1,1679 с выборочным Fn(x) не отвергается. При лы2>(nuF^-p гипотеза от- клоняется. Уровень значимости р выбирают обычно равным 0,5. Критерий м2 полнее, чем критерий Пйрсона, использует информацию, заключающуюся в данных выборки. В группировке данных, которая производится при применении критерия Пирсона, имеется определен- ный произвол. Сама группировка приводит к некоторой потере информации, содержащейся в выборке. Кроме того, распределение лю2 значительно быстрее, чем X2, сходится к предельному закону, особенно в области больших значений и2 которые только и существен- ны для вероятностной оценки. 19. Критерий Вилькоксона. Критерий Вилькоксона применяется для проверки гипотезы принадлежности двух выборок одной и той же генеральной совокупности. Пусть имеются выборки случайных вели- чин X и Y объема тип. Преобразуем выборки в вариационные ряды: Х1 < х2 < • • • < хт > У1 < У2 < • • • < Уп- Нулевая гипотеза Н° заключается в равенстве функций распределе- ния F(x) = F(y). Альтернативная гипотеза Н формулируется в виде неравенства F(x) < F(y). Критерий Вилькоксона основан на распределении общего числа инверсий, под которым понимается следующее: элементы обеих вы- борок располагаются в общую возрастающую последовательность, например: У1 х1УгУз x2Vi хз х4Уь • хтУп • (11.126) Если какому-либо значению х предшествует некоторый у, то эта пара дает инверсию. Так, в последовательности (II.126) xj дает одну инверсию с у„ х2 дает три инверсии (с ур у2 и у3) и т. д. При л? >10 и пХ) общее число инверсии и распределено при- близительно нормально с математическим ожиданием ти — тп/Ч (11.127) (11.128) и дисперсией ^=-^-(т+п-1). При уровне значимости р = 0,05, согласно (1150), критическими значениями для нулевой гипотезы будут 3* 67
и <.ти— 1,96ои, и > ти + 1,96с„. (11.129) Пример 14. Одним из наиболее распространенных методов идентификации матема- тических моделей процессов химической технологии является получение и обработка кривых отклика при нанесении импульсных возмущений для получения так называемых С-кривых. Исследовался гидродинамический режим работы промышленного экстрактора. С этой целью была использована С-кривая распределения времени пребывания частиц твердой фазы в реакторе, полученная сотрудниками НИУИФа импульсным методом на Воскре- сенском химическом комбинате в цехе производства экстракционной фосфорной кис- лоты дигидратным методом. Объектом исследования являлся 8-секционный экстрактор, на входе которого в твердую фазу (апатитовый концентрат) вводили индикатор. В ка- честве индикатора использовано радиоактивное золото 198 (g—350 мкр). Перемешивание осуществляется двухъярусными мешалками (с шестью лопастями в каждом ярусе). Из последней секции часть пульпы возвращается в первую. Объем первых четырех секций = Иг = Из = V* = 76 мз. Объем последних четырех секций Из = Ив = И? = Из —109 мз. Экспериментальная С-кривая снималась при нагрузке по пульпе G„ —111,5 мз/ч, и величине рецикла Я—9,7. Время пребывания в 1—4 сек- циях Ti = тз = тз = т4 = И/бп — 76/111,5 — 0,68 ч. Время пребывания в 5—8 секциях тз = те = т? = те — 109/111,5 —0,98 ч. Экспериментальная С-кривая (рис. 20), снятая на выходе пульпы из экстрактора, построена по следующим экспериментальным данным. Г, ч . . С, мкр/мз Г, ч . . С, мкр/мз 1 2 50 40 15 16 5,8 5,0 3 4 33,8 30 17 18 4,6 4,2 5 6 26,2 22,8 19 20 3,8 3,4 7 8 19,8 17,2 21 22 3,0 2,8 9 10 14,7 12,6 23 24 2,4 2,3 11 12 10,9 9,2 25 26 1,8 1,4 13 14 7,8 6,6 27 28 1,2 1,0 Решение. Было проведено сравнение экспериментальной С-кривой с решением системы дифференциальных уравнений для ячеечной модели с рециклом. Организацию потока в реакторе можно представить в виде структурной схемы (рис. 21). Система дифференциальных уравнений по концентрации индикатора в твердой фазе имеет вид: = (си + /?с8- (1 + R)cJ — . аг tj -^7- = l(l+/?)ci-(l + Я)с2] — • dr tj dco 1 “Т7- = ((1 + R) сг — (1 + R) с3] » аг tj ~~ = [(1 + Я) С3 — (1 + R) с4] • dt т, (! = [(1 + R)ct~ (1 + Я)с6] — . de. 1 -7Г = 1(1 + Л) С» - (1 + R) С.1 — > аг т2 ~~ ™ [(1 + Л)С. — (1 + Я)с7] ----- • dr т2 = ((1 + R) с-, - (1 + R) с8] — . аг т2 Рис. 20. Экспериментальная С-кривая 68
Рис. 21. Структурная схема реактора где С — концентрация индикатора, мкр/мз,- R — величина рецикла. Начальные условия для системы g 350 мкр Ci = — = ——----------= 4,005 мкр/м3; t = 0 vi 76 . с2н-8 = 0- Система уравнений (11.130) была решена методом Рунге —Кутта на ЦВМ «Минск-22». Полученные результаты представлены в виде графика (см. рис. 20, кривая 2). Г, ч . . . . с расч,мкр/мз 1 2 3 4 5 6 7 8 9 10 11 12 13 14 47,0 41,9 35,7 30,6 26,1 22,3 19,1 16,3 13,9 11,9 10,1 8,7 7,4 6.4 Z, Ч . . . . С расч, мкр/м3 15 16 17 18 19 20 21 22 23 24 25 26 27 28 5,4 4,64 4,0 3,4 2,9 2,5 2,1 1,8 1,5 1,3 1,1 0,96 0,8 0,7 Сравнение двух С-кривых; экспериментальной (у) и расчетной (х) — производилось по критерию Вилькоксона. Проверялась гипотеза Н° принадлежности двух выборок (у) и (х) одной и той же генеральной совокупности. Для этого элементы рок были расположены в общую возрастающую последовательность: обеих выбо X х X У X Д’ X У X У X 0,7 0,8 0,96 1,0 1,1 1,2 1,3 1,4 1,5 1,8 1,8 х У У X У X У г У У X 2,1 2,3 2,4 2,5 2,8 2,9 3,0 3,4 3,4 3,8 4,0 У У X У X У X У X У х 4,2 4,6 4,64 5,0 5,4 5,8 6,35 6,6 7,4 7,8 8,7 У х У X У х У X У X у 9,1 Ю,1 10,9 И,9 12,6 13,9 14,7 16,3 17,2 19,1 19,8 X У X У У X У х У X X 22,3 22,8 26,1 26,2 30 30,6 33,8 35,7 40 41,9 50 Определялось общее число инверсий; «=14-2 + 3 + 4+4 + 6 + 7 + 8+10 4-12+13+14+15+16+17 + + 18 + 19 + 20 + 21 + 22 + 23 + 25 + 26 + 27 + 27 = 360. Гипотеза Но не отвергается, если число инверсий не попадает в критическую область, определяемую формулами (11.129). Случайная величина и распределена приблизительно нормально с математическим ожиданием ти = тп/2 = 28-28/2 = 392 и стандартам °и 1 / тп , Г28-28 |/ —(28 4-28- 1) = 59,94. При уровне значимости р — 0,05 критическими значениями для нулевой гипотезы, согласно (11.129), будут; 69
«<392- 1,96-59,94; «<274,5; «>391 4- 1,96-59,94; «>509,48. Следовательно, число инверсий, равное 360, не попадает в критическую область, и можно считать разницу между сравниваемыми С-кривыми статистически незначимой. Таким образом, гидродинамический режим в каждой секции реактора близок к идеаль- ному перемешиванию. 20. Проверка гипотезы нормальности по совокупности малых вы- борок. Пусть имеется достаточно большое число п независимых выборок одного и того же объема т. Требуется проверить гипотезу нормальности генеральных совокупностей, из которых взяты выборки, при условии, что параметры этих совокупностей могут иметь раз- ные значения. Рассмотрим относительное отклонение «л где /-Й элемент к-й выборки; xt, среднее и среднеквадра- тичное отклонение к-й выборки. Можно показать, что распределение величины т не зависит от параметров генеральной совокупности т и о , а зависит только от объема выборки т. Плотность вероятности величины т равна /7 4-1\ 1-2 0 при |т| > У f 4- 1 • где число степеней свободы f =т - 2 Из (IL132) при разных значе- них т получим: (11.133) Из (IL133) следует, что при /и =4 относительные отклонения в от- дельных выборках подчиняются равномерному распределению, если исходные совокупности нормальны. Этим можно воспользоваться для 70
проверки гипотезы нормальности, если число выборок достаточно велико. При т 4 из-за отсутствия нужных таблиц приходится переходить от величины т к величине ц: 1“ -------- • Ц1.1О-») К/+1-Г» Можно доказать, что при исходных нормальных совокупностях величина г| имеет распределение Стьюдента с f=m~2 степенями свободы. При проверке гипотезы нормальности по большому числу малых выборок из каждой выборки случайным образом отбирается по одному значению. Здесь возможно некоторое упрощение — можно отобрать только первые измерения, только вторые и т. д. Такой отбор также можно рассматривать как случайный. Если число элементов в выборках велико, например т > 10, то может быть сделано несколько самостоятельных проверок гипотезы, например, по первым и последним элементам каждой выборки. Затем, если т =4, для каждого отобранного значения по формуле (11.131) вы- числяется г, если т^4, по формуле (II134) т|. После перехода к величинам гид для проверки гипотезы равномерного распределе- ния г или распределения Стьюдента г] (и, следовательно, нормаль- ности исходного распределения) может быть применен любой из рассмотренных ранее критериев согласия. Пример 15. Требуется проверить гипотезу нормального распределения концентра- ции (г/л) аммиачной селитры во вторичном паре после реакционного аппарата в про- изводстве аммиачной селитры по результатам четырехкратного определения в 40 про- бах (таблица ниже). Номер пробы XI Х2 хз Х4 Номер пробы XI Х2 ХЗ Х4 1 5,97 6,39 6,05 5,64 21 4,09 4,19 3,96 4,18 2 5,56 6,02 5,14 5,46 22 4,87 5,10 4,38 4,20 3 4,51 5,32 5,06 4,30 23 2,93 4,60 2,93 4,03 4 5,28 4,40 4,88 4,83 24 3,86 4,40 4,92 4,17 5 5,36 5,52 4,60 5,49 25 5,74 5,06 4,81 5,52 6 4,82 4,99 5,42 5,34 26 5,26 6,01 6,09 6,07 7 5,61 4,83 5,37 5,27 27 6,45 5,99 5,77 6,05 8 4,79 4,51 5,54 5,75 28 5,13 5,19 5,08 5,35 9 4,69 5,62 6,77 6,19 29 5,18 4,59 4,90 5,26 10 5,30 5,60 6,16 6,11 30 4,94 4,44 4,66 5,01 11 4,28 4,47 4,10 4,53 31 4,56 4,12 4,63 4,24 12 4,32 4,03 4,49 4,04 32 3,84 3,22 3,28 3,16 13 3,17 4,85 4,43 4,39 33 2,86 3,78 3,75 3,03 14 4,41 4,04 4,01 3,82 34 4,00 3,48 4,00 4,35 15 5,66 6,24 5,95 5,49 35 3,95 4,05 4,20 440 16 5,19 5,45 5,14 5,08 36 3,98 5,06 3,94 4,52 17 5,02 4,45 5,22 4,82 37 3,87 3,09 3,86 3,49 18 4,35 4,43 4,32 4,26 38 4,64 4,33 3,94 4,40 19 5,10 4,67 4,57 4,79 39 4,63 4,16 4,24 4,50 20 5,17 4,83 4,68 4,79 40 4,14 5,24 4,11 4,44 71
Решение. Возьмем из результатов четырех параллельных определений каждой пробы первое (xi) и вычислим для каждого из 40 значений величину т по формуле (11.131). Результаты вычислений сведены в таблицу: Номер пробы х sx XI - X т=^ Номер пробы X 5Х Xi - X т=^ 1 6,01 0,31 —0,04 -0,137 21 4,11 0,11 -0,02 -0,141 2 5,55 0,36 0,01 0,0413 22 4,64 0,42 0,23 0,557 3 4,96 0,34 0,45 -1,316 23 3,62 0,83 -0,69 -0,831 4 4,93 0,24 0,35 1,467 24 4,34 0,45 -0,48 -1,067 5 5,24 0,43 0,12 0,272 25 5,28 0,42 0,46 1,083 6 5,14 0,28 -0,32 -1,131 26 5,86 0,40 -0,60 -1,493 7 5,27 0,33 0,34 1,044 27 6,07 0,28 0,39 1,358 8 5,15 0,59 -0,36 -0,603 28 5,19 0,12 -0,06 -0,486 9 5,82 0,89 -1,13 -1,272 29 4,98 0,30 0,2 0,652 10 5,79 0,41 -0,49 -1,189 30 4,76 0,26 0,18 0,677 11 4,35 0,19 -0,07 -0,334 31 4,39 0,25 0,17 0,702 12 4,22 0,22 0,10 0,445 32 3,38 0,31 0,47 1,481 13 4,21 0,72 -1,04 -1,437 33 3,36 0,48 -0,50 -1,035 14 4,07 0,25 0,34 1,378 34 3,96 0,36 -0,04 0,120 15 5,84 0,33 -0,18 -0,531 35 4,15 0,20 -0,2 -1,022 16 5,22 0,16 -0,03 -0,153 36 4,38 0,53 -0,4 -0,749 17 4,88 0,33 0,14 0,436 37 3,58 0,37 0,29 0,792 18 4,34 0,71 0,01 0,141 38 4,33 0,29 0,31 1,078 19 4,78 0,23 0,32 1,391 39 4,38 0,22 0,25 1,129 20 4,87 0,21 0,30 1,444 40 4,48 0,53 -0,34 -0,651 Из формулы равна (11.133) следует. что при т— 4 плотность распределения величины! _ при |т| < 2 /з если исходные совокупности подчиняются нормальному закону. Проверим эту гипотезу при помощи критерия соз. Расположим полученные значения т в вариационный ряд, и для каждого элемента ряда определим значения эмпирической функции распределе- ния Fn(t) по формуле (II. 135) где л—40; Аг—1,2,...,л, и теоретической функции f(T). Результаты расчета сведены в таблице. В этой таблице значения т расположены в порядке возрастания. Номер опыта т W - F„(<) [Р(г) * Fn(z)p 1 -1,494 0,0687 0,0125 0,0562 0,003161 2 -1,437 0,0852 0,0375 0,0477 0,002273 3 -1,316 0,1201 0,0625 0,0576 0,003318 ' 4 -1,272 0,1328 0,0875 0,0453 0,002053 5 -1,189 0,1568 0,1125 0,0443 0,001959 6 -1,131 0,1735 0,1375 0,0360 0,001297 7 -1,067 0,1920 0,1625 0,0295 0,000869 8 -1,035 0,2012 0,1875 0,0137 0,000188 9 -1,022 0,2050 0,2125 -0,0075 0,000057 10 -0,831 0,2601 0,2375 0,0226 0,000511 72
Продолжение Номер опыта т W f(') ~ FnM WrJ - F„(,)p 11 —0,749 0,2838 0,2625 0,0213 0,000455 12 —0,651 0,3122 0,2875 0,0247 0,000609 13 —0,603 0,3259 0,3125 0,0134 0,000179 14 —0,531 0,3467 0,3375 0,0092 0,000084 15 —0,480 0,3613 0,3625 -0,0012 0,000001 16 —0,334 0,4037 0,3875 0,0162 0,000263 17 —0,153 0,4557 0,4125 0,0432 0,001868 18 -0,141 0,4594 0,4375 0,0219 0,000478 19 -0,137 0,4605 0,4625 -0,002 0,000004 20 -0,041 0,5119 0,4875 0,0244 0,000596 21 0,12 0,5346 0,5125 0,0221 0,000489 22 0,141 0,5408 0,5375 0,0033 0,000011 23 0,272 0,5785 0,5625 0,0160 0,000257 24 0,404 0,6165 0,5875 0,0290 0,000842 25 0,445 0,6285 0,6125 0,0160 0,000257 26 0,557 0,6608 0,6375 0,0233 0,000543 27 0,652 0,6881 0,6625 0,0256 0,000657 28 0,677 0,6954 0,6875 0,0079 0,000063 29 0,702 0,7027 0,7125 —0,0099 0,000097 30 0,792 0,7287 0,7375 —0,0088 0,000077 31 1,044 0.8014 0,7625 0,0389 0,001511 32 1,078 0,8112 0,7875 0,0237 0,000561 33 1,083 0,8126 0,8125 0,0001 0,000000 34 1,129 0,8259 0,8375 -0,0016 0,000134 35 1,358 0,8920 0,8525 0,0295 0,000871 36 1,378 0,8978 0,8875 0,0103 0,000106 37 1,391 0,9015 0,9125 -0,0110 0,000120 38 1,444 0,9168 0,9375 -0,0207 0,000427 39 1,467 0,9235 0,9625 —0,0390 0,001522 40 1,481 0,9275 0,9875 -0,0600 0,003597 I 0,032057 Принимая во внимание, что имеем f (т) = 0 при т < — 1^3 , F (т) = f —1~ йт = —l— Gfc + Т^з”). 6=1,2, _^-2ИЗ 2 V 3 n. (11.136) Так, при т,--1,494 — 1,494 4- УТ F (— 1,494) =-------1------------= 0,0687. 2 ГЗ Значения эмпирической функции распределения определены по формуле (П.135). Так, при т — т, имеем 2-1 — 1 f»(Ti) = ~40" =0,0125. Для определения критерия псо2 в формулу п 73
подставим значение л — 40 и полученную в таблице сумму. В результате имеем пшг = — ---ь 0,032057 = 0,03414. 12-40 Для уровня значимости р — 0,05 табличное значение (па>2)1р —0,4614 (см. табл. 4). Вычисленное значение лш2 меньше табличного. Следовательно, гипотеза нормального распределения концентрации аммиачной селитры в соковом паре не отклоняется. В главе описаны основные понятия математической статистики: генеральная совокупность и случайная выборка, оценки и их свой- ства, методы проверки статистических гипотез и построения до- верительных интервалов для математического ожидания и дисперсии. Для получения оценок используется метод максимального правдо- подобия, приводящий к получению состоятельных, эффективных, хотя иногда и смещенных оценок. Проверка гипотез относительно параметров распределения генераль- ной совокупности проводится в предположении нормального распреде- ления наблюдаемой случайной величины. Гипотеза о нормальности распределения проверяется с помощью критериев согласия Пирсона, Колмогорова, критерия со2, Вилькоксона, по совокупности малых выборок. Упражнения 1. При изготовлении эталона большим количеством измерений в нем было надежно установлено среднее содержание вещества, равное 2%, с квадратичной ошибкой единич. кого измерения, равной 0,1%. Определить, с какой вероятностью можно ожидать, что при повторном анализе средний результат девяти параллельных измерений будет варь. ировать в пределах 1,9 ч- 2,1%. 2. Построить доверительный интервал для математического ожидания нормально распределенной случайной величины X при доверительной вероятности 0—0,95, если среднее выборочное х —20,5 получено по четырем измерениям, считая дисперсию, равную 0,81: а) генеральной; б) выборочной. 3. Оценить ошибку определения плотности вещества, используя следующие резуль- таты измерений: масса 420,2 г, ошибка измерения массы 0,22 г, объем 50,15 см-з, ошибка определения объема 0,12 смТ 4. Оценить ошибку воспроизводимости по выборке из 31 наблюдения с выбо- рочным стандартом sx — 0,85, используя Х2-распределение и нормальное распределение. Доверительную вероятность 0 принять равной 0,9. 5. В результате анализа дистиллята на двух параллельно работающих ректифика- ционных колоннах получены следующие данные о содержании бензола (мол. доли, %): колонна N? 1 94,0; 95,0; 95,0; 97,0; 94,0; 97,5; 98,0; колонна № 2 99,0; 97,0; 95,0; 98,0; 95,0. Является ли значимым различие в содержании бензола в дистилляте этих колонн1' 6. При постоянном режиме были проведены измерения потерь со вторичным паром связанного азота при производстве аммиачной селитры (в г/л): 5,0; 5,3; 5,8; 4,9; 4,6; 7,5. 5,2. Следует ли отбросить значение 7,5 как грубое измерение? ГЛАВА III ДИСПЕРСИОННЫЙ АНАЛИЗ 1. Задача дисперсионного анализа. В любом эксперименте средние шачения наблюдаемых величин меняются в связи с изменением основ ных факторов (качественных и количественных), определяющих условие опыта, а также и случайных факторов. Исследование влияния те> 74
или иных факторов на изменчивость средних является задачей дисперсионного анализа. В дисперсионном анализе используется рассмотренное в гл. 1,3 свойство аддитивности дисперсии изучаемой случайной величины, обусловленной действием независимых факторов. Р. А. Фишер в 1938 г. впервые определил дисперсионный анализ как «отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписывае- мой другим группам». В зависимости от числа источников дисперсии различают однофакторный и многофакторный дисперсионный анализ. Дисперсионный анализ особенно эффективен при изучении не- скольких факторов. При классическом методе исследования варьируют только один фактор, а остальные оставляют постоянными. При этом для каждого фактора проводится своя серия наблюдений, не используемая при изучении других факторов. Кроме того, при таком методе исследования не удается определить взаимодействие факторов при одновременном их изменении. При дисперсионном анализе каждое наблюдение служит для одновременной оценки всех факторов и их взаимодействий. Дисперсионный анализ состоит в выделении и оценке отдельных факторов, вызывающих изменчивость изучаемой случайной величины. Для этого производится разложение суммарной выборочной дисперсии на составляющие, обусловленные независимыми факторами. Каждая из этих составляющих представляет собой оценку дисперсии генераль- ной совокупности. Чтобы решить, значимо ли влияние данного фактора, необходимо оценить значимость соответствующей выборочной дисперсии в сравнении с дисперсией воспроизводимости, обусловлен- ной случайными факторами. Проверка значимости оценок дисперсий проводится по критерию Фишера (см. гл. II, 11). Если рассчитанное значение критерия Фишера окажется меньше табличного, то влияние рассматриваемого фактора нет оснований считать значимым. Если же рассчитанное значение критерия Фишера окажется больше таблич- ного, то рассматриваемый фактор влияет на изменчивость средних. В дальнейшем будем полагать, что выполняются следующие допуще- ния: 1) случайные ошибки наблюдений имеют нормальное распреде- ление; 2) факторы влияют только на изменение средних значений, а дисперсия наблюдений остается постоянной; эксперименты равноточны. Требование нормального распределения определяет выбор основ- ных факторов при исследовании процесса методом дисперсионного анализа. Если нужно получить нормальное распределение выходной величины, к случайным желательно относить только те факторы, влияние которых на выходную величину очень мало. Исключение можно делать лишь для тех факторов, которые сами по себе (из каких-либо других соображений) дают нормальное распределе- ние результатов. Факторы, рассматриваемые в дисперсионном анализе, бывают двух родов: 1) со случайными уровнями и 2) с фиксированными. В первом случае предполагается, что выбор уровней производится из бесконечной совокупности возможных уровней и сопровождается рандомизацией. При этом результаты эксперимента имеют большее 75
значение, поскольку выводы по эксперименту можно распространить на всю генеральную совокупность. Если все уровни выбираются случайным образом, математическая модель эксперимента называется моделью со случайными уровнями факторов (случайная модель). Когда все уровни фиксированы, модель называется моделью с фиксирован- ными уровнями факторов. Когда часть факторов рассматривается на фикси- рованных уровнях, а уровни остальных выбираются случайным образом, модель называется моделью смешанного типа. Иногда отсутствует различие в критериях, применяемых для разных моделей, и единствен- ное различие состоит в общности выводов, в других случаях существует различие в критериях. Дисперсионный анализ может применяться в различных формах в зависимости от структуры исследуемого процесса; выбор соответ- ствующей формы является обычно одной из главных трудностей в практическом применении анализа. 2. Однофакторный дисперсионный анализ. Рассмотрим действие единичного фактора А (количественного или качественного), который принимает к различных значений (уровней фактора). На /-м уровне производится т наблюдений, результаты которых можно записать следующим образом: Уп Ун • • Укг > Угг Угг • • • Укг > Утг Угпг • Укпь • Будем предполагать, что результат любого наблюдения можно представить в виде модели ytj = р. 4-(Ш-1) где ц—суммарный эффект во всех опытах; z/, —эффект фактора А на i-м уровне (/ = 1,2 ...Л); —ошибка измерения на /-м уровне. Предположим также, что наблюдения на фиксированном уровне фактора нормально распределены относительно среднего значения р +dj с общей дисперсией о2. Общее число опытов равно N: N = «1 + п2 + ... + nh. (III.2) Проверяется нулевая гипотеза равенства средних значений на раз- личных уровнях фактора А: тг = тг = ... = тк = т. Наиболее простые расчеты получаются при равном числе опытов на каждом уровне фактора А: = п2 =... = пк = п (табл. 5). При этом общее число наблюдений N равно кп. Обозначим через у среднее значение наблюдений на i-м уровне п 76
Таблица 5. Исходные данные для однофакторного дисперсионного анализа с равным числом повторений опытов Номер наблюдения Уровни фактора А di 02 ак 1 Tn У21 Ук1 2 Tl! У22 Ук2 п У'2п Укп n n л Итоги A'^yv A2 = I Ту Ак =.\УЦ ./“1 а общее среднее значение для всей выборки из N наблюдений Для проведения дисперсионного анализа необходимо общую выбороч- ную дисперсию s2 (III.5) разложить на составляющие, которые характеризовали бы вклад фак- тора А и фактора случайности. Фактор случайности при этом легко оценить благодаря наличию повторных опытов на каждом уровне. Определим выборочную дисперсию на каждом уровне: i = 1,2....k. Если нет уверенности в равноточное™ экспериментов, однородность дисперсий s2 522...,52 можно проверить по критерию Кохрена (см. гл. 11,13). Если между дисперсиями нет значимых различий, для оценки генеральной дисперсии ст2, характеризующей фактор случайности, используют выборочную дисперсию s2m: (Ш.7) 77
Число степеней свободы дисперсии равно к(п -1) = N - к. При- ближенную оценку для дисперсии фактора А можно получить следую- щим образом: Более точную оценку для ст2 можно получить, рассматривая отклоне- ния средних у на отдельных уровнях от общего среднего всей выборки у Действительно, k о 1 — \2 2 . ®2 2 . Soin —2/к-Л ««л+v• <1М 1=1 Отсюда 1 жЧ S2 Дисперсия фактора А для модели с фиксированными уровнями (ал2) не связана ни с какой случайной величиной, это условное название для математического ожидания среднего квадрата отклонений, обусловленного влиянием фактора А. Такое обозначение удобно, так как определяет рассеяние, вызванное влиянием фактора А анало- гично показателю влияния случайного фактора, что позволяет не- посредственно сравнить фактор А с эффектом случайности. Введем также следующее обозначение: k sA = (у; — У )2 « ДДд + 4 . (Ш.11) i=i Эта дисперсия имеет к— 1 степеней свободы. Если дисперсия значимо отличается от нулевая гипотеза от, = т2 =...= тк= т от- вергается и влияние фактора А считается существенным. Проверяет- ся нулевая гипотеза по критерию Фишера. Так как альтернативой = = является неравенство >с§ц, для проверки гипотезы применя- ется односторонний критерий Фишера. Влияние фактора А считается значимым, если s2 h=k(n-l) = N-k. (III.12) ®ош Дисперсионный анализ можно провести по следующему алгорит- му: подсчитывают 1) итоги по столбцам п А1 = ^У/1> (Ш.13) У=1 2) сумму квадратов всех наблюдений k п ssi=2 2y-/: (111-14) i=i /=1 78
3) сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце, (III.15) 4) квадрат общего итога, деленный на число всех наблюдений (корректирующий член),. / t \2 55з=-^-(2Л' ) : (1П16) 5) сумму квадратов для столбца — «SSgj (III.17) 6) SSoem- общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом, ^^общ —• SSi — SS3; (III.18) 7) SSOCT — остаточную римента сумму квадратов для оценки ошибки экспе- SS0CT = SSi — SS2; (III. 19) 8) дисперсию , SSX ^=^1 (HI.20) 9) дисперсию s-" M/-i) • (11121) Результаты расчета обычно представляются в виде таблицы дисперсионного анализа (табл. 6). Таблица 6. Однофакторный дисперсионный анализ (с равным числом повторений опытов) Иточник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Математическое ожидание среднего квадрата A к—Л SS. — SS2 — SSs А SSA А к- 1 2 1 2 + стош Остаток к(п -1) ^ОСТ = — SS2 оЛо Е II н 2 Общая сумма кп -1 ^общ' £$общ кп - 1 79
Если отношение s% / Fx_p, то влияние фактора А следует считать незначимым. При этом общая дисперсия № связана только с фактором случайности и может служить оценкой для дисперсии воспроизводимости. Такая оценка лучше, чем (III.7), так как имеет большее число степеней свободы, равное кп- 1. При интерпретации результатов дисперсионного анализа необходимо иметь в виду, что очень низкое значение дисперсионного отношения может быть связано с тем, что влияние какого-то важного неконтролируемого в ходе эксперимента фактора не было рандомизировано. Это может увеличить дисперсию внутри уровней, а дисперсию между уровнями оставить неизменной, что уменьшает дисперсионное отношение. Результаты экспериментов при этом не подчиняются модели (III. 1). Если же справедливо неравенство (III. 12), различие между диспер- сиями и значимо и, следовательно, значимо влияние фактора А. Определим оценку влияния фактора А из (Ш.П): s2 —S2 2 5 А а,« ------- л п (III.22) При этом нулевая гипотеза т} = т2=...тк = т отвергается и различие между средними ту, т2,...,тк следует считать значимым. Для выясне- ния вопроса, какие именно средние различны, применяются критерии Стьюдента, Фишера или ранговый критерий Дункана (см. гл. 11.14). При интерпретации результатов дисперсионного анализа для моде- ли со случайными уровнями обычно интересуются не проверкой гипотез относительно средних, а оценкой компонент дисперсий. В отличие от модели с фиксированными уровнями выводы по случайной модели распространяются на всю генеральную совокупность уровней. Рассмотрим схему вычислений для разного числа параллельных наблюдений. Пусть на уровне а, проведено и, параллельных наблю- дений. Общее число всех наблюдений равно k N= i=i Определим: 1) итоги по столбцам п1 i= 1,2, ..., k-, (III.23) /=1 2) суммы квадратов всех наблюдений k ni SS1=22v <Ш'24) i=i /=1 3) сумму квадратов итогов по столбцам, деленных на число наблюдений в соответствующем столбце, SS2 = S^: (11L25) 1=1 80
4) квадрат общего итога, деленный на число всех наблюдений, SS3 = -^-( I ’ (Ш’26) \ (Si / Дальнейшие расчеты проводятся по формулам (ITL17) — (IIL 21). Если дисперсии и значимо отличаются друг от друга, диспер- сию фактора А вычисляют по формуле № - 2 1=1 Пример 1. Рассмотрим применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А) на процесс радикальной поли- меризации. Изучалось влияние на выход полимера (у, %) пяти различных галоген- алкилов: СНз1(<и), СзШЦаз), СаНеЦаз), СзНзВг (ад), СзН?Вг(а5). Результаты эксперимента с различными галоидными алкилами (фиксированные уровни фактора А) приведены в таблице. Номер наблюдения Уровни фактора А а\ 02 аз 04 05 1 79,80 87,30 42,45 76,0 70,70 2 86,30 69,60 64.3 83,5 64,65 3 86,50 81,75 78,9 72,80 38,50 4 92,30 77,95 61,00 89,00 77,00 5 76,50 83,65 31,30 76,50 91,50 6 87,05 64,80 72,85 87,45 68,00 7 82,50 67,30 58,65 74,50 38,05 8 90,00 75,45 52,50 93,15 79,95 Итоги А । - 680,95 Аг = 607,8 >4з-461,95 •44 = 652,9 •45 = 528,35 Определим средние значения выхода для каждого галоидного алкила: 680,95 - 607,8 - У» = —— = 85,1; уг = -т— - 75,97; у3 = О о 461,95 8 57,74; 652,9 У« = -г- = 81,61; О Уь == 528,35 8 66,04 и общее среднее для всех результатов 5 У = Т J^ = 73’2- i=i Для облегчения вычислений будем вместо значений у рассматривать отклонения у1 них значений от величины, близкой к общему среднему всех результатов, равной 73 (см. таблицу). 81
Номер наблюдения Уровни фактора А at «2 аз ал as 1 6,8 14,3 -30,55 *3,0 -2,3 2 13,3 -3,4 -8,7 10,5 -8,35 3 13,5 8,75 5,9 -0,2 -34,5 4 19,3 4,95 -12,0 i6,o 4,0 5 3,5 10,65 -41,7 3,5 18,5 6 14,05 -8,2 -0,15 14,45 -5,0 7 9,5 -5,7 -14,35 1,5 -34,95 8 17,0 2,45 -20,5 20,15 6,95 Итоги 96,95 23,8 -122,05 68,9 -55,65 По данным таблицы проведем вычисления по формулам (111.14) — (111.21) в соответ- ствии с вышеприведенной схемой. Результаты расчета представлены в таблице. Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат А 4 4084,5 1021 Ошибка 35 5281,46 150,9 Общая сумма 39 9365,96 Полученные в результате расчета дисперсии сравним по критерию Фишера: F = ^а/ Ci = 1021/150,9 = 6,9. По табл. 5 приложения находим /Ь,95(4,35) — 2,65. Так как F> 2,65, различие галогеналкилов следует признать значимым. Установив при помощи дисперсионного анализа тот факт, что средние значения выходов полимера в целом существенно различаются между собой, перейдем к сравнению влияния отдельных галогеналкилов. Проведем это срав- нение по критерию Дункана (см. гл. II, 14) с доверительной вероятностью 3—0,95. Нормированная ошибка среднего равна s—~y 150,9/8 = 4,35. у г Расположим средние значения в порядке возрастания их величин и выпишем из табл. 7 приложения значимые ранги для/—35 и р — 0,05: </з(С4Нв1) 57,74 Уъ (СзН7Вг) уг (CjH,l) Ух (CsH6Br) 81,61 У1 (СН31) 85,1 66.04 75.97 Р • • .... 2 3 4 5 Ранги, г .... 2,875 3,025 3,11 3,185 Г ' Sy . .... 12,5 13,2 13,52 13,9 Ki — Кз = 27,3 > 13,9 — различие значимо Ух — Уъ= 19,05 > 13,52 — различие значимо Ух — I/, = 9,13 < 13,2 — различие незначимо Ух — Ух = 3,49 < 12,5 — различие незначимо Ух — Уз = 23,81 > 13,52 — различие значимо 82
У* — Уь~- 15,56 > 13,2 — различие значимо У« — У г ~ 5,64 < 12,5 — различие незначимо Ул — Уз~ 18,17 > 13,2 — различие значимо У г — Уа = 9,92 < 12,5 — различие незначимо Уз — Уз~ 8,25 < 12,5— различие незначимо 3. Двухфакторный дисперсионный анализ. Изучается влияние на процесс одновременно двух факторов А и В. Фактор А исследуется на уровнях а1л а2,—,ак, фактор В—на уровнях b\, b2,...,bm- Допустим, что при каждом сочетании уровней факторов А и В проводится п параллельных наблюдений (табл. 7). Таблица 7. Данные для двухфакторного дисперсионного анализа с повторениями в А Qi a2 ai ак Al ^111 '^112 ’ J’l\П У211' -^212 • ••> ,Г21л •У/’п ' Уi\2 ’УЬп Ук\у Ук\2 •••> Ук-\п в, bi Л*121 > .^122 .^221 ’ У 222 •••’ Уцп У/21 ’ У^2 •••’ У',2П Ук2\ ' Ук22 У къп в2 bi ^1/1 УгВ v2 /2 • У tjn У ii\ ' Л/2 ’ У ijn У kj\ . Ук/2 •••’ Уkjn BJ bm .V Iffll ,У1ГП2 У 2ТП У У2ТП2 •••’ Уътп У im\ - У im2 •••> Уimn Укту Укт2 ’ Уктп Вт Итоги И2 Ai Ак Общее число наблюдений равно N = пкт. Результат наблюдения мож- но представить в виде следующей модели: УИц = Р + <4 + ?‘j + . (111.28) где ц —общее среднее; а, —эффект фактора А на i-м уровне, / = 1,2,...,к; fij- эффект фактора В на j-м уровне, у = 1,2,...,т,-а,Ву— эффект взаимодействия факторов. Эффект взаимодействия представляет собой отклонение среднего по наблюдениям в (ij)-it серии от суммы первых трех членов в модели (111.28), a EiJq (q= 1,2,...,л) учитывает вариацию внутри серии 83
наблюдений (ошибка воспроизводимости). Будем полагать, как и преж- де, что распределена нормально с нулевым математическим ожиданием и дисперсией о02ш- Если предположить, что между факторами нет взаимодействия, то можно принять линейную модель: УИ= + <4 + ₽; + ZU- (Ш.29) Эта модель обычно применяется при отсутствии параллельных наблюдений (табл. 8): Таблица 8. Данные для двухфакторного днсперснонного анализа без повторении В А Итоги «1 а2 ак *1 Т11 Т21 Ук, Sl -^12 Т22 Ук, «2 Ьт Tim У2т Укт Вт Итоги Ai Az 4 к Рассмотрим вначале линейную модель (111.29). Через у, и yi обозначим средние, соответственно, по столбцам и по строчкам: й = — , (HI.30) т Bi у.= — ' (1И.31) J k через среднее всех результатов: k m JX (Ш.32) .=4 /=1 Рассеяние в средних по столбцам у], уг,...,Ук относительно общего среднего “ не зависит от фактора В, так как все уровни фактора В усреднены. Это рассеяние связано с влиянием фактора А и случай- ного фактора. Так как дисперсия среднего (см. гл. II, 5) в т раз меньше дисперсии единичного измерения, имеем (III.33) В свою очередь, рассеяние в средних по строчкам не зависит от фактора А и связано с влиянием фактора В: 84
т ^ТТ^(^--^)2я;ав + Т- (Ш-34) /=1 Равенства (III.33) и (III.34) позволяют оценить влияние факюров А и В, если известна оценка дисперсии о2. Чтобы оценить фактор случайности при отсутствии параллельных наблюдений, поступим следующим, образом. Найдем дисперсию наблюдений по /-му столбцу т /=1 Эта дисперсия обусловлена влиянием фактора В и фактора случай- ности 4 ~ ав + ’2- Равенство станет более точным, средневзвешенную дисперсию по всем k 2 1 S. = ----- 1 k (т — 1) 2 <3 В если вместо ,s? использовать столбцам: k т -Г/)2- (III.36) Вычитая (III.35) из (III.34), получим я* — --- k k (т — 1) m — 1 (111.37) >2 Отсюда (fe-l)(m-l) .2 (III.38) Обозначим полученную оценку (1IL38) для дисперсии о2 через .v2UI. Число степеней свободы равно <А:-1> (т-1). Введем также сле- дующие обозначения: k = TZT ~ * ™A + s" ’ (Ш-39) m / = 1 Величины ,s2 и .v2 можно считать выборочными дисперсиями с (к-1) и (т - 1) степенями свободы соответственно. Проверяюi пуле- вые гипотезы о незначимости влияния факторов А и В по криюрию Фишера. Если дисперсионное отношение F=—<^-,0), fi = fe-H = (А—1) (m—1), 85
принимается гипотеза № : а, =0. Если SA — ft), (Ш.42) som нулевая гипотеза отвергается и влияние фактора А считается значи- мым. Аналогично, если F= < F1_p(f1, f2), SOU1 h = m—\; f2 = (k— l)(m— 1), (Ш.43) принимается гипотеза Я0 : jij =0. При справедливости неравенства ->Л-р (111-44) ОШ влияние фактора В считается значимым. При проверке нулевых гипо- тез применяется односторонний критерий Фишера, так как альтерна- Iивой равенству = о02ш служит неравенство При проведении дисперсионного анализа в условиях линейной модели (111.29) удобно использовать следующий алгоритм расчета. Находят: 1) итоги по с голбцам At = 2 УИ> i= 2- <Ш-45> /=1 2) итоги по строкам k В}= ^yi}, j= 1,2, (Ш-46) 1=1 3) сумму квадраюв всех наблюдений SS1= 2 2 У*г <ш-47) i=l 7 = 1 4) сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце, k SS2 = J-'V42: (Ш.48) т ‘ 5) сумму квадратов итогов по строкам^ деленную на число наблюдений в строке = <ш-49) 7=1 6) квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член). (Ш.50) 86
7) сумму квадратов для столбца SS4 = SS2 — SS4; (Ш.51) 8) сумму квадратов для строки SSB = SS3 — SS4; (Ш.52) 9) общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом, SSo6m = SS4 — SS4; (Ш.53) 10) остаточную сумму квадратов ‘SSqct — — SS2 — 4" ^*$4 * (Ш.54) 11) дисперсию &A = ssA /(fe—i); (Ш.55) 12) дисперсию s?B 13) дисперсию у20ш (III.56) 2 OCT soui “ (fe — I) (m— 1) (111.57) Результаты расчета удобно представлять в виде табл. 9. Таблица 9. Двухфакториый дисперсионный анализ (без повторения опытов) Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Математическое ожидание сред- него квадрата A к- 1 SS, = ss2 - sst А 2 4 2 _ Sa к - 1 + аош В т - 1 SSB = 553 - 554 SSB V2 в m - 1 , 2 2 лОд + °ош Остаток (Аг-1) (т-1) SS ост ‘S‘S'1 “ — SS% — SS3 +• 55Ост $2 __ ————————— ош (A-D(m-l) 2 °ош Общая сумма кт - 1 •ХУобщ = — Установив при помощи дисперсионного анализа значимость влияния данного фактора, выясняют затем при помощи критерия Стьюдента или рангового критерия Дункана, какие именно средние значения у различны. Линейная модель (III.29) справедлива, если между факторами А и В нет взаимодействия. В противном случае этому взаимодействию как фактору 87
присуща своя дисперсия cjB. Взаимодействие АВ, служит мерой того, насколько влияние фактора А зависит от уровня фактора В, и наобо- рот, насколько влияние фактора В зависит от уровня А. В приведенном алгоритме при наличии взаимодействия между факторами ajB , как со- ставная часть, входит в дисперсию Выделить ojB можно только при наличии параллельных наблюдений. Пусть при каждом сочетании уровней факторов А и В проводится п параллельных опытов. Так, в табл. 7 в ячейке, образованной пере- сечением 1-го столбца и у-й строки, имеется целая серия наблюдений Уу2- ’ Уцп- Сохраним обозначение за средним результатом в ячейке. Выборочная дисперсия результатов в каждой ячейке п Si/ = 7TT 2 -Уи)2 (П1.58) имеет «—1 степень свободы. Если выборочные дисперсии по всем ячейкам однородны, их можно усреднить и использовать полученную средневзвешенную дисперсию - т <1п.so) i-=l /=1 в качестве оценки для дисперсии воспроизводимости о2. Число степеней свободы 52ш равно тк(п— 1). Более удобная формула для вычисления дисперсии воспроизводимости k т n k (Ш.60) s2 : аош п__________« mk (п — 1) где ytJ — сумма наблюдений в ij-й ячейке. При проведении дисперсионного анализа для нелинейной модели удобно использовать следующий алгоритм расчета. По табл. 7 находят: 1) суммы наблюдений в каждой ячейке У И — 2 У Ни > и=1 7=1,2......т\ i = 1, 2, ... , k ; (III.61) 2) квадрат сумм наблюдений в каждой ячейке ( п V У а ~ ( 2 У и и I 3) итоги по столбцам т п At= 2 2 yiJu-, /=1 и=1 (III.62) (II 1.63) 88
4) итоги по строкам k п Bj — 2 2 УИи'< 1=1 И=1 5) сумму всех наблюдений (общий итог) k т п k т 1=1 /=1 и=1 1=1 / = 1 6) сумму квадратов всех наблюдений k т п ss.= 2 2 2 1=1 /=1 и=1 (Ш.64) (III.65) (III. 66) 7) сумму квадратов итогов по столбцам, деленную на число наблюде- ний в столбце, k SS2 = — Х'л2; (III.67) тп 1 1=1 8) сумму квадратов итогов по строкам, деленную на число наблюде- ний в строке, т SS3 = -^-Vb2; (III.68) kn 1 i=i 9) квадрат общего итога, деленный на число всех наблюдений (коррек- тирующий член), 1 mkn 2 В] ; (III.69) 10) сумму квадратов для столбца = SS2 — SS4 ; 11) сумму квадратов для строки SSfi = SS3 — SS4 ; (III.70) (III.71) 12) сумму квадратов для дисперсии воспроизводимости fem 2 Ъун sSoH1 = ssi--±dv—= (I1L72> 13) общую сумму квадратов, равную разнице между суммой квадра- тов всех наблюдений и корректирующим членом, 55общ = SS1 - ss4; (III.73) 14) остаточную сумму квадратов отклонений для эффекта взаимо- действия АВ S^B=S\>6UI-S^-SSB-SSOU1; (Ш. 74) 89
15) дисперсию s\ = /(* — 1); 16) дисцерсию s^b 4 = SSB/(m~ 1); 17) Дисперсию tfAB 2 Sab = (k— 1) (m — 1) 18) дисперсию воспроизводимости 2 SS ОШ (III.75) (III.76) (III.77) (III.78) Проверка гипотезы о значимости взаимодействия факторов А и В проводится по F-критерию одинаково для моделей со случайными и фиксированными уровнями. Однако проверки гипотез о значимости факторов А и В проводят неодинаково для разных моделей. В табл. 10 приведен двухфакторный дисперсионный анализ с повторными опытами для модели со случайными уровнями. Таблица 10. Двухфакторный дисперсионный анализ для модели со случайными уровнями (с повторными опытами) Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Математическое ожидание сред- него квадрата А к- 1 SSA = SS2 — SS4 ,2 = А к- ] Пт°А + П°АВ +СТош В т - 1 — SS3 — SS4 о 2 SSB 4 - о т - ] ПаАВ ^°ош АВ (к- 1) (т- 1) S$AB = ® ' — SS2 ~ SS3 + s2 SS.AB АВ <*-1) (т-1) ПаАВ+^Ш Остаток (ошибка) тк(п-1) •^ош = ~ к т п 2 = ~<>Ш 0Ш тк(П-}) стош Общая сумма ткп - 1 •£%бщ ~ — -£$4 Из табл. 10 видно, что для оценки значимости фактора А необходимо составить дисперсионное отношение вида 90
f=sa/sab- (111.79) Влияние фактора А признается значимым, если sa/sab > Fi-p (fi > Л)’ (III.80) где p—уровень значимости; f\*=k- 1; fz = (k-l)(m - 1). Аналогично, влияние фактора В считается значимым, если ^в/ <>ЛВ > Fi-p (fi ’ ft)’ (111.80а) где/i = m - l,/2 = (/c- l)(m - 1). Если неравенства (III.80) и (IIL80a) не выполняются, влияние фак- торов А и В следует считать незначимым. Для математической модели с фиксированными уровнями члены, соответствующие взаимодействию, исчезают из сумм квадратов откло- нений SSA и SSB. Вследствие этого для оценки значимости фактора А составляют дис- персионное отношение вида (III.8D в знаменателе которого стоит оценка дисперсии воспроизводимости. Полученное дисперсионное отношение сравнивается с табличным f_p(f, f2) Для чисел степеней свободы Д = к - 1, f2mk (п - 1). Ана- логично, для оценки фактора В рассматривают отношение F = sb/ 5ош> (Ш.81а) которое сравнивают с табличным F^ (f\,fz) для чисел степеней свободы /, = т - 1 и /2 = тк (л -1). Если дисперсионные отношения (Ш.81) и (III.81а) больше табличных SV soiu >Fi-p(fi- ft) и (III.816) 5ОШ > Fl-P (fl • ft)’ влияние факторов А и В следует считать значимым. Если же неравен- ства (III.816) не выполняются, влияние факторов А и В незначимо. Для проверки значимости эффекта взаимодействия составляют диспер- сионное отношение вида и сравнивают его с табличным F}(f, fz) при уровне значимости р и числах степеней свободы f = (к- 1)(т - 1) и fz = тк (л-1). Если получен- ное дисперсионное отношение больше табличного %в/%ш > F (f\, fz), влияние эффекта взаимодействия факторов надо считать значимым. В противном случае, если F,_P(f\, fz), влияние эффекта взаимо- действия следует считать незначимым. Пример 2. Исследовалось влияние на процесс органического синтеза двух факто- ров; А — тип растворителя на уровнях а\, аг, аз, at и В — тип галогеналкила на уровнях bi, Ьг, Ьз, bt. Результаты (выход полимера в процентах) представлены в таблице: 91
В А ау «2 аз ал ь, 13,2 4,7 53,4 13,6 13,9 5,8 48,3 13,2 bi 18,9 19,8 14,0 9,5 21,0 17,9 13,2 8,6 Ьз 7,3 38,2 5,1 54,4 8,5 37,7 5,9 55,2 Z»4 20,0 60,1 19,6 58,2 20,8 60,9 18,5 59,7 При каждом сочетании типа растворителя и галогеналкила сделано два параллель- ных опыта. Требуется оценить значимость влияния типа растворителя и галогеналкила на процесс синтеза. Решение. Математическая модель эксперимента представляет собой модель с фиксированными уровнями. Уровни факторов А и В выбраны не случайно, поскольку необходимо установить влияние на процесс синтеза только данных четырех типов растворителей и галогеналкилов. Расчет проводится в соответствии с приведенным алгоритмом по формулам (111.61) — (111.78): 1. Определим суммы наблюдений в каждой ячейке (таблица). В А Итоги ai аг аз ад h 27,1 10,5 101,7 26,8 166,1 Ь1 39,1 37,7 27,2 18,1 122,1 Ьз 15,8 75,9 н,о 109,6 212 3 Ьд 40,8 121 38,1 117,9 317,8 Итоги 122,8 245,1 178,0 272,4 818,3 2. Возведем полученные суммы в квадрат. Результаты у?. представим в виде таб- лицы: В А ai аг аз ад Ь' 734,41 110,25 10342,89 718,24 />2 1528,81 1421,29 739,84 327,61 Ьз 249,64 5760,81 121,0 12012,16 Ьа 1064,64 14641 1451,61 13900,41 92
3. Подсчитаем итоги по столбцам. Например. = 27,1 + 39,1 + 15,8 + 40,8 = 122,8. 4. Подсчитаем итоги по строчкам. Например, В2= 39,1 + 37,7+ 27,2 + 18,1 = 122,1. 5. Определим общий итог — сумму всех наблюдений: ' 4 4 2 4 4 2 2 2уо«= 2Л* = 2 = 8i8.3- 6. Определим сумму квадратов всех наблюдений; SSi=22 2 1/^ = 32916,43. Определим сумму квадратов ний в столбце, 7. итогов по столбцам, деленную на число наблюде- SS2 = — 2 4-2 4 2 1 |г = —- (122,82 + 245,12 + 178.02 + 272,42) 181039,01 ---------= 22262,95. 8 8. Определим сумму квадратов итогов по строкам, деленную на число наблюдений в строке, ss3 = 4 = (166,12+ 122,12 + 212.32 + 317.82) = 188565,75 -------— = 23570,72. 8 9. Определим квадрат общего итога, деленный на число всех наблюдений. SS4 = /442 \2 2 2 2 учи \ 1=1 /=1 и=1 / 818,32 32 669617,89 32 20925,47. 4 2 10. Определим суммы квадратов отклонений для факторов Лий: = SS2 — SS4 = 22262,95 — 20925,47 = 1704,48, SSfl = SS3 — SS4 = 23570,72 — 20925,47 = 2645,25. 11. Определим сумму квадратов для дисперсии воспроизводимости: k т 2 2<- ,=1 ,=i 1 65724,61 SS = SS,-----1— ----= 32916,43 —---’— = 54,13. ош 1 п 2 km 4 4 2 2^=22 у-}- ,=1 /=1 >=1 /=1 93
12. Определим общую сумму квадратов: 550бщ = SSj — SS4 = 32916,43 — 20925,47 = 11990,96. 13. Определим сумму квадратов отклонений для эффекта взаимодействия. = 550бщ - — SSfi — SSO1U = 11990,96— 1704,48 — — 2645,25 — 54,13 = 7587,11. 14. Определим соответствующие дисперсии: 2 SA k— 1 2 s в m— 1 1704,48 = — = 568,16, 4— 1 2645,25 o„ = — = 881,75, 4 — 1 2 $$ош s — ош mk (n— 1) 54,13 = = 3,38, 4 4(2 — 1) 2_______SSAB SAB~ (k— l)(m — 1) 7587,11 (4— 1) (4— 1) = 843,01. Результаты расчета сведены в таблицу двухфакторного дисперсионного анализа. Иточник дисперсии Число степеней свободы Сумма квадратов Средний квадрат A 3 1704,48 568,16 В 3 2645,25 881,75 AB 9 7587,11 843,01 Ошибка 16 54,13 3,38 Общая сумма 31 11990,97 Значимость линейных эффектов А и В и эффекта взаимодействия проверялась по критерию Фишера. Дисперсионное отношение для эффекта А F = s2A/ *ош = 568,16/3,38= 168,09. Для эффекта В F = S2B/ S2OU1 = 881,75/3,38 = 260,87. Табличное значение критерия Фишера для уровня значимости р = 0,05 и числа сте- пеней свободы f = 3 и/2 — 16 Fo,95(3,16) = 3,2. Поскольку рассчитанные дисперсионные отношения больше табличного, факторы А и В значимы, т.е. выход полимера существенно зависит от типа растворителя и галогеналкила. Для проверки значимости эффекта взаимодействия составлено отношение /?=-улв/'уош= 843,01/3,38 = 249,41. Табличное значение критерия Фишера для р — 0,05,/, — 9 и/2 — 16, /*6,95(9,16) — 2,65, ^Ав/ ^ош > ^"табл. и, следовательно, эффект взаимодействия следует считать значимым. Таким образом, интенсивность влияния типа растворителя на процесс полимеризации зависит от того, с каким галогеналкилом проводится полимеризация, и наоборот, влияние галогеналкила зависит от выбранного растворителя. 94
4. Планирование эксперимента при дисперсионном анализе. Латинские и гипер-греко-латинские квадраты. При изучении влияния на процесс двух факторов число необходимых экспериментов N (без повторения опытов) определялось произведением уровней изучаемых факторов. Если число уровней п одинаково, то объем эксперимента при двух- факторном дисперсионном анализе равен N= ifi. При таком числе опытов в эксперименте встречаются'все возможные сочетания уровней изучае- мых факторов. Такой эксперимент называется полным факторным экспе- риментом (ПФЭ). Эксперимент, в котором пропущены некоторые сочета- ния уровней, называется дробным факторным экспериментом (ДФЭ). Сокращение перебора уровней всегда приводит к потере части ин- формации. Поэтому при ДФЭ важно так спланировать эксперимент, чтобы терялась наименее существенная при данной постановке задачи информация. Особенно широко используется ДФЭ, в котором теряется лишь информация о взаимодействиях изучаемых факторов. Это право- мерно в тех случаях, когда эффекты взаимодействия заведомо отсутству- ют или настолько малы, что их можно не учитывать. Рассмотрим трех- факторный дисперсионный анализ при одинаковом числе уровней п для каждого фактора. Полный перебор сочетаний уровней факторов потре- бует N опытов ^ = Л3. (III.82) Число опытов можно значительно сократить, если воспользоваться ДФЭ по схеме латинского квадрата, введенного впервые Фишером. Латинский квадрат п X п — это квадратная таблица, составленная из п элементов (чисел или букв) таким образом, что каждый элемент повто- ряется в каждой строке и каждом столбце только один раз. Из трех элементов образуется латинский квадрат 3X3: АВС В С А (III.83) С А В Из четырех элементов — латинский квадрат 4X4: А В С D В С D А (111.84) С D А В D А В С Стандартными или каноническими латинскими квадратами называются такие квадраты, у которых первая строка и первый столбец построены в алфавитном порядке (элементы квадрата — буквы) или в порядке на- турального ряда (элементы квадрата —числа). Квадраты (III.83) и (III.84) являются стандартными. Построены эти квадраты путем одношаговой циклической перестановки; вторая строка строится перестановкой в конец строки первого элемента первой строки, третья строка — переста- новкой в конец первого элемента второй строки и т. д. Одношаговая циклическая перестановка — это наиболее простой способ построения латинского квадрата. В общем случае иХи латинский квадрат может 95
быть построен при и — 1 одношаговых циклических перестановках. Число латинских квадратов зависит от размера квадрата и для п > 3 оно доста- точно велико. Так, имеется 576 латинских квадратов 4X4, 161 280 латин- ских квадратов 5X5. К планированию эксперимента по схеме латинского квадрата при- бегают при исследовании влияния на процесс трех факторов А, В и С. При этом факторы А и В могут быть связаны с самим исследованием, а в качестве фактора С рассматривается неоднородность материала. Все три фактора в латинском квадрате имеют одинаковое число уровней (ait b-, ct). Так, в плане (табл. 11) каждый фактор изменяется на двух уровнях. наложен 2X2 латинский квадрат. Матрица планирования — соответствую- щий табл. 11 план эксперимента, включающий три столбца и четыре строчки, представлена в табл. 12. Латинский квадрат является частью плана —по схеме латинского квадрата введен в планирование третий фактор С. Однако весь этот план (табл. 11) принято называть латинским квадратом. В латинском квадрате каждый элемент повторяется только один раз в каждой строчке и в каждом столбце, поэтому каковы бы ни были нарушающие свойства элемента квадрата, они в равной степени скажутся при подсчете средних по столбцам и по строкам. Приведенный в табл. 12 план представляет собой половину— полуреплику от ПФЭ 23 (табл. 13). Вошедшие в полу- реплику опыты отмечены звездочками. Результат наблюдения, полученного по полному факторному эксперименту, можно представить в виде следующей модели: Уи<1 = И + “i + + lq + a$j + ailq + + '?Hq + ai$flq + ^ijg- (III.85) В модель (III.85) помимо линйных эффек- тов входят три эффекта парного и один тройной эффект взаимодействия. Сокраще- ние числа опытов в дробной реплике (см. табл. 11) приводит к тому, что линейные эффекты оказываются смешанными с эффек- тами взаимодействия: Таблица 13. Полный факторный эксперимент 23 96
эффект А с ВС взаимодействием, эффект В с АС взаимодействием, эффект С с АВ взаимодействием. При применении латинского квадрата обычно исходят из пред- положения, что эффекты взаимодействия между факторами незначимы. Тогда результаты эксперимента можно представить в виде линейной модели УМ, = Р- + »г + ^ + 7<? + ч^- (III.86) В табл. 14 приведен план эксперимента по схеме латинского квадра- та 3X3. Латинский квадрат 3X3 со структурной точки зрения можно рас- сматривать как ’/з реплику от полного факторного эксперимента З3. В общем случае латинский квадрат и X и можно рассматривать как 1 / и реплику от ПФЭ и3. При проведении дисперсионного анализа латинского квадрата без повторных опытов удобно использовать следующий алгоритм расчета. Для этого определяют: 1) итоги по строкам А,-, столбцам Bj и латин- ским буквам С9. Например, для приведенного в табл. 14 латинского квадрата 3X3 итоги по строкам: Ai = У1 + Уг + Уз > А2 — У& + Ув + Ув > А3 = у, + у8 + ул; итоги по столбцам: — У1 + У1 + У1 • — У г + Ув + У» > &з = Уз + Ув + У»< итоги по латинским буквам; Ci = У1 + У в + Ув • С.2 — у2 + у4 + уя, С3 = Уз + Ув + у7; 2) сумму квадратов всех наблюдений п п SS1= 2 <ш-87) >=1 /=1 4-5’9 97
3) сумму квадратов итогов по строкам, деленную на число наблюдений в строке, п SS2 = — Vm2; (111.88) п 1=1 4) сумму квадратов итогов по столбцам, деленную на число наблюде- ний в столбце, п SS3 = ^-^B2; (111.89) /=1 5) сумму квадратов итогов по латинским буквам, деленную на число наблюдений, соответствующих каждой букве, п (111.90) <7=1 6) квадрат общего итога, деленный на число всех наблюдений (корректирующий член), (п \2 , п , П \2 Wd;'’’ “VQjc*г °"”’ 1 = 1 ' \ /=1 ' \ q—l ' 7) сумму квадратов для строки .S.S4 -.S.S2 - .S.S5; (III.92) 8) сумму квадратов для столбца SSB = SS3-SS6; (111.93) 9) сумму квадратов для латинской буквы SSC = SS4 — SS5; (III.94) 10) общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом, «50бщ = SSi - SS6; (111.95) 11) остаточную сумму квадратов SSoct = $$общ - -S-S^ - SSB - SSC = SS4 - SS6 - SS2 + SS6 - SS3 + + SS6 — SS4 + SS6 = SSj — SS2 — SS3 — SS4 + 2SS6. (111.96) Остаточная сумма квадратов складывается из дисперсии, обусловлен- ной ошибкой опыта, и дисперсии, обусловленной взаимодействиями факторов, если такие имеются; 12) дисперсию s2a= ss/(n-l); (111.97) 13) дисперсию ?B=SSB/(n-l); (111.98) 98
14) дисперсию s2c = SSc/(n- 1); 15) дисперсию ?2 __ ___SSoct ош ~ (n — 1) (п —2) (111.99) (111.100) Результаты расчета представляются в виде табл. 15. Таблица 15. Дисперсионный анализ латинского квадрата (без повторных опытов) Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Математическое ожидание сред- него квадрата А л-1 ssA = ss2 - о SSA + °ош В л-1 SSR = SS, - В 0 5 8% В „-1 "aj + С л-1 SSC = - S56 C n-1 «а^+ л02ш Остаток (ошибка) (л-1) (л-2) ^oct = — - S52 - £$3 - — + 2«S,S'5 5S’oct s2 - ош (.«-!)(. л-2) %2ш Общая_ сумма Л2 - 1 ^обш = — Значимость линейных эффектов проверяют по критерию Фишера. Если-дисперсионные отношения удовлетворяют неравенствам ' л/ ' ош < Fl~p(f 1’ /2)» 5 В / 5ош < ^1-р (/1 ’ /г)» 5 с/ 'ош < ^1-р(/1' /2). (111.101) где р~ уровень значимости; f, /2 — числа степеней свободы, равные /2 =(л-1)(л-2), принимаются нулевые гипотезы: а, = 0, Ру = О; Y? =0. Если какое-нибудь дисперсионное отношение оказывается больше табличного, соответствующая нулевая гипотеза отвергается, и влияние фактора считается значимым. Приняв гипотезу о значимости влияния фактора, т. е. гипотезу о значимости различия в средних, обычно выясняют, какие именно средние значимо различаются между собой при помощи критерия Стьюдента или множественного рангового критерия Дункана. Если же согласно условиям задачи один или два фактора являются источниками неоднородностей, влияние которых надо 4 99
исключить при подсчете главного эффекта (это обеспечивается плани- рованием по схеме латинского квадрата), то средние по источникам неоднородностей не подсчитываются и не проверяется значимость их различия по статистическим критериям. Пример 3. Планирование эксперимента по схеме латинского квадрата было исполь- зовано для исследования влияния на процесс органического синтеза трех факторов: А — типа галогеналкила на уровнях ау, аг, аз и at; В—типа растворителя на уровнях by, Ьг, Ьз и bt; С—отношения количества мономера к растворителю. Результаты (выход полимера в процентах) представлены в таблице. Эксперимент проводился без повторных опытов. Требуется оценить значимость влияния рассматриваемых факторов на процесс синтеза. А В Итоги по строкам Ь? Ьз Й4 «1 Ci 13,2 Со. 27 сз 49,1 С4 7,2 72,2 az С2 19,0 сз 8,0 С4 15,5 С] 9.5 52,0 аз сз 4,6 С4 5,9 С| 31,5 С2 53,1 95,1 Й4 С4 14,7 С1 16,3 С2 60,9 сз 55,2 147,1 Итоги по столбцам 51,5 32,9 157,0 125 Решение Расчет проводится в соответствии с приведенным алгоритмом по формулам (III.88) — (III. 100). Итоги по строкам Ау, Аг, Аз, Ал и итоги по столбцам By, Вг, Вз, Вл приведены в таблице. Определим: 1) итоги по латинским буквам: С, = 70,5; С2= 135,7; С3= 116,9; С, = 43,3; 2) сумму квадратов всех наблюдений 4 4 SSi = 2 У у})== 13,22 + 2,72+ ••• +55,22 = 14505,14; /=1 /=1 3) сумму квадратов итогов по строкам, деленную на число наблюдений в строке, SS2 = V4 (72,22 + 52,02 + 95,12 + 147,12) = 9649,82; 4) сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце, SS3 = 1/4(51,52 + 32,92 + 157,02 + 1252) = 11002,16; 5) сумму квадратов итогов по латинским буквам, деленную на число наблюдений, соответствующих каждой букве, SS4 = V4 (70,52 + 135,7* + 116,92 + 43,32) = 9731,31; 100
6) корректирующий член .S'.S's — квадрат общего итога, деленный на число всех наблюдений: 88б = —Ц- (72,2+ 52,0 + 95,1 + 147,1 )2 = —Ц- (51,5 + 32,9+ 157+ 125)2 = 4-4 4-4 = —— (70,5 + 135,7 + 116,9 + 43,3)2 = 8390,56; 4 4 7) сумму квадратов для строки 88л = SS2 — SS6 = 9649,82 — 8390,56 = 1259,26; 8) сумму квадратов для столбца SSB = SS3 — 886 = 11002,16 —8390,56= 2611,60; 9) сумму квадратов для латинской буквы SSC = SS4 — 886 = 9731,31 — 8390,56 = 1340,75; 10) общую сумму квадратов 55общ = SSi-SS6 = 14505,14 — 8390,56 = 6114,58; 11) остаточную сумму квадратов 880ст = 88 , — 88 , — 88 — 88„ = 6114,58— 1259,26 — — 2611,60 — 1340,75 = 902,97; 12) дисперсию г’ л-2л = 88л / 3 = 1259,26/3 = 419,75; 13) дисперсию г’ л2 = 2611,60/3 = 870; 14) дисперсию sf s2c = 1340,75/3 = 446,92; 15) дисперсию + = 902,97/6= 150,5. Результаты расчета сведены в таблицу дисперсионного анализа. Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат А 3 1259,28 419,75 В 3 2611,60 870 С 3 1340,75 446,92 Ошибка 6 902,97 150,5 Общая сумма 15 6114,58- Значимость влияния факторов А, В и С проверяется по критерию Фишера. Дисперсион- ное отношение для эффекта А F=s\l^Oyn = 419,75/150,5 = 2,64; для эффекта В f=sb/s201u = 870/150,5 = 5,62; 101
для эффекта С F = sc/ 5ош = 446,92/150,5= 2,88. Табличное значение критерия Фишера для уровня значимости р —0,05 и чисел степеней свободы сравниваемых дисперсийД — 3 и/з — 6 fo,9s(3,6) — 4,8. Сравнение полученных дисперсионных отношений с табличным значением крите- рия Фишера показывает, что влияние факторов А и С следует признать незначимым. Значимо влияет на процесс только фактор В, так как F =5в/Л'ош > ^табл- Проранжируем эффекты фактора В на разных уровнях при помощи множествен- ного рангового критерия Дункана (см. гл. II, 14). Средние значения выхода полимера для различных типов растворителя; Тип растворителя Ь< У..................12,87 tn Ьз bt 8,24 39,25 31,25 Расположим средние в порядке возрастания: b'j b] Ьл Ьз У2-8,24 7,-12,87 ул- 31,25 уз -39,25 Дисперсия воспроизводимости s’ —150,5 с числом степеней свободы /—6 (см. табл, на с. 101). Определим нормированную ошибку среднего: / 150,5/4 =6,13. у Выпишем из табл. 7 приложения значимые ранги для р — 0,05 и/— 6: Ранги, г ... . 3,46 3,58 3,64 rX Sy-.......... 21,4 21,9 22,3 Определив разницу между средними, оценим значимость различия между раство- рителями: Уз — = 39,25 — 8,24 = 31,01 > 22,3 — различие значимо уа — У1 = 39,25 — 12,87 = 26,38 > 21,9 — различие значимо у3 — ~у4 = 39,25 — 31,25 = 8,00 < 21,4 — различие незначимо Уь — у2 = 31,25 — 8,24 = 23,01 > 21,9 — различие значимо 71— ~Уз = 31,25 — 12,87 = 18,38 <21,4 — различие незначимо 7j — ~уг = 12,87 — 8,24 = 4,63 <21,4 — различие незначимо Приведенный дисперсионный анализ справедлив в условиях линейной модели. Однако, не имея параллельных (повторных) наблюдений, нельзя проверить адекватность принятой линейной модели. Если в каждой ячейке латинского квадрата проделать одинаковое число параллельных опытов, это позволит оценить значимость взаимодействий между факто- рами. При этом наличие параллельных наблюдений используется только для оценки ошибки опыта. Если эффекты взаимодействия незначимы (линейная модель), то остаточная дисперсия незначимо отличается от 102
дисперсии случайности, обусловленной ошибкой опыта. При этом значи- мость линейных эффектов может быть легко проверена. Если же линейная модель неадекватна и существуют взаимодействия между факторами, невозможно оценить значимость линейных эффектов, так как все они смешаны с эффектами взаимодействия. В этом случае плодотворным может оказаться выдвижение дополнительных гипотез о незначимости некоторых взаимодействий. Планирование эксперимента по латинскому квадрату позволяет ввести в исследование три фактора. Для четырех факторов хорошими свойства- ми обладает план эксперимента по схеме греко-латинского квадрата. Задача состоит в том, чтобы к трем исследуемым факторам, не меняя общего числа опытов п , добавить четвертый фактор D. Это удастся сделать, если найти такое расположение уровней факторов С и В, при котором в каждой строке и в каждом столбце имеются все п уровней фактора С и все п уровней фактора D и в то же время никакие два уровня факторов С и D не встречаются во всей таблице больше одного раза. Расположение такого типа называется латинским квадратом второго порядка, который получается комбинацией двух ортогональных латин- ских квадратов. Рассмотрим следующие два латинских квадрата, составленных соот- ветственно из латинских и греческих букв: I 11 А В С D Е а р t 6 £ С D Е А В 8 £ п Р 7 Е А В С D р 7 6 £ а (III.102) В С D Е А £ а р 7 & D Е А В С 7 Ъ е а р Если наложить эти два латинских квадрата один на другой и составить третий квадрат, каждая клетка которого содержит как латинскую, так и греческую букву соответствующих клеток исходных квадратов, то по- лучим Да 5р Ct Di Ez С8 Dz Еа др Bt £р Д7 ВЪ Се Da (III. 103) 5г Са О? 48 D-I ЕЪ Az Ва ср В полученном квадрате каждая буква одного квадрата связана один и только один раз с каждой буквой другого квадрата. Такие два латин- ских квадрата называются ортогональными. Полученный квадрат второго порядка называют также греко-латинским квадратом. Задача о нахожде- нии ортогональных латинских квадратов в комбинаторной математике еще полностью не решена. Доказано существование ортогональных латинских квадратов для и = 3,4, 5. 7,8 и 9. Известно, что их нет для я”=6. Для п = 6 поэтому можно построить обычный латинский квадрат и нельзя построить квадрат второго порядка. Латинский квадрат для я”=10 не исследован. Если имеется k^n-l попарно ортогональных 103
латинских квадратов, то они образуют так называемую полную систему ортогональных латинских квадратов. Показано, что существуют полные системы латинских квадратов для п=р (р — простое число) и п=ра (степени простого числа). Полную систему ортогональных латинских квадратов для п=р (р — простое число) можно построить, используя поля Галуа. Построим, например, поле Галуа вычетов по модулю 5. Два целых числа а и b конгруэнтны по модулю 5; если a-b= Z5, где X. — какое-либо целое число, это можно записать в виде a==Z>(mod5E (111.104) Конгруэнция (III. 104) определяет поле. В этом поле содержится пять различных элементов 0, 1, 2, 3, 4. Составим таблицу сложения и таблицу умножения в этом поле: Сложение Умножение 0 12 3 4 12 3 4 1 2 3 4 0 2 4 1 3 2 3 4 0 1 3 14 2 (III.105) 3 4 0 4 0 1 1 2 4 3 2 1 2 3 Рассмотрим латинский квадрат, образованный таблицей сложения. Если в этом квадрате заменить р-ю строку, начинающуюся с элемента р (р—0, 1, 2, 3, 4), строкой, полученной прибавлением (по модулю 5) к элементам первой строки первого квадрата числа р X 2, получим второй квадрат; k = 2 2X0=0 0 01234 2x1=2 2 23401 2X2=4 4 4 0 1 2 3 (111.106) 2X3=1 1 12340 2x4=3 3 34012 Для получения р-й строки третьего и четвертого латинских квадратов прибавляют (по модулю 5) к элементам первой строки первого квадрата соответственно числа р X 3 и р X 4: * = 3 3X0 = 0 0 0 12 3 4 3X1 = 3 3 34012 3X2= Г 1 1 2 3 4 0 3x3= 4 4 4 0 1 2 3 3X4 = 2 2 2 3 4 0 1 k= 4 4X0 = 0 0 0 12 3 4 4x1 = 4 4 40123 4X2 = 3 3 3 4 0 12 4X3 = 2 2 2 3 4 0 1 4X4= 1 1 1 2 3 4 0 (111.107) Таким образом, получили полную систему ортогональных латинских квадратов. 104
Таблица 16. Греко-латинские квадраты 3X3 4X4 А В Ьх b-2 Ьз а\ С1 dx C2 di сз ds ai О ds СЗ dx Ci di аз СЗ di С] ds Cl dx A В bx Ь2 Ьз bt a\ C1 d\ Ci di Сз ^3 C4 dA ai Cl ds Cl d4 C4 d] Сз di аз C3 d4 C4 ds Ci di Cl d\ 04 CA di C3 d\ Cl dA C\ ds 5X5 A в bx b2 Ьз *4 Ьь ai C] di Cl di сз ds CA d4 Cz ds ai C3 dA C4 dz Cz d] Ct di ci ds аз di Ct ds Ci d4 C3 dz C4 d] OA Cl d$ C3 d] Ca di Cz ds Cl dA az Ca ds Cz d4 C\ dz Ci df C3 di Планирование эксперимента по схеме греко-латинского квадрата при- меняется для четырех факторов. Число уровней для всех факторов должно быть одинаково. В табл. 16 приведены греко-латинские квадраты размерности ЗХЗ,4Х4и5Х5. 105
Греко-латинский квадрат является частью четырехфакторного плана — по схеме греко-латинского квадрата вводятся в план эксперимента факто- ры С и D. Например, в последнем плане (табл. 16) уровни фактора С соответствуют латинским, а уровни фактора/) — греческим буквам греко- латинского квадрата (III. 103): А -а, В-сг, С-аз, D-сл, Е-съ и a-th, Р у-4/3, 8-4/4, £-4/5. Однако принято греко-латинским квадратом называть весь четырехфакторный план (табл. 16). Матрица планирования, соответствующая греко-латинскому квадрату 3X3, приведена в табл. 17. Таблица 17. План эксперимента л = 3, Л' = 9 Номер опыта А В С D У Номер опыта А В С D У 1 а\ by С1 dy 6 02 Ьз С\ di Уь 2 а\ Z>2 С2 di У2 7 03 Ьу Сз d2 У? 3 £h Ьз сз (1з Уз 8 03 Ь2 С1 da УЗ 4 02 by С2 da У4 9 03 Ьз С2 dy У9 5 02 />2 Сз dy У5 Таблица 18. Гипер-греко-латииский квадрат четвертого порядка А В 0 1 2 3 4 0 С= 0 С= 1 С = 2 С = 3 С= 4 D = 0 0 = 1 0 = 2 0 = 3 0 = 4 £= 0 £ = 1 £= 2 £= 3 £= 4 F=0 £ = 1 F = 2 £=•3 £=4 1 С = 1 С= 2 С = 3 С=4 С= 0 D = 2 0 = 3 0 = 4 0 = 0 0 = 1 £ = 3 £ = 4 £= 0 £= 1 £= 2 £=4 F= 0 £= 1 £= 2 £= 3 2 С= 2 С= 3 С=4 С= 0 С= 1 0 = 4 0 = 0 0 = 1 0 = 2 0 = 3 £ = 1 £= 2 £= 3 £=4 £= 0 £ = 3 £=4 £=0 £= 1 £=2 3 С= 3 С = 4 С= 0 С= 1 С= 2 0= 1 0 = 2 0 = 3 0 = 4 0 = 0 £ = 4 £= 0 £= 1 £= 2 £= 3 £ = 2 £ = 3 £= 4 £= 1 £= 2 4 С = 4 С= 0 С= 1 С= 2 С= 3 0 = 3 0 = 4 0 = 0 0 = 1 0 = 2 £= 2 £= 3 £= 4 £= 0 £= 1 F = 1 £ = 2 F = 3 £=4 £=0 106
В греко-латинском квадрате имеется rfi различных комбинаций уров- ней факторов вместо л4 комбинаций полного четырехфакторного экспери- мента. Поэтому греко-латинский квадрат представляет собой 1 / rfi реплику от полного факторного эксперимента (ПФЭ). Так, приведенный в табл. 16 греко-латинский квадрат 3X3 представляет собой 1/9 реплику от ПФЭ З4 (N=81), греко-латинский квадрат 4X4-1/16 реплику от ПФЭ 44 (7V=256), 5 Х5 - 1/25 реплику от ПФЭ 54 (7V=625). Дисперсионный анализ греко-латинского квадрата проводится так же, как и анализ обычного латинского квадрата, с учетом четвертого фак- тора D (греческая буква). Сумма квадратов для греческой буквы имеет число степеней свободы п - 1. Число степеней свободы остаточной сум- мы, определяемой, как и ранее, в виде разности между общей суммой квадратов и суммами квадратов всех факторов, равна (п-1)(п-3). Если наложить друг на друга три ортогональных латинских квадрата, получим латинский квадрат третьего порядка, п ортогональных квадратов — латинский квадрат п-го порядка. Полученные квадраты называют также гипер-греко-латинскими квадратами. При п уровнях в план можно ввести п+1 фактор. Число степеней свободы остаточной суммы при этом будет равно нулю. Такие планы называются насыщенными. Построим насыщенный план для п = 5. Нало- жим для этого друг на друга четыре полученных ортогональных латин- ских квадрата 5X5 [см. (III.105) — (III.108)], составляющих полный ряд ортогональных латинских квадратов 5X5 (табл. 18). Исходный латинский квадрат (III. 105) соответствует уровням фактора С, второй квадрат (III. 106) —уровням фактора/) и т. д. Уровни факторов обозначены цифра- ми. Соответствующий план эксперимента для шести факторов приведен в табл. 19. Полученный план является насыщенным, так как число степеней свободы остаточной суммы, определяемое по формуле /=(и-1)(и- - к+ 1), где к— число изучаемых факторов, равно нулю. План представляет собой 1/625 реплику от ПФЭ 56. Такие планы обычно применяют на первых стадиях исследования процесса, когда при- 107
Рис. 22. Латинский куб первого порядка ходится проводить сложный перебор каче- ственных факторов с тем, чтобы выделить перспективные комбинации для дальнейше- го исследования и отсеять неприемлемые. Использование греко-латинских и гипер- греко-латинских квадратов в качестве пла- нов эксперимента одновременно дает эконо- мию в числе наблюдений и приводит к упрощению вычислений. Основным допущением, лежащим в ос- нове применения греко-латинского квадрата и квадратов высших порядков, является пред- положение об отсутствии взаимодействий между факторами. Проверить адекватность принятой линейной модели, как и при применении латинских квадратов, можно только при наличии параллельных опытов. 5. Латинские кубы. Полному факторному эксперименту для трех фак- торов «3fn>2) соответствует кубическое расположение из п элементов, включающее rfl позиций. Трем ребрам куба соответствуют факторы А, В и С с уровнями 0, 1, 2, ..., п-1 (рис. 22). Если ввести в план четвертый фактор D и уровни этого фактора (0, 1, 2, ..., п - 1) разместить в соответствующих опытам точках кубического расположения, то полу- чится латинский куб размера и первого порядка. Латинским кубом размера п первого порядка называют кубическую таблицу из п элементов, расположенных в п3 позициях, в которую каждый элемент входит rfi раз и встречается в каждой из Зи плоскостей, парал- лельных координатным плоскостям xyoxz, х\охз, хгохз, одинаковое для всех элементов и равное п число раз. Действительно, уровни дополни- тельного фактора D (элементы латинского куба) встречаются в плане одинаковое и равное гр число раз и встречаются в каждой из Зи коорди- натных плоскостей (т. е. с уровнями трех факторов А, В, С) одинаковое и равное п число раз (табл. 20). 3 латинский куб Соответствующая матрица планирования для латинского куба с раз- мерами п = 3, r= 1 приведена в табл. 21. Планирование эксперимента по латинскому кубу первого порядка позволяет включить в рассмотрение четыре фактора (А, В, С и D). Отли- чие от греко-латинского квадрата, который тоже дает возможность изу- 108
Таблица 21. План эксперимента л = 3, N = ll Номер опыта А В С D У Номер опыта А В С D У 1 0 0 0 0 15 1 2 1 0 У15 2 0 1 0 1 У2 16 2 0 1 0 У16 3 0 2 0 2 Уз 17 2 1 1 1 У17 4 1 0 0 0 У4 18 2 2 1 2 У18 5 1 1 0 1 Уб 19 0 0 2 1 У19 6 1 2 0 1 У6 20 0 1 2 2 У2О 7 2 0 0 2 У1 21 0 2 2 0 У21 8 2 1 0 2 Уз 22 1 0 2 0 У 22 9 2 2 0 0 У9 23 1 1 2 1 У23 10 0 0 1 2 Ую 24 1 2 2 2 У 24 11 0 1 1 0 Уп 25 2 0 2 2 У25 12 0 2 1 1 У12 26 2 1 2 0 У26 13 1 0 1 1 У13 27 2 2 2 1 У27 14 1 1 1 2 У14 чать влияние четырех факторов, состоит в том, что в латинском кубе три фактора (А, В и С) считаются главными и один фактор (D) составляет элиминирующую группировку, а в греко-латинском квадрате главными считаются два фактора А и В, а С viD составляют двойную элиминирую- щую группировку. Число опытов в кубе в п раз больше, чем в греко- латинском квадрате. Латинский куб без повторных опытов применяется в предположении линейной модели процесса: ytjql ~ Iх + ai + ?Z + 'tq + 5Z + zijqi • (III. 108) где н — общее среднее; az — эффект фактора А на z-м уровне, z =0, 1, 2, п - 1; J3j — эффект фактора В на у-м уровне, у —0, 1, 2, ..., п - 1; у? — эффект фактора С на q-м уровне, q = 0, 1, 2, ..., п -1; 8, —эффект фак- тора D на l-м уровне; s.ljql — случайная ошибка эксперимента. Статистический анализ латинского куба первого порядка без повтор- ных опытов удобно проводить по следующему алгоритму. Определяют; 1) итоги для всех факторов на каждом уровне; Л|0 = 0, 1, 2, ... , л — 1), = 1, 2.....п —- 1), Cq(q = 0, 1, 2......п—1), Dz(/ = 0, 1, 2...........п— 1). Применительно, например, к плану, приведенному в табл. 21, имеем = У1 4" Уг + Уз 4' f/ю 4“ Уп 4" 1/12 + 4/19 4" Узо 4" 4/21 > А = У в + Уъ + Уз 4“ У13 + 4/14 4- У1Ъ 4- Угг + Угз + 4/24 > Аг = Уз 4- Ув 4- Уя 4- Ую 4" Уп + У1в 4- Угъ 4" Узе 4- Угз> Во = У1 4- У в 4" Уз 4- 4/1о 4" 4/13 4“ Ум 4- 4/19 4" Угг + Угъ , Bi = У г 4" Уъ 4" У я 4" Уп + Уц А У 1з 4~ У го 4“ Угз 4" У го > Вг = Уз 4- Ув 4- Уя 4- 4/12 + 4/15 4- У1в 4~ 4/21 4“ 4/24 4~ Угз> = У1 4- Уг 4 Уз 4" Ув 4" Уъ 4" У в 4- Уз 4" Ув + Уя< Ci = 4/1о 4- Уп 4- 4/12 4- 4/13 4" 4/14 4- У1ъ +• Ую + у 1з + 4/1в, 109
Ci = 4/1Э + У20 + У21 + У22 + У23 + 4/24 + У25 + У26 + У2т Do = У1 + У& + Уб + Уч + Уч + Уч + У21 + Угг + Уч • 01 = Уг + Ув + У1 + J/12 + 4/13 + У п + Уч + У 23 + Уък Di = Уз + 4/4 + Уб + f/ю + Уч + Уч + 4/го + 4/24 + 4/гв! 2) сумму квадратов всех наблюдений п—1 п—1 п— 1 SSi = 2 2 2 (ytiql^ i=0 j=0 q~0 (III. 109) 3) сумму квадратов итогов по фактору А, деленную на п2. Оо Оо II 1 — Mi (111. ПО) 4) сумму квадратов итогов по фактору В, деленную на rfi, Оо 00 со II S“ 1 “ iMi to ч*. t* (III.Ill) 5) сумму квадратов итогов по фактору С, деленную на п2, я -1* II те со СО (III. 112) 6) сумму квадратов итогов по фактору Z>, деленную на п2, Оо Оо «г II ?Mi (111.113) 7) корректирующий член, равный квадрату общего итога, деленному на число всех наблюдений, 1 ( z П—1 \2 , n—1 \2 , П— I \2 1 1 1V 1 1 1V J SS’ = ^( =V 2jc’ = \ 4=0 ' \ /=0 ' \ q=Q ' / —~1 \2 = V ; (II, H4) \ /So / 8) общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом, 55общ = SSj. — SSe ; (111.115) 9) сумму квадратов, обусловленную фактором Л, = SS2 — SS,; (III.116) но
10) сумму квадратов, обусловленную фактором В, SSB = SS3 —SS,; (II 1.117) 11) сумму квадратов, обусловленную фактором С, SSC = SS4 — SS,; (III. 118) 12) сумму квадратов, обусловленную фактором/), SSD = SSs - SS,; (I II. 119) 13) остаточную сумму квадратов 55ост=55общ-(55л +SSB + SSC + SSD). (III. 120) Результаты расчета представляют в виде таблицы дисперсионного анализа (табл. 22). Таблица 22. Дисперсионный анализ для латинского куба первого порядка (без повторных опытов) Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Математическое ожидание сред- него квадрата Фактор А и - 1 SSA ssA И - 1 "°? +002ш Фактор В и - 1 SSB SSB п - 1 па2в +а2аш Фактор С и - 1 ssc SSC п ~ 1 Фактор/) и - 1 SSD ззъ п - 1 па& + ^ш Остаток я3 - 4и + 3 SSqCT SSqct п3 - 4п + 3 Итого - 1 Два латинских куба размера п первого порядка ортогональны, если при наложении их друг на друга каждый элемент одного куба встре- чается с каждым элементом другого куба п раз. Два таких ортогональных куба, наложенные друг на друга, представляют греко-латинский куб размера п первого порядка. Планирование по схеме греко-латинского куба первого порядка позволяет ввести в эксперимент пятый фактор. Если совместить три ортогональных латинских куба и более, то получится гипер-греко-латинский куб. Полная система ортогональных латинских кубов размера п первого порядка, составляющих полностью ортогональ- ный гипер-греко-латинский куб, не может включать более гР + п - 2 кубов. Существование таких систем доказано для п, представляющего собой простое число или целую положительную степень простого числа. 111
Рис. 23. Латинский куб второго порядка В латинских кубах первого порядка все факторы устанавливаются на одинаковом количестве уровней, равном « — размеру ку- ба, и все линейные эффекты определяются с одинаковой точностью, максимальной для данного числа опытов. В латинском кубе второго порядка один фактор устанавливает- ся на «2-уровнях, а все остальные факто- ры—на «-уровнях. На рис. 23 изображен латинский куб размера « = 3 второго порядка. Факторы А, В, С имеют три уровня: 0, 1, 2, а фактор D~девять уровней: 0, 1, 2, 3, 4, 5, 6, 7, 8, расположенных по схеме латин- ского куба (табл. 23). Планирование по схеме латинского куба может быть очень полезно на первых этапах исследования процесса при выборе оптимальной ком- бинации качественных факторов. нового полимерного материала на основе полиэтилена высокого давления, обладаю- щего повышенной жесткостью и способностью перерабатываться методом термо- формования. Рассматривалась трехкомпонентная система: ПЭВД, наполнитель, эласти- фицирующая добавка. Изучались свойства композиций с тремя видами эластифицирую- щих систем, девятью типами наполнителей, в которых менялись на трех уровнях количество добавок и количество наполнителя. Тип добавки хс СКЭП (1); ИСТ-30 (2); ДСТ-30 (3); количество добавки Х2,%: 3 (1); 5 (2); 10 (3); количество наполнителя ха.%: 5 (1); 10 (2); 15 (3); тип наполнителя ха: тальк — Т(0); аэросил — А(1); слюда —С(2); Т;А —1:1(3); Т : А — 1 :0,5(4); Т ; А —0,5 : 1(5); А : С — 1 : 1(6); А : С - 1 : 0,5(7); А :С-0,5 : 1(8). Опыты проводились в лабораторных условиях. Пригодность разрабатываемого пластического материала к переработке и эксплуатации оценивалась по четырем пока- зателям: ут — модуль упругости при изгибе, МПа; уг — разрушающее напряжение при разрыве, МПа; уз — относительное удлинение при разрыве, %; D — обобщенный безраз- мерный критерий качества (обобщенная функция желательности). Решение. План эксперимента и результаты испытаний образцов приведены в табл. 24 (см. также табл. 23). Для выделения факторов, существенно влияющих на показатели качества, был проведен дисперсионный анализ результатов в предположении линейной математической модели (III. 108). Дисперсионный анализ проводился в следующем порядке. Для четырех пока- зателей качества yi, у?, уз и D подсчитывались: 1) итоги для каждого фактора на всех уровнях (табл. 25): xu(i = o, 1, 2), Х2>(/ = 0, 1. 2)- Х89(9 = 0, 1, 2), X4Z(( = 0, 1, 2..........8); 112
Таблица 24. Латинский куб второго порядка Номер опыта XI Х2 хз Х4 л • ю,1 МПа yi • 10,1 МПа Уз, % D 1 0 0 0 0 364 117 483 0,645 2 0 1 0 4 365 118 504 0,647 3 0 2 0 8 367 99 447 0,610 4 1 0 0 1 470 134 447 0,810 5 1 1 0 5 352 122 480 0,650 6 1 2 0 6 324 112 452 0,550 7 2 0 0 2 434 96 456 0,686 8 2 1 0 3 355 126 493 0,638 9 2 2 0 7 354 127 477 0,638 10 0 0 1 3 476 112 376 0,759 11 0 1 1 7 464 96 241 0,650 12 0 2 1 2 .484 66 90 0,381 13 1 0 1 4 502 99 386 0,732 14 1 1 1 8 547 104 69 0,440 15 1 2 1 0 320 89 407 0,491 16 2 0 1 5 464 126 361 0 773 17 2 1 1 6 535 НО 104 0,248 18 2 2 1 1 431 143 402 0,768 19 0 0 2 6 615 101 69 0 210 20 0 1 2 1 615 129 28 0,350 21 0 2 2 5 572 94 205 0.668 22 1 0 2 7 593 114 25 0,430 23 1 1 2 501 85 36 0,304 24 1 2 2 3 482 114 108 0,530 25 2 0 2 8 610 96 36 0,340 26 2 1 2 0 605 102 69 0,445 27 2 2 2 4 558 120 231 0,743 Таблица 25. Итоги по разным уровням факторов Отклики Добавки (Xi) Количество добавки (Х2) Количество наполнителя (хз) 0 1 2 0 1 2 0 1 2 У< 4322 4091 4346 4528 4339 3892 3385 4223 5151 У2 932 973 1046 995 992 964 1050 945 955 Уз 2443 2410 2629 2639 2024 2819 4239 2436 807 D 4,937 4,920 5,279 5,382 4,320 4,986 3,627 5,238 5,877 Продолжение табл. 25 Отклики Наполнители (хд) 0 1 2 3 4 5 6 7 8 1289 1516 1419 1313 1425 1388 1474 1411 1524 У2 308 406 247 352 337 342 323 337 299 Уз 959 877 582 977 1121 1046 625 743 552 D 1.581 1,929 1,371 1,926 1,725 1,911 1,008 1,719 1,389 113
2) сумма квадратов всех наблюдений 2 SS1=2 1=0 /=0 например, для модуля упругости при изгибе у. SSi = 364“ + 365“ ч------+ 5582 = 6 275 327; 3) сумма квадратов итогов по фактору х>, деленная на rfl. 2 Так, для показателя у, (табл. 25) SS2 = ‘~° 2 л2 43222 + 40912 + 43462 SS2 =----------—— ------------= 6 033 742. Таким же образом определялись эти величины для остальных факторов; 2 2 4) SSs=i-^ например, для yt (табл. 25) S$3 = 45282 + 43392 4- 38922 ------13---------------= 6 053 041; 5) SS4 = 2 ___ 3<7 4=0 9 например, для у\ (табл. 25) ss4 = 33852 + 42232 + 51512 -------!---------------= 6 202 750; 2 2 9 2 9 например, для у, (табл. 25) о 12892 + 15162 4- 14192 +--- + 15242 SS5 = --------------------;-----1------------= 6 046 886; 3 7) корректирующий член, равный квадрату общего итога, деленному на число опытов, 114
нацример, для у, (табл. 25) (4322 4- 4091 + 4346)’ (4528 + 4339 + 3892)’ SSe -- -- ~~ 6 27 27 (1289 4---1- 1524)’ „ Л = --------1!----------— = 6 029 336. 27 Далее определялись суммы квадратов для всех источников дисперсии • 8) SSXi = SS2 — SSe; например, для yi SSX1 = 6033 742 — 6029 336 = 4406 ; 9) 55х2 = 55з - SSe; например, для у, SSXJ = 6 053 041 — 6 029 336 = 23 705 ; 10) SSX3=SS4-SS6; например для уч SSX= 6 202 750- 6 029 336 - 173414; 11) = SS5 - SSe; например, для у, SSX1 = 6 046886— 6 029 336= 17 547; 12) общая сумма квадратов равна разности между суммой квадратов всех наблю- дений и корректирующим членом: 55общ= SS1 ~SS6 ’ например дляу1 550бщ = 6 275 327 — 6 029 336 = 245 991 ; 13) остаточная сумма квадратов служит для оценки ошибки эксперимента SS0CT = 550бщ - (SSXI 4- SSXj + SSXj 4- SSX<) ; например, для у\ SSOct= 245 991 — (4406+ 23 705+ 17 341 + 17 547) = 26919. Результаты дисперсионного анализа для всех четырех показателей качества пред- ставлены в таблице. Свой- ство Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Проверка значимости У\ XI х2 *3 Х4 Ошибка Общая сумма 2 2 2 8 12 26 4 406 23 705 173 414 17 547 26 919 245 991 2 203 11 853 86 707 2 193 2 243 — ОС С-) v !х * ю 00 1 II ~ а з 11 a v3 и и и и < Уч Х2 Хз Х4 Ошибка Общая сумма 2 2 2 8 12 26 741 65 761 4 949 964 7 480 370 33 381 619 80 F' = 3, 4,625 *> = 33 4’763 / V 7’730 115
Продолжение Свой- ство Источник дисперсии Число степеней свободы Сумма квадратов Средний квадрат Проверка значимости Уз X] Х2 ха х4 Ошибка Общая сумма 2 2 2 8 12 26 3 098 38 617 654 929 .120 054 , 60 375 877 073 1 549 19 309 327 465 15 007 5 031 й = /*Ош 3’838 = <, /5ош= 65,089 Л = 2,983 D Xi Х2 Хз Х4 Ошибка Общая сумма 2 2 2 8 12 26 0 0,058 0,299 0,307 0,130 0,794 0 0,029 0,150 0,154 0,011 F, < 1 F, = 2,636 Та = 13,636 Fa = 14,00 Для выбора оптимальной композиции эффекты факторов на разных уровнях были сопоставлены при помощи множественного рангового критерия Дункана (см. табл. 7 приложения). При этом поскольку тип добавки (х,) значимо влияет только на уг (см. таблицу), была выбрана добавка, обеспечивающая максимальную прочность при изгибе. Ошибка среднего значения .и равна = V "2оШ/9 = V 80/9 = 2,99. Средние значения уг для уровней фактора xi...........................у£°— 104 Ранги, г.......................... г ^- ............................. ys'—108 уР=116 3,08 3,23 9,2 9,7 — у^ = 12 > 9,7 — различие значимо y'f1 — у^ = 8 < 9,2 — различие незначимо у^ — у™ — 4 <9,2 — различие незначимо Была выбрана добавка типа ДСТ-30. Этот тип добавки существенно отличается от добавки типа СКЭП и незначимо от ИСТ-30. В связи с тем, что факторы ха, хз и хд по-разному влияют на показатели качества (табл. 25), оптимальная композиция была выбрана на основании факторного анализа обобщенной функции желательности D. Была определена ошибка среднего значения D: для факторов ха и ха з- = /0,011/9 = 0,035, для фактора ха = /0,011/3 = 0,061. Уровни фактора ха . . . . 1 2 0 Средние значения D . . . . . 0,480 0,554 0,598 Ранги г 3,08 3,23 rXsB 0,107 0,113 116
р(°). — р(1’= = 0,118 ; > 0,113 — различие значимо о<°). = 0,044 - < 0,107 — различие незначимо р(2). -5(1) = 0,074 <0,107 — различие незначимо Уровни фактора хз . . Средние значения D . 0 0,403 1 2 0,582 0,653 d{2) - — О<°) = 0,250 : > 0,113 — различие значимо — р(’> = 0,071 • < 0,107 — различие незначимо д(1) _д(°) = 0,179 > 0,107 — различие значимо Уровни фактора Х4 Средние значения/) Ранги, . 6 0,336 2 8 0 0,457 0,463 0,527 3,08 3,23 3,33 7 4 3 1 0,573 0,575 0,642 0,643 3,36 3,40 3,42 3,44 г X .... 0,187 0,197 0,201 0,205 0,208 0,209 0,210 р(5) _р(6) = 0,331 >0,210 — различие значимое 5(5) _р(2) = 0,240 > 0,210 — различие значимое р(5) -D<8) = 0,234: > 0,209 — различие значимое р(5) -D<°) = 0,170 < 0,208 — различие незначимое р(5) — d(7) = 0,124 < 0,205 — различие незначимое р(5) -D^ = 0,122 < 0,201 — различие незначимое р(5) - D<3> = 0,055 < 0,197 - различие незначимое р(5) — D(1) = 0,054 < 0,187- различие незначимое ДО — D(6> = 0,307 >0,210- • различие значимое р(1) -D«> = 0,186 < 0,209 — различие незначимое р(1) -5(8) = 0,180< 0,208 — различие незначимое р(1) _p(0) = 0,116<0>205 — различие незначимое 5(D -D<7) = 0,070 < 0,201 - - различие незначимое pin -d<4> = 0,068 <0,197 — различие незначимое 5(|) — 5(3) = 0,001 < 0,187 — - различие незначимое р<Э) -D<6> = 0,306 > 0,209- различие значимое 5 0,697 3,44 0,220 D<3> — О(2) = 0,185 < 0,208 — различие незначимое Z)<3) — = 0,179 < 0,205 — различие незначимое D(3) — £)(0* = 0,115 < 0,201 — различие незначимое p<3) — £>(7) = 0,069 < 0,197 — различие незначимое 5<3> — Д(4> = 0,067 <0,187 — различие незначимое 117
= 0,239 > 0,208 — различие значимое — Z/2' = 0,118 < 0,205 — различие незначимое — O<8> = 0,112_< 0,201 —различие незначимое — D® = 0,048 < 0,197 — различие незначимое — D® = 0,002 < 0,187 — различие незначимое /У7' — /У6' = 0,237 > 0,205 — различие значимое О*7' — О*2' = 0,116 < 0,201 — различие незначимое О*7' — О*8' = 0,110 < 0,197 — различие незначимое /У7' — О*0' — 0,046 <0,187 — различие незначимое д(°) —р(б) _ о,191 < 0,201 — различие незначимое д<°) — /)<2) = 0,070 < 0,197 — различие незначимое д<°) — р(8) _ 0,064 <0,187 — различие незначимое О(8) — £>(б) __ о, 127 < 0,197 — различие незначимое /У8) — £>(2) _ о ооб < 0,187 — различие незначимое О<2) — = 0,121 <0,187 — различие незначимое На основании дисперсионного и факторного анализа были выбраны следующие композиции: 1) ПЭВД+ 10% (Т:А-1 : 1) + 10%ДСТ-30; 2) ПЭВД + 15% (Т : А « 1 : 1) + 10%ДСТ-30; 3) ПЭВД + 10% (Т : А = 1 : 0,5) + 10% ДСТ-30 Свойства оптимальных композиций приведены в таблице. Номер компо- зиции J't 10,1 МПа У2 10, 'МПа Уз, % Формуемость 1 545 135 450 Отличная 2 576 125 400 Хорошая 3 498 130 470 Отличная Методы дисперсионного анализа и тесно связанного с ним планиро- вания эксперимента в настоящее время довольно широко применяются для решения прикладных задач в химии и химической технологии. Дисперсионный анализ использует свойство аддитивности дисперсии изучаемой случайной величины и дает возможность разложить ее на ком- поненты, обусловленные действием независимых факторов. Основные положения дисперсионного анализа даются в данной главе без доказательств. Приведены алгоритмы обработки наблюдений для однофакторного и двухфакторного анализов. Рассмотрены методы планирования экспериментов по схеме латинско- го, греко-латинского, гипер-греко-латинского квадратов и латинских ку- 118
бов первого и второго порядков, дающие возможность существенно сократить перебор уровней, пожертвовав при этом наименее существен- ной при данной постановке задачи информацией. Упражнения 1. Для каких задач эффективно применение дисперсионного анализа? 2. Какие модели используются в дисперсионном анализе? Каковы особенности интерпретации результатов при использовании различных моделей? 3. Что такое латинские квадраты и как они применяются в планировании экспе- риментов? 4. Сколько факторов и на скольких уровнях позволяют ввести в эксперимент латинские квадраты, гипер-греко-латинские квадраты, латинские кубы первого и вто- рого порядков? 5. Оценить значимость различия в производительностях реакторов. Средняя про- изводительных четырех параллельно работающих реакторов представлена в таблице: Реактор Средняя производительность, т/сут 1 1600 1610 1650 1680 1700 2 1500 )640 1640 1700 1750 3 1460 1550 1600 1620 1640 4 1510 1520 1530 1570 1600 6. Оценить влияние температуры и значимость различия между марками стали на скорость коррозии. В таблице приведены значения скорости коррозии (мм/год) в поли- фосфорной кислоте при различной температуре для четырех марок стали. Марка стали Температура, °C 80 100 120 140 1 0,006 0,012 0,075 0,231 2 0,002 0,012 0,093 0,185 3 0,007 0,025 0,088 0,326 4 0,003 0,00 0,050 0,158 7. Латинский квадрат 3X3 (табл. 14) был использован для анализа процесса перекристаллизации биологически активного вещества. Факторы и их уровни приведены в таблице: Факторы Обозначение факторов Уровни фактора обозначение значение а\ 3 Температура, °C А ач 10 аз 20 Продолжитель- Ь\ 7 ность, ч В 17 Ьз 24 Соотношение Ci 1:0,5 растворитель: С С2 1:1 вода сз 1:2 119
План эксперимента и результаты опытов — выход биологически активного вещества у приведены в таблице: 1. Оценить значимость факторов методами факторного и дисперсионного анализов. 2. Провести анализ параметрической чувствительности процесса кристаллизации к изменению уровней факторов. 3. Определить оптимальную комбинацию уровней факторов, обеспечивающую наи- больший выход биологически активного вещества. ГЛАВА IV МЕТОДЫ КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗОВ 1. Выборочный коэффициент корреляции. Методы корреляционного и регрессионного анализов широко применяются для выявления и описа- ния зависимостей между случайными величинами по экспериментальным данным. Для экспериментального изучения зависимости между случай- ными величинами X и Y производят некоторое количество п независи- мых опытов. Результат z-го опыта дает пару значений (х,, у,), / = 1, 2, ..., п. О наличии или отсутствии корреляции между двумя случайными величинами качественно можно судить по виду поля корреляции, нанеся точки (х,-, уД на координатную плоскость. Положительная корреляция между случайными величинами представлена на рис. 24, а. Еще более ярко выраженная корреляция, близкая к линейной функциональной, показана на рис. 24, б. На рис. 24, в приведен пример сравнительно слабой отрицательной корреляции, а на рис. 24, г — пример фактически некоррелированных случайных величин. Для количественной оценки тесноты связи служит выборочный коэф- фициент корреляции. Рис. 24. Поле корреляции случайной величины 120
Как было показано (см. гл. И), состоятельными и несмещенными оценками для математических ожиданий тх и ту служат выборочные средние: Состоятельными и несмещенными оценками дисперсий ст? и ау служат выборочные дисперсии: Наконец, состоятельной и несмещенной оценкой ковариации covyY служит выборочная ковариация: п COV4* = 7Z7 - 7)- i=l По этим оценкам получают выборочный коэффициент корреляции: п 2 (х< —X )(yi~ у) = 0- Sy <1V • ') Выборочный коэффициент корреляции г* дает состоятельную, но сме- щенную оценку для коэффициента корреляции генеральной совокуп- г (1 — г2) ности, эта оценка имеет смещение, равное —1----.Величина смещения 2п убывает обратно пропорционально числу опытов п и при л>50 состав- ляет менее 1 %. Выборочный коэффициент корреляции г*,, так же как и г— коэффи- циент корреляции генеральной совокупности, по абсолютной величине не превосходит единицы: — 1 < г *у < + 1 • Выборочный коэффициент корреляции не изменяется при изменении начала отсчета и масштаба величин X и Y (см. свойства коэффициента корреляции генеральной совокупности, с. 25). Это свойство позволяет существенно упростить вычисления. Коэффициент корреляции одинаково отмечает долю случайности и криволинейность связи между X и Y. Зависимость между X и Y может быть близкой к функциональной, но существенно нелинейной, а коэффи- циент корреляции будет значительно меньше единицы. 121
При достаточно большом объеме выборки п выборочный коэффици- ент корреляции г* приближенно равен генеральному коэффициенту г. Однако оценить возникающую при этом погрешность затруднительно. Для этого нужно знать распределение г* как случайной величины. Это распределение зависит от генерального коэффициента корреляции г, который неизвестен. Для проверки гипотезы об отсутствии корреляции необходимо проверять, значимо ли отличается г* от нуля. Для проверки нулевой гипотезы /7°; г=0 можно использовать нормальное распределе- ние со стандартом-. аг. «(1 —(IV.2) Если в качестве доверительной вероятности взять уЗ = О,95, коэффи- циент корреляции находится в следующих доверительных границах: 1,96(1—г*2) 1,96(1—г*2) г* —--------—----- < г <. г* + ----—----- У п У п (IV.3) С вероятностью 0,95 можно утверждать, что зависимость между слу- чайными величинами существует, если 0 не содержится внутри довери- тельного интервала, т. е. если 1,96(1 — г*2) (IV.4) При малом числе экспериментов и сравнительно высокой корреляции распределение коэффициента корреляции существенно отличается от нормального (рис. 25, а). Для построения доверительного интервала можно воспользоваться преобразованием Фишера; отсюда г* = th z = е22 — 1 е22 + 1 ’ (IV.5) (IV. 6) Распределение z является почти неизменным по форме при меняющихся г* и и и с возрастанием п быстро приближается к нормальному (рис. 25, 6) со средним, равным Рис. 25. Плотность распределения выборочного коэффициента корреляции 122
1 , 1 +r = ~ ln7T77’ (,v-7) и co стандартом °z = ~==• (iv. 8) Vn~3 Тогда с доверительной вероятностью Ji значение неизвестного m2 находится в пределах "3 “з г —— - < < z + -—-—- . (IV.9) Vn — 3 Vn — 3 где Up — квантиль нормального распределения. При доверительной вероятности уЗ = О,95, 1,96, отсюда 1,96 1,96 После нахождения доверительных^границ для т2 1,96 2i=2-—= (IV. И) Уп — 3 можно найти доверительные границы для генерального коэффициента корреляции, подставляя z; и гг в формулу (IV.5). 2. Коэффициенты частной корреляции. При исследовании зависимости величины у от двух факторов х; и Х2 наличие корреляции между у и хг и корреляции между х, и хг будет влиять на корреляцию между у и х,. Для того чтобы устранить влияние хг, необходимо измерить корреляцию между у и Xi, когда хг постоянно. Для этой цели в статистике при- меняют частные коэффициенты корреляции; * __ fyXl Гух‘ 'х'х' \ УХ2' X (IV. 12) (IV.13) *ryx, ryxtrx,x1 Частный коэффициент корреляции г*х . оценивает степень влияния факторах; на у при условии, что влияние хг на у исключено. В обозначении частного коэффициента корреляции этот исключенный фактор поставлен в индексе после точки. При изучении зависимости у от трех факторов xi, хг и хз частный коэффициент корреляции между у и х; при условии, ЧТО Х2 и хз будут постоянными, можно вычислить по формуле г* ух,х,х, ГУ1.3 Г»2.3Г12.3 о-азГ’О-'ы.зК (IV. 14) 123
При переходе от парных коэффициентов корреляции к частным может существенно измениться не только величина коэффициента кор- реляции, но и знак. Проиллюстрируем это на примере. Исследовалась скорость коррозии (К) образцов стали, содержащих серу (S), фосфор (Р) и медь (Си) в растворе лимонной кислоты. На основании выборки из 39 опытов были получены значения коэффи- циентов парной корреляции; г== И" 0,205; г’р = + 0,810; г кр " +0,277; rscu = + 0,663; гКСи ~ —0,504; гр си = + 0,369. По формуле (IV.12) найдем частные коэффициенты корреляции, ис- ключив влияние одного из факторов; rK s cu ~ + 0,850; rKCuS= 0,887; гксиР== 0,690. rK s p = — 0,034; 's p-cu = + 0,813; ГК Р-Си = + 0,585; rp Cu-s = ~ 0,383; rK ps = +0,193; rS Cu-P = + 0,668; Сопоставление величин парных и частных коэффициентов корреляции показывает, что влияние, например, фосфора на скорость коррозии при постоянном содержании меди больше, чем при переменном, а влияние фосфора на скорость коррозии при постоянном содержании серы меньше, чем при переменном: * * • 'KP S < ГКР < гКР-Си- Частные коэффициенты корреляции, вычисленные по формуле (IV.14) в предположении, что устранено влияние двух факторов, приведе- ны ниже: rKS Cu р — + 0,792; >\p.SCu = —0,343; rK Cu.SP = — 0,897. Коэффициент парной корреляции между скоростью коррозии и содер- жанием фосфора при меняющихся концентрациях меди и серы поло- жительный (г*КР =+0,277); частный коэффициент корреляции SCu= = -0,343. Таким образом, анализ корреляции дал возможность установить харак- тер и степень влияния количества серы, фосфора и меди, содержащихся в стали, на скорость ее коррозии в растворе лимонной кислоты. В общем случае для расчета коэффициентов частной корреляции можно воспользоваться выборочной корреляционной матрицей; 124
Коэффициент частной корреляции между х,- и у определится по формуле * Aly ij/1.2....t—1, 14-1....fe = r-r — ' у Лц- Ayy (IV.15) где A,;y — минор, получаемый вычеркиванием /-й строки и столбца у; А „ (А у ) — минор, получаемый вычеркиванием /-й (/-й) строки и /-го (/-го) столбца. Например, для корреляционной матрицы Г11 г12 г1з • • • г1у • • • • Л21 Г22 г23 ’ ’ ’ г2у ГЭ1 г32 г33 ••• Г3у • • • • i yl ГУ2 ГУЗ-- - гуу (IV. 16) коэффициент частной корреляции з* 23 между xi и у определится сле- дующим образом: г* riy. 23 Л21 Г22 Л23 Г31 г32 г33 • • • Гу1 гу2 ГУЗ (IV.17) При интерпретации результатов корреляционного анализа нужно иметь в виду, что коэффициент корреляции — чисто статистический показатель. Он не содержит предположения, что изучаемые величины находятся в причинно-следственной связи. Поэтому любая трактовка корреляционной зависимости должна основываться на информации физико-химического характера. 3. Приближенная регрессия. Метод наименьших квадратов. Для харак- теристики формы связи при изучении корреляционной зависимости пользуются уравнением приближенной регрессии. Задача ставится таким образом: по данной выборке объема п найти уравнение приближенной регрессии и оценить допускаемую при этом ошибку. Эта задача решается методами регрессионного и корреляционного анализа. Уравнение прибли- женной регрессии существенно зависит от выбираемого метода прибли- жения. В качестве такого метода обычно выбирают метод наименьших квадратов. Пусть задан некоторый класс функций /(х), накладывающих на выборку одинаковое число связей I. Число связей / равно числу неопределенных коэффициентов, входящих в аналитическое выражение этой функции. Чаще всего используют многочлены различной степени. Наилучшее уравнение приближенной регрессии дает та функция из рассматриваемого класса, для которой сумма квадратов имеет наимень- шее значение п Ф= (IV. 18) (=1 125
При нормальном распределении случайных величин метод наимень- ших квадратов обосновывается в теории вероятностей как частный слу- чай принципа максимума правдоподобия. Предположим, что уравнение истинной регрессии выражается форму- лой ту = <р (х), а экспериментальные точки отклоняются от этой зависи- мости вследствие случайных ошибок измерения. Допустим, что ошибки измерения подчиняются нормальному закону распределения. Тогда ре- зультат /-го опыта есть случайная величина у,-, распределенная по нормальному закону с математическим ожиданием myj = <p(xi) и сред- ним квадратичным отклонением а,, характеризующим ошибку воспро- изводимости. Полагая, что все эксперименты равноточны, имеем: — а2 — • • • — ^1 — • • • а • Тогда нормальный закон, у,., можно записать в виде по которому распределена величина Л (Уд = 1 2~ а ехр В результате опыта —ряда измерений — произошло следующее событие: случайные величины У), У2,...,У„ приняли совокупность значений у,, _^,...,у„. В соответствии с принципом максимального правдоподобия (см. гл. II, с. 30) подберем так математические ожидания (p(xt), ф(х2),...,ф(хД, чтобы вероятность этого события Р была максимальна. Вероятность р, того, что случайная величина У, попадет в интервал у! - е/2, у! + е/2 в первом приближении, равна: ' I 1 г Pi = —exp J — — [yi— <р (xi)]2 1/ о № у a I Найдем вероятность того, что система независимых случайных величин Xi, Yz,...,Y„ примет совокупность значений из интервалов у,- -е/2, у,+е/2, i = 1,2,.,.,п: ^{У1-Ч(хд]г { п - [</<- ? (X/)]2 (=1 где Л'—коэффициент, не зависящий от ф(х,/ Очевидно, что при заданном о2 максимум вероятности Р получит - 126
ся в случае, когда стоящая в показателе степени экспоненты сумма минимальна, т. е. п 'P(x')]2 = min- 4=1 По методу наименьших квадратов можно обрабатывать любые экспериментальные данные, однако оптимальность этой процедуры доказывается только для нормального распределения. При этом мож- но говорить о достаточных статистиках, т. е. таких функциях от результатов наблюдений (оценках для параметров генеральной сово- купности), при помощи которых извлекается вся информация об этих параметрах, содержащаяся в эксперименте. Задача определения коэффициентов уравнения регрессии по методу наименьших квадратов сводится практически к определению миниму- ма функции многих переменных. Если у = /(х, &0, &j, Ь2, .... bk) (IV.19) есть функция дифференцируемая и требуется выбрать Ьо, Ь,, Ь2... так, чтобы п Ф= У, (У; — f b0, bi, b2......&ft)]2 = min, (IV.20) i=i необходимым условием минимума Ф(/>0, b}, b2,...,bj является выполне- ние равенств <ЗФ <ЭФ <ЭФ — = 0, ----= 0..........— =0 dbn dbi дЬк или уч Г 1 df (х;) У2 yt-flxt, b0, blt b2, ..., М —^ = 0, £1 L J дЬ» 2 2 [ У1-/(х;, &G, b2, b2, ... , М] д-^=°’ (IV.21) (IV.22) п У 2 Г у, — f (xh b0, Ь2, Ь2, . ^U0. dbh После преобразования п dfM dbn п — Ь0’ Ь1’ Ь2’ ••• . М -2-^ = 0, дЬ„ п df (хг) yt — d&i п (хг, Ьо, &1, Ь2, ... , bft) = °. (IV.23) 127
n yt df (xt) _ dbk • , bk) J01 , ^2» df (xi) dbk Система уравнений (IV 23) содержит столько же уравнений, сколько неизвестных коэффициентов b0, bu b2,...,bk входит в уравнение регрессии, и называется в математической статистике системой нормальных уравнений. Функция Ф>0 при любых Ьй, bv b2,...,bk, следовательно, у нее обязательно должен существовать хотя бы один минимум. Поэтому если система нормальных уравнений имеет единственное решение, то оно и является минимумом для функции Ф. При изучении зависимости от одного переменного параметра полезно для определения вида уравнения регрессии построить эмпирическую линию регрессии. Для этого весь диапазон изменения х на поле корреляции (рис. 26) разбивается на к равных интерва- лов Дх. Все точки, попавшие в данный интервал Дх7, относят к его середине ху. Для этого подсчитывают частные средние у. для каждого интервала ni ^Ун У) =—— , (IV.24) где л; — число точек в интервале Дх-; при этом к ^Pnj = n; (IV.25) /=1 л —объем выборки. Затем последовательно соединяют точки (х;, у) отрезками прямой. Полученная ломаная называется эмпирической линией регрессии у по х. По виду эмпирической линии регрессии можно подобрать уравнение регрессии у = f(x). 4. Линейная регрессия от одного параметра. Требуется определить по методу наименьших квадратов коэффициенты линейного уравне- ния регрессии у = &0 + М (IV. 26) по выборке объема п. Система нормальных уравнений при этом имеет вид 2^ ~ 2 (ft°+bi =°’ l—I f=“l п п ^У1Х1 — 2 + Ь1 *i= °’ 1=1 1=1 п п пьа+ьг 2* = 2^* i=i <=1 128
п п п Ь° = (IV.27) i=\ i=l i=l Коэффициенты b0 и легко найти при помощи определителей: п п п п 2Xiyi 2=1 2=1 2=1 2=1 П / n \2 n2*?-() 2=1 \2=1 / n n n i=l 1=1 i=l (IV. 28) n ^(Xi ~X)(yi~y) 2=1 n 2(*-na <=i (IV.29) b0 проще найти по известному Ь, из первого уравнения системы: (,0=7-ЛГ (IV.30) Уравнение (IV. 30) показывает, что между коэффициентами Ьо и Ь} существует корреляционная зависимость. Для оценки силы линейной свя- зи (IV. 26) вычисляется выборочный коэффициент корреляции г*: п = , (iv.3i) (n— 1) sx sy где sx, sy - выборочные среднеквадратичные отклонения. 5-529 129
Из уравнений (IV. 29) и (IV. 31) имеем (IV. 32) Пример 1. Требуется определить зависимость растворимости хлорида бария в воде (у) в присутствии хлорида кальция (х) при 70°С. Объем выборки л —6. Эксперимен- тальные данные приведены ниже; хСаС12 , %........................О 5 8 10 15 20 у (растворимость BaCh, %) ... 32 25 20 17 11 5 Решение. Определим коэффициенты уравнения линейной регрессии вида Л У = ba + biX. Коэффициент di определим по формуле (IV.29), do — по формуле (IV .30). Для этого экспериментальные данные и результаты расчета представим в виде таблицы. Номер опыта X У Л2 ху У2 х + у (X + у? 1 0 32 0 0 1024 32 1024 2 5 25 25 125 625 30 900 3 8 20 64 160 400 28 784 4 10 17 100 170 289 27 ' 729 5 15 11 225 165 121 26 676 6 20 5 400 100 25 25 625 Z 58 ПО 814 720 2484 168 4738 Проверку вычислений можно провести по формуле п п п п 2(x«+^2=2^+22 xiyt + 2^ • (IV-33) 1=1 1=1 1=1 1=1 В данном примере имеем 4738 “ 814 + 2 720 + 2484, т.е. вычисления проведены пра- вильно. Используем полученные в таблице суммы для определения коэффициентов Ьо и Ь<: 6-720 — 58-110 . , 110+ 1,355-58 bi = ~г-7-----—— = — 1,355; Ь„ =--------;----------= 31,43. 1 6-814—58« 0 6 По формуле (IV.32) определим выборочный коэффициент корреляции: г* = — 1,355 6-814 — 3364 6 • 2484— 12 100 ~ ~ 1,355 Коэффициент корреляции очень близок к единице, следовательно, зависимость между х и у является практически линейной в изученном диапазоне и имеет вид Л У = 31,43— 1,355 х. 130
После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ заключается в проверке значимости всех коэффициентов регрессии в сравнении с ошибкой воспроизводимости и адекватности уравнения. Такое исследование называется регрессионным анализом. Примем при проведении регрессионного анализа следующие допущения: 1 Входной параметр х измеряется с пренебрежимо малой ошибкой по сравнению с ошибкой в определении у. Большая ошибка у объясняется наличием в каждом процессе невыявленных перемен- ных, не вошедших в уравнение регрессии. 2 Результаты наблюдений yt, у2,...,у„ над выходной величиной у представляют собой независимые, нормально распределенные случай- ные величины. 3 При проведении эксперимента с объемом выборки п при условии, что каждый опыт повторен т раз, /=1,2,...,л, выбороч- ные дисперсии 52, должны быть однородны. Однородность дисперсий при одинаковом числе степеней свободы проверяют по критерию Кохрена, а при разном —по критерию Бартлета. Определенная по параллельным опытам дисперсия вос- производимости 5в2оспрнеобходима для оценки значимости коэффициен- тов уравнения регрессии и проверки адекватности уравнения экспе- рименту. Оценка значимости коэффициентов производится по критерию Стьюдента G = (iv. 34) где bj -j-й коэффициент уравнения регрессии; sb — среднее квадратич- ное отклонение у-го коэффициента. Если tj больше табличного tp(f) для выбранного уровня значи- мости р и числа степеней свободы f =fBomp, то коэффициент bj значимо отличается от нуля; sb. определяется по закону накопления ошибок (II 36): 7 Если выборочные дисперсии sf, однородны, получим (IV.36) (IV.37) 5* 131
Незначимые коэффициенты исключаются из уравнения регресии. Оставшиеся коэффициенты пересчитываются заново, поскольку коэф- фициенты закоррелированы друг с другом. Адекватность уравнения проверяется по критерию Фишера: F с2 /2 г 5ад' пвоспр » (IV.38) где ^2д—дисперсия адекватности; л°оспр—дисперсия воспроизводимости; ®ад — ^5ад/f аД > (IV.39) ^ад— сумма квадратов адекватности; 55ад ~ SSoct SSB0Cnр, Уад— число степеней свободы дисперсии адекватности; (IV. 40) /ад ~ /ост f воспр = (IV.41) /— число коэффициентов в уравнении регрессии; SS’eocnp ~ сумма квадратов, связанная с дисперсией воспроизводимо- сти <)с|,р, п т1 ssB0Cnp <,V42> i = l U=1 3 -Is II IS (IV. 43) saocnp — -SSeocnp/Zeocnp, (IV.44) Лоспр-число степеней свободы дисперсии воспроизводимости; /воспр = (mi 1)> Г=1 п _ 2 2 (У‘а У?)* S2 _ . = 1 и=1 (IV.45) (IV. 46) BOClip п , 2 (mt — 1) >=1 S.SM, — остаточная сумма квадратов; п л SSoct = 2 ^(yiu — yi)2; ( = 1 u=-l (IV.47) п /ост ~ т1 ” L 1=1 (IV.48) 132
fa„— число степеней свободы остаточной дисперсии з20С (IV. 49) Если F = s2 Is2 г Лад' 5воспр (IV.50) окажется меньше табличного значения fit) для уровня значи- мости р и числа степеней свободы f\ и /2 =у£оспр, уравнение адекватно эксперименту. Для одинакового числа опытов т, = ms =...= nij = ...= т„ = т вы- числения упрощаются: - 5;)2 »ад= —1-Д---------- • (IV. 51) п — I п т , 2 2 slocnp = ‘ —-Д---------- . (IV. 52) п (т ~ 1) Если опыты проведены бёз параллельных, а для получения дисперсии воспроизводимости проделана отдельная серия и5 т опы- тов, тогда Д Л 2(i/i -yi) < = £т = — (,v-53) и 2 (»:-?) 1 r m — 1 2 y°u у» = —— • (IV.55) При отсутствии параллельных опытов и дисперсии воспроизводи- мости можно оценить качество аппроксимации принятым уравнением, сравнив з2с1 и дисперсию относительно среднего з2: i=i (IV.56) 133
по критерию Фишера г sffafi) (IV.57) В этом случае критерий Фишера показывает, во сколько раз уменьшается рассеяние относительно полученного уравнения регрес- сии по сравнению с рассеянием относительно среднего. Чем больше значение F превышает табличное I\_p(fa, fa) для выбранного уровня значимости р и чисел степеней свободы j\ = п - 1 и fa~n-l, тем эффективнее уравнение регрессии. 5. Параболическая регрессия. Если уравнение регрессии представля- ет собой, полином некоторой степени, то при применении метода наименьших квадратов коэффициенты этого полинома находят реше- нием системы линейных уравнений. Например, требуется определить по методу наименьших квадратов коэффициенты квадратичной функ- ции-параболы второго порядка: У = + btx H-b2xa- (IV.58) При этом (х) df (х) д! (х) — I • ..-—г V’ I --- V* db0 ’ dbL ' и система нормальных уравнений имеет вид: л п п bon + bi У xi + bt У yi' £=1 < = 1 1=1 У xi + *1 + *г (IV.59) 1=1 1=1 1=1 1=1 i=i i~i 1=1 i=i Аналогичными по структуре уравнениями будут определяться коэффициенты параболы любого порядка. Адекватности уравнения регрессии эксперименту добиваются по- вышением степени полинома. При этом в связи с наличием кор- реляции между коэффициентами все коэффициенты регрессии нужно вычислять заново. При переходе от к-й степени полинома к (7с + 1)-й в правой части уравнения регрессии добавляется одно слагаемое ви- да bk j хк +', но все к+2 коэффициента приходится рассчитывать заново. В качестве критерия при вычислениях рассматривается оста- точная дисперсия: п «оет = 2S Z>' 1=1 134
Как только №А+1ост перестанет быть значимо меньше s2k0CT, увеличе- ние степени к нужно прекратить. Значимость различия между s2 и j2+) проверяется по критерию Фишера: F = &sk+i • Если полученное Е-отношение меньше табличного F (f\, fz) для выбранного уровня значимости и чисел степеней свободы f =fk и fz =fk+i, увеличение степени к нужно прекратить. 6. Полиномы Чебышева. Уравнение регрессии, выраженное через полиномы Чебышева, имеет вид y = bllP0(x)f-blP1(x) + ... +bhPk(x), (IV.60) где P0(x),>Pi(xf...,Pk(x) — ортогональные полиномы Чебышева на мно- жестве точек xt, Х2,...,х„. Это означает, что для всех j выполняют- ся соотношения = (IV. 61) (=1 где Рм(х) зависит только от объема выборки п. Зная многочлены Чебышева Рк^(х), при каждом увеличении степени уравнения регрес- сии необходимо вычислять только коэффициент Ьк+]. Многочлены Чебышева определяются по формулам Р0(х)=1, (IV.62) п+ 1 Pi(x)^x--j- , (IV.63) fe2 (П2 _ k2) Pk+1 (х) = (х) Р„ (х) - —f—------Рк_г (Х). (IV.64) 4 (4А/ — 1) Например, Р2 (х) = х2 - (л 4- 1) х + ~ ” + . (IV.65) О г, , , 3 (п + 1) 6л2 + 15л + 11 (л + 1) (л + 2) (л + 3) Р3 (х) = Xs------ ' - X2 4-----L- - -------X — v —— (IV.66) „ . „ , ,, , , 9л2 + 21л4-4 , (л4-1)(2л24-7л4-Ю) Р4 (х) = х« - 2 (л 4- И х3 +-----------х2 — '—’ х 4- (л + 1) (л + 2) (л 4- 3) (л 4~ 4) Определяя коэффициенты b0, b\,...,bk уравнения регрессии (IV 60) по методу наименьших квадратов, получим п 1=1 135
% У, Pi (Xi) 6i = Щ, 2 <x*) 1=1 ....................... (IV. 68) n 2 p k bk = —----------- • K n 2 pl (*.) 1=1 Вычисленные по формулам (IV 68) коэффициенты b> не зависят от того, каков будет порядок определяемого уравнения регрессии. При нахождении уравнения регрессии методом последовательных уточне- ний используются все ранее найденные bj. Повышение порядка уравнения регрессии на 1 приводит к определению только одного коэффициента. При этом удобными получаются формулы для расчета остаточной дисперсии для уравнения регрессии к-то порядка: 4 ост = ~ ’ (,V'69) где суммы квадратов отклонений .SIS’ определяются по рекуррентной формуле SSk = SSA_, - bk V (Xj). (IV. 70) 1=1 Необходимо только заранее подсчитать SS0: SSO = 2[<Н-b„р„(х,)р = 2(yi -7)2 = i=l 1=1 i=l (л V 2d — — (IV.71) п При равноотстоящих значениях аргумента х2 = Х1+Л; Х3=Х1+2Л; ... ; xn = Xj + (n—1) Л, где h — шаг интерполяции, вычисления коэффициентов облегчаются. Сделаем замену переменных: г = -—-1+1. (IV.72) h Тогда каждое значение х, заменится своим номером, т. е. z, = i. Определим коэффициенты уравнения регрессии вида У = W + ^Р. (г) + akPk (г), (IV.73) 136
где %У1 >=i 2 yi pi ю г-=1 2 1=-1 (IV.74) (IV.75) 2 Vi pk (i) ak = ^--------- • (IV.76) .2 ^(0 i=l Суммы, стоящие в знаменателе, можно определить по сокращен- ной формуле: V р2 М = (Wn(n*-l)(n*-4) ... (n* — k2) * 1 [(2ft—1) !!J222*(2ft + 1) ’ ' 1=1 где (2/с—I)-'! —произведение всех нечетных чисел от 1 до 2к~ 1 включительно. В частности, ^P?(0 = 2fcJ_) , (IV.78) VI 2 n(n2 — l)(n2 — 4) = ' <,v-79> f=l VI 2 ,n (n2 — 1) (n2 — 4) (n2 — 9) 2 p’ -----------------S5S-1---------' (,v e“> 1=1 Ё Pj «> - . (1V M) i=l Эти суммы используются и для вычисления сумм SSk, нужных для определения остаточной дисперсии: SSk = SSft_x - ak 2 pl (i) (I V. 82) i=i После получения уравнения регрессий (IV 73) переменную z опять заменяют первоначальной переменной х. 137
Пример 2. Требуется определить зависимость степени диссоциации а иодида водо- рода от температуры I. Экспериментальные данные приведены ниже: /,°С. . . . 280 300 320 340 360 380 400 420 440 460 480 а . . . . 0,178 0,182 0,186 0,191 0,196 0,202 0,207 0,213 0,220 0,228 0,236 Объем выборки л —11. Температура фиксировалась через равные интервалы 20° (Л-20). Решение. Применим метод ортогональных полиномов Чебышева для получения уравнения регрессии степени диссоциации от температуры. Сделаем замену переменных по формуле t —260 г =---------- . 20 Одновременно для удобства вычислений заменим а нау: У — 1000 (а —0,178). Полученные значения z,-, у, и полиномов Чебышева, посчитанных по формулам (IV.63), (IV.65) и (IV.66), в которые вместо х подставлены значения i —1,2,...,11, приведены в таблице. 2/ = i У1 Pt(i) yiPt(i) ftp? у/Рз(>) 1 0 -5 0 15 0 -36 0 2 4 -4 -16 6 24 7,2 28,3 3 8 -3 -24 -1 -8 26,4 24,2 4 13 -2 -26 -6 -78 27,6 358,8 5 18 -1 -18 -9 -162 16,8 302,4 6 24 0 0 -10 -240 0 0 7 29 1 29 -9 -261 -16,8 -487,2 8 35 2 70 -6 -210 -27,6 -96,6 9 42 3 126 -1 -42 -26,4 -1108,8 10 50 4 200 6 300 -7,2 -360 И 58 5 290 15 870 36 2088 S 281 631 193 67,2 Определим коэффициенты уравнения вида Л !/ = аоЛ>(г) +<4 Pi (г); P0(z)=l; Р1(г) = г — 6. По формуле (IV.74) ов = 281/Ц =25,6; л 2 У Pi(i) по сокращенной формуле (IV.78) равна = Lum - ! = по 1' ' 12 г=1 и коэффициент at по (IV.75) равен «! = 631/110 = 5,73. Уравнение регрессии первого порядка имеет вид у = 25,6-|-5,73(г — 6). 138
Определим остаточную дисперсию х?Ост. Для этого по формулам (IV.71) и (IV.82) вычислим суммы: (1! \ 2 ,=! „ 78961 оо0 = У--------------= 10843 —----------------= 3665, £1 * 11 И 11 SS1 = SSe— о? V Р? (0 = 3665 — 5,732-110 = 53, - 1=1 откуда Определим теперь уравнение регрессии второго порядка: У =“» ра (z) + а А (г) + «2^2 (г). По формуле (IV.65) Pi(z) равно Р2 (г) = z!t — 12г + 26. По формуле (IV.79) находим 11 г' 180 1=1 и определяем «а = 193/858 = 0,225. В результате получим уравнение регрессии второго порядка: Л </ = 25,6 4-5,73(2 — 6) + 0,225 (г2 — 12г+26). Определим остаточную дисперсию s? ост: ssj-42^(0 , " 53— 0,2252-858 9,6 2ост л-3 п-3 8 ~ 8 Проверим значимость различия 5,20ст и^ост по критерию Фишера. f=si ост/ 4 ост = 5,9/1,2 =4,9, fo,95 (9.8) = 3,4, f >fi-p(/i. /2). значит, уравнение второго порядка является существенным уточнением уравнения пер- вого порядка. Определим уравнение регрессии третьего порядка: Л У = °Л (г) 4- “1Р1 (г) 4- «2^2 (г) + а:/з (г) Подставляя л — 11 в формулу (IV.66), получим Рз (г) = г9—18г2+ 90,2г—191,1. По формуле (IV.80) находим 139
11 11 (121 — 1) (121 —4) (121—9) 2800 = 6177,7, откуда «3 = 67,2/177,6= 0,0109, и уравнение регрессии третьего порядка имеет вид у = 25.6 + 5,73 (z— 6)+ 0,225 (z2 — 12z + 26) + + 0,0109(z3+ 18z2 + 90z— 191,1). Проверим существенность перехода от уравнения регрессии второго порядка к уравнению третьего порядка. Для этого определим 9 SS3 " 9,6 — 0.01092-6177,6 8,9 s23oct = —4 =------------------------- =-------------~7---------= Т =1,27, S2 2> S2 ост Л2 ост ’ Следовательно, нужно остановиться на регрессии вюрого порядка. Делая обратную замену у и z на а и г, получим 1000 (я — 0,178) = 25,6+5,73 I - —6 20 + 0,225 и окончательно а = 0,1731 — 0,000139/ + 0,0000005 Полученное уравнение является окончательным в классе полиномов. Оценим тес- ноту найденной связи при помощи корреляционного отношения (IV.89): е = у 1 _ е, е = SS2/SS0 = 9,6/3665 = 0,00272, О = /1—0,00272 = 0,986. Корреляционное отношение 0 близко к 1, следовательно, найденная связь близка к строго функциональной. 7. Трансцендентная регрессия. При малых объемах выборки п увеличение порядка полинома может привести к росту остаточной дисперсии. Чтобы уменьшить число определяемых коэффициентов, используют трансцендентную регрессию. Вычисление коэффициентов трансцендентной регрессии может оказаться весьма трудоемким вследствие необходимости решать систему нелинейных уравнений. Вычисление упрощается, если провести замену переменных. Например, зависимости показательного типа и дробно-степенного 7= V*. (IV.83) 7= Ъох' (IV.84) 140
линеаризуются логарифмированием: lg^= lg&o + *lg&l» ’gZy= 1g*0 + *i 1g « ПОЛОЖИВ (IV.85) (IV.86) lgy=2, 1g be = a0 И Jg6l = o1, Igx=/ получим линейные уравнения относительно новых переменных: 2=a04-ajX, z=ae-}-b1t. Коэффициенты а0, а,, by определяются по методу наименьших квадратов. По полученным а0 и а, определяются коэффициенты Ьо и by. Однако следует иметь в виду, что полученные таким образом коэффициенты уравнений регрессии (IV 83) и (IV 84) являют- ся смещенными оценками для соответствующих генеральных коэф- фициентов. 8. Оценка тесноты нелинейной связи. Если считать, что уравне- ние регрессии найдено с достаточной точностью, то остаточная дисперсия обусловлена только наличием дисперсии воспроизводи- мости, т. е. ' ост ~ 'воспр' (IV.87) Чем меньше доля з?с,~^оспр в общей дисперсии тем сильнее связь между У и X, так как меньше доля случайности в этой связи. Поэтому силу связи можно характеризовать величиной (IV.88) где S (yi — yi) t _ ______________ S ост я _ I 2 ... 1_______ у n— I Л 2 У1 1=1 Связь тем сильнее, чем меньше Величина уТ^Т =в (IV.89) 141
называется корреляционным отношением. Чем больше 0, тем сильнее связь (IV.90) Если 0= 1, то существует функциональная зависимость между параметрами. Однако при 0=0 величины Y и X нельзя считать независимыми, так как связь между ними, не сказываясь на диспер- сиях, может проявить себя в моментах более высокого порядка. И только при нормальном распределении равенство нулю корреля- ционного отношения однозначно свидетельствует об отсутствии связи между случайными величинами. Корреляционное отношение, как и коэффициент корреляции в линейной регрессии, характеризует тесноту связи между случайными величинами. Вообще анализ силы связи по 0 называют корреляционным анализом. При линейной регрессии корреляционное отношение равно коэф- фициенту корреляции: 6= | =|г*|. (IV.91) V л-1 s2y 9. Метод множественной корреляции. Если необходимо исследо- вать корреляционную связь между многими величинами, то пользуют- ся равнениями множественной регрессии: У = *о + М1 + *2Х2+•••(IV.92) Уравнение (IV 92> представляет собой поверхность регрессии при к = 2 и гиперповерхность при Л>2. Эту поверхность называют поверхностью отклика. При построении поверхности отклика на координатных осях факторного пространства откладываются числен- ные значения параметров (факторов). Исходный статистический материал представлен в табл. 26. Таблица 26. Исходный статистический материал в “Натуральном масштабе Номер опыта Х1 Х2 хз У 1 *11 *21 *31 Х/с, У^ 2 *12 *22 *32 хк? У? 3 *13 *23 *33 хкз Уз п Х,„ Х2П хзп хкп Уп Перейдем от натурального масштаба к новому, проведя нормиров- ку всех значений случайных величин по формулам: 0 _ У1 — У . о _ ХН — *} . 6 » xts — » (IV.93) i= 1, 2, ... , л; /= 1, 2, ... , k. 142
где yfi х$ - нормированные значения соответствующих факторов; у, х, - средние значения факторов; sy, ^—среднеквадратичные откло- нения факторов: В табл. 27 приведен исходный статистический материал в новом масштабе: Таблица 27. Исходный статистический материал в безразмерном масштабе Номер опыта \ *1 1 *?, *?i *31 *?1 У? 2 *?2 х22 *32 Хк2 Уг 3 у0 *13 *23 *33 хЧз Уз п V0 Х1П *20 *3» У°„ В новом масштабе имеем: х° = 0, у° = 0 и 3*0=1, ^ = 1. (IV.94) Выборочный коэффициент корреляции при этом равен • 1 ° ° г о=--------- ▼ . у x.s, «•* л— 1 t il i »=1 (IV.95) n • 1 % о о r _o 0 =---------- ▼ . x, x„ , I, m = 1, 2, ... , k, I > ли xlxm n— 1 k”4' i=l Вычисленный по формуле (IV 95) выборочный коэффициент кор- реляции равен коэффициенту корреляции между переменными, вы- раженными в натуральном масштабе г*х., г?Хт. Уравнение регрессии между нормированными переменными не имеет свободного члена и принимает вид -"'0 0 о у° = а1х + а2х +- -+<zftx . (IV.96) 12 Л Коэффициенты уравнения (IV 96) находятся из условия е XI ( 0 s = = mln- 1=1 143
Условия минимума функции S определяются так же, как для зависимости от одной переменной: dS dS — =0; • • • ; -— = 0, да2 дак и система нормальных уравнений имеет вид «1 Zj 2j xlix2i +--Ь “Л 2 ХцХм = 21 ХцУ1, dS 1Г = 0: (IV.97) «I S + 2 ( x2i)2^----+ ®A 2 = 2 (IV.98) “1 2 хЛ<х°1г +®2 2 XkiXu 4------1- ак 2 ( ^ki)2 = 2 ХМУ1- i=l i=l i=l 1=1 Умножим левую и правую части системы уравнений (IV 98) на \!(п — D. В результате при каждом коэффициенте а, получается согласно (IV 95) выборочный коэффициент корреляции г*. Принимая во внимание, что п 1=1 получаем систему нормальных уравнений в виде “I + + “зГ*ХЛ + • • + , аЛ,Х1 + “2 + О3Т*,Ж, .+ ••• + . (IV.99) “1гхЛх, + a2rxhxt + a»rxhx, 4-Н ak = В системе уравнений (IV 99) Для многопараметрических процессов система (IV 99) оказывается высокого порядка и для ее решения необходимо использовать вычислительную машину. Решив систему (IV 99), рассчитывают коэффициент множественной корреля- ции R: R — ]/^airffx, + а^гух, + • • + (IV. 100) Коэффициент множественной корреляции служит показателем силы связи для множественной регрессии: 0</?<1. (IV.101) Для выборок небольшого объема в величину R необходимо внести коррекцию на систематическую ошибку. Чем меньше число степеней свободы выборки f = п—1, тем больше завышается сила связи, оце- 144
ниваемая коэффициентом множественной корреляции. Формула для коррекции /?'=]/ 1 — (1 -Я2) , (IV. 102) у Л — • где А'—скорректированное значение коэффициента множественной корреляции; /—число коэффициентов уравнения регрессии. В уравне- нии (IV 92) 1 = к+1. От уравнения (IV 96) можно перейти к натуральному масштабу по формулам bj = а, —т—, /=1,2...........Л; /=#=0, J (IV. 103) п Ь0 = 7~ У bjXj. i=l При наличии параллельных опытов можно рассчитать дисперсию воспроизводимости и провести статистический анализ уравнения регрессии. Пример 4. Необходимо получить зависимость степени извлечения серной кислоты (» из травильных растворов от следующих факторов; xi — концентрации H2SO4 в исходном растворе; %2 — концентрации сульфата железа FeSCh; хз — объемного соотношения спирт — кислота. Исходным статистическим материалом служит выборка объемом в 105 измерений, полученная пассивным экспериментом. Решение. Известно, что зависимость между степенью извлечения серной кислоты и выбранными факторами в исследуемой области носит линейный характер. В связи с этим определим эту зависимость в виде линейного уравнения регрессии У = Ьв + Ь2х2 + Ь2х2 + Ь3Хз методом множественной корреляции. По формулам (IV.93) все результаты эксперимента переводим в стандартный масштаб. Затем по (1 V.95) вычисляем выборочные коэффициенты корреляции: г* =0,212, г* =0,043, г* =0,903, г* = — 0,417, У*1 ’ ’ yxt ’ ’ ухл XfXt » ’ г’ =—0,128, г’ =0,046. *1*3 xixs Полученные значения коэффициентов корреляции подставляем в систему уравнений (IV.99). В результате получим в! — 0,417а2 — 0,128а3 = 0,212, — 0,417а) + а2 + 0,046а3 = 0,043, — 0,128aj 4-0,046а2 + а3 = 0,903. Решив систему, получим ai — 0,397, аг “0,166, аз— 0,903 и уравнение регрессии в стандартном масштабе: XX 0 О О у» = 0,397*1 4-о, 1 ббХа 4-о, 9ОЗх3. По формулам (IV. 103) перейдем к натуральному масштабу: ^= —26,5+ 1,987*)+ 1,17*2+ 14,14*3. 145
Проверим адекватность полученного уравнения по критерию Фишера: Г _ с2 / ,,2 ост/ аоспр* Дисперсию воспроизводимости определим по данным трех параллельных опытов 3 ’'аоспр = g = 3>82, где уо— среднее по параллельным опытам. Число степеней свободы Увоспр равно 2. Остаточную дисперсию определим по формуле (IV.53): 105 , У (</< — </.) 2 <=1 Число степеней свободы sqct равно 101; F-отношение равно 9,4. Табличное значение критерия Фишера для уровня значимости р — 0,05 и чисел степеней свободы / — 101 и fi — 2 F-p (/, fa) — 19,5. Следовательно, полученное уравнение регрессии адекватно эксперименту. 10. Регрессионный анализ в матричной форме. Регрессионный анализ в матричной форме удобен для решения задач на ЦВМ. Методом наименьших квадратов необходимо найти коэффициенты уравнения регрессии по данным табл. 26 У = Мо -ф ftjXj -f- b2x2 + • • + Ь^х^, где xo —фиктивная переменная, равная 1. Представим исходный статистический материал в матричной форме. Будем называть матрицу (IV. 104) матрицей независимых переменных, а матрицу-столбец У1 у? .Уп_ вектором наблюдений. Введем матрицу-столбец коэффициентов В = локированную к X: х<и х°2 • • х°п Т Х11 *12 ' • • *1П (IV. 105) и матрицу, транс- UV. 106) *hi *ha • • • *hn 146
Система нормальных уравнений для определения й0, bltbk имеет вид fto xoi "Ь xoixii 4" ‘ ' 4“ xoixki = хо1У1 > i=l t = l i=l i=l Л П 2 П n bo xlixoi + xii 4" * • 4" bk xlixki ~ xii!/i , i=l i=l 1 = 1. i = l (IV. 107) П n n 2 n bo 2 xkix0i + bi 2 xMxii + ’ • • + bk 2^/ = ^ХМУ1- i=l i=l i = l i = l В матричной форме система нормальных уравнений запишется следующим образом: Хт ХВ = Хт Y. (IV. 108) Действительно, перемножив матрицу Хт и X, имеем хтх = ~~ п п Xoi S xoixil ’ • • i=l i = l n n 2 xiixoi 2 Xii ‘ ‘ i=l i=l n “ i=l n ^iixki t = l (IV. 109) n n t=l n .. У A AU ki <=I _ ХтX—матрица моментов. Умножив матрицу Хт X на матрицу- столбец В, получим матрицу-столбец: ** n 2 Xoi b* t==l n n i=l n n • + bk 2 i=l n XTXB = ^0 4“ 1=1 2 + t=i * + 2 i=l . (IV. 110) п п п Ьо 2 xkixoi + Ь1 2 xkixii + • • • +*fc 2 Xhi . i=l i=l i=l Умножив матрицу Хтна вектор наблюдений Y, получим Хт Y = п 2 х<иУ1 i=l п 2 xnyt i=i (IV.Ill) п 2 ХМШ _/=1 147
Из уравнения (IV 108) матрица-столбец коэффициентов В опреде- ляется следующим образом: В = (Хг X)’1 Хт Y, (IV. 112) где (X1 X)— матрица, обратная матрице (ХТХ); (х7^)"1 = соо coi • • • соЛ С1° с“ Clk . (IV. 113) -cho cki ••• ckk. Элементы обратной матрицы определяются соотношением CjU -- ! Т \ ’ det (Хт X) (IV.114) где det (ХТХ)— определитель матрицы Х7Х, а — алгебраическое дополнение элемента .£ х„,х,, в матрице ХТХ. Для существования обратной матрицы (ХТХ) должна быть не- вырожденной. В связи с этим при использовании рассматриваемого вычислительного метода необходимо, чтобы переменные Хр x^...,x,t были линейно независимы. Тогда в матрице независимых перемен- ных элементы одного столбца не будут линейной комбинацией соответствующих элементов других столбцов. Для определения остаточной дисперсии определяют матрицу- столбец ~Ь~ У1 к У'2 = хв. (IV. 115) Л ~Уп— Числитель остаточной дисперсии получается умножением матриц: (IV.116) Обозначим через В вектор-столбец коэффициентов истинной регрессии, при этом математическое ожидание В равно M(B) = R. Тогда М [(2?-р)(2?-Рг)1 = Ч C0Vv.---C0VfeA C0VM, • C0VMft (IV. 117) 9 COVk k COVk . ... a* гдео/,2 —генеральная дисперсия коэффициента Ь,\ covbbu — ковариация, или корреляционный момент, между коэффициентами bj и Ьи. Таким образом, диагональные члены матрицы представляют собой дисперсии коэффициентов, необходимые для проверки гипотезы 148
значимости, а недиагональные — ковариации соответствующих коэффи- циентов регрессии, определяющие статистическую зависимость между коэффициентами. Выразим матрицу М[(В - В)(В - В)т] через результаты наблюдений, имея в виду, что В = (ХГХ)~,Х1 Y. В результате получим Af [(Л — ₽) (В — ₽)г ] = М {(Хг X)-1 Хт Г» [(Хт X)'1 Хт У0]т } , где У0—случайный нормальный вектор с независимыми компонента- ми, имеющими дисперсии о2; У° = У — м (У) = У1 — т(У1) у2—т (у2) _уп—т(уп)_ Матрица коэффициентов нормальных уравнений симметрична и, следовательно, [(хг х)-1]г = (хгх)-1. Полагая о2 =о22 “...“О2, =<т2 висимость ошибок, получаем г< °2У, учитывая статистическую неза- м (у®у°г) = (IV.118) а2 Уп О и О Таким образом, имеем М [(2? - р) {В - р)г ] = (Хг X)"1 (IV. 119) Отсюда ab} = CJi^; ™ь,ьи= w*- (IV. 120) Матрица (Х7Х)-’ называется матрицей ошибок или ковариацион- ной матрицей. Так как ковариационная матрица недиагональна и, следовательно, все коэффициенты регрессии взаимно связаны, нельзя проверить значимость каждого коэффициента в отдельности. Поэтому отношения I bj | tj = —1 _ (IV. 121) Sy VCjj можно рассматривать только как средство ранжировки факторов. Используется процедура последовательного исключения незначимых факторов: фактор, для которого tj оказывается наименьшим, исключает- ся, и расчет повторяется. Исключение факторов производится до тех пор, пока уменьшается остаточная дисперсия. При этом улучшаются интерполяционные свойства уравнения регрессии, однако полученные коэффициенты оказываются смещенными оценками для соответствую- щих генеральных коэффициентов. При большом числе факторов для расчета множественной регрессии необходимо использовать ЦВМ. 149
При решении линейных алгебраических систем часто приходится сталкиваться с проблемой плохой обусловленности этих систем. Так, если для системы ХВ = У малым изменениям элементов матри- цы X или вектора У отвечают достаточно большие изменения реше- ний (элементов вектора В), то система плохо обусловлена. В про- тивном случае система обусловлена хорошо. Погрешности в опреде- лении экспериментальных величин х и у сказываются на определяе- мых величинах коэффициентов и при плохой обусловленности влекут за собой сильные вариации в значении коэффициентов и, следова- тельно, малую достоверность полученных результатов расчета. Хорошая или плохая обусловленность тесно связана с величинами определителя матрицы (ХТХ) и ее элементов. Введено большое число различных критериев, определяющих обусловленность. Для плохо обусловленных систем возникает проблема выбора алгоритма решения. При проведении расчетов по рассмотренному алгоритму на каждом шаге будет возникать некоторая ошибка, на- пример, за счет округления или заданной точности на ЦВМ, а также ощутимая потеря значащих цифр в результате вычитаний. В конечном итоге это может привести к достаточно сильному иска- жению решения. Для таких систем требуются так называемые устой- чивые алгоритмы, позволяющие исключить появление нежелательных ошибок, связанных, в частности, с плохой обусловленностью. Наибо- лее общим и наиболее часто используемым подходом является метод регуляризации, разработанный А. Н. Тихоновым. Проблем, связанных с плохой обусловленностью, не возникает при обработке планированного эксперимента (см. гл. V). 11. Метод группового учета аргументов (МГУА). Метод группового учета аргументов, предложенный А. Г. Ивахненко, существенно уменьшает вычислительные трудности, возникающие при применении метода наименьших квадратов в задачах большой размерности. МГУА дает возможность решение исходной многофакторной задачи свести к решению большого числа сравнительно простых задач аппроксимации экспериментальных данных функциями двух перемен- ных — полиномами обычно невысокого порядка. Метод Ивахненко состоит в выборе иерархии частных моделей вместо одной общей модели. На каждой из стадий этого процесса производится отбор наилучших, в некотором смысле, полиномов, которые используются на следующей стадии в качестве фиктивных аргументов новых полиномов. На рис. 27 приведена схема применения МГУА. Каждая частная модель имеет два входа и один выход. Параметры частных моде- лей (коэффициенты частных полиномов) подбираются так, чтобы как можно точнее аппроксимировать величину у. В качестве частных полиномов используют линейные уравнения для двух факторов: v=b0+b1Xl + btx2, (IV. 122) уравнения с эффектом парного взаимодействия v — Ьо + bLx2 -Ь fe2x2 + bl2x2x2 (IV. 123) 150
Частная модель Рис. 27. Схема МГУА или второго порядка v — Ьо -f- ^1*1 + b2x2 “F ^12*1*2 + 4~ b22x%. (IV. 124) Последовательно образуя, согласно схеме на рис. 27, новые пере- менные, стараются в конце концов получить расчетные значения у, являющиеся хорошей аппроксимацией экспериментальных данных. Пусть исходные экспериментальные данные представлены в табл. 26. Разобьем совокупность экспериментальных данных на три множества: обучающее М0 ={ х®, у®} , »= 1, 2, ... , проверочное ма = { xf, , i = + 1, п2 + 2, ... , п2; контрольное Мк = { х^, tf(], i = ла + 1, л2 + 2, ... , п. На первом этапе (рис. 27) построим С% частных полиномов для двух факторов хи и х}, например, вида (IV 124): °ui = ^oui ^ихи 4~ bjXj Ц- bujXaXj + + bjjXj; «,/=1,2.......k; u^=j. Коэффициенты частных полиномов определим методом наименьших квадратов по данным табл. 26, принадлежащим обучающему мно- жеству Л/о„ при этом число точек в множестве л, должно быть больше числа коэффициентов в частном полиноме. При определе- нии каждого частного полинома на первой стадии (рис. 27) мини- мизируется сумма квадратов отклонений вида Г A I2 $1 = Л L</i — vuj (О J . г=1 (IV. 125) Среди полученных полиномов необходимо выбрать лучшие. Исполь- зуем для этой цели проверочное множество экспериментальных точек Мп. Вычислим vUj для каждого полинома во всех точках множества М„ и определим средние квадратичные ошибки аппрок- симации экспериментальных данных проверочного множества Мп каждым частным полиномом: 151
S“>=1/ “— V [.VJ - Vui (OF; (IV. 126) W n2 — n1 F <=л»-Н u, j = 1, 2, ... , k', u=l= j. Среди ошибок аппроксимации найдем наименьшую и обозначим ее •у,,. Выберем среди частных полиномов т1 лучших (щ, v2,...,vm), кото- рым соответствуют меньшие ошибки аппроксимации sUJ. В методе группового учета аргументов процедура выбора числа лучших поли- номов наименее формализована. Чрезмерное уменьшение числа отбираемых на следующую стадию полиномов может привести к потере значимых факторов, увеличение от —к резкому росту объема вычислений. Вычислим значения v,(i), j=1,2,...,oti отобранных полиномов во всех точках обучающего множества Мо и контрольного Мх. Полученные значения Vj(i) на контрольном множестве используем для опреде- ления средних квадратических ошибок 5, : 8>=1/ ’ (IV.127) Г Г=л« Среди всех величин 5, найдем наименьшую и обозначим ее б.,. Эта величина используется на следующих стадиях аппроксима- ции. На второй стадии отобранные полиномы vv v2,-..,v„t служа! аргументами новых частных полиномов: 2uj — ^oui “h buvu “И bjVj bujvuVj baav%.-{- bjjv‘j; (IV. 128) и, j= 1, 2, ... , mi, u=£j. Число полиномов (IV 128) на второй стадии равно С^. Коэффициенты новых частных полиномов определяются методом наименьших квадратов на обучающем множестве МОу значения Vj(i) и vu(i),j, « = 1,2,..., от,;у и; i — 1, 2,..., л, были вычислены на первой ста- дии. При определении коэффициентов полиномов (IV. 128) минимизиру- ется сумма квадратов отклонений вида vU A I2 2 LFi ~ z <4 (ОJ • (IV. 129) Для выборки лучших полиномов воспользуемся проверочным множе- ством точек М„. Вычислим zuj для каждого нового частного полинома во всех точках множества Мп и определим средние квадратичные ошибки аппроксимации экспериментальных данных проверочного мно- жества М„у подставив для этого в формулу (IV.129) zUJ вместо ц,.. Среди ошибок аппроксимации снова найдем наименьшую и обозначим ее s,2. Выберем среди новых частных полиномов от2 лучшие z,, z2, ..., которым соответствуют меньшие ошибки аппроксимации эксперимен- 152
тальных точек на множестве Мп. Число отобранных полиномов m2 меньше отобранных на первой стадии отбора rri2< С%,. Каждый такой полином представляет собой зависимость уже от четырех факторов, поэтому вероятность аппроксимации им с требуемой точностью эксперименталь- ных данных табл. 26 выше, чем полиномами, полученными на первой стадии. В связи с этим необходимо выяснить целесообразность перехода к третьей стадии аппроксимации. Процедура последовательной аппрок- симации оканчивается, когда средняя квадратичная ошибка аппроксима- ции экспериментальных данных контрольного множества М>: лучшим полиномом 6. статистически незначимо отличается от ошибки воспроиз- водимости. Для проверки точности аппроксимации вычислим средние квадратичные ошибки 8/ на множестве Мг; / п Ъ= 1/ —— V} [Уг — Z1(‘)F . /=1. 2.................т2. (IV. 130) / л — п2 1 1~пг Найдем наименьшую среди всех 5, и обозначим 5,2. Если окажется, что 5,2 статистически незначимо отличается от ошибки воспроизводимости, то процедура аппроксимации закончена. Если же 6.2 существенно больше ошибки воспроизводимости, необхо- дима третья стадия аппроксимации, на которой уже в качестве фиктив- ных аргументов будут использоваться полиномы zv z2, ..., zm,. При отсутствии информации об ошибке воспроизводимости для окон- чания процесса аппроксимации можно применять величину £ — I — 5*2 I / ^*2 • (IV.131) Если е относительно невелико, например менее 0,1—0,15, то дальней- шая аппроксимация малоэффективна. Следует отметить, что во многих случаях величина 5, возрастает с ростом числа стадий аппроксимации. Это явление называют неустой- чивостью МГУА. Неустойчивость МГУА проявляется и в изменении величины 5*, которая с ростом числа стадий вначале убывает, а затем начинает быстро возрастать. Величина s* менее чувствительна к росту числа стадий, чем 6,, так как точки, принадлежащие проверочному множеству Мп, участвуют в формировании аппроксимирующего поли- нома. Рекомендуется заканчивать процедуру последовательной аппрок- симации на стадии, соответствующей минимальному значению s’. Многие вопросы применения и обоснования метода группового учета аргументов еще нуждаются в детальной разработке. Важным достоин- ством этого метода является возможность на каждой стадии аппрокси- мации иметь дело с информационной матрицей порядка, не превышаю- щего 6X6, что в общем случае способствует улучшению ее обусловлен- ности. 12. Метод главных компонент. Метод главных компонент был пред- ложен Пирсоном (1901) и позднее детально разработан Хотеллингом (1933). Метод дает возможность от непосредственно измеряемых фак- торов Xj(7=l, ..., к) перейти к их некоррелированным линейным ком- бинациям: 153
k vi= ^UjiXi, i, j = 1, 2, ... , k, (IV. 132) i=l дисперсии которых убывают, т. е. ... Коэффициентами линейных комбинаций, нагрузками i-й переменной в j-й компоненте являются элементы собственных векторов матрицы ковариаций, а дисперсии компонент равны собственным числам этой матрицы. Пусть X— матрица центрированных наблюдений с нулевым вектором средних: Х21 . . . Xfn х22 • . • xk2 х2п • • • xkn Тогда матрица хт х L = -*--= (п-1)-1 п — 1 N 1=1 N x2ixii Z=1 2 xkixii (=1 N N 1 xiix2i • • • 2 xlixki i—1 i=l 2 X2i " ’ ‘ x2ixki i=l i=l N N 2 xkix2i ••• 2 Xki i~l i—1 (IV. 133) дисперсионно-ковариационная матрица наблюдений; ее диагональные элементы представляют собой дисперсии, недиагональные элементы — ковариации. Если от центрированных переменных перейти к нормированным (см. IV.93), получим корреляционную матрицу; rxix1 • rxtxh гх X 1 ГХ X / r* ••• 1 xkx‘ xkx‘ (IV. 134) Для любой симметрической матрицы L (или/?) существует ортогональ- ная матрица L7 такая, что UT LU = X = I 0 \0 (IV. 135) где Хг (г—1, 2, ..., /с) — собственные значения матрицы Z, a U является такой ортогональной матрицей, в которой r-й столбец является r-м соб- ственным вектором, соответствующим r-му собственному числу. Соб- 154
ственные числа матрицы/, определяются как корни характеристического многочлена (Д —Х£) = 0, (IV. 136) где Е— единичная матрица; | L—iE | =(- 1)*Х*+ (- ••• +м. (IV. 137) Первый, второй и последний члены -характеристического полинома матрицы L определяются просто: /л = tr(L) — след матрицы L (сумма ее диагональных элементов); Рк = \ L I. Значительно трудней определить остальные члены характеристического полинома. Предложены следую- щие формулы для коэффициентов характеристического полинома: Д1== L Pi = tr (Д0 Bi — l^i — PiE L% — LB i Pi = -y tr (Д0 B2= L2 . . . . . (IV. 138) I'k-i — LB^-2 1 Pk-i- b , tr(£fc_i) ft — 1 Bh-i ~ Lk-i Pk-jE Lk — LBk_r 1 Pk = — tr (Lk) ft Bk = Lk—PkE где Е— единичная матрица. Геометрически нахождение главных компонент сводится к переходу к новой ортогональной системе координат. Первую координатную ось определяют так, чтобы соответствующая ей линейная комбинация из- влекала возможно большую дисперсию, далее находят ортогональную ей ось, которая делает то же самое с оставшейся дисперсией, и т. д. От новых координат можно вернуться к старым : k Xt= У UfiVf, i, i= 1, 2, ... , k, (IV. 139) /=1 где Vj —j-я главная компонента; uJt — масса j-й компоненты в i-й пере- менной. Доля дисперсии, выраженная в %, объясняемая r-й компонентой, определяется следующим образом: X. 7=-----*-- 100%. (IV. 140) 2^ В ряде задач интересные выводы можно получить по небольшому числу компонент. В этих случаях метод главных компонент дает воз- можность уменьшить размерность задачи за счет того, что линейные комбинации, имеющие маленькие дисперсии, отбрасываются, а рас- сматриваются лишь линейные комбинации с большими дисперсиями. Например, процесс характеризуется не одной выходной величиной, а целым набором коррелированных показателей. Желательно знать, какие 155
комбинации показателей объясняют большую долю дисперсии. Это определит, что следует изучать дальше. Главные компоненты можно рассматривать как новое множество измерений, полученных в результа- те линейной комбинации исходных измерений. Используя метод глав- ных компонент, можно попытаться свести большое количество сильно коррелированных характеристик процесса к одной-двум обобщенным характеристикам или компонентам, что облегчит оценку качества про- цесса в каждой точке наблюдения. Все это будет иметь смысл только в том случае, если полученным линейным комбинациям удастся дать разумное физическое истолкование. Метод главных компонент применяют и как способ ортогонализации матрицы независимых переменных. Если V— матрица значений главных компонент, полученная ортогональным преобразованием: Г = (IV. 141) то новые переменные ц независимы и их ковариационная матрица диагональна: VT V= UTXT XU = (я-1) UT LU. (IV.142) С учетом (IV.135) имеем (и—1) X. (IV.143) Если Y — вектор значений выходной величины и все предпосылки регрессионного анализа выполняются, можно получить оценки коэффи- циентов линейного уравнения регрессии Y—VB, (IV. 144) где В — вектор коэффициентов. В соответствии с (IV.143) получим В=(п — l)-*£-*Vr, (IV. 145) или для каждого коэффициента -1 " bj = (n—l ИХ; (IV. 146) i=i оценка значимости коэффициентов регрессии по главным компонентам проводится по Г-критерию Стьюдента вполне корректно, так как все ковариации между коэффициентами равны нулю: S^j 1^(Л— 1) X; $воспр Можно показать, что коэффициенты регрессии по независимым пере- менным х и по главным компонентам связываются следующим обра- зом: k bj = 2 (IV. 148) i=l где а, — коэффициент регрессии по переменной х,, /—1, 2, ..., к; bj — коэффициент регрессии по компоненте v}; w„ — координаты /-го собствен- ного вектора; /, — масштабный множитель. Главные компоненты не инвариантны к изменению масштаба тех шкал, по которым отсчитываются переменные. Обычно работают с 156
нормированными переменными, в качестве масштабного множителя берут величину, обратную среднему квадратичному отклонению /, — = 571, т. е. все вычисления проводятся для матрицы корреляции. Метод главных компонент был успешно применен для построения математической модели промышленного процесса флотации калийных руд в условиях комбината Белорускалий. В ходе пассивного экспери- мента на комбинате фиксировались значения 20 входных и двух выход- ных параметров процесса. Были построены уравнения регрессии по главным компонентам для показателей процесса yt и у2, проведена оценка значимости коэффициентов по формуле (IV. 147). По уравнениям регрессии и по нагрузкам компонент оценена степень влияния перемен- ных на показатели процесса у, иу2, сделаны выводы о взаимосвязях процесса и даны рекомендации по его улучшению. Г лава посвящена методам корреляционного и регрессионного анали- зов, широко применяемым при обработке результатов наблюдений. Математическая модель процесса представляется полиномом, коэф- фициенты которого определяются методом наименьших квадратов. Метод наименьших квадратов обосновывается как частный случай метода максимального правдоподобия при нормальном распределении наблюдаемой случайной величины. Полиномиальная модель очень удобна, так как позволяет улучшать аппроксимацию, повышая порядок полинома, приводит к линейной сис- теме нормальных уравнений при определении коэффициентов уравнения регрессии методом наименьших квадратов. Рассмотрены различные алгоритмы регрессионного анализа для обра- ботки пассивного эксперимента. Корреляция между коэффициентами уравнения регрессии получен- ного обработкой пассивного эксперимента, затрудняет статистический анализ и интерпретацию результатов. Методы активного эксперимента, изложенные в следующей главе, дают возможность преодолеть эти недостатки классического регрессионного анализа. Упражнения 1. В таблице приведены характеристики гомогенных анионитовых мембран, полу- ченные при различных условиях нитрования сополимера: х, — температура, °C; Х2 — про- должительность, ч; хз — степень нитрования, %; yi — удельное объемное электрическое сопротивление, Ом см: у>2 — предел прочности при растяжении, МПа. Номер опыта XI Х2 ХЗ л 10 У2 ' 10 Номер опыта Xi Х2 хз J’l • 10 У2 10 1 60 2 30 920 190 9 70 8 85 85 59 2 60 4 55 290 105 10 70 10 85 89 53 3 60 6 74 190 74 11 80 2 55 505 80 4 60 8 75 100 68 12 80 4 80 195 68 5 60 10 75 100 68 13 80 6 92 82 54 6 70 2 40 740 107 14 80 8 92 82 50 7 70 4 68 207 72 15 80 10 92 88 50 8 70 6 83 98 59 157
Определить коэффициенты парной и частной корреляции между параметрами процесса. 2. Определить зависимость содержания Fe, % (у), в кристаллах медного купороса CuSO4-5H2O от содержания FeSO4, г/л (х), в маточном растворе. Каждый опыт повто- ряется два раза. X У х У 50 0,65 0,84 85 1,33 1,47 60 0,96 0,84 100 1,75 1,86 70 0,93 1,2 105 2,32 2,48 а) Оценить однородность дисперсий; б) определить дисперсию воспроизводимости; в) выбрать вид функциональной зависимости у =f(x)\ г) определить уравнение регрессии; д) провести регрессионный и корреляционный анализ результатов. 3. Определить зависимость гидравлического сопротивления слоя насадки Др (h = 4 м5 насадка кольца Рашига 15X15X0,5 мм) от фиктивной скорости потока уСр, используя ортогональные полиномы Чебышева: цср , см/с. ... 1 2 3 4 5 6 7 8 9 10 Др-10, МПа .... 0,01 0,025 0,04 0,055 0,07 0,09 0,113 0,13 0,16 0,019 4. При получении фосфора возгонкой из фосфатов кальция исследовалась зависи- мость степени восстановления фосфата (у) от температуры (х) для фосфорита Каратау. Опыты повторялись 2—3 раза. X, °C у. % X, °C у. % 1100 8,5 11,6 1175 37,5 40,0 42,3 1125 19,0 28,2 21,8 1200 50,5 50,0 1150 29,5 30,6 1225 57,2 60,3 62,7 а) Проверить однородность выборочных дисперсий; б) посчитать коэффициент кор- реляции между температурой и степенью восстановления; в) определить коэффициенты уравнения регрессии; г) оценить значимость коэффициентов и адекватность уравнения регрессии эксперименту. 5) Исследовалась зависимость степени окисления (у) хромита СггОз в хромат СгОз от продолжительности прокаливания (х) шихты при 83О°С. Каждый опыт повторялся два раза. X, ч у, % X, ч у, % 0,3 8,2 12,3 3,0 49,3 51,4 1,2 28,0 32,0 4,0 52,0 58,0 2,0 43,1 47,2 5,0 56,5 57,4 6,0 58,7 61,6 Считая зависимость степени окисления от времени нелинейной (полином второго порядка), методами линейной алгебры определить уравнение регрессии и провести регрессионный и корреляционный анализ результатов.
часть 2 Методы планирования эксперимента ГЛАВА V МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСТРЕМАЛЬНЫХ ЭКСПЕРИМЕНТОВ Большое количество экспериментальных задач в химии и химической технологии формулируется как задачи экстремальные: определение оптимальных условий процесса, оптимального состава композиции и т. д. Благодаря оптимальному расположению точек в факторном простран- стве и линейному преобразованию координат, удается преодолеть не- достатки классического регрессионного анализа, в частности корреляцию между коэффициентами уравнения регрессии. Выбор плана эксперимента определяется постановкой задачи исследования и особенностями объек- та. Процесс исследования обычно разбивается на отдельные этапы. Информация, полученная после каждого этапа, определяет дальнейшую стратегию эксперимента. Таким образом возникает возможность опти- мального управления экспериментом. Планирование эксперимента позволяет варьировать одновременно все факторы и получать коли- чественные оценки основных эффектов и эффектов взаимодействия. Интересующие исследователя эффекты определяются с меньшей ошиб- кой, чем при традиционных методах исследования. В конечном счете применение методов планирования значительно повышает эффектив- ность эксперимента. 1. Полный факторный эксперимент. При планировании по схеме полного факторного эксперимента (ПФЭ) реализуются все возможные комбинации факторов на всех выбранных для исследования уровнях. Необходимое количество опытов N при ПФЭ определяется по формуле W = л*. где л —количество уровней; /г—число факторов. Если эксперименты проводятся только на двух уровнях, при двух значениях факторов и при этом в процессе эксперимента осуществляются все возможные комбинации из к факторов, то постановка опытов по такому плану называется полным факторным экспериментом типа 2к. Уровни факторов представляют собой границы исследуемой области по данному технологическому параметру. Например, изучается влияние на выход продукта (у, %) трех факторов: температуры (zi) в диапазоне 100—200°С, давления (z2) 2-6-105 Па и времени пребывания (z3) 10— 159
20 мин. Верхний уровень по температуре z,max равен 200°С, нижний zj”'" равен Ю0°С. Тогда для z, имеем -max I -min „max -min 0 21 Г1 2i —zi \ = ---------- = 150О; = 2 - = 50°. Вообще для любого фактора zt -max г _min 0 2/ “Г2/ . / = 1. 2...k', (V.1) _max „min 2/ —2/ ‘ 2 L • (V.2) Точка с координатами (z?, 4) называется центром плана, иногда ее называют основным уровнем; Az, — интервал варьирования по оси z,. От переменных z,, zk перейдем к новым — х,, хк путем следую- щего линейного преобразования; 2;— 2°, XJ= -----L ; /=ь 2, ... , k. (V.3) Для переменных хр хк верхний уровень равен +1, нижний уровень - 1, координаты центра плана равны нулю и совпадают с началом коор- динат. В рассматриваемом примере к = 3. Число возможных комбинаций N из трех факторов на двух уровнях равно 7V=2k = 23 = 8. План прове- дения экспериментов (матрица планирования) записывается в виде табл. 28. Представленный в табл. 28 план в безразмерном масштабе i еометри- чески может быть интерпретирован в виде восьми вершин куба (рис. 28). Введем в ПФЭ 23 столбец так называемой фиктивной переменной хо = 1 (табл. 29). Приведенная в табл. 29 матрица планирования обладает следующими свойствами; N 2х“<хя = °; «=*/; «. / = --- . Л; i=i N 2 х><= 0: j = 1 >2....* f * °: <=i N 2^ = ^; / = 0, 1, .... *, i=l где к — число независимых факторов; N— число опытов в матрице пла- нирования. Первое свойство (V.4) — равенство нулю скалярных произведений всех вектор-столбцов — называется свойством ортогональности матрицы пла- нирования. Это свойство резко уменьшает трудности, связанные с рас- четом коэффициентов уравнения регрессии, так как матрица коэффи- циентов нормальных уравнений (ХТХ) становится диагональной и ее 160
Таблица 28. Полный факторный эксперимент Т? Номер опыта Факторы в натуральном масштабе Факторы в безразмерном масштабе Z1 Z2 Z3 XI Х2 хз У 1 100 20 10 -1 -1 -1 2 2 ‘200 20 10 +1 -1 -1 6 3 100 60 10 -1 +1 -1 4 4 200 60 10 +1 +1 -1 8 5 100 20 30 -1 -1 +1 10 6 200 20 30 +1 -1 +1 18 7 100 60 30 -1 +1 +1 8 8 200 60 30 +1 +1 +1 12 диагональные элементы равны числу опытов в матрице планирова- ния N. Коэффициенты уравнения регрессии по методу наименьших квадра- тов определяются следующим образом; &о Ьт = (ХГХ)~1ХГУ. у L_ Матрица моментов (X АГ), соответствующая табл. 29, имеет вид 8 8 8 8 Xoi *li *•« *•* X*iX^i i=3 i=l i=l 2=1 8 8 8 8 xll xoi 2 Xli Jt2i *li 'Я®* Г"1 i=l i=l i=\ 8 8 8 8 *»«У *« *‘f XtiXbi 8 <=i 8 8 8 *»i 2X3i Xu 2 i=l 2=1 2=1 _ В = 6-529 161
Учитывая свойства (V.4), получим / 8 0 0 о \ (Л) = 0 8 0 0 1 1 1 (V.5) 1 0 0 8 0 1 \ 0 0 0 8 / Матрица, обратная матрице моментов (XrX)”‘, получается равной (V.6) .(V.8) Следовательно, любой коэффициент уравнения регрессии bj опреде- ляется скалярным произведением столбца у на соответствующий стол- бец Xj, деленным на число опытов в матрице планирования N; N b> = yi- i=v (V.9) Пользуясь планом, представленным в табл. 28, сначала вычислим коэффициенты линейного уравнения регрессии 162
у = Ьй + bxxx + М2 + Ma- (V.10) Например, для определения коэффициента Ь} при %, необходимо получить сумму произведений: 2 Xi#/ = 20 8 2 х><у, Аналогично получим /ю = 8,5; Z>2 = — 0,5; />з = + 3,5. Если в рассмотрение ввести более полное уравнение регрессии с коэффициентами взаимо- действия У = b0 + b |Х1 + b2x2 + b3x3 + bl2xlx2 + bi3xlx3 + b23x2x3 + b 1 (V.11) то для определения коэффициентов Ь^?, Ь^з, bis (эффектов парного взаимодействия) и Ь,5з (эффекта тройного взаимодействия) необходимо расширить матрицу (табл. 29) следующим образом (табл. 30). Таблица 30. Расширенная матрица планирования полного факторного эксперимента 2Э Номер опыта Х0 XI Х2 Хз Х1Х2 Х1Хз Х2ХЭ Х1Х2ХЭ У 1 +1 -1 -1 -1 +1 +1 +1 -1 2 2 +1 +1 -1 -1 -1 -1 +1 +1 6 3 +1 -1 +1 -1 -1 +1 -1 +1 4 4 +1 +1 +1 -1 +1 -1 -1 -1 8 5 +1 -1 -1 +1 +1 -1 -1 +1 10 6 +1 +1 -1 +1 -1 +1 -1 -1 18 7 +1 -1 +1 +1 -1 -1 +1 -1 8 8 +1 +1 +1 +1 +1 +1 +1 +1 12 Эффекты взаимодействия определяются аналогично линейным эф- фектам. Так, для определения коэффициента необходимо: 6 163
У (*iXih У1 = —4 i=i “ %(хЛ)1У1 Остальные коэффициенты определяются подобным образом: £>13 — 0,5 * £>2з---1,5, £>123 — 0,11. Если поставить дополнительно параллельные опыты, можно опреде- лить 5|оспр, проверить значимость коэффициентов регрессии и при нали- чии степеней свободы — адекватность уравнения. В связи с тем, что ковариационная матрица (ХТХ)~' для сплани- рованного эксперимента — матрица диагональная Г 1/ЛГ 0 0 ... 0 - _ 0 0 0 коэффициенты уравнения регрессии некоррелированы между собой. Значимость коэффициентов уравнения регрессии можно проверять для каждого коэффициента в отдельности по критерию Стьюдента. Исклю- чение из уравнения регрессии (VII) незначимого коэффициента не скажется на остальных коэффициентах. При этом выборочные коэффи- циенты £>, оказываются так называемыми несмешанными оценками для соответствующих теоретических коэффициентов 0 ; £>;-> ib, (V.13) т. е. значения коэффициентов уравнения регрессии характеризуют вклад соответствующего фактора в величину у. Диагональные элементы ковариационной матрицы равны между собой, поэтому все коэффициен- ты уравнений (V 10) и (V 11) определяются с одинаковой точностью: sbj ~ *воспр/ • (V.14) Например, в центре плана поставлено дополнительно три параллель- ных опыта и получены следующие значения у. 164
уО = 8; у° = 9; у° = 8,8; ’1 2 3 2 (».’-?)’ Сспр = 2 =0,28; Явоспр = 0,55; sbj = 0,55 / Кв= 0,2. Оценим значимость коэффициентов по критерию Стьюдента: <2== JAL = 2,5; S*2 <з = _LM_ = 17 5; % Gi=-^ = 2.5; S»!2 G3 = = 2.5; Sft13 /23=1^-=7,5; Sft23 ^3 = 1^1= 1,25. S*123 Табличное значение критерия Стьюдента для уровня значимости р==0,05 и числа степеней свободы f==2 tp(f) = 4,2 Таким образом, коэффициенты Ь2, Ь}2. Z>13 и 6)23 незначимы и их следует исключить из уравнения. После исключения незначимых коэффициентов уравнение регрессии имеет вид у = 8,5 4" 2,5%i 4" 5,5хд — 1,5 Проверим адекватность полученного уравнения по критерию Фишера: г _ .2 / л г — °ост/ воспр ' 8 л » s2 _ “OCT N—l — = 2; 4 165
seocnp — 0 ’ 2®’ / — число значимых коэффициентов в уравнении регрессии, равное 4. Тогда /'’=2/0,28=7,1 Табулированное значение критерия Фишера для р = 0,05,/1-4,Л = 2, /'_₽(/’,,/г) = 19,3, F<F^,f2). Следовательно, полученное уравнение адекватно описывает экспери- мент. 2. Дробные реплики. Если при получении уравнения можно ограни- читься линейным приближением, то число опытов резко сокращается при использовании дробных реплик (см. гл. III, 4) от полного факторного эксперимента или дробного факторного эксперимента (ДФЭ). Чтобы дробная реплика представляла собой ортогональный план, в качестве реплики следует брать полный факторный эксперимент для меньшего числа факторов. Число опытов при этом должно быть больше (или равно) числа неизвестных коэффициентов в уравнении регрессии. Допустим, что нужно получить линейное приближение некоторого небольшого участка поверхности отклика при трех независимых факто- рах: Л У = + bixi + bixi + Ьзхз- Для решения этой задачи можно ограничиться четырьмя опытами, если в планировании для ПФЭ 22 (табл. 31) использовать столбец х}х2 в качестве плана для х3 (табл. 32). Таблица 31. Полный факторный эксперимент 22 Таблица 32. Полуреплика от ПФЭ 23 Номер лсо XI XI Х1Х2 Номер Х0 Xt Х2 хз опыта опыта 1 +1 +1 +1 +1 1 +1 +1 +1 +1 2 +1 -1 -1 +1 2 +1 -1 -1 +1 3 +1 -1 +1 -1 3 +1 -1 +1 -1 4 +1 +1 -1 -1 4 +1 +1 -1 -1 Такой сокращенный план — половина ПФЭ 23 — называется полуреп- ликой от ПФЭ 23. Пользуясь таким планированием, можно оценить свободный член и три коэффициента уравнения регрессии при линейных членах. На практике обычно не удается априори постулировать равенство нулю эффектов взаимодействия, однако часто имеются основания полагать, что некоторые из них малы по сравнению с линейными эффектами. Если коэффициенты регрессии при парных произведениях не равны нулю, то полученные коэффициенты будут смешанными оцен- ками для генеральных коэффициентов: ?1 + ₽2з> “* ?2 + ?i3> Ьз -* + (V.15) где 3 — математические ожидания для соответствующих коэффициентов. Эти генеральные коэффициенты не могут быть раздельно оценены по плану, включающему всего четыре опыта (табл. 32), так как при 166
этом столбцы для линейных членов и парных произведений одинаковы. Если, например, в дополнение к столбцам, приведенным в табл. 32, вычислить еще столбец для произведения х,х3, то окажется, что элементы этого столбца в точности равны элементам столбца х2. Таким образом, сокращение числа опытов приводит к получению смешанных оценок для коэффициентов. Чтобы определить, какие генеральные коэффи- циенты смешаны, удобно пользоваться- таким приемом: поставив х3 на место х}х2 (табл. 32), получаем соотношение Х3 = Х1Х2, (V.16) называемое генерирующим соотношением. Умножим обе части генерирую- щего соотношения на х3: при этом слева получим единичный столбец: / = х1х2х3. (V.17) Произведение (V 17) называется определяющим контрастом, при помо- щи его удобно определить, в каких столбцах одинаковые элементы. Умножив по очереди определяющий контраст на х2, х^, получим х, = х? х2х3 = х2х3; x2 = XjX3; Хз — XiX2. (V:18) Полученным соотношениям (V.18) соответствует система смешанных оценок (V 15). При использовании ДФЭ необходимо иметь четкое представление о так называемой разрешающей способности дробной реплики, т. е. опре- делить заранее, какие коэффициенты являются несмешанными оцен- ками для соответствующих генеральных коэффициентов. Тогда в зави- симости от поставленной задачи подбирается дробная реплика, при помощи которой можно извлечь максимальную информацию из экспери- мента. Например, в задаче с четырьмя факторами /с = 4 в качестве генерирующего соотношения можно взять х4=Х1Х2Хз (V.19) и любое из парных произведений факторов, например х4=х2х2. (V.20) Матрица планирования с генерирующим соотношением (V 19) при- ведена в табл. 33 Таблица 33. Полуреплика от ПФЭ 24 с генерирующим соотношением (V.19) Номер опыта Хо xt Х2 Хз Ха Номер опыта ХО XI Х2 Хз Х4 1 +1 +1 +1 +1 +1 5 +1 +1 +1 -1 -1 2 +1 -1 -1 +1 +1 6 +1 -1 -1 -1 -1 3 +1 -1 +1 +1 -1 7 +1 -1 +1 -1 +1 4 +1 +1 -1 +1 -1 8 +1 +1 -1 -1 +1 Воспользовавшись определяющим контрастом /=х1х2х3х4, получим такую систему совместных оценок для коэффициентов уравнения регрес- сии: 167
*1 = *2 *з xit Xi = x1xaxt, *3 = X1 XZ x4< Xt = *1 X, x3, *1 *2 = *3*4. *1*3 = *a*4. *1 X4 = X, X3 , 01 -* 01 + 0234, *2 02 + 0134» 03 03 + 0124 > bi -> 04 + 0123, 012 “* 013 4" 0341 *13 "* 0X3 + 0241 *14 “* 0X4 + 023- (V.21) В реальных задачах тройные взаимодействия бывают равными нулю значительно чаще, чем двойные. Если наибольший интерес представ- ляют оценки для линейных эффектов, следует брать генерирующее соотношение х4=х]х2х3. При регенерирующем сотношении (V.20) матрица планирования име- ет вид (табл. 34). Таблица 34. Полуреплика от ПФЭ 2« с генерирующим соотношением (V.20) Номер опыта хо xt X? хз Х4 Номер опыта ХО Х1 Х2 хэ Х4 1 +1 +1 +1 +1 +1 5 +1 +1 +1 -1 +1 2 +1 -1 -1 +1 +1 6 + 1 -1 “1 -1 +1 3 +1 -1 +1 +1 -1 7 +1 -1 +1 -1 -1 4 +1 +1 -1 +1 -1 8 +1 +1 -1 -1 -1 Определяющий контраст выражается соотношением I = х,х2х4. По- лучается следующая система оценок: *Х = *,*4. *1*- 01 + 034. *,= *1*4, *2 02 + 014, *3 = *1 *3 *3 *4» *3 -* 0з + 0U34, * 4 = *1*3, *4 -*04+013. * 1 *3 = *3 *3 *4 • *13 013 + 0234 > * 3 *3 = *1 *3 *4. *23 -► 033 + 0134. * 3*4= *1*2*3. *34 034+ 0123- (V.22) Следовательно, дробную реплику с генерирующим соотношением х4 = х}х2 имеет смысл использовать, если наибольший интерес пред- ставляют коэффициенты 012, р23 и 034. В полуреплике от ПФЭ 25 с генерирующим соотношением х5 = х1х2х3х4 все линейные эффекты и эффекты парного взаимодей- ствия смешаны только с эффектами тройного и более высокого порядков: *0 — *1 *3 *3 *4 *6» 0Q “* 00 + 012343» *1 = *2 *3 *4 *5> *1 -* 01 + 03315. 168
(V.23) Xj= XlX8X4Xj, bi -► Pj + Pi34»> Хз = Xj Xj X4 Xj , Ьз ?3 + ?1344 • X4 = Xj X, Хз Xj, bl -► ₽4 + ₽123S> Xj = Xj Xj X3 X4, bs> $0 + ?1J34> *1 Хг = X3 X4 Xj, bn + ?344 > *1*3 = *2X4Xj, ^13 -► ?13 + ₽34S. X1X4 = XjX8Xj, ^14 -* ₽h+ ?J3S, Xi Xj = X, X3 X4, &1S -*• ihs + p234> Xi X8 = Xj X4 Xj, Ьзз ?23 + P14I > Xj X4= Xj X3 Xj, bu -► ?34 + Piss» Xj Xj = Xj X3 X4, ba -► ?u + ?is4> *3 x4 = *1 X2 Xj, ^34 ?34 + ₽1J5 < XS Xj = Xj X, X4, ^3S -»• ?3S + ?1M> X4Xj= XjXjX8, ^4S -► ?4б+ 3123 • Пренебрегая эффектами взаимодействия выше второго порядка, практически можно считать, что при /с>5 полуреплики от ПФЭ обеспечивают несмешанные оценки для линейных эффектов и эф- фектов парного взаимодействия. Используют в экспериментальной практике также и V4 реплики, ’/в реплики и т. д. Дробную реплику, в которой р линейных эффектов приравнены к эффектам взаимодей- ствия, обозначают 2 . Для четвертьреплики, например, в планирова- нии для к=5 типа 25 2 могут быть заданы генерирующие соотношения: X4=XjXsX3, Xj = XjXj. Определяющими контрастами для этой реплики будут соотношения / = х1хах3х4, /=Х1Х,хв. (V.24) Перемножив определяющие контрасты между собой, получим так называемый обобщающий определяющий контраст, который с учетом соотношений (V 24) полностью характеризует разрешающую способность реплик высокой степени дробности: * 1 = Xj Xj Х3 Х4 Xj Xj Xj = Х3 Х4 Xj . (V.25) При этом получается следующая система совместных оценок X, = Xj Xj Х3 Х4 = Xj х2 х6 = х3 х4 xs, X j = Xj Х3 Х4 = Xj Xj — X! Х3 Х4 Xj, Xj = х1 Х3 Х4 = Xj Xj = Xj Х3 Х4 Xj , Х3 = х1 Xj Х4 = Xj X, Х3 Xj = Х4 Xj, Х4 = Xj Xj Х3 = Xj Xj Х4 Xj = Х3 Xj, Xj = Xj Xj X3 X4 Xj = X, Xj = X3 X4, bo -* 3o + 31234 + 311» + 3s4S, bl -* 31 + 3>34 + 3>4 + 3134»• bt -> 3« + 3134 4" 31» + Згз4»> Ьз Зз + 3124 + 3123» + ₽4В> bi -► 34 + 3i28 + 3i»4s + Зз» > bo -► 3» + 31234» + 312 + Зз4> 169
*1 X3 = Х1 X4 = X2 «з Xs = Xi X4 XS> 6j3 -► ?13 + ₽24 + ?23b + ?!«• X1X4= x2x3 = x2x4xs = XjXaXs, b14-*- ?i4+?2s + ?2«+ Piss- (V.26) Соответствующий план эксперимента приведен в табл. 35 Таблица 35. Четвертьреплика от ПФЭ 25 с генерирующими соотношениями (V.24) Номер Xt Х2 Хз Х4 Х5 Номер Xt Х2 Хз х4 хв опыта опыта 1 +1 .+1 +1 +1 +1 5 +1 +1 -1 -1 +1 2 -1 -1 +1 +1 +1 6 -1 -1 -1 -1 +1 3 -1 +1 +1 -1 -1 7 -1 +1 -1 +1 -1 4 +1 -1 +1 -1 -1 8 +1 -1 -1 +1 -1 Разрешающая способность этой четвертьреплики невелика —все линейные эффекты смешаны с эффектами парного взаимодействия. ДФЭ можно дополнить до полного факторного эксперимента, реали- зовав недостающие дробные реплики. В рассматриваемом примере для остальных трех четвертьреплик генерирующие соотношения будут: Х4=Х1Х2Х3, ХЬ= — X! Х2, х4 = — х4х2 х3, хь = Xi х2> (V. 27) Х4=—Х1Х2Х3> ХЬ= — XjX2. При этом обобщающие определяющие контрасты имеют вид / = Xj х2 х3 х4 — — Xj х2 х6 = — х3 х4 х6> I = — Xi х2 х3 х4 = Xj х2 х6 = — х3 х4 хь, (V.28) I = — Xj Х2 Х3 Х4 = — Х1 х2 хь = х3 х4 хь. В результате реализации этих дополняющих четвертьреплик по- лучаются несмешанные оценки для всех теоретических коэффициентов. Число опытов в дробной реплике должно удовлетворять не- равенству k + 1 < N < 2* (где к— число факторов) для получения несмешанных оценок линей- ных эффектов. Если число опытов N равно к+ 1 — числу определяе- мых коэффициентов в линейном уравнении регрессии, дробная реплика представляет собой насыщенный линейный ортогональный план. В табл. 36 приведен насыщенный ортогональный план для к=1, представляющий собой 1/16 ПФЭ 27. В табл. 36 факторы х4, х5, х6 и %7 приравнены произведениям факторов: Х4 = Xj Х2, Х6 = Х4 XS, Х,= Х2 Х3, Х7 = Xj х2 х3. В связи с этим все линейные эффекты смешаны с эффектами взаимодействия. Поскольку число опытов в насыщенных планах равно числу определяемых коэффициентов, число степеней свободы остаточной 170
Таблица 36. Линейный насыщенный план для к = 1 дисперсии равно нулю. Для проверки адекватности линейного уравне- ния, полученного по насыщенному плану, необходим дополнитель- ный эксперимент. Таким образом, оптимальные двухуровневые планы 2* и 2к~римеют следующие преимущества: планы ортогональны, и поэтому все вычисления просты, все коэффициенты определяются независимо друг от друга; каждый коэффициент определяется по результатам всех N опытов. Эти планы обладают также свойством D-оптималь- ности: для данного числа опытов N они имеют минимальный определитель ковариационной матрицы (ХТХ)~1. Вследствие этого все коэффициенты регрессии определяются с одинаковой и мини- мальной дисперсией. Необходимо также отметить, что линейные планы 2к и 2к~р обладают свойством ротатабельности. Вследствие отсутствия корреляции между коэффициентами по закону сложения дисперсий для линейного уравнения при к факторах имеем: 2 2 2 2 2 2 se sb„ + Х1 sbt + • • • sb (V.29) k Так как s2 = s2ocnf>/N, получим /=1 где р2 —квадрат радиуса сферы в ^-мерном пространстве. Величину, Рис. 29. Свойство ротатабель- ности линейного плана 23 обратную $2, можно принять за меру информации, содержащейся в уравнении регрессии. Согласно (V.30) коли- чество информации убывает пропорционально квадрату радиуса сферы р2 и одинаково для всех эквидистантных точек (рис. 29). Планирование, обладающее таким свойством, называют рота- табельным планированием. Приведем в общем виде схему диспер- сионного и регрессионного анализов планированного эксперимента, когда каж- дый опыт в матрице планирования по- вторялся т раз (табл. 37). 171
Таблица 37. Матрица планирования и результаты измерений В каждой строчке матрицы планирования определяется среднее значение измеряемой величины по т параллельным опытам: т у,--= —---- , i= 1,2, ... , N- (V.31) m и дисперсия т s? = —------------; i = 1,2....ЛГ. (V.32) ‘ m — 1 Проверяется однородность выборочных дисперсий по критерию Кохрена. Для этого составляется отношение максимальной дисперсии к сумме всех дисперсий: с* °тах Полученное отношение сравнивается с табличным: G,-^ где /7=0,05;/ = т- l;f2 =N. Если дисперсии однородны. Тогда в качестве оценки для дисперсии воспроизводимости можно взять среднюю дисперсию с числом степеней свободы /аОспР = Afa _1Л Коэффициенты уравнения регрессии определяются по формуле ' (V-34) Учитывая, что дисперсия у полученного по выборке объема т в т раз меньше дисперсии единичного измерения 172
2 9 i s~ ~ seocnp /m ’ (V.35) в рассматриваемом примере (табл. 37) дисперсия коэффициентов s2b определяется следующим образом: ^=«2воспр/'^- (V.36) Значимость коэффициентов проверяется по критерию Стьюдента. В условиях нулевой гипотезы Н°ф7 = 0, отношение абсолютной вели- чины коэффициента уравнения регрессии к его ошибке имеет распре- деление Стьюдента. Для всех коэффициентов уравнения регрессии составляется z-отношение которое сравнивается с табличным (f) для уровня значимости р = 0,05 и числа степеней свободы f=N(m-l). Если то принимается гипотеза равенства нулю генерального коэффициента рег- рессии = 0, а соответствующий выборочный коэффициент bj как незначимый отсеивается из уравнения регресии. При этом ввиду ортогональности матрицы планирования остальные коэффициенты не приходится пересчитывать. Адекватность уравнения регрессии эксперименту проверяется так же, как и при обработке пассивного эксперимента, по критерию Фишера. В матрице планирования (табл. 37) каждый опыт повторял- ся т раз. Для проверки адекватности составляется дисперсионное отношение Р — §2 / §2 г аад / 5воспр > где s2a — дисперсия адекватности, определяемая формулой N Л <=—’ <v-38> /—число значимых коэффициентов в уравнении регрессии. Если полученное дисперсионное отношение оказывается меньше табличного: F<F1_p(f1, (V.39) где р — уровень значимости; / —число степеней свободы дисперсии адекватности, (V.40; f7 — число степеней свободы дисперсии воспроизводимости, f2 = N(m — S), уравнение адекватно эксперименту. Если F > /«)> (V.41) то для адекватного описания эксперимента необходимо увеличить порядок аппроксимирующего полинома. 173
Рис. 30. Движение по поверхности отклика (а) к экстремуму в однофакторном эксперименте и в методе крутого восхождения (6) 3. Оптимизация методом крутого восхождения по поверхности отклика. Задача оптимизации ставится таким образом: необходимо определить экспериментально координаты экстремальной точки (х°пт, х£пт,...,л£п9 функции у =f(xv х2, .... хк). Построим контурные сече- ния y=const поверхности отклика для Л=2 (рис. 30, а). При тради- ционном эксперименте обычно фиксируют один из факторов, на- пример х„ и двигаются из точки L в направлении оси х2. Коорди- наты точки L известны из предварительных опытов. Движение по х2 продолжается до тех пор, пока не прекращается прирост у (рис. 30, б). В точке М с лучшим выходом фиксируется фактор х2 и начинается движение в направлении оси х}. В точке У снова фиксируется х, и начинается опять движение по переменной х2 и т. д. Очевидно, что путь к экстремуму по ломаной LMNR не самый короткий. Известно, что движение по кратчайшему, наиболее круто- му пути —это движение по градиенту перпендикулярно линиям у = const (на рис. 30, б показано пунктиром). Если описание поверх- ности отклика в общем случае у = f(xv х2, xj, градиент функции J ' df df-> df — grad f = — i + j + ... + -i- k , (V. 42) dxj дхг dxk —> —► —> где i, j, .... к— орты координатных осей. Предполагается, что функция f непрерывна, дифференцируема, однозначна и не имеет особых точек. Бокс и Уилсон предложили шаговый метод движения по поверхности отклика. В окрестности точки L ставится эксперимент для локального описания поверхности отклика линейным уравнением регрессии: Л 0 = &О+М1 + М2+ ••• A-bhXb. (V.43) Далее двигаются по поверхности отклика в направлении градиента линейного приближения: дУ h . ду_ . дхг дх^ Л ду к ~ = bk- dxh (V.44) При постановке опытов величина шага должна быть пропорцио- нальна произведению коэффициента bj на интервал варьирования bj&Zj. Если одного линейного приближения недостаточно, то ставит- 174
ся новая серия опытов с центром в точке, которая соответствует наибольшему значению у, и находится новое направление для движения по поверхности отклика. Такой шаговый процесс про- должается до достижения области, близкой к экстремуму, или «почти стационарной области». Направление градиента зависит от выбранного интервала варьирова- ния независимых факторов. При изменении в п раз интервала варьирования для некоторого ./-го фактора меняется в л2 раз величина шага для этого фактора, так как в п раз изменяется коэффициент регрессии bj и также в п раз —интервал варьирования. Инвариантны- ми к изменению интервала остаются только знаки составляющих гра- диента. Удачный выбор интервала варьирования во многом связан с наличием априорной информации о параметрической чувствительности процесса. Интервал варьирования должен быть достаточно велик, чтобы диапазон изменения выходной величины был в несколько раз (не менее 3—4 раз) больше ошибки воспроизводимости. В то же вре- мя для большинства процессов линейное приближение поверхности отклика адекватно эксперименту только при небольших интервалах варьирования. Если на интервалы варьирования не наложено никаких ограничений, их стремятся выбрать таким образом, чтобы получить уравнение регрессии, симметричное относительно коэффициентов при линейных членах. Обработка результатов эксперимента, связан- ного с крутым восхождением, должна сопровождаться тщательным статистическим анализом полученных результатов. Пример 1. Определялся оптимальный состав фотохромного стекла в системе LisO - AI2O3 - SiOs. В качестве параметров оптимизации (у) рассматривалась оптическая плотность в облученном состоянии. Надо было определить состав стекла и условия его варки, обеспечивающие максимальную оптическую плотность. В качестве независимых факторов были выбраны: zi — исходная концентрация хлора, г-атом/100 г стекла; zi — исходная концентрация брома, г-атом/100 г стекла; гз — cooi- ношение Ag ; Cl; Z4 — температура варки, °C; zs — время выдержки, ч; ze — содержание AI2O3, мол. доли; z? — соотношение Ы2О / S 1Ог. Условия эксперимента приведены в таблице. 21 22 23 24 25 26 27 Основной уровень zf> Интервал варьирова- ния Az- +1 -1 Решение. Для о У = Ьв + 0,0425 0,0205 0,063 0,022 пределен Mi + * 0,0187 0,0093 0,028 0,0094 ля коэффз 2х2 + Ь3 0,0675 0,0325 0,1 0,035 щиентов Хз + ^Х 1325 25 1350 1300 линейног + Ь3х3 1,75 0,25 2 1,5 0 уравнен Е Ьвх$ -Е 0,1395 0,0125 0,157 0,124 ия регрес Ь7х, 0,4165 0,0835 0,5 0,333 сии использована Из от ПФЭ 2’ с генерирующими соотношениями Х1=Х1Х2Х3, х6=х1х2> Хв=Х1Хз, X, — х2 х3. Каждый опыт в матрице планирования (табл. 38) повторен два раза. Средние значения оптической плотности у получены по двум измерениям. Про- верим однородность дисперсий s?, i = 1, 2,..., 8, по критерию Кохрена. Сумма дисперсий 175
Критерий Кохрена 8 2s? = 27>8°-10~<- i=l max 24 i=i 10,1-10-* 27,80-10"* = 0,363. Табличное значение критерия Кохрена для уровня значимости р— 0,05 и чисел степеней свободы — 1, fi —8 Go,9s(l,8)— 0,6798. G< Go,95(1,8), и, следовательно, дисперсии одно- родны. Дисперсия воспроизводимости определяется в связи с этим как среднее ариф- метическое: воспр 27,80-10-* 8 = 3,475-10-*. Число степеней свободы дисперсии воспроизводимости равно f воспр — N (/п — 1) — 8 (2 —- 1) — 8. Коэффициенты уравнения регрессии определяем по формуле (V.34): 5и = 0,2128, = 0,0724, Ьг = — 0,00575, 69 = 0,1363, б4 = — 1'00088, 56 = —0,0129, 5в=—0,041, б7 = 0,00625. Оценим значимость коэффициентов по критерию Стьюдента. Для этого по формуле (V.36) определим ошибку коэффициентов s*- = JM7510~* = 0,468- 10“г V 2-8 и составим /-отношение для всех коэффициентов уравнения регрессии t0= 0,2128 = 45,5; G = 0,0724 = 15,45; 0,468-10-* 0,468-10-* ^2 — 0,00575 = 1,23; — 0,1363 = 29,1; 0,468-10-* 0,468-10-* 0,00088 = 0,188; h — 0,0129 = 2,77; м — ’ 0,468-10-* 0,468-10-* /в — 0,0041 = 0,875; 0,00625 = 1,35. 0,468-10-* 0,468-10-* Табличное значение критерия Стьюдента (о,О5 (8) = 2,31. Коэффициенты fe, 64, Ьа, bi незначимы, так как составленные для них (-отношения меньше табличного. После исключения незначимых коэффициентов уравнение регрессии примет вид у = 0,2128 + 0,0724*! + 0,1363х3 — 0,0129xs. Проверим адекватность этого уравнения эксперименту по критерию Фишера. Диспер- сия адекватности определяется по (V.38): 8 Л 2 2 (^ - 2-6,77-10-* 4 = 3,385-10"*. 176
Таблица 38 Номер опыта *2 *3 X* -Ч •Ч Х1 Уг У 52 Ю4 * * * * * У (У-у)2* х104 1 + + + + — 0 0 0 0 0,017 2,9 2 + + + — — + — — 0,108 0,15 0,129 8,82 0,136 0,49 3 + — — — — + + + 0 0 0 0 -0,0089 0,77 4 + + — — + — — + 0,194 0,16 0,177 5,78 0,1618 2,3 5 + — + + — — — + 0,298 0,292 0,295 0,18 0,2896 0,29 6 + + + + + + + + 0,400 0,408 0,404 0,32 0,4086 0,21 7 + — — + + + — — 0,255 0,278 0,266 2,6 0,2638 0,073 8 + + — + — — + — 0,453 0,408 0,431 10,1 0,4344 0,1156 Тогда F-отношение равно F S2 5ад 3,385-К)"4 = 1,01 S2 ’воспр 3,35-10-4 Табличное значение критерия Фишера для р — 0,05, /, — 4 и /2 —8 To.as (4,8) —3.8. F</'о,95 (4,8), и уравнение регрессии адекватно эксперименту. Используем полученное уравнение для крутого восхождения по поверхности отклика для увеличения оптической плотности стекла. При крутом восхождении незначимые параметры были зафиксированы на нулевом уровне, время выдержки на нижнем уровне 1,5 ч. Таким образом, изменя- лись только исходная концентрация хлора (Zi) и соотношение Ag : Cl (z3). Первые три опы- та при крутом восхождении (9, 10, 11) были «мысленные» (таблица). zi Z3 У Номер опыта zi Z3 У ZJ 0,0425 0,0675 0,0205 0,099 hJ 0,0724 0,1363 9 0,0462 0,0787 — hj 0,00148 0,00443 10 0,0498 0,0897 — Шаг 0,0036 0,0111 11 0,0536 0,1008 — 12 0,0573 0,1119 0,552 13 0,0610 0,1230 0,500 14 0,0647 0,1341 0,476 15 0,0683 0,1452 0,436 16 0,0719 0,1563 0,426 В качестве шагов взяты величины, в 2,5 раза большие произведений bjAzj. Лучший результат получен в 12-м опыте. Дальнейшее увеличение концентрации хлора и отно- шения Ag : Cl ухудшает фотохромные свойства стекла. В связи с этим были реализованы пропущенные опыты 10 и 11. Получены следующие значения оптической плотности стекла: у10 = 0,496, у11 = 0,561. Таким образом, в качестве оптимального рекомендуется состав стекла, полученный в 11-м опыте. 4. Описание области, близкой к экстремуму. Композиционные планы Бокса — Уилсона. Область, близкую к экстремуму, называют также почти стационарной областью. Это область с существенной нелинейностью функции отклика, для адекватного описания которой необходимо использовать нелинейные полиномы. В настоящее время наиболее широко для описания области, близкой к экстремуму, 177
применяют полиномы второго порядка. Это связано с тем, что, во-первых, имеются хорошо разработанные планы второго порядка, во-вторых, с тем, что поверхности второго порядка легко поддают- ся систематизации и исследованию на экстремум. И наконец, увели- чение порядка аппроксимирующего полинома приводит к значитель- ному увеличению числа опытов. Обычно эксперимент, реализованный для определения оптималь- ных условий процесса, можно адекватно описать полиномом второго порядка. При этом число опытов N в плане должно быть не меньше числа определяемых коэффициентов в уравнении регрессии второго порядка для к факторов: Л У = *0 + + Ь2Х2 + ••• + *Л хк bis Хг + . . . + + bk—1, k xk-i xh + *n + • • • + bkk x% . (V.45) Коэффициенты уравнения регрессии (V 45) служат оценками для соответствующих коэффициентов уравнения теоретической регрессии: ту — ₽0 + ₽1Х1 + • • • + ?*Xh + ?12Х1Х2 + . . . + k X*-! Xfc + + ?п + • • + Pfeh X* • (V.46) Число коэффициентов / в полиноме второго порядка (V 45) можно определить по формуле ,_*+1+4+с« _24 + 1 +---5!--_ <* + >№ + *> k 25(6 — 2)1 2 . (V.47) где С*— количество сочетаний из к факторов по два, равное числу эффектов парного взаимодействия в уравнении (V 45). Если почти стационарную область адекватно можно описать теоре- тическим уравнением регрессии второго порядка (V.46), тогда становятся значимыми определенные по эксперименту эффекты взаимодействия факторов и квадратичные эффекты. Это позволяет установить факт нахождения в почти стационарной области. Близость почти стационар- ной области можно установить, если поставить дополнительно к факторному плану 2к или 2к~р опыты в центре плана (xi=0; Х2=О;...; хк=0) и вычислить среднее уо. Среднее у5 является оценкой для свободного члена уравнения теоретической регрессии (V.48) в то время как коэффициент Ьо, подсчитываемый в факторном эксперименте по формуле N У Ли Vi *0= —------- ’ 0 является совместной оценкой для свободного члена и суммы квадра- тичных: h b0 (V.49) ,=1 178
Поэтому разность k У о * 7=1 (V.50) может до некоторой степени служить мерой кривизны поверхности. Для описания поверхности отклика полиномами второго порядка независимые факторы в планах должны принимать не менее трех разных значений. Трехуровневый план, в котором реализованы все возможные комбинации из к факторов на трех уровнях, представляет собой полный факторный эксперимент 3*. В табл. 39 приведена матрица планирования полного факторного эксперимента З2. Таблица 39. ПФЭ З2 Номер опыта х2 У Номер опыта *1 х2 У 1 0 0 У, 6 1 +1 Л 2 +1 0 У? 7 0 -1 V? 3 -1 0 Уз 8 +1 -1 Уй 4 0 +1 У* 9 -1 -1 У, 5 +1 +1 Уь Полный факторный эксперимент 3* требует слишком большого числа опытов, намного превышающего число определяемых коэффи- циентов / уже для к>2. Число опытов в ПФЭ 3* и число коэффициентов / в уравнении регрессии второго порядка приведены ниже: к.....................2 3*.....................9 /.....................6 3 4 5 6 27 81 243 729 10 15 21 28 Сократить число опытов можно, если воспользоваться так называе- мыми композиционными или последовательными планами, предложенны- ми Боксом и Уилсоном. Ядро таких планов составляет ПФЭ 2* при к<5 или полуреплика от него при к >5. Возможность использования в качестве ядра плана полуреплики при к>5 обус- ловлена тем, что уже полуреплика обес- печивает получение несмешанных оценок для линейных эффектов и эффектов пар- ного взаимодействия (см. гл. V, 2). Если линейное уравнение регрессии оказалось неадекватным, необходимо: 1) добавить 2к звездных точек, располо- женных на координатных осях факторного пространства. Координаты звездных то- чек: Рис. 31. Композиционный план второго порядка для к=2 179
(*а, 0, ... , О), (О, ±а, О...О) ... (О, О.....О, ±а), где а — расстояние от центра плана до звездной точки — звездное плечо-, 2) увеличить число экспериментов в центре плана п0. Рассмотрим построение композиционных планов на примере к = 2 (рис. 31). Точки ], 2, 3, 4 образуют ПФЭ 22, точки 5, 6, 7, 8 — звездные точки с координатами (± а, 0) и (0, ± а), координаты п0 опытов в центре плана нулевые — (0, 0) (табл. 40). Таблица 40 Композиционный план второго порядка для двух факторов Номер опыта xo *1 X2 x,x2 2 X2 Номер опыта XQ *1 x2 x,x2 *2 2 *2 1 +1 +1 +1 +1 +1 +1 8 +1 0 -a 0 0 a2 2 +1 +1 -1 -1 +1 +1 9 +1 0 0 0 0 0 3 +1 -1 -1 +1 +1 +1 10 +1 0 0 0 0 0 4 +1 -1 +1 -1 +1 +1 5 +1 +a 0 0 a2 0 6 +1 -a 0 0 a2 0 N +1 0 0 0 0 0 7 +1 0 +a 0 0 a2 Информационная матрица (матрица моментов) композиционного пла- на второго порядка имеет для к=2 вид &2 &12 ьгг ь0 — N 2 1=1 2 X г Qi 0 0 о *Oi*ii 2 X0i*2« 1=1 h 0 N 2*11 1=1 0 0 0 0 bi (хтх) = Ь1г 0 0 0 0 N 1=1 0 0 лг 2 2 2 xuxu i=! 0 0 0 0 (V.5!) Ь11 АГ 2 1=1 2 0 0 о XU N 2 Х*Л 1=1 ^22 1 2 *ЫХЫ 0 0 о ХЖ ilbds: 1 где N 1=1 = N, N N S^ = 2^ = 22 + 2^, (=1 i=i N N 2 X«iXU = 2 x'ix« = 22 + 2“2’ i=l 1=1 180
N £s=tl 2^ = 2 ^ = 22 + 2“‘- /ssl fs=l Общее число опытов в матрице композиционного плана второго порядка при к факторах (табл. 41) составляет # = 2* + 2Л+по при Д><5, ^ = 2Л1 + 2Л +я,, при Л>5. (V.52) Таблица 41 Композиционный план второго порядка для к факторов Номер опыта Хо .к, х2 Хз Хк 1 +1 +1 -1 +1 -1 2 +1 -1 -1 -1 +1 3 +1 +1 -1 +1 1 4 +1 -1 +1 -1 +1 5 +1 +1 -1 +1 -1 «Я +1 -1 -1 -1 -1 пя + 1 +1 +а 0 0 0 «я+ 2 +1 —а 0 0 0 «я + 2Л +1 0 0 0 — а N +1 0 0 0 0 Соответствующая плану (табл. 41) информационная матрица ХтX имеет вид (V.53) Таблица 42. Значения а2 для различного числа факторов и количества опытов в пентре плана "о к «0 к 2 3 4 5* 2 3 4 5* 1 1,00 1,476 2,00 2,39 6 1,742 2,325 2,950 3,31 2 1,160 1,650 2,164 2,58 7 1,873 2,481 3,140 3,49 3 1,317 1,831 2,390 2,77 8 2,00 2,633 3,310 3,66 4 1,475 2,00 2,580 2,95 9 2,113 2,782 3,490 3,83 5 1,606 2,164 2,770 2,14 10 2,243 2,928 3,66 4,00 * Полуреплика, х5 = х^х^. 181
•ft •ft* •ft 1 т >? ZJ о «V V pq ?q °%s V пг н pq^r *—• ечем И Н ?q ?q S *л/ *1/ 2 ХЛ« ^ • • • 2 X»i пг >? V >? >1 о V *е т •о* о . %* Н - о пг V о 00 •ft ПТ Z1 09 •ft >1 о •ft о см 5 Н . N <o - <r с? "V >1 п? zi । о о ’S 5 ° *L nr nr ?q ?q >? ... V pq । *» ©О а -с* 182
где лг 2й = ^ <=i V у2 — V г2 — .. — V Г2 + 2“2 для k < 51 ЯДР° 2* ь xii X2i ' ” хл1^2А-1 + 2а2 для k >• 5, ядро 2й"1; АГ лг 2 = xtiX2i “ i=l i=l _ V г Г2 + 2а2 ДЛЯ k < 5 — Zi xaixki «2*-* + 2а2 для k > 5; /V j. — V v2 V2 <<г2 для А < 5 ~ Jj X(A-1) i Xki *^2*’* для k > 5; _ yi 4 „2* + 2а4 для k < 5 - + 2а« для k > 5. 1=1 Таким образом, композиционные планы второго порядка неортого- нальны: N 2 xotxji 0 ’ / — 1» 2, ... > ki «=1 N 2 xjixui=^^' u’ i= '’ 2’ ’ u=fci- Выбор величины звездного плеча а и числа опытов в центре плана п0 связан с критерием оптимальности плана. 5. Ортогональные планы второго порядка. Композиционные планы легко приводятся к ортогональным выбором соответствующего звездного плеча а. Для этого было проведено обращение матрицы (V.53) в общем виде. При этом достаточно было обратить ту ее часть, которая связана со столбцами х0 и х2 (табл. 41), т. е. с коэффициентами Ьо и , и опре- делить а из условия равенства нулю недиагонального элемента обрат- ной матрицы: а* _|_ 2М- 2*-i (k + О,5по) = 0, ядро 2*; а4 -|_ 2*-1а2 _ 2*-2 (k + 0,5л„) = 0, ядро 2*-1. (V.54) Значения а2, определенные по (V.54), приведены в табл. 42 (см. стр. 181). Выбрав а из табл. 42 и проведя следующее линейное преобразова- ние квадратичных столбцов 2х> s х/_лд-лд = х2„ 1 > ’ • 1 (V.55) получим ортогональную матрицу. Так, ортогональный план второго порядка для к = 2 и п0= 1 имеет вид (табл. 43): 183
Таблица 43. Ортогональный план второго порядка для к — 2 Номер опыта х0 *1 х2 *1*2 X? Хз 1 +1 +1 +1 +1 +1/3 + 1/3 2 +1 +1 -1 -1 +1/3 +1/3 3 +1 -1 -1 +1 +1/3 +1/3 4 +1 -1 +1 -1 +1/3 +1/3 5 +1 +1 0 0 +1/3 -2/3 Номер опыта Хо *1 х2 Х,Х2 X,' х2 6 +1 -1 0 0 +1/3 -2/3 7 +1 0 +1 0 -2/3 +1/3 8 +1 0 -1 0 -2/3 +1/3 9 +1 0 0 0 -2/3 -2/3 Благодаря ортогональности матрицы планирования все коэффициен- ты регрессии определяются независимо друг от друга по формуле N S ХНУ1 ---- (V.56) 2^ 1=1 и дисперсии коэффициентов равны Л а = —воспр_ (V.57) bj N i=i В результате расчетов по матрице с преобразованными столбцами для квадратичных эффектов получим уравнение вида Л У = ь0 + *1*1 + Ь2х2 + • • • + bhxh + b12xtx2 Н-+ + b(k-\) k xk-i xk + bn •*])+ ••• + *fth (4~xk)- (v-58) Чтобы перейти к обычной записи, определяют Ьо по формуле bo ~ ьо *ц*? • • • bfyf, х2 (V.59) и оценивают с дисперсией, равной = sb' + ( *i)2sbt, +•••+( 4У sl (V.60) o hh Зная дисперсию воспроизводимости, проверяют значимость коэффи- циентов и адекватность уравнения Л У = Ьо + 51*1 + Ь2х2 + • • + bhXh + *i2*i*2 + • • + + bk~\. k xh-ixh + Н--------1- • Адекватность уравнения проверяют по критерию Фишера, составляя отношение дисперсий: F = s2 /s2 1 ад / эвоспр* Уравнение адекватно, если составленное таким образом F-отношение меньше табличного для выбранного уровня значимости р (обычно рав- ного 0,05) и чисел степеней свободы дисперсии адекватности и диспер- сии воспроизводимости: 184
F < Fi-p ft)t где fi —N-1 — число степеней свободы дисперсии адекватности; /2— число степеней свободы дисперсии воспроизводимости; N— число опы- тов в матрице планирования; /—число коэффициентов в уравнении регрессии второго порядка. Значимость коэффициентов проверяется по критерию Стьюдента: О = bi/sbt. Коэффициент значим, если tj > tp (fi), где fi — число степеней свободы дисперсии воспроизводимости. Коэффициенты уравнения регрессии, получаемые при помощи орто- гональных планов второго порядка, определяются с разной точностью. Согласно (V.57) имеем; sb„ = sBocnp/)^N, sbj — sBocnp I К2* + 2“2 > j — 1 > 2- • • > k ПРИ k < 5, ядро 2*, sb) = Явоспр / V2*"1 + 2a2 при k > 5, ядро 2*"1, при k <5, ядро 2*. и, j= 1, 2, ... , k, u=bi, sbuJ = sBocnp при k >5, ядро 2*-1, (V.61) sb = ---------- воспр При J < ядр0 2», ” V 2*(1 — xj)2 + 2(a2 —x^)2 + (n0 + 2A —2)(T^)2 / = 1, 2, ... , k, sb =------- " Bocnp ...........................— -...- при k>5, ядро 2*”1. " 2*-1 (1 -72)2 + 2(a2 - Iff + (n0 + 2k - 2) py)2 Ортогональные планы второго порядка не обладают свойством ротатабельности. Пример 2. Исследовался процесс разложения полигалита азотной кислотой: K2SO4 MgSO4 2CaSO4 • 2Н2О + 4HNO3 -► - 2KNO3 + Mg (NO8)2 + 2H2SO4+2CaSO4 Ставилась задача выяснения принципиальной возможности максимально полного перевода полезных компонентов полигалита калия и магния в азотнокислотную вытяжку и анализ параметрической чувствительности процесса. Решение. В качестве факторов, от которых зависит процесс разложения поли- галита азотной кислотой, были выбраны следующие: zi — температура процесса, °C; zt — продолжительность взаимодействия реагентов, мин; гз — норма азотной кислоты, мае.% от стехиометрии на разложение калийно-магниевой части полигалита; za — концентрация азотной кислоты, мае.%. В связи с тем, что целью данного исследования был анализ параметрической чувствительности процесса, в качестве плана эксперимента был выбран ортогональный план второго порядка, обеспечивающий равенство нулю всех ковариаций между коэф- фициентами в уравнении регрессии. Координаты центра плана, интервалы варьирования и уровни исследования приведены в таблице. 185
Zj z2 + Z4 0 30 15 150 12,5 6,21 3,1 31 4,65 +1 36,21 18,1 181 17,15 -1 23,79 11,9 119 7,85 +1,61 40,00 20,00 200 20,0 -1,61 20,00 10,00 100 5,0 В экспериментах были использованы полигалитовые отходы от производства суль- фата калия из полиминеральной руды Калужского комбината. Состав полигалитовых отходов, %: КаО 13,8; Mg 7,3; СаО 15,6; SO3 46,5; нерастворимый осадок (н.о.) 6,2; минералогический состав, %; K2SO4 25,59; MgSO< 21,8; СаЗОд 34,9;Н20гидр 4,0; н.о. 6,2; НгОгигр 1,92. Химический состав и грансостав полигалитовых отходов Калужского комбината иден- тичен полигалиту Жилянского месторождения. Средний размер частиц полигалита 0,25 мм. План и результаты эксперимента ; yi — степень извлечения в жидкую фазу К2О, мае.%; у2 — степень извлечения MgO, мае.% приведены в табл. 44. Параметры плана; к — 4; ло — 4; а — 1,61; N = 28. Дисперсии воспроизводимости посчитаны по четырем опытам в центре плана- - 6,48; - 5,38. Таблица 44. План н результаты эксперимента Номер опыта *1 x2 хз X4 У, 1 +1 +1 +1 +1 93,94 90,40 2 -1 -1 +1 +1 65,50 67,75 3 -1 +1 +1 +1 77,74 74,52 4 +1 -1 +1 +1 94,08 87,00 5 +1 +1 -1 +1 79,69 76,30 6 -1 -1 -1 +1 67,77 65,96 7 -1 +1 -1 +1 69,95 67,05 8 +1 -1 -1 +1 81,31 78,08 9 +1 +1 +1 -1 96,95 87,50 10 -1 -1 +1 -1 76,47 73,90 11 -1 +1 +1 -1 76,68 63,66 12 +1 -1 +1 -1 88,72 83,90 13 +1 +1 -1 -1 90,00 81,51 14 -1 -1 -1 -1 62,06 58,56 15 -1 +1 -1 -1 71,33 66,78 16 +1 -1 -1 -1 88,00 78,77 17 0 0 0 0 90,31 80,96 18 0 0 0 0 89,16 79,73 19 0 0 0 0 88,27 82,26 20 0 0 0 0 94,65 85,14 21 +1,61 0 0 0 98,36 86,62 22 -1,61 0 0 0 63;00 61,64 23 0 +1,61 0 0 89,20 86,93 24 0 -1,61 0 0 75,25 75,41 25 0 0 +1,61 0 91,30 90,00 26 0 0 -1,61 0 71,38 73,29 27 0 0 0 +1,61 79,60 75,48 28 0 0 0 -1,61 79,49 76,03 По результатам экспериментов (табл. 44) рассчитаны коэффициенты регрессии и их ошибки. Согласно формулам (V.56) и (V.57) для у, получены значения; 186
Ьа = 81,77 bi = 9,54; 6а = 1,94; 63 = 4,34; 64 = —0,946; 612 = — 0,96; 613 = 0,588; 6М= —0,568; 623 ~ 0,543; 624 = — 0,44; 634=—0,32; 6ц = — 3,13; 622 = — 2,54; 633 = — 2,88; 644 = — 3,57; = 0,55; sb , = "uj = 0,64; SbH - = 0,69. Для уг: Ьо =87,09; *1 = = 8,57; = 1,89; 63 =4,11; 64 =0,44; 612 = = — 1,07; ^13 ' = 0,64; 614 = 0,02; Лаз = — 0,34; 624 = = — 0,013; *34 = = 0,11; 6ц = — 4,18; 622 = = — 1,72; *33 = = —1,56; 644 = —3,67 sbj = 0,504; Ч/ = 0,58; bii = 0,634. Значимость коэффициентов уравнений регрессии оценена по ^-критерию Стьюдента в соответствии с формулой (IV.34): для i/i: tY = 17,35; < 4 = 1,72; < 23 = 0,85; < ii = 4,54; < 2 = 3,53; = 1,5; < 24 = 0,64; < 22 = 3,68; <з =7,9; <13 = 0,92; <34 = 0,5; <33 = 4,17; <14 = 0,89; <44=5,17; Для y2: <1 = 17,0; <2 = 3,75; <з = 8,15; <4 = 0,87; <12= 1,84; <13= и; <14 = 0,034; ^23 ~ 0»88; <24 = 0,02; <34 = 0,19; Gi = 6,59; <22= 2,71; <зз = 2,46; <44= 5,79. Табличное значение критерия Стьюдента для уровня значимости р —0,05 и числа сте- пеней свободы f = по — 1 — 3 /о,05(3) — 3,18. После отсева незначимых. коэффициентов, для которых /-отношение меньше таб- личного, уравнения регрессии имеют вид у1 = 90,98 + 9,54х1+ 1,-94х2 + 4,34х8- 3,13х® —2,54х® — -2,88^-3,57x5, Уг = 93,07 + 8,57Xi + 1,89хг + 4,11х3 — 4,18х“ — 3,67х®. Рис. 32. Влияние температуры на степень извлечения КзО (/) и MgO (2) в раствор Рис. 33. Влияние продолжитель- ности взаимодействия на степень извлечения К2О (7) и MgO (2) в раствор 187
Рис. 34. Влияние нормы азотной кис- лоты на степень извлечения КгО (7) и MgO (2) в раствор Рис. 35. Влияние концентрации азот- ной кислоты на степень извлечения КгО (7) и MgO (2) в раствор Полученные уравнения адекватны эксперименту: Fy, —2,52; Fy2— 1,95. Табличное значение критерия Фишера 7’'табл —8,65 для уровня значимости р — 0,05, fi — 20, fi — З и fi — 22, Л-З. Анализ параметрической чувствительности процесса по уравнениям регрессии показан на рис. 32—35. Расчеты сделаны для центра плана. Степень извлечения КгО и MgO в раствор возрастает с увеличением температуры, продолжительности и нормы азотной кислоты (рис. 32—34). Зависимость степени извлечения MgO и КгО в раствор от кон- центрации азотной кислоты носит экстремальный характер (рис. 35). Значение экстремума (максимума) для степени извлечения КгО равно в данных условиях (в центре плана) 91,0%, a MgO—93,0% при концентрации азотной кислоты 12,5%. Из приведенных данных следует, что при всех изученных условиях MgO быстрее извлекается из полигалита в раствор, чем КгО. Поэтому при установлении оптимальных условий процесса разло- жения полигалита азотной кислотой в качестве основного показателя была выбрана степень извлечения К2О. В результате решения задачи оптимизации методом нелиней- ного программирования получено, что в изученном диапазоне изменения факторов наибольшая степень извлечения КгО в раствор (94,5%) достигается в следующих усло- виях: концентрация HNOa 12,5%, норма HNO3 — 200% от стехиометрии, продолжитель- ность взаимодействия — 20 мин. В этих условиях MgO практически полностью переходит в раствор. 6. Ротатабельные планы второго порядка Бокса — Хантера. Ортого- нальные планы второю порядка не обладают свойством ротатабель- ности. Количество информации, Рис. 36. Линии равной инфор- мации для ортогонального пла- на второго порядка при к —2 определяемое как величина, обратная sj, оказывается различным для эквиди- стантных точек. На рис. 36 показаны контуры равной информации для к = 2 и плана, приведенного в габл. 43. По- верхности равной информации для большего числа факторов имеют очень сложный характер. Бокс и Хантер пред- ложили считать оптимальными рота- табельные планы второго порядка. Рота табельным будет такое планирова- ние, у которого ковариационная матри- ца {ХТХ)~ 1 инвариантна к ортогональ- ному вращению координат. Условие ротагабельности для планов второго порядка выполняется, если моменты 188
информационной матрицы удовлетворяют соотношениям N 2 2^ = ЛГк2, /=1,2.........k, (V.62) i=l N N 2 X* = 3 2 = 3M4> и, /=1,2........k, u^j, (V.63) где Л 2 и Л 4 — произвольные константы. Остальные моменты информационной матрицы равны нулю (см. с. 190). В зависимости от значений <2 и меняются информационные профили. На рис. 37 приведены информационные профили для к=2, к2 — 1 при различных значениях к 4. Аналогичные профили получаются и для других значений к. Значение к* выбирают так, чтобы информация оставалась постоянной в интервале 0< Р ^1. Такое планирование называется униформ-ротатабельным планированием. В определитель матрицы (V.64) в качестве множителя входит вели- чина [(2 + к) кл/ к 2 ] - к. Для существования матрицы (ХТ Х)~ ’ необхо- димо, чтобы выполнялось условие [(2+ к) к*/ к # 0, т. е. Х4/)2> А/(й + 2). (V.65) Рассмотрим, в каких случаях условие (V.65) не выполняется. Найдем связь констант к 2 и 7.4 с числом факторов к. Умножив на к соот- ношение (V.62), получим N kN N k N 1=1 /=1 ,=i i=i /=1 ,=1 Отсюда (V.66) (V.67) где Р, —радиус г-й точки в ^-мерном пространстве. Используя соотношение (V.63J, также получим ,v ,v k ^Х*Л = 1> (V-68) IS=1 /=1 к Выразим сумму через радиус точки и число факторов к. Имея в виду, что для любой /-Й точки k = 2^ + 2С^вх2 = Рис, 37. Информационные профили для ротатабельного плана при к — 2 189
s > 190
=2ъ-ьм*-1)^. (v.69) получим k 2 X* = P‘-A(A-J)X>J. (V.70) У=1 Подставляя (V.70) в (V.68), получим k 2 Xji ~ 2 pi k 2 Xui XJi • i=l i=l *=1 С учетом соотношения (V.63) имеем N . N " 4 3*2хЛ = 32 Л=1 i=l i=l Отсюда N N 3g₽: .2 ХЛ- ft(ft+2) И N 2 ₽: X = i=1 • 4 Nk (k 4- 2) Тогда (V.71) (V.72) (V.73) (V.74) (V.75) Если все N точек ротатабельного плана расположены на одной сфере, т. е. О о 9 4 4 4 ₽1= Р2^ ••• = ₽М И р1= р2= ... =Рдг , из (V.75) имеем У Xj = k!(k 4- 2) и определитель матрицы (X7 X) равен нулю. Поэтому необходимо, чтобы точки плана были расположены на нескольких сферах. Для некоторого числа факторов радиус сферы, на которой лежат точки ядра плана, совпадает с радиусом а сферы, на которой лежат звездные точки. Чтобы информационная матрица была невырожденной, в ротатабельный план вводят точки, лежащие на сфере с нулевым радиусом, — п0 точек в центре плана. Пусть N точек плана расположены на s сферах по пи точек на каждой сфере, тогда Ns Ns 2^=2^- 2₽?=2««£ (V-76) 1=1 U=1 1=1 U=1 191
При А.2 = 1 имеем 1 < Х4= ----— /5 \8 s ««₽: \«=1 / kN k + 2 ' (V.77) Если точки ядра плана ия и звездные точки па расположены на одной сфере Ря = Рц ив центре плана имеется п0 точек, тогда N= пл + п, + По = п 4- «о и из (V.77) имеем х4 = -^- = (V^78) * + 2 (* + 2)n k + 2 ' * Таким образом, наличие п0 точек в центре плана обеспечивает вы- полнение условия (V.65). Величина звездного плеча в ротатабельных планах может быть определена из соотношения (V.63): при к<5 2* + 2а4 = 3 • 2Л; а=2*/4, (V.79) при к^ 5 А_, 2*-1 + 2а« = 3 • 2*-1; а = 2 * . (V.80) В табл. 45 приведены значения а, и0 и радиуса сферы, на которой расположены точки ядра плана ря для различного числа факторов в ротатабельных униформ-планах. Таблица 45 Величины звездных плеч н количества точек в центре плана в ротатабельных уннформ-планах Параметры плана к 2 3 4 5 5 6 6 7 7 Ядро плана 22 23 V 26 25-, 26 26-1 2? 27-1 Ря 1,41 1,73 2,00 2,24 2,27 2,45 2,45 2,64 2,64 а 141 1,68 2,00 2,38 2,00 2,83 2,38 3,36 2,83 "о 5 6 7 10 6 15 9 21 14 Матрица ротатабельного плана второго порядка неортогональна, так как 2 XoiX^ =£0, j = 1, 2, ...,k, 2 XJiXui 0’ / / • И = 1» 2, , k. 1=1 Коэффициенты bjj коррелированы между собой и со свободным членом Ьо. Поэтому для определения коэффициентов уравнения регрес- сии необходимо решать систему нормальных уравнений, обращая мат- 192
рицу(Хг X) В = (ХТ X)'1 Хт Y- Специфический характер матрицы (Хт X) для ротатабельных планов позволяет провести процедуру обращения этой матрицы в общем виде и получить формулы для расчетов коэффициентов уравнения регрессии и их дисперсий: N N 2Х*(й+2) 2 </|-2Х4С 2 *„У1 1=1 1=1 С N bj= — 2 хлУ1’ 2’ ••• • ki с2 N 2 xuixiiyt’ u=ti’ u, i =\,2, ... i k-, 1=1 h A N kN [С*(к + 2)^-к] 1=1 /=1 1=1 (V.81) n 1 -2k4C 2 M '» 1=1 J 2 2/lk4 (k + 2) 2 V. — ------------s b„ N воспр • 2 C 2 st = —s : bj fl воспр • sh =-------s ; buj W »OC"P = Л[(Де+ l)k< —(fe— 1)]C« s2 l>jj ft воспр ’ где k — число факторов, C=-------— : i i=l A=___________!______ 2Х4[(й + 2)Х4-й] Константа X4 определяется по формуле (V.77). Выражения (V.81) можно упростить, объединив константы: N kN ьо = 01 2 yi — a* 2 2 1=1 /=11=1 N bj = a3 2 хлу(; j=l, 2......k; (V.82) i=i 7-529 193
N buj = хщхцуг, u=f=j; f, u= I, 2. , k; 1=1 N kN N bjj = Я5 2 XjlMi H~a# 2 ХцУ1 a1 У*’ i=l /=1 i=l i=l sb,= a^: sbj = a^Zy> = ^ = (“5 + «e)s£- (V.83) Значения констант, входящих в выражения (V.82), приведены в табл. 46. Таблица 46. Вычисление коэффициентов регрессии при ротатабельиом планировании дЛя к^. 7 Число не- зависимых перемен- ных к Число опытов По а а, а2 ^3 *4 ^5 <77 г 13 5 1,412 0,2 о,1 0,125 0,25 0,1251 0,0187 о,1 3 20 6 1,682 0,1663 0,0568 0,0732 0,125 0,0625 0,0069 0,0568 4 31 7 2,00 0,1428 0,0357 0,0417 0,0625 0,0312 0,0037 0,0357 5* 32 6 2,00 0,1591 0,0341 0,0417 0,0625 0,0312 0,0028 0,0341 5 52 10 2,378 0,0988 0,0191 0,0231 0,0312 0,0156 0,0015 0,0191 6* 53 9 2,378 0,1108 0,0187 0,0231 0,0312 0,0156 0,0012 0,0187 6 91 15 2,828 0,0725 0,0098 0,0125 0,0156 0,0078 0,0005 0,0098 7* 92 14 2,828 0,0703 0,0098 0,0125 0,0156 0,0078 0,0005 0,0098 7 163 21 2,333 0,0398 0,0052 0,0066 0,0078 0,0039 0,0002 0,0052 * Полуреплика. При использовании ротатабельных планов второго порядка отпадает необходимость в постановке дополнительных параллельных опытов для оценки дисперсии воспроизводимости. Дисперсию воспроизводимости определяют по опытам в центре плана: По По п —------------ ; у“ = —--------- (V.84) «о— > «о Число степеней свободы дисперсии воспроизводимости равно /воспр — (По— О- Остаточную дисперсию определяют по формуле N К 2 {Уг - У1? 2 1=1 °ст М —/ Число степеней свободы остаточной дисперсии f0„ =N-1. Адекватность уравнения регрессии проверяют по критерию Фишера; = 5 ад/5 воспр’ (V-85) 194
где л?д — дисперсия адекватности, которая определяется из соотношения ®ад/ад = ’оСт/ОСТ ’воспр fвоспр ’ 2 5ост^ост ’воспр /воспр _ 5»“------------77,----------- (V86' f — число степеней свободы дисперсии адекватности; /ад = /ост—f воспр- Уравнение адекватно, если F<Fv p (f\, Д), где fi — число степеней свободы дисперсии адекватности;^ — число степеней свободы дисперсии воспроизводимости. Значимость коэффициентов проверяют по критерию Стьюдента. Если незначимым оказался один из квадратичных эффектов, после его ис- ключения коэффициенты уравнения регрессии необходимо пересчитать. Пример 3. Требуется установить влияние примесей, содержащихся в экстракционной фосфорной кислоте, на степень разложения (у, %) флотационного концентрата фосфорита Каратау. В качестве факторов, от которых зависит степень разложения, были выбраны следующие: zi - температура процесса, °C; Z2 — концентрация MgO в фосфорной кислоте, мае.%; za — концентрация SOs в фосфорной кислоте, мас.%; Z4 — концентрация АЬОз в фосфорной кислоте, мас.%; ze — концентрация F в фосфорной кислоте, мас.%. Основной уровень; интервалы варьирования и границы области исследования при- ведены в таблице. z z2 23 *4 % z«. 50 2Д 2,0 1,33 0,75 AZ; 20 0,9 1,0 0,37 0,25 +/ 90 3,9 4,0 2,07 1,25 —2 10 0,3 0,0 0,59 0,25 Область изменения независимых факторов соответствует диапазону изменения кон- центраций примесей в промышленной.экстракционной кислоте. Решение. Для определения уравнения регрессии используем ротатабельный план второго порядка (табл. 47). Таблица 47. Ротатабельный план второго порядка для к = 5 Номер опыта <1 x2 *3 x4 X5 % Номер опыта *1 x2 *3 X5 y>, % 1 +1 +1 +1 +1 +1 34,7 17 -2 0 0 0 0 25,0 2 -1 +1 +1 +1 -1 41,4 18 +2 0 0 0 0 33,3 3 +1 -1 +1 +1 -1 39,0 19 0 -2 0 0 0 42,0 4 -1 -1 +1 +1 +1 39,2 20 0 +2 0 0 0 49,2 5 +1 +1 -1 +1 -1 29,5 21 0 0 -2 0 0 17,5 6 -1 +1 -1 +1 +1 26,6 22 0 0 +2 0 0 41,0 7 +1 -1 1 +1 +1 30,0 23 0 0 0 2 0 35,6 8 -1 -1 -1 +1 -1 34,5 24 0 0 0 +2 0 27,2 9 +1 +1 +1 -1 -1 32,2 25 0 0 0 0 -2 39,0 10 -1 +1 +1 -1 4-1 41,4 26 0 0 0 0 +2 30,0 11 +1 -1 +1 -1 +1 33,7 27 0 0 0 0 0 35,4 12 -1 -1 +1 -1 -1 40,9 28 0 0 0 0 0 36,4 13 +1 +1 1 -1 +1 23,9 29 0 0 0 0 0 33,2 14 -1 +1 -1 -1 1 33,3 30 0 0 0 0 0 32,4 15 +1 -1 -1 1 -1 27,7 31 0 0 0 0 0 37,7 16 -1 -1 -1 1 +1 35,9 32 0 0 0 0 0 36,9 195 7
Число опытов в матрице планирования для к — 5 равно 32. Ядро плана представ- ляет собой полуреплику 25"1 с генерирующим соотношением хь = хиехзлч. Величину звездного плеча а— 2 определяем по табл. 45. Переход от натуральных переменных z к безразмерным х проведен по формуле (V.3). По эксперименту в центре плана опре- деляем дисперсию воспроизводимости Твоспр = 4,47 с числом степеней свободы /воспр — = по - 1 - 5. По данным табл. 47 рассчитываем коэффициенты уравнения регрессии второго порядка и их ошибки; *0=35,41: />1 = 1,07794; />2 = — 0,146; Ь3 = 4,5098; Ь4 = —0,542; *s = —1,3; />п = —1,5; bs2 = 2,66; *зз = —1,47; 644 = —0,93; />56 = — 0,15; />12 = 0,147; />13 = 0,256; *14=1,61; />i5 = 0,0534; bi3 = 0,736; *24 = —0,198; />а5 = 0,403; />34 = 0,401; />36 = 0,256; *45 = 0,93; s/jj = 0,43; з6ц/ = 0,53; sbjj= 0,394. Значимость коэффициентов проверяем по критерию Стьюдента: <1 = 1,07/0,43 = 2,48; /12 = 0,147/0,53 = 0,278; /а= 0,146/0,43 = 0,34; /13 = 0,256/0,53= 0,483; /3 = 4,51/0,43 = 10,4; /к= 1,61/0,53 = 3,04; /4= 0,542/0,43= 1,26; /16 = 0,0534/0,53 = 0,1; /5= 1,3/0,43= 3,02; /23 = 0,736/0,53 = 0,1375; /ц = 1,5/0,394 = 3,82; /24 = 0,198/0,53= 0,374; /22 = 2,66/0,394= 6,75; /33 = 1,47 / 0,394 = 3,73; /аб = 0,403/0,53= 0,762; /44= 0,93/0,394 = 2,36; /34 = 0,401/0,53 = 0,758; /55 = 0,15/0,394 = 0,38; /46 = 0,93/0,53 = 1,75. Табличное значение критерия Стьюдента для уровня значимости р = 0,05 и числа степеней свободы f— 5 - tQ09 (5) = 3.18. После отсева незначимых коэффициентов, для которых r-отношение меньше табличного, и пересчета получаем уравнение регрессии вида у = 36,2 + 4,51х3 — 1,3х6 + 1,01*iX4 — 1,45х^ 2,82 х| — 1,53 . Проверка адекватности по критерию Фишера показала, что оно адекватно эксперименту: ^ = 447; 4=15,35; F=3,43; Г0>95 (20,5) = 4,5. Полученное уравнение позволяет определить степень разложения флотоконцентрата фосфорита Каратау при различных температурах в зависимости от содержания приме- сей в кислоте. 7. Критерии оптимальности планов. При определении критериев оптимальности планов для Бокса и его школы характерным является эмпирико-интуитивный подход. Сначала ими было предложено считать оптимальным ортогональные планы, позднее — ротата- бельные. План ортогонален, если ему соответствует диагональная информационная матрица. Полученные по ортогональным планам оценки параметров независимы. План ротатабелен, если соответствующая ему ковариационная матрица инвариантна к ортого- нальному вращению координат. Выполнение этого условия делает любое направление от центра эксперимента равнозначным в смысле точности оценки поверхности отклика. Свойства ортогональности и ротатабельности планов чрезвычайно удобны в прак- тическом отношении, что способствует широкому применению этих планов в экспери- 196
менте. Линейные ортогональные планы и 1^-Р обладают также свойством ротата- бельности. Композиционные ротатабельные планы, предложенные Боксом и Хантером, не ортогональны. Если же в качестве критерия оптимальности выбирать ортогональ- ность, то неизбежны некоторые потери в точности оценок параметров и регрессионной функции. Одновременно с развитием идей Бокса развивалось второе, чисто теоретическое направление в планировании эксперимента. Наибольший вклад в его развитие внес американский математик Кифер. Концепция Д-оптимальности, развиваемая Кифером, является естественным продолжением теории эффективных оценок Фишера. В теории Фишера эффективность оценок задается только оптимальным способом обработки результатов эксперимента. При обработке экспериментов методом наименьших квадратов для линейного уравнения регрессии находят совместно эффективные оценки этих коэф- фициентов. При этом эллипсоид рассеяния оценок имеет наименьший объем. Объем эллипсоида рассеяния связан с определителем информационной образом: (й+2)А/2т?/2 Vh = 77------, г .... - . Г( 2 +1Г |%Г%| — гамма-функция. матрицы следующим (V.87) В концепции Кифера эффективность обусловливается еще и оптимальным распо- ложением точек в факторном пространстве. План эксперимента, при котором объем эллипсоида рассеяния минимизируется на множестве планов в заданной области, назы- вается D-оптимальным. Согласно (V.87) D-оптимальному плану должен соответствовать максимальный определитель информационной матрицы. Кифером предложен ряд критериев оптимальности планов. Все эти критерии, как и критерий D-оптимальности фактически сводятся к некоторым требованиям, предъяв- ляемым к виду ковариационной, а следовательно, и информационной матрицы. Так, план называется А-оптимальным, если его ковариационная матрица имеет наименьший след (сумму диагональных элементов). Л-Оптимальный план позволяет минимизировать среднюю дисперсию оценок параметров. План называется Е-оптимальным, если максимальное характе- ристическое значение соответствующей ему ковариационной матрицы оценок параметров минимально. Это значит, что £-оптимальный план минимизирует максимальную ось эллипсоида рассеяния оценок параметров. План называется G-оптимальным, если он обеспечивает наименьшую по всем планам максимальную дисперсию предсказанных значений у в области планирования и, следовательно, обеспечивает отсутствие в области планирования точек, в которых точность оценки поверхности отклика слишком низкая. Боксом и Дрейпером предлагается еще один критерий оптимальности планов, позволяющий минимизировать систематическое и общее смещение, возникающее при аппроксимации поверхности отклика полиномом более низкого порядка, чем это требуется для адекватного описания. В настоящее время наиболее развита теория построения D-оптимальных и (/-опти- мальных планов. В общем виде задача построения D-оптимальных планов не решена. Наиболее разработанными можно считать методы получения D-оптимальных планов для оценки одного параметра. В работах Кифера, Вольфовица, Хоула и Коно введено понятие непрерывного плана и построены непрерывные D-оптимальные планы для полиноминаль- ной регрессии первого и второго порядков при ограничениях на гиперкубе и ^-мерном шаре; для тригонометрической регрессии с различными весовыми функциями на от- резке. Границы эксперимента чаще всего задаются гиперкубом. D-Оптимальные планы первого порядка при ограничениях на кубе можно задать в виде ПФЭ 2*. D-Оптималь- ными планами являются также некоторые дробные реплики полного факторного экспери- мента, и планы Нлакетта — Бермана для числа факторов к, удовлетворяющих условию к+ 1, кратны четырем. Эти планы в то же время ортогональны и ротатабельны. D-Оптимальные непрерывные планы второго порядка на кубах размерности 2—5 для полиномов второго порядка, предложенные Кифером и Вольфовицем, как правило, содержат очень большое число наблюдений; так, например, при к = 5 в таком точном плане должно быть более 1500 измерений. В связи с этим при помощи‘ЦВМ были найдены несимметричные планы второго порядка с достаточно малым числом экспе- риментальных точек, которые близки к D-оптимальным по таким характеристикам, как определитель информационной матрицы, средняя и максимальная дисперсия пред- 197
сказанного значения параметра оптимизации. Была проведена также сравнительная оценка с позиции D-оптимальности характеристик некоторых композиционных планов второго порядка при ограничениях на кубе для к — 4, 5, 6. Выбор того или иного плана ис- следования определяется постановкой задачи и возможностями эксперимента. 8. Исследование поверхности отклика. Решение задачи оптимизации. Уравнение регрессии второго порядка, адекватно описывающее почти стационарную область, исследуют для определения координат оптимума. Кроме того, представляет интерес изучение свойств поверхности от- клика в окрестности оптимума. При этом полезно перейти от полинома второго порядка, полученного по результатам опыта, к стандартному, каноническому уравнению: У — ys — + Х2г + ... + \kk (V • 88) где у, — значение выхода в центре поверхности; Xi, Х2, Хк — канони- ческие переменные, являющиеся линейными функциями факторов х,, х2, ..., хк, А.11, ка, ...,А.и — коэффициенты канонической формы. Первый этап канонического преобразования —перенос начала коор- динат в особую точку поверхности отклика — центр поверхности. Коорди- наты центра 5 определяются решением системы уравнений Рис. 38. Канонические поверхности и их сечения для к — 2 198
При аппроксимации поверхности отклика полиномом второго порядка приходится решать систему к линейных уравнений. Если определитель этой системы равен нулю, то поверхность не имеет центра. В этом случае можно или перенести начало координат в точку с наилучшим значением выхода, или совсем не переносить центр. При этом для нецентральной поверхности оптимум будет лежать на границе области определения факторов. Если поверхность имеет центр, то в него пере- носят начало координат. При этом в уравнении поверхности исчезают члены, содержащие линейные эффекты, и изменяется свободный член. Коэффициенты при вторых степенях и взаимодействиях инвариантны относительно переноса. Второй этап — поворот координатных осей в но- вом центре таким образом, чтобы исчезли члены с эффектами взаимо- действия; свободный член инвариантен относительно поворота. В ре- зультате получим уравнение вида (V.88). Поверхности второго порядка классифицируются по их каноническим формам (рис. 38). 1. Все коэффициенты канонической формы имеют одинаковые знаки. Поверхность — эллиптический параболоид (рис. 38,а). В центре поверх- ности максимум при А,-,- < 0 и минимум — при А;,- > 0. 2. Коэффициенты имеют разные знаки. Поверхность — гиперболиче- ский параболоид, «седло» (рис. 38, б). В центре поверхности — «мини- макс». 3. Один или несколько (но не все) коэффициентов близки к нулю. При этом центр лежит далеко за областью экспериментирования. По- верхность такого типа называется «возрастающим возвышением» («греб- нем»), 4. Возможен еще вырожденный случай параллельных плоскостей, который не представляет практического интереса (рис. 38, в). При А 22 =0 (рис. 38, г), перенеся начало координат в точку 5 (обычно вблизи центра плана), получаем уравнение параболы; у — Уэ— + А22 Хг- (V.90) Перейдем от уравнения регрессии второго порядка для к=2, полу- ченного по экспериментальным данным У =Ь0 + Ь1х1 + b2x2 -|- b12xtx2 4- ЬцХ? + b22x^ , (V.91) к каноническому уравнению (V.88). Определим координаты точки 5 — центра поверхности. Для этого необходимо решить систему уравнений; ду -^ = 0, 26„ X, + ft12x2 + ft, = 0; (V.92) ду - = 0, 612х, + 2Ь22х2 + Ь2 = 0. дх2 Решение, системы (V.92) дает координаты центра xls и xis. Подставив их в уравнение регрессии (V.91), получим значение выходной величины в точке S-ys. Перенесем начало координат в .точку 5 (у5, х15, х25). Старые координаты хр х2, у связаны с новыми х', х2, у' соотношениями; *1 = *15 + *1 • 199
*2 = *24 + *2 ’ (V.93) У = Ув + у' • В новой системе координат уравнение (V.91) примет вид у — ys = 6U (*]') + Ь2г ( *2 ) +6i2 *1 х2 • На втором этапе преобразования при помощи поворота осей коорди- нат освободимся от эффекта взаимодействия. Для этого необходимо повернуть оси координат на такой угол а, чтобы ctg 2а = (bn — b22)Jb12. (V.94) Тогда получим в новой системе координат X., Х2, у уравнение регрессии в каноническом виде: ?-^ = ХпХ? + Х22 X2 . (V.95) Старые координаты хр х2 связаны с новыми соотношениями *1 — (Х1 + *14) cos а — (Х2 4- *24) sin а, Х2 — (Xi + Xls) sin a + (X2 + x2s) COS а. (V.96) Для определения коэффициентов канонического уравнения Хи и Х.22 воспользуемся следующими двумя инвариантами уравнения (функ- циями коэффициентов, которые не изменяют своего значения при любом преобразовании координат): /1 = 6ц + b22 — const, (V .97) *11 гЬц 1/гЬ12 Ь22 = const. Из (V.95) имеем Ьц + b22 = Xu + Х22, (V.98) ь22 */&ь22 ~ Хц Х22 — 4X^2 . Так как в данном преобразовании Х(2=0, получим соотношения для определения Хц и Х22: Ьц + Ь22 = Хц + Х22, (V.99) ^11 622- ’ Д Ь22 = Хц Х22. Используя теорему Виета, Хц и Х22 можно определить как корни квадратного уравнения: К» - (ftu + ft22) X + (ftu b22 - ’/««>?2) = 0. (V. 100) В многомерных задачах каноническое преобразование осуществляется методами линейной алгебры. Составим из коэффициентов уравнения регрессии второго порядка, полученного по эксперименту, 200
У = Ь» + Ь1Х1 + . . . + ЬкХк + 2*1X2 + • • • + k Xk-1 xk + + ^n*i 4* • •• 4- Ькк xl квадратную матрицу ^12 • • • 1!i blk 1/г^21 &22 ••• Vibtk (V. 101) _ 1/гЬк1 ЧгЬк2 ... Ькк _ в которой Ьл = bjj. Для определения коэффициентов Хц, Xkk уравнения регрессии в каноническом виде (V.88) необходимо найти корни характеристиче- ского полинова Рк ( X) матрицы В: Рк(Х) = \В-\Е\. (V.102) где Е— единичная матрица, или Aji К 1/г^12 — */2^21 Ь22— К ... 1/^Ь2к ^(Х)= . . . (V.103) 1/гЬк1 у!2Ькг ... bkk — \ Ортогональное линейное преобразование для X координат задается системой уравнений: Х1 = т11(хх — хи) + т12(хг — хм) + • •• 4* т1к (хк — хЛ1), Xt = m2i (*1 — Хц) 4* т22 (xg — x2S) 4* • • - 4* т2к (хк — х^), ........................................................ (V. 104) Хк = mki (Х1 — Хи) + тк2 (Xj — xgi) + ... + ткк (хк — xks). Коэффициенты mik являются решениями Xсистем однородных уравнений. Для X, система будет иметь вид (6ц — kj) /пц -|-1/2 Ь12М(2 + ... Ч2 blk ntik = О, : : : (V.105) 1/2^*1я*и + 1/2^k2rt4a+ • • • + (Ькк — kt) mix = 0. Так как решения уравнений лишь пропорциональны тем величинам , которые необходимы для ортогонализации линейного преобразова- ния (V.104), их пересчитывают, принимая во внимание условие орто- гональности; «а 4-т?2 + • • • + = 1. <=1,2,.,., k. (V.106) Вычислив коэффициенты уравнения регрессии в каноническом виде, тем самым определяют тип поверхности отклика. Тип поверхности отклика определяет стратегию поиска экстремума. Если поверхность от- клика представляет собой эллиптический параболоид и Хп<0, Х^СО, 201
в центре поверхности — максимум. Параметр оптимизации при Лц>0 и А.22>0 максимальное значение имеет на границе области исследова- ния. Если поверхность отклика — гиперболический параболоид Л У Уз — Ац — Х22 {V. 107) и определяются условия, обеспечивающие максимальное значение пара- метра оптимизации, задаются значениями у>у5 при Xz =0 и осуществля- ют движение вдоль канонической оси X], имеющей положительный канони- ческий коэффициент. При этом проверяют выполнение ограничения Xj =± а, подставляя значения (V.108) в формулы (V.96). В многомерных задачах поиск оптимальных условий процесса ведут на ЦВМ, используя обычно один из методов нелинейного программиро- вания. Пример 4. Получено уравнение регрессии степени разложения флотационного кон- центрата фосфорита Каратау от температуры и содержащихся в фосфорной кислоте примесей: У = 35,4 + 4,51 хэ — 1,3 х5 — 1,5 4+ 2,66 — 1.47 4 + 1,61 хх х4. Требуется определить условия, соответствующие максимальной степени разложения O'max), при ограничениях, накладываемых сферой с радиусом, равным звездному плечу (табл. 47). Решение. Для определения условий максимальной степени разложения пере- менные, характер1 влияния которых ясен из уравнения регрессии, принимаем равными: хг=+2; xs =-2. Влияние концентрации SOs в фосфорной кислоте представлено в урав- нении положительным линейным и отрицательным квадратичным членами. Оптимальное шачение ха, равное 1,533, определяем из условия экстремального значения г по хз. При этих значениях факторов хз, хз и х5 уравнение регрессии примет вид Л , у = 52,12 — 1 .Sx] + 1,61 хх х4. Приведем это равны; уравнение к каноническому виду. Координаты центра поверхности 5 Л д У —~ = — 1,5-2xj + 1,61 х4 = 0, Л . д у = 1,-61 xi= 0, ох4 хХ5 — 0; х45 — 0, у$ — 52,12. Таким образом, центр поверхности совпадает с центром плана. Характеристический полином Рк (X) = или — 1,5—X 0,805 0,805 .0—X Ph (Х) = Х2+ 1,5X — 0,64== 0. 202
Рис. 39. Гиперболы равного выхода Рис. 40. Поиск экстремума при наличии ограничений Корни полинома Xi —+0,35, Хг — -1,85. Уравнение в канонической форме у — 52,12= 0,35 Х\ - 1,85 X2 . Поверхность отклика — гиперболический параболоид, В сечениях поверхности отклика плоскостями у = const — гиперболы (рис. 39). В центре поверхности — минимакс. Линейное преобразование задается системой: Хг = 0,920 + 0,39 х4, Х4 = — 0,39^+ 0,92 х4. Для определения максимальной степени разложения выходим из минимакса по оси Х\ (коэффициент канонической формы положительный), приравняв Хь нулю: Увеличивая У, проверяем при этом выполнение условий xi = Х4 < 2. Максимальная величина степени разложения получилась равной 53,5% (х, = ±1,82; Х4 = ±0,795). При увеличении у до 54% значение х, > 2. В полученных оптимальных условиях (XI- + 1,82; Х2-+2; «-+1,533; «-+0,795; хв --2) и (эс, —-1,82; хг-+2; «-+1,533; Х4 — -0,795; xs — -2) были поставлены контрольные опыты. Степень разложения полу- чилась соответственно равной 55,8 и 53,7%. Таким образом, расхождения с расчетными лежат в пределах ошибки эксперимента (Sp = V 4,466 = 2,1). Если процесс описывается несколькими уравнениями регрессии, при- ходится решать компромиссную задачу — определять экстремальное значение одной функции отклика при ограничениях, накладываемых другими функциями отклика и границами области исследования (рис. 40). Пусть требуется найти экстремум функции y=f (хь ..., хк), которая зависит от к переменных х^(/-=1, ..., к), связанных в свою очередь соотношениями <ри (*i, ... , *й) = 0, и = 1, ... , т, т < k. (V. 109) Экстремум, который достигается функцией Дх,, ..., хк) с учетом вы- полнения соотношений (V.109), обычно называется условным или от- носительным. Аналитически эта задача поиска условного экстремума решается с применением множителей Лагранжа. Формально задачу 203
отыскания условного экстремума функции f можно свести к определе- нию безусловного экстремума функции Лагранжа: Ф(х, Х) = / (х)+ 2*и<ри(*), (V.110) и=1 рассматриваемой как функция к + т переменных, где неопределен- ные множители Лагранжа. Примером применения неопределенных мно- жителей Лагранжа может служить решение такой компромиссной задачи. В широком диапазоне изменения параметров исследовали процесс кон- версии нитрата кальция и фосфорной кислоты в твердый монокальций- фосфат и азотную кислоту в присутствии w-бутилового спирта. Был реализован ротатабельный план второго порядка и получены уравнения регрессии вида; Л Уу = 60,9 4- 14,5 хх + 3,83 х3 — 4,р9 Xj + 2,14 ххх3 + 2,71 х^+ + 2,21 xxx5 + 1,28 х2х3 — 2,48 х3х4 + 0,68 х^ + 0,68 xf+0,8xj , (V.111) у2 = 1,682 — 0,85 хг + 0,2722 х3 + 0,062 х4 — 0,041 х^ — 0,034 ххх5 + + 0,032 х3х4—0,0235x2 — 0,015xJ , (V.112) где yi — степень конверсии; уч — отношение питательных веществ в удоб- рении в пересчете на Р2 О5 и N (азот); х, — концентрация исходной фос- форной кислоты; продоложительность контакта; х3 — норма фосфор- ной кислоты в растворе; х4 —объемное отношение кислота: спирт; х5 — температура конверсии. С учетом ограничений на независимые переменные, накладываемых первой стадией процесса — кислотного разложения фосфатов; х, =-0,5; х5 = 0, и необходимостью работать с высокой производительностью х2 =0 имеем: = 53,65 + 2,76 х3 + 5,45х42,48 х3 х4+ 0,68 х\ , (V.113) у2 = 2,112 + 0,2722 х3+ 0,083 х4 + 0,032 х3 х4 — 0,0235х| — 0,015 x?j. (V. 114) На соотношения питательных веществ в удобрении по агробиологи- ческим соображениям накладываются ограничения. Необходимо было получить удобрения с одним из следующих соотношений питательных веществ: P2O5:N=1: 1; P2O5:N= 1,5: 1; P2O5:N = 2:1. Причем предпочтительнее всего получить уравновешенное удобрение с соотношением 1:1. С применением неопределенных множителей Лагранжа решалась задача определения значений хэопт и х4"', обеспечи- вающих максимальную степень конверсии с ограничением по соотноше- нию питательных веществ в удобрении. Функция Лагранжа имеет вид Л Л ф =1/х+Х(1/2 —2,112 —0,2722 х3— 0,083х4 — 0,032 х3х4+ + 0,0235x2+ 0,015x2). (V.115) 204
Система уравнений для определения оптимальных режимов: дФ — = 2,76 — 2,48 х4 +А (— 0,2722 — 0,032 х4 + 2-0, 0235 х3) = 0, дх3 дФ — = — 5,45 — 2,48 х3 + 2-0,68 х4 + X (— 0,083 — 0,032 х3 + дх4 + 2-0,015х4)= 0, (V.116) дФ Л — = у2 —2,112 — 0,2722 х3 — 0,083 х4 — 0,032 х3 х4 + дк + 0,0235х2_|_0,015Л2= 0. Система (V.116) решалась на ЦВМ при ограничениях на х3 и х4, накладываемых областью исследования: х3 = ± а =±2их4=± а =±2; 1) у2 = 1 :1; 2) у2 = 1,5 :1; 3) у2 = 2 :1. Оказалось, что внутри исследован- ной области можно получить только удобрения с соотношением пита- тельных веществ 1,5 :1 и 2 :1. В результате расчета имеем: у”ах= 72,63% и у2 = 2,03 при Хз" =0,7 и х^1" =-2,0; у™* = 54,05% и у2 = 1,46 ’при х§П1=-1,7 их4о,,т =-2,0. При определении оптимальных условий процесса иногда возможна некоторая экстраполяция за границы области исследования. Во всех случаях требуется экспериментальная проверка найденных расчетом опти- мальных условий процесса. 9. Функция желательности. Задачу оптимизации процессов, характе- ризующихся несколькими откликами, обычно сводят к задаче оптимиза- ции по одному критерию с ограничениями в виде равенств или нера- венств. В зависимости от вида поверхности отклика и характера ограни- чений для оптимизации предлагается использовать методы неопреде- ленных множителей Лагранжа, линейного и нелинейного программиро- вания, ридж-анализ и др. К недостаткам этих способов решения задачи оптимизации следует отнести вычислительные трудности. В частности, при описании поверхности отклика полиномами второго порядка реше- ние задачи на условный экстремум с применением неопределенных множителей Лагранжа приводит к необходимости решать систему не- линейных уравнений. Поэтому одним из наиболее удачных способов решения задачи оптимизации процессов с большим количеством от- кликов является использование предложенной Харрингтоном в качестве обобщенного критерия оптимизации так называемой обобщенной функции желательности D. Для построения обобщенной функции желательности D предлагается преобразовать измеренные значения откликов в безраз- мерную шкалу желательности d. Построение шкалы желательности, которая устанавливает соотношение между значением отклика у и соот- ветствующим ему значением d (частной функцией желательности), явля- ется в своей основе субъективным, отражающим отношение исследова- теля (потребителя) к отдельным откликам. , Для построения шкалы желательности удобно использовать метод количественных оценок с интервалом значений желательности от нуля до единицы, хотя возможны и другие варианты шкалы. Значение d = Q 205
(или D = 0) соответствует абсолютно неприемлемому значению данного отклика; a d = l (D — 1) — самому лучшему значению отклика, причем дальнейшее улучшение его или невозможно, или не представляет инте- реса. Промежуточные значения желательности и соответствующие им числовые отметки приведены в табл. 48. Таблица 48 Базовые отметки шкалы желательности Количественная отметка на шкале желательности Желательность значения отклика 0,80 1,00 0,63+0,80 0,37 + 0,63 0,20 + 0,37 0,00 + 0,20 Очень хорошо Хорошо Удовлетворительно Плохо Очень плохо Такой выбор числовых отметок объясняется удобством вычислений, поскольку 4=0,63®!-—, а 4=0,37®— . (V.117) е е Построенная в соответствии с табл. 48 шкала d представляет собой безразмерную шкалу, при помощи которой любой отклик может быть преобразован так, чтобы его можно было интерпретировать в терминах полезности или желательности для любого специфического применения. Простейшим типом преобразования служит такое, в котором существу- ет верхний и (или) нижний пределы спецификации, причем эти пределы являются единственным и не допускающим изменений критерием ка- чества. Вне этих пределов значение d = Q,O, между ними значение rf==l. Частная функция желательности при одностороннем ограничении (рис. 41, а) имеет вид | 0, У < t/min 4= (V.118) I 1> У !/min Рис. 41. Простейший вид част- ной функции желательности У mln Утах У Рис. 42. Функция желательности для двустороннего ограничения 206
Аналогичным образом получается частная функция желательности, если спецификация задает ограничение сверху. Если для данного свой- ства существует двустороннее ограничение (рис. 41, 6), то (О, У<Ут1п И у > Утах d=J I 1 • Ут1п Утах (V. 119) Всегда желательно, чтобы значение отклика находилось не только между пределами спецификации, но и на определенном расстоянии от них, чтобы противостоять присущим производственному процессу случайным колебаниям. Кроме того, довольно трудно бывает провести точную пограничную линию между приемлемой и неприемлемой про- дукцией. Поэтому в общем случае преобразование у в d осуществляется по более сложным законам. Для двустороннего ограничения вида Ут in У Утах преобразование измеренного отклика у в шкалу d (рис. 42) производится при помощи выражения 6=ехр[— (|у'|)л]. (V.120) где п — положительное число (0<и<°°), не обязательно целое; у><== 2У - (Утах + Уты).. (V ,121) Утах Ут1п показатель степени п можно вычислить, если задать некоторому значе- нию у значение d (предпочтительно в интервале 0,6 < d <0,9) по фор- муле In In \/d ln|y'| (V.122) Задавая при помощи контрольной точки крутизну кривой желатель- ности, можно учесть особую важность отдельных свойств; для них п будет иметь большее значение, и малому изменению свойства вблизи ограничивающих пределов будет соответствовать резкое изменение желательности. Показатель степени п определяет наклон кривой, и когда п становится большим, кривая прибли- жается к своей предельной форме (см. рис. 41,6): d = 0 вне пределов специфика- ции и 6=1,0 между этими пределами. Если нет спецификации, целесообразно дать статистическую оценку п по ряду значений у и соответствующих 6. Для односторонних ограничений вида у^Утах или y>ymin более удобной формой преобразованияувбслужит другая экспоненциальная зависимость (рис. 43): Рис. 43. Функция желательности для свойства, ограниченного с d = ехр [—ехр (—у')]. (V.123) одной стороны 207
В выражении (V.123) у’ = <’в + М- (V. 124) Коэффициенты Ьо и Ь\ можно определить, если задать для двух значений свойства у соответствующие значения желательности d предпочтительно в интервале 0,2 < rf<0,8. Нелинейное преобразование у в / применяется, если данное свойство имеет особую важность; нарушение ограничивающих условий недопустимо, и малому изменению свойства вблизи ограничивающего предела соответствует резкое изменение желательности. Односторонняя спецификация наиболее часто встречается на практике. Имея несколько откликов, преобразованных в шкалу d, можно при помощи арифметических операций скомбинировать из этих различных d некий обобщенный показатель желательности D. При этом, если какой-либо один отклик является абсолютно неудовлетво- рительным, обобщенная функция желательности D должна быть рав- на 0 независимо от уровня остальных откликов. Математическим выражением, отвечающим этим требованиям, служит среднее геометри- ческое частных функций желательности, т. е. D = y/'d1 d2...dk. (V. 125) Очевидно, что если какое-либо одно =0, то соответствующее 7)=0. Более того, на D сильно влияют именно наименьшие значения </,. В то же время D = 1 только тогда, когда все частные желатель- ности d,= l(i = l,2,...,k). Важно еще то, что (V.125) позволяет приме- нить к частным желательностям и обобщенному показателю единый способ задания базовых отметок шкалы желательности, представленный в табл. 48, так как если di = di =...= dk =0,37, то и 7)=0,37 и т. д. С обоб- щенной функцией желательности D можно проделывать все вычисли- тельные операции, как и с любым откликом системы, можно исполь- зовать D в роли критерия оптимизации при исследовании и оптими- зации процесса (см. пример 6). Следует иметь в виду, что множество возможных значений D ограничено: 7)^1. Очень эффективным оказалось применение обобщенной функции желательности при раз- работке рецептур и технологии получения новых полимерных мате- риалов. Пример 5. Латинский куб второго порядка был применен при разработке композиции нового полимерного материала на основе полиэтилена высокого давления (см. с. 112). В качестве откликов были использованы: у, — модуль упругости при изгибе, мПа; уг — разрушающее напряжение при разрыве, мПа; уз — относительное удлинение при разрыве, %; D — обобщенная функция желательности. Покажем последовательность расчетов при определении D. Решение. Для сравнительной оценки качества различных композиций обобщенную функцию желательности определяли по формуле О= У d, d2 d3 , (V.126) где di, d? и — частные функции желательности. Для построения частных функций желательности необходимо сначала установить преобразование измеренных свойств у в безразмерную равномерную шкалу у'. Ограни- чения при этом носят характер yjiymin. Разрабатываемый материал должен удовлетво- 208
рять заданным требованиям по трем показателям качества, которые предусматривают пригодность его к переработке и эксплуатации. Исходя из этих требований, были выбраны значения у,. уз и уз, соответствующие двум базовым отметкам на шкале желательности (см. табл. 48). Преобразование отклика у в частную функцию желательности имеет вид (V.123). Коэффициенты Ьо и Л, определялись по данным таблицы. лПа Л мПа Уз % Значение свойств Числовые отметки по шкале желатель- 430 320 ПО 60 200 100 ности d 0,63 0,2 0,63 0,2 0,63 0,2 Подставим значения d в уравнение (V.123): 0,63 =ехр [—ехр (—/)] и 0,2 = exp [—exp (—t/')], (V. 127) 1/0,63 = 1,587 = ехр [ехр (—/)] и 1/0,2 = 5 = ехр [ехр (—у')]. Дважды логарифмируя выражения (V.127), получим — у' = In (In 1,587) и — у' = In (In 5), или — / = —0,755 и — / = 0,326. (V.128) Тогда 60 +430 i>i = 0,755, (V.129) 60 4- 320 61 = — 0,326. Решение системы (V.129) дает ii — 0,0098, io — 3,445. Таким образом, частная функция желательности имеет вид di = exp[—exp(—3,445 4-0,0098i/i)]. (V.130) Аналогично получены частные функции желательности di и 4з: d2 = ехр [— ехр(— 1,45 4- 0,02 у2)], , , (V.131) d3 = ехр [— ехр (— 1,25 4- 0,01 у3)], Для всех композиций (таблица) частные функции желательности можно определять по формулам (V.130), (V.131) или по рис. 44. Номер КОМПО- ЗИЦИИ 4. </2 43 D Номер компо- зиции 4, </2 4Э D 1 0,410 0,67 0,97 0,645 15 0,260 0,49 0,95 0,491 2 0,420 0,67 0,98 0,647 16 0,720 0,71 0,91 0,773 3 0,423 0,55 0,96 0,610 .17 0,850. 0,62 0,29 0,535 4 0,730 0,75 0,96 0,810 18 0,630 0,78 0,93 0,768 5 0,419 0,68 0,97 0,650 19 0,930 0,57 0,17 0,210 6 0,270 0,63 0,97 0,550 20 0,930 0,72 0,07 0,350 7 0,640 0,53 0,97 0,686 21 0,890 0,52 0,64 0,668 8 0,370 0,71 0,98 0,638 22 0,917 0,64 0,06 0,430 9 «,371 0,71 0,97 0,638 23 0,790 0,45 0,08 0,304 10 0,740 0,63 0,92 0,759 24 0,760 0,64 0,30 0,530 11 0,720 0,53 0,73 0,650 25 0,930 0,53 0,08 0,340 12 0,760 0,31 0,24 0,381 26 0,920 0,57 0,17 0,445 13 0,780 0,55 0,93 0,732 27 0,870 0,68 0,71 0,749 14 0,860 0,58 0,17 0,440 209
500 400 500 600 ~yf 60 80100120140)60 уг )00 150 200 250 500 350 у5 Рис. 44. Функция желательности Обобщенная функция желательности (таблица) определена по формуле (V.126) и имеет вид D = ехр |— -у- | ехр (— 3,445 4- 0,0098 yj 4- +ехр (— 1,45 "4 0,02 z/2) 4“ ,, (V. 132) 4- ехр (—.1,25 4- 0,01 у3) Н . Наибольшее значение обобщенной функции желательности получено в четвертом опыте (Z) — — 0,810). Хорошие композиции получены также в опытах 10, 13, 16, 18 и 27. Оптимальный состав композиции по обобщенной функции желазель- ности выбран после проведения факторного и дисперсионного анализа. Пример 6. Обобщенная функция желательности была использована в задаче моделирования и оптимизации процесса кристаллизации полутидрага сульфата кальция в условиях получения зкстракционной фосфорной кислоты. Полугидратный процесс позволяет получить без дополнительной упарки кислоту концентрацией 40—50% Р2О5 и значительно увеличить производительность действующих цехов, работающих в дигидратном режиме без введения дополнительных производствен- ных мощностей. Разложение апатитового концентрата идет по реакции Cal0 F2 (РО4)в 4- 10H2SO4 4- 2,5Н2О -► 6Н3РО4 4- 10CaSO4- 0,5Н2О 4- 2HF Лимитирующей стадией производства фосфорной кислоты полугидратным способом явля- ется процесс кристаллизации полугидрата сульфата кальция. Необходимо получить крупные, хорошо фильтрующиеся, стабильные в течение длительного времени кристаллы полугидрата. Проведение процесса кристаллизации в неоптимальных условиях ведет к снижению про- изводительности фильтра и к увеличению потерь Р2О5. Оптимальные условия процесса кристаллизации различны для разных видов фосфатного сырья. Решение. В лабораторных условиях исследовалось влияние на процесс кристалли- зации полугидрата сульфата кальция температуры и состава раствора (концентрации фос- форной кислоты и содержания в ней примесей РегОз, АЬОз. SiFe , SO4 ). В качестве физической модели, имитирующей кристаллизацию полугидрата сульфата кальция в про- цессе получения экстракционной фосфорной кислоты непрерывным способом, выбран процесс дегидратации реактивного гипса в растворах фосфорной кислоты различной концентрации, содержащих примеси серной и кремнефтористоводородной кислот, а также фосфаты алюминия и железа. В процессе фазового превращения дигидрат вначале растворялся, а затем в осадок с различной скоростью выделялись кристаллы полугидрата, которые- при своем формировании захватывали фосфат-ионы. Размер кристаллов и фильтруемость пульпы также связаны с условиями кристаллизации. Гипс растворяется с достаточно большой скоростью, и лимитирующей стадией в процессе является стадия образования и роста кристаллов полугидрата сульфата кальция. Показателями процесса служили следующие параметры: у, — скорость кристаллиза- ции, характеризующаяся степенью перехода CaSCh • 2Н2О в CaSCh • 0,5НгО, %; у? — время фильтрования, с; уз — захват фосфат-ионов, % Р2О5; уз — размер кристаллов полугидрата, мкм. Факторы и диапазоны их изменения приведены в таблице: SO4, % z, SiFe, % Z2 AI2O3, % P2O5, % T, °C Z5 Fe2O3, % ze Центр плана z9 2,50 0,75 ' 1,35 46,5 95 1 Интервал варьирования Azy 1,32 0,38 0,34 3,96 5 0,52 Xj ~ +1 3,82 1,15 1,70 51,46 100 1,53 Xj “ -1 1,18 0,35 1,00 43,54 90 0,48 Xj -+1,895 5,00 1,50 2,00 55,0 105 2 xj --1,895 0 0 0,70 40,00 85 0 210
В качестве плана эксперимента выбран ортогональный план второго порядка. Па- раметры плана: к — 6; «о — 4; N — 26-1 + 2 • 6 + 4 — 48. Величина звездного плеча а опре- делена по уравнению (V. 54): а4 + 2S"'a2 - 26~2(6 + 0,5 4) — 0. Отсюда а2 — 3,6; а — 1,895. Безразмерные переменные xj связаны с размерными zj линейным преобразованием (V.3). Опыты проводили в термостатированном лабораторном реакторе (F— 250 мл) с об- ратным холодильником и лопастной мешалкой. К раствору фосфорной кислоты с опре- деленным содержанием примесей (HjSiFe, H2SO4, AI2O3, РезОз), нагретому до темпера- туры опыта, при перемешивании добавляли CaSCH • 2Н2О. Номер опыта XI х2 хэ х4 ^5 хе 1 +1 +1 +1 +1 +1 +1 2 -1 -1 +1 +1 +1 +1 3 -1 +1 +1 +1 +1 -1 4 +1 -1 +1 +1 +1 -1 5 +1 +1 -1 +1 +1 -1 6 -1 -1 -1 +1 +1 -1 7 -1 +1 -1 +1 +1 +1 8 +1 -1 -1 +1 +1 +1 9 +1 +1 +1 -1 +1 -1 10 1 -1 +1 -1 +1 -1 11 -1 +1 +1 -1 +1 +1 12 +1 -1 +1 -1 +1 +1 13 +1 +1 -1 -1 +1 +1 14 -1 -1 -1 -1 +1 +1 15 -1 +1 -1 -1 +1 -1 16 +1 -1 -1 -1 +1 -1 17 +1 +1 +1 +1 -1 -1 18 -1 -1 +1 +1 -1 -1 19 -1 +1 +1 +1 -1 +1 20 +1 -1 +1 +1 -1 +1 21 +1 +1 -1 +1 -1 +1 22 -1 -1 -1 +1 -1 +1 г. 5 -1 +1 -1 +1 -1 -1 24 +1 -1 -1 +1 -1 -1 25 +1 +1 +1 -1 -1 +1 26 -1 -1 +1 -1 -1 +1 27 -1 +1 +1 -1 -1 -1 28 +1 -1 +1 -1 -1 -1 29 +1 +1 -1 -1 -1 -1 30 -1 -1 -1 -1 -1 -1 31 -1 +1 -1 -1 -1 +1 32 +1 -1 -1 -1 -1 +1 33 +1,895 0 0 0 0 0 34 -1,895 0 0 0 0 0 35 0 +1,895 0 0 0 0 36 0 -1,895 0 0 0 0 37 0 0 +1,895 0 0 0 38 0 0 -1,895 0 0 0 39 0 0 0 +1,895 0 0 40 0 0 0 -1,895 0 0 41 0 0 0 0 +1,895 0 42 0 0 0 0 -1,895 0 43 0 0 0 0 0 +1,895 44 0 0 0 0 0 -1,895 45 0 0 0 0 0 0 46 0 0 0 0 0 0 47 0 0 0 0 0 0 48 0 0 0 0 0 0 211
Результаты эксперимента приведены в таблице. Результаты эксперимента Номер опыта У, -Тз >4 Номер опыта У, ^’э л 1 99,1 200 4,08 8,0 25 85,9 61 1,64 117 2 95,8 137 2,45 11,4 26 85,0 30 130 13,5 3 90,1 120 1,69 10,0 27 51,0 45 1,20 16,2 4 93,0 103 0,90 11,5 28 89,0 31 1,79 16,4 5 98,6 65 1,39 11,1 29 86,9 16 0,25 14,0 6 89.2 44 1,97 13.8 30 86,6 25 1,68 15,2 7 84,3 115 2,83 6,1 31 25,3 27 0,40 14,1 8 96,6 120 2,06 12,8 32 90,4 30 1,00 14,1 9 86,1 56 3,04 11,2 33 96,7 41 2,80 14,6 10 85,2 31 0,68 14,2 34 59,4 40 3,30 16,3 11 57,3 65 0,04 9,8 35 80,5 59 2,0 13,6 12 95,1 43 0,31 9,1 36 99,3 27 2,07 13,0 13 89,7 28 2,50 12,4 37 94,0 86 2,50 15,4 14 88,7 21 ЛЮ 14,2 38 88,9 14 1,20 18.6 15 73,6 31 0,40 6,2 39 95,9 i90 3,10 13,5 16 93,2 24 1,03 14,6 40 72.0 17 1,80 22,4 17 92,7 176 3,88 12.1 41 99,3 30 1,60 14,2 18 88,3 109 5,75 9,3 42 88,6 60 2,12 14,2 19 80,1 245 4,72 9,5 43 86,3 80 1,65 15,5 20 94.5 200 4,10 12,4 44 87,0 22 0,60 16.4 21 89,9 157 2,58 8,9 45 93,0 41 2,35 16,8 22 80,3 150 5.00 12,1 46 96,3 60 1,72 13,2 23 84,5 67 1,80 13,3 47 96,8 61 2,30 15,3 24 95,4 64 1,10 13,2 48 86,5 41 1.69 15,0 На основании обработки экспериментальных данных, отсева незначимых коэффициентов по критерию Стьюдента получены следующие уравнения регрессии: У! — 89,4 4- 9,3 хх —-6.5х2 + 7,0 х4 + 4,5 х5 — 5,1 Д -J- б.б.^Хг— — 5,4 xt х4 + 5,9 х2 х4 + 3,9 *з хв, у2 = 56,5 9,5 л-.. 20,5*3+ 46,8 *4 — 7,4 *5 4- 18,9 х., 4- 8,0 *2*3 + -4- 10,9 *3 *4 — 9,3 *4 *5 + 16,6 *4 *в !- 20,2 *2 ; у3 = 1,78+ 0.32*з + 0,32 — 0,30 х5 + 0,30 *„ + 0,50 *4 х2 + 0,16*4*3 — -0,28*4*4+ 0,30*4*5-;- 0,18*2*з +0,32 х2 *5 + 0,23 х3х4 —0,39 х3х6 — — 0,25 *3 *в -- 0,36 х4 *ь + 0,29 *4 *в +0,33 + 0,22 — 0,22 *|; 1/4 = 16,5 — 0,8 *2 — 0,8 *5 — 1 ,3 *4 — 0,6 *в — 0,7 *2 Xg— — 0,8 х* — 1,4 х$ — 1,1 х? — 0,7 х? . 212
Проверка по критерию Фишера показала, что полученные уравнения адекватно описывают эксперимент. Уравнения для - у4 позволяют рассчитать значения выбранных показа- телей процесса при любом сочетании изученных факторов в исследованном диапазоне. Результаты таких расчетов приведены на рис. 45—51. На рис. 45 показана зависимость скорости кристаллизации полугидрата (yi) от концентрации иона SO?’ в различных условиях ведения процесса. Зависимость yi от концентрации SO? имеет экстремальный Рис. 45. Зависимость скорости кристалли- зации полугидраза сульфата кальция от концентрации SO? в растворе при раз- личных условиях.- 1 - значения всех переменных соответствуют центру плана: РгОк - 47,5%; SiFg’ “ 0.75%; AhO? - 1,35%; РегОз — 1% температура 95°- 2 - 1,5% SiF2-; 3 ~ 105°С; 4 - нет Fe2O? и 0.7% А1гОэ; о6- 55% Р2О5; значения остальных переменных для кривых 2, 3, 4. 5 соответ- ствуют цен।ру плана Рис. 46. Индивидуальное влия- ние факторов на скорость крис- таллизации полугидрата: 1 - SiFs '; 2 - AhO3 (0% Fe2O3); 3 - Р2О5: 4 - температура; 5 — Ре20з (0.7% AI2O3). Значения осталь- ных парныегров соотвезствуюз цент- ру плана характер. При этом положение и величина экстремума (максимума) зависит от прочих условий проведения процесса кристаллизации полугидрата (температуры, концентрации Р2О5, содержания примесей SiFe ~, AI2O3 и Р'егОз). Отсутствие в уравнении эффектов взаимодействия между содержанием SO?’ и температурой, а также содержанием SO? и попутных оксидов приводит к тому, чю увеличение температуры и содержания R2O3 изменяет только абсолютную величину максимума. Наличие эффекта взаимодействия между концентрацией Р2О5 и SO?’ обусловливает не только изменение величины экстремума, но и сдвиг максимума в область более низких значений So? (кривая На рис. 46 приведены кривые, характеризующие индивидуальное влияние факторов (хг - се) на скорость кристаллизации полугидрата при значениях остальных независимых переменных, соответствующих центру плана. Из рисунка следует, что с увеличением концентрации фосфорной кислоты скорость процесса кристаллизации полугидрата увели- чивается, а с увеличением концентрации кремнефтористоводородной кислоты — умень- шается. При увеличении концентрации одного из полуюрных оксидов в отсутствие другого в растворе скорость кристаллизации полугидрата уменьшается. Однако из урав- нения для у] следует, что при одновременном присутствии в растворе обоих оксидов отрицательное влияние каждого из них уменьшается и при определенной концентрации одного из них сходит на нет Повышение температуры приводит к увеличению скорости процесса На рис. 47 представлены графики зависимости продолжигельиости фильтрации образовавшейся пульпы (у2, с) от условий процесса кристаллизации, Из рис, 47 следует, что наибольшее отрицательное влияние на процесс фильтрации оказывает повышение концентрации фосфорной кислоты (кривая 5), так как при этом увеличивается не только вязкость раствора, но уменьшается н размер кристаллов полугидрата, кристаллизую- щихся из этого раствора. Возрастание содержания AI2O3, РезОз и SiFe” повышает вяз- 213
О ------1------1-----1— 40 45 50 55 —,_______ 0,5 1 , 1,5 2 I I Si Рр ’ ^3’ % 80 85 90 95 100 105 1,°С Рис. 47. Влияние температуры и состава раствора на продол- жительность фильтрации пульпы; 1 — температура; 2 — SiF^,- 3 - FeaOa; 4 - AI2O3; 5 - РгОзсвоб . Значения остальных параметров соответствуют центру плана кость раствора, что увеличивает продолжительность фильтрации (кривые 4, 3, 2). Напротив, - повышение температуры (кривая 1) уменьшает вязкость и, соответ- ственно, сокращает время фильтрации. На рис. 48 изображены графики взаимодействия между концентрациями А12О3 и SiFg ~ в растворе: при концентрациях А12О3 до 1% с увеличением содержа- ния иона SiFs- скорость фильтрации возрастает; при концентрациях А12О3 1—2% с увеличением содержания SiF2 - скорость фильтрации снижается. Таким образом, положительное влияние совместного присутствия в растворе ионов А13 + и SiFj _ в условиях производства фосфорной кислоты полугидратным способом ограни- чено небольшим интервалом концентраций. На рис. 49 представлены графики зависимости за- хвата фосфат-ионов осадком полугидрата (уз, %) от состава раствора и температуры. Зависимость содер- жания Р2О5 в полугидрате от ионов SO42 _ в при- сутствии примесей R2O3 и SiFe2 - имеет экстремальный характер. Положение и величина экстремума (мини- мума) определяется температурой и концентрацией примесей (рис. 49). На рис. 50 показано индивидуальное влияние примесей SO, (кривая /), SIFg (кривая 2) и А12О3 (кривая 3) на величину захвата Р2 О, полугидра- том, кристаллизующимся из раствора фосфорной кис- лоты, содержащей 40% Р2 О5 и 0,7% А12О3 при темпера- туре 90°С. В отсутствие примесей Fe2C)3, SiF2 и ма- лом содержении А12О3 (0,7%) повышение концентрации SOJ- в растворе приводит "к плавному снижению потерь Р2 О5 (кривая /). В указанных условиях увеличение содержания SiF2- в изучен- ных пределах резко снижает потери Р2 О5 (кривая 2), что, по всей вероятности, связано с образованием нерастворимого в концентрированных фосфорнокислотных рас- творах кремнефторида кальция и появлением в жидкой фазе соответствующего коли- п U---1---1---1---1---1— 0 1 2 3 9 5 S0£',% Д1203,% Рис. 48. Влияние содержания АЬОз и SiFe" на продолжи- тельность фильтрации пульпы,- 1 - 0% SiFg-,- 2 - 0,75% SiF2~- 3 - 1,5% SiF=- Рис. 49. Влияние температуры и со- става раствора на величину захва- та Р2О5: 1 — центр плана; 2 — 55% Р2О5; 5 — 2% А12О3;4— 1,5% А12О3; 5 — 105°С. Значения остальных факторов соответствуют центру плана чества ионов SO?" Присутствие, примесей в растворе влияет на диссоциацию фосфор- ной кислоты. В этом растворе фосфат-ионы, по-видимому, находятся в виде комплексных соединений с примесями. Степень диссоциации таких комплексных соединений зависит 214
Рис. 51. Индивидуальное влияние фак- торов на размер кристаллов полу- гидрата-. I — Sib?'- 2 - РегОз- 3 - температура; 4 — РгОвсвоб; 5 - SO?'; значения осталь- ных параметров соответствуют центру плана Рис. 50. Индивидуальное влияние факторов на величину захвата Р2О5: 1 ~ SO?- 2 - SiFg-,- 3 - АЪОз,- 4 - Р-Аевоб, значения постоянных параметров соответствуют минимальным величинам (40% Р2О5 своб ; 0,7% Д120з; нет SOJ-, SiF|‘, AI2O3) при 90°С; 5 - тем- пература; 6 — АЬОз; значения остальных факторов при построении кривых 5, 6 соответствуют центру плана не только от температуры, но и от соотношения компонентов в растворе. Такое пред- положение позволяет объяснить наличие в уравнении для уз эффектов взаимодействия между температурой и содержанием SO?', SiF?', АЪОз, РгОв и между содержанием компонентов в растворе SO? - АЪОз; SO?' - Р2О5; SiF?' - АЪОз; АЪОз - РгОв; АЪОз - —Fe2O3;P2O5 - Fe2O3. На рис. 51 представлены графики зависимости размера кристаллов от состава и температуры. В исследованном диапазоне изменения факторов образуются игольчатые кристаллы полугидрата, поэтому длина кристаллов характеризует их размер. Среднее значение длины кристаллов (ув, мкм) определялось для каждого опыта усреднением длин 200—300 кристаллов. Из рис. 51 следует, что в растворе, состав которого соот- ветствует центру плана, при повышении концентрации фосфорной кислоты размер кристаллов уменьшается (кривая 4)\ по всей вероятности, это связано с увеличением скорости кристаллизации полугидрага (см. рис. 46, кривая 5). Зависимость размера кристаллов от концентрации SO?' носит экстремальный характер (кривая 5). В интер- вале от 0 до ~0,6% SiF?' повышение концентрации кремнефтористоводородной кислоты приводит к увеличению растворимости CaSO4 • 0,5ЪЪО, уменьшению скорости кристалли- зации полугидрата (см. рис. 46, кривая 1) и увеличению размера кристаллов. При даль- нейшем повышении концентрации SiF?' возможна кристаллизация мелких кристаллов кремнефторида кальция на поверхности кристаллов полугидрата и торможение их роста. Аналогичным образом повышение концентрации регОз в растворе приводит к умень- шению скорости кристаллизации полугидрата (см. рис. 46, кривая 5), в результате этого размер кристаллов полугидрата несколько увеличивается (кривая 2). При дальнейшем увеличении концентрации РегОз часть его выпадает в осадок, что приводит к тормо- жению процесса диффузии ионов Са2+ и SO? к поверхности растущих кристаллов полугидрата. Зависимость размера кристаллов от температуры носит экстремальный ха- рактер: повышение температуры приводит к росту скорости диффузии, что облегчает рост кристаллов, однако увеличение скорости кристаллизации полугидрата (см. рис. 46, кривая 4) влечет за собой осаждение мелких кристаллов (кривая 5). 215
Полученные уравнения регрессии для у, - yt были использованы для решения за- дачи оптимизации процесса кристаллизации полугидрата сульфата кальция. Анализ пара- метрической чувствительности процесса показал (рис. 45—51), что характер влияния регулируемых факторов (концентрации SOJ , Р2О5 и температуры) существенно различен. Как уже отмечалось (с. 205), одним из наиболее удачных способов решения задачи оптимизации процессов с большим количеством откликов, лишенным вычислительных трудностей, является использование предложенной Харрингтоном так называемой обоб- щенной функции желательности О в качестве обобщенного критерия оптимизации. Для построения обобщенной функции желательности D необходимо преобразовать измеренные значения откликов в безразмерную шкалу желательности d. Построение шкалы желатель- ности устанавливает соотношение между значением отклика у и соответствующим ему значением d (частной функцией желательности). В нашем случае имеют место односторонние ограничения на выходные параметры вида у<утах или у>ут;п. Удобной формой преобразования у в d служит экспонен- циальная зависимость (V.123): коэффициенты io и i, можно определить, если задать для двух значений свойства у соответствующие значения желательности d предпочти- тельно в интервале 0,2<d<0,8. Для определения Ьо и i, был использован следующий прием; худшему значению отклика, полученному по матрице планирования (см. табл, на с. 212). присваивается значение желательности, равное 0,2, а лучшему значению свойства, определенному по соответствующему уравнению регрессии методом нелиней- ного программирования в области исследования, присваивается значение желательности, равное 0,8. Согласно (V.123) имеем: 0,8=ехр[—ехр(—£/')]• отсюда у‘= 1,51; 0,2 = ехр [— ехр (— /)], отсюда у' = — 0,46. Согласно (V.124) система уравнений для определения Ьо и bi для скорости кристалли- зации (у,) имеет вид 1,51 =60+ 99,8*1, — 0,46= 60+ 25,3*1, где 99,8 — лучшее значение отклика (%), полученное в результате решения задачи опти- мизации для yi; 25,3 — худшее значение (%) полученное в 31-м опыте Отсюда io — -1 08- 61 - 0,026. Аналогичным образом для времени фильтрования, уз: 1,51 = 60+5,3 6!, — 0,46= 60 + 24561, где 5,3 — лучшее значение времени фильтрования (с); 245 — худшее значение времени фильтрования (с), полученное в 19-м опыте. Отсюда io — 1,553; ii = -0,008. Для уз — захвата фосфат-ионов: 1,51 =60 + 0,0276!, —0,46 = 6,+ 5,75 61, где 0,027 — лучшее значение для уз (%); 5,75 — худшее значение для уз (%). Отсюда io — 1,519; ii-0,34. Для размера кристаллов уд, мкм: 1,51 = 60 + 19,261, — 0,46 = 60 + 6,1 6Х, где 19,2 — лучшее значение уд (мкм); 6,1 — худшее значение уд (мкм), полученное в 7-м опыте. Отсюда Ьо — -1,37; ii — 0,15. Частные функции имеют вид di = ехр [— ехр (— 1,08+ 0,026i/J}, = ехр [— ехр (1,553 — 0,0081/2)], d3 = ехр [—ехр (1,519— 0,34(/3)], ^4= ехр [—ехр(1 ,37+ 0,15 i/4)]. Значения частных функций желательности для всех точек плана, определенные по этим формулам, приведены в таблице. 216
Номер опыта 4 d2 ^3 dA D Номер опыта d} 'ft D 1 0,800 0,330 0,410 0,300 0,43 25 0,730 0,705 0,690 0,540 0,66 2 0,780 0,440 0,600 0,490 0,57 26 0,721 0,765 0,615 0,590 0,67 3 0,745 0,475 0,690 0,420 0,57 27 0,450 0,740 0,740 0,700 0,65 4 0,760 0,510 0,730 0,490 0,61 28 0,750 0,760 0,665 0,710 0,72 5 0,790 0,690 0,710 0,470 0,65 29 0,731 0,790 0,780 0,610 0,72 6 0,750 0,740 0,660 0,602 0,68 30 0,730 0,775 0,690 0,670 0,72 7 0,720 0,580 0,560 0,205 0,46 31 0,200 0,770 0,775 0,610 0,52 8 0,780 0,475 0,650 0,541 0,60 32 0,750 0,765 0,730 0,610 0,71 9 0,730 0,715 0,535 0,473 0,60 33 0,780 0,750 0,575 0,640 0,68 10 0,721 0,760 0,765 0,620 0,71 34 0,450 0,749 0,490 0,710 0,59 11 0,510 0,690 0,795 0,410 0,58 35 0 690 0,710 0,655 0,600 0,66 12 0,780 0,745 0,775 0,360 0,64 36 0800 0,700 0,680 0,560 0,69 13 0,750 ft 770 0,610 0,532 0,66 37 0,770 0,600 0,610 0,671 0,66 14 0,740 0,780 0,650 0,620 0,70 38 0,750 0,710 0,740 0,781 0,74 15 0,650 0,760 0,775 0,200 0,53 39 0,780 0,350 0,520 0,590 0,54 16 0,760 0,775 0,730 0,640 0,73 40 0,640 0,790 0,695 0,870 0,74 17 0,759 0,375 0,430 0,530 0,50 41 0,800 0,765 0,695 0,610 0,71 18 0,740 0,495 0,200 0,300 0,41 42 0,740 0,710 0,640 0,610 0,67 19 0,690 0,200 0,330 0,380 0,37 43 0,730 0,621 0,690 0,680 0,68 20 0,771 0,330 0,410 0,530 0,49 44 0,740 0,780 0,765 0,710 0,75 21 0,750 0,410 0,590 0,350 0,50 45 0,770 0,750 0,620 0,730 0,72 22 ft 690 0,425 0,285 0,511 0,46 46 0,780 0,710 0,680 0 550 0,67 23 0,720 0,685 0,670 0,550 0,65 47 0,781 0,705 0,620 0,670 0,69 24 0,780 0,690 0,750 0,549 069 48 0,730 0,750 0,690 ft 660 0,71 Обобщенная функция желательности D определена по формуле 4 /------------------- D == у/ d-^ d% dg d^ и приведена в последнем столбце таблицы. По этим данным находим уравнение рег- рессии обобщенной функции желательности D от изученных факторов: D = 0,62+ 0,022 хх — 0,027 х2 —0,024 х3 — 0,057 х4 —0,032 хв — 0,013ххх3 — — 0,014 ххх5 + 0,045 хх хв — 0,015 х2 х5 — 0,022 х3 х4 + 0,012 х3 хв + + 0,023 х4х5 +0,041 х4 хв— 0,029x2-0,016x2 —0,027x2 —0,012х? Полученное уравнение регрессии для О было использовано, для определения опти- мальных условий процесса кристаллизации, соответствующих максимальному значению D. Для выяснения предельных возможностей процесса на первом этапе задача решалась во всем диапазоне изменения факторов. В результате получено Отах “0,86 при хх = — 0,69, х2 = — 0,705, х3 = — 1,895, х4 = — 1,11, х5 = — 0,127, хв = — 1,895, г1= 1,59%, ?я = 0,48%, *з= 0,7%, z* =43%, z5 = 95°C, ze = 0,0%. В оптимальных условиях обеспечиваются следующие значения показателей процесса: у, -92%, или 990 кг/(мз . ч); у2 —13 с; уз — 0,01%; уч — 17 мкм. При экспериментальной проверке в оптимальных условиях получены следующие результаты; у, —970 кг/(мз . ч); 217
у? = 14 с; .уз — следы Р2О5; уд — 15,6 мкм. Разница между расчетом и экспериментом укладывается в ошибку воспроизводимости. Таким образом, в идеальных условиях процесс кристаллизации полугидрата можно осуществить без захвата фосфат-ионов при большой скорости кристаллизации с полу- чением крупных кристаллов. На втором этапе задача определения Dmax была решена для апатитов различных месторождений, характеристика которых приведена в таблице. Месторожде- ние В фосфате В жидкой фазе после разложения Р2О5 СаО РегОз АЬОз F Неорга- ничес- кий оста- ток СО2 РегОз А12ОЗ SiFe2' F Кольское Ошуркове- 39,4 52,1 0,25 0,70 2,9 - - 0,20 0,74 1,50 1,2 кое Белозимин- 36,0 49,5 1,3 1,2 2,4 3,8 2,2 0,90 0,90 1,38 1,1 ское • Вьетнам- 36,4 48,0 2,0 1,0 2,8 4,5 0,8 2,00 0,70 1,50 1,2 ское 34,9 44,8 1,9 1,2 2,7 4,3 0,31 0,95 1,42 1,50 1,2 апатитового сырья Результаты решения задачи оптимизации для различных видов представлены в таблице. Оптимальные условия процесса кристаллизации Месторождение Оптимальные значения параметров Значение ^max *4 *5 z„ % *«, % z5, °C Кольское -0,625 -1,895 1,01 1,678 40,0 100,05 0,706 Ошурковское 0,815 -0,119 -i,365 3,58 47,03 88,18 0,611 Белозиминское 1,895 1,895 -1,895 5,0 55,00 85,53 0,766 Вьетнамское -0,200 -1,05 -0,373 2,975 43,34 93,27 0,553 Полученные в результате расчета оптимальные условия для апатита Кольского месторождения были проверены экспериментально. В результате расчета в оптимальных условиях /)тах - 0,706, что соответствуете - 74,2%, или 800 кг/(мз . ч); у2 - 15,6 с; уз — 0,04%; У4 — 13,5 мкм. Разница между расчетными и экспериментальными показателями процесса укладывается в ошибку воспроизводимости. Значение обобщенного показателя Dmax, полученного в результате решения задачи оптимизации, может служить для предварительной оценки качества любого фосфатного сырья при получении из него экстракционной фосфорной кислоты полугидратным ме- тодом, если состав экстрагируемой из него кислоты по содержанию оксида фосфора (V) и примесей лежит в изученном нами интервале изменения этих факторов. 10. Сложные планы. Факторный эксперимент 22к, совмещенный с латинским квадратом. Для определения оптимальной комбинации качественных факторов применяют методы планирования эксперимента по схеме латинских, гипер-греко-латинских квадратов и кубов (см. гл. Ш). При совмещении факторного эксперимента /2 с ортогональны- ми латинскими квадратами/X/ все факторы вводятся в планирование 218
на четырех уровнях и всего можно исследовать эффекты (7 + факторов. Во многих задачах в планировании наряду с качественными факторами участвуют количественные, и их может быть достаточно много. Если всем факторам задавать одинаковое число уровней /> 2, то или потребуется большое количество опытов, или необходимо будет ограничивать величиной (7+1,) число факторов, вводимых в план. Кроме того, для некоторых качественных факторов иногда невозможно задать более двух уровней. В таких задачах полезными оказываются сложные планы: факторный эксперимент 22к, совмещенный с латинским квадратом размера 2кХ2к Они позволяют вводить в пла- нирование несколько факторов на 1 = 2к уровнях и достаточно боль- шое число количественных и качественных факторов на двух уровнях. Такие планы можно построить только для факторного эксперимента 22к с количеством опытов, равным полному квадрату числа 2к, к—2, 3,... Таблица 49. Совмещение факторного эксперимента 24 с латинским квадратом 4X4 JK(-I) и(+1) xi(-1) Xl(+1) XI (-1) xi(+l) Х4<~1) хз(-1) А в С D хз(+1) В А D С Х4(+1) хз(-1) D С В А хз(+1) С D А В Для совмещения факторного эксперимента 22к с латинским квадра- том удобно факторный эксперимент 22к представить в виде таблицы с 2к+] входами, на которую накладывается латинский квадрат размера 2кХ 2к, например табл. 49. Тогда фактор, вводимый в планирование по схеме латинского квадрата, ортогонален 2к факторам, задающим полный факторный эксперимент. Действительно, все I =2к уровней этого фактора встреча- ются в плане одинаково часто и каждый уровень его встречается с любым уровнем исходных 2к факторов одинаковое число раз. Исходный план можно совместить с греко-латинским квадратом 2кХ2 или даже с гипер-греко-латинским квадратом, полученным наложением друг на друга (2к- 1) ортогональных латинских квадратов, если существует полный ряд ортогональных латинских квадратов для данного 1 = 2к. При этом введенные (2^-1) факторы ортогональны исходным 2к факторам, а также ортогональны всем взаимодействиям факторов, задающим столбцы квадрата. План будет насыщенным, если эти взаимодействия считать незначимыми и использовать их для введения в план дополнительных факторов на двух уровнях. 219
Представляют интерес самые различные варианты насыщенных ортогональных планов, полученных в результате совмещения фактор- ного плана 22к с одним латинским квадратом, двумя ортогональными латинскими квадратами и т. д. до (2*1-!) ортогональных латинских квадратов. Каждый фактор, введенный в план на 1 = 2к уровнях, имеет (2fc-l) степеней свободы и оказывается смешанным с 2Л-1 различными взаимодействиями 2к факторов полного факторного эксперимента. Если ввести в план т факторов (т < 2к - V на 2к уровнях, то они окажутся смешанными с ти(2Л-1) взаимодействиями исход- ных факторов Всего в полном факторном плане 22к имеется (22к - -2Л--1). взаимодействий. Следовательно, свободными от смешивания с главными эффектами (2к + т) факторов останутся (22к - 2к - 1) - т(2к - 1) взаимодействий. Их можно использовать для введения в план допол- нительных факторов на двух уровнях. Насыщенный план тогда включа- ет п = 22к-т2к + 2т - 1 факторов, из которых т вводятся на 1 = 22к уровнях и (п-т) на двух уровнях. Наибольший практический интерес представляют планы при к = 2, т. е. N=16, 1—4. Могут оказаться полезными планы при к = 3, т. е. N=64, / = 8. Планы, построенные при к = 4, требуют слишком большого числа опытов (N=256). При использовании сложных планов для количественных факторов, введенных в план на двух уровнях, можно подсчитать главные эффекты факторов, которые благодаря ортогональности плана совпада- ют с эффектами, вычисленными по методу наименьших квадратов, и затем провести круТое восхождение. При этом качественные факто- ры на этапе крутого восхождения устанавливаются на тех уровнях, которые дают лучшие эффекты. Эффекты факторов, введенных в план на двух уровнях, вычисляют- ся следующим образом. Пусть проделано N=222k опытов по схеме сложного плана. В план введены п факторов, из них т установлено на 1 = 2к уровнях, а (7г-ти)-на двух уровнях. Получен ряд значений отклика: у,, y?,...,yN. Тогда главный эффект фактора х,// = 1,2,,.,п-т) по- лучается как разность между суммой откликов во всех опытах, в ко- торых X, установлен на верхнем уровне х-, и суммой откликов во всех опытах, в которых х, установлен на нижнем уровне х?, делен- ная на число опытов в плане: = .....xi......— х°.....x»_m)].(V.133) Отношение ти, к <j(m,) = стош//У где <тош—ошибка в измерении отклика, которое имеет /-распределение, можно использовать для оценки значимости вычисленных эффектов. При этом если план нена- сыщенный, то для оценки величины ^(пъ) можно использовать свободные от смешивания с основными факторами эффекты взаимо- действия. Эффекты факторов, введенных в план на / = 2* уровнях, вычисля- ются отдельно для каждого уровня. Эффект фактора xj(J = п-т + 1,...,п) на q-м уровне (q^O, 1, 2,...,/-равен сумме откликов во всех опытах, в которых фактор xj установлен на q-м уровне, деленной на число вхождений (/ = 2*) в план фактора ху на q-м уровне, 220
Если есть основание предполагать однородность дисперсий в измерении отклика по всем опытам, то для оценки значимости раз- личия между эффектами указанных факторов на различных уровнях можно применить r-критерий. Недостатком этого критерия является то, что при оценке значимости различия между эффектами указанных факторов, например х7, на двух уровнях / и /+1 используется не вся информация, а лишь часть ее. Множественный ранговый критерий Дункана позволяет определить значимость различия между эффектами уровней факторов, введенных в план на />2 уровнях, с большей надежностью, поскольку при этом используется одновременно вся информация, полученная в эксперименте. Значимость главных эффектов факторов, введенных в план, как на двух, так и на />2 уровнях, можно проверить при помощи многофакторного дисперсионного анализа и факторного анализа. На основании результатов факторного анализа можно провести крутое вос- хождение. Для линейной модели = + + + + (VJ35) где yt...jq.../ — значение отклика в некотором опыте; д—суммарный эффект во всех опытах; х„- — эффект фактора х, на z-м уровне (1=0,1); х1п_т — эффект фактора х„_,„ на j-м уровне (/' = 0, 1); x,„_w+1l~эффект фактора х„_т+1 на q-м уровне (<?=0, 1,...,2* —1); x„f — эффект фактора х„ на f-м уровне (f=0, 1, 2,...,2Л—I); е, ошибка в измерении отклика. Схема дисперсионного анализа приведена в табл. 50, в которой при- няты следующие обозначения: (‘‘=0,1) (V.136) — квадрат суммы результатов всех опытов, в которых фактор х, был установлен на z-м уровне, деленный на число вхождений (22<гл) в план фактора х, на Z-м уровне; Й1... zL (9 = 0.1,2, .... 2й—1) (V.137) — квадрат суммы результатов опытов, в которых фактор х„_т+1был установлен на q-м уровне, деленный на число вхождений (2й) в план фактора х„_т+1 на q-м уровне; 4= (/=0.1.2.......2й—1) (V.138) — квадрат суммы результатов, опытов, в которых фактор х„ установлен на f-м уровне, деленный на число вхождений (2й) в план данного 221
Математическое ожидание среднего квадрата । 2 2/с— 1 2 <?ош+ 2 оХ1 U/ — W у* mo 1 Х£> -7 +»nOD 1 + £ Е ^0 + э Ъ° Е « ч + V Э еч © 0 Средний квадрат со i 1 1 х п - т L 1 (I -^)/ш~их55 1 SSx„/(2k- 1) а о Со 1 - X ~ т^с- - | Сумма квадратов о. о Ъ£ & СО 1 -Н II |Г ч & СО О. о & со 1 -Н? II" £ Е Со о. о X со Со 1 М И с + £ Со а о со 1 "oJ W II Е Й Е ч Со Со 1 1 ч Со 1О СО° Со II а 55, Число степеней свободы - —* J 22к— т2к+ 2т ~ п ~ 1 Источник дисперсии ч £ Е ч + £ Е ч Е ч Ошибка 222
фактора на f-м уровне; ££ул..79...л—сумма квадратов результатов всех опытов; ЗЗкор =--------------— (V. 139) — средний квадрат суммы результатов всех Х=22/с опытов. Пример 7. Исследовался одностадийный процесс получения водорастворимых поли- электролитов путем радикальной полимеризации винилпиридиновых солей без их про- межуточного выделения. Процесс зависит от большого числа количественных и каче- ственных факторов. Необходимо определить оптимальные условия процесса. Решение. Для оптимизации процесса синтеза водорастворимых полиэлектролитов на основе 2-метил-5-винилпиридина (2,5 МВП) был использован сложный план — дробная реплика 26~2, совмещенная с двумя латинскими квадратами (табл. 51). Таблица 51. Матрица планирования Номер опыта Х 2 х3 *5 хъ X? •*6 1 — — — — + А 0 30,155 2 + — — — + — В 1 31,761 3 — + — — + — С 2 12,899 4 + + — — — + D 3 80,715 5 — — + — + + В 3 88,876 6 + — + — — — А 2 16,806 7 — + + — — — D 1 12,463 8 + + + — + + С 0 81,443 9 — — — + — + С 1 24,959 10 1- — — + + — D 0 19,602 11 — + — + + — А 3 21,761 12 + + — + — + В 2 52,953 13 — — + + + + D 2 78,220 14 + — + + — — С 3 20,953 15 — -н + + — — В 0 1,684 16 + + + + + + А 1 48,910 Рассматр ивалось влияние на вы? (ОД пол имера (jv ) ВОСЬМ! факто| )ОВ, из которых два качественных — i алогенакилы RX и растворители — менялись на четырех уровнях, а один качественный — инициатор — на двух. Значения выбранных уровней для всех исследуемых факторов приведены в табл. 52. Вследствие ценных комбинаторных свойств, плана и рационального выбора факторов уже в процессе реализации матрицы планирования определены условия (опыты 4, 5, 8, 13), в которых выходы полимеров удовлетворяют технологическим требованиям. Для определения интенсивности влияния различных параметров на выход полимера был проведен факторный и дисперсионный анализы полученных результатов. Ошибка вос- производимости Лвоспр — 1,94, используемая в факторном анализе, определена из пред- варительных опытов. Число степеней свободы/воспр “ 6. В табл. 52 приведены эффекты факторов, введенных в планирование на двух уровнях, полученные по формуле (V.133). Значимость этих эффектов проверялась по критерию Стьюдента. Табличное значение критерия Стьюдента Т0,05(6) — 2,45. Эффект фактора (соотношение реагирующих компонентов) оказался незначимым. Таким об- разом, избыток галоидного алкила не влияет на выход полимера. Незначимый эффект в табл. 52 заменен нулем. Значимость главных эффектов факторов, введенных в план как на двух, так и на четырех уровнях, проверялась при помощи многофакторного дисперсионного анализа. Для оценки значимости эффектов в дисперсионном анализе было использовано отношение средних квадратов, обусловленных действием соответ- ствующих факторов, к среднему квадрату, связанному с ошибкой опыта, имеющее рас- пределение Фишера. При этом к сумме квадратов, связанной с ошибкой опыта, отне- сена с соответствующим числом степеней свободы сумма квадратов, обусловленная 223
Таблица 52. Результаты факторного анализа Факторы Обозна- чения Уровни факторов Эффект +1 -1 Температура, °C Xi 70 60 +4,633 Соотношение МВП/RX, моль/моль х2 1/1,3 1/1,1 0 Концентрация инициатора, % 1,2 0,8 +4,159 Соотношение МВП и раст- ворителя, мае. доли X, 1/2 1/1 5,88 Продолжительность реакции, ч х5 12 6 +8,425 Вид инициатора Хв ДАК ПБ 17,24 Вид растворителя х7 Бутанол Л 27,41 Этанол В 43,82 Пропанол с 35,06 Изопропанол D 47,75 Вид галогеналкила Хв Бромистый этил 0 33,22 Йодистый этил 1 27,52 Йодистый пропил 2 40,22 Йодистый метил 3 53,08 действием фактора хг, эффект которого оказался незначимым. Результаты дисперсионного анализа представлены в табл. 53. Данные факторного и дисперсионного анализов хорошо согласуются. В табл. 52 приведены эффекты факторов на двух и на четырех уровнях. Значи- мость различия между эффектами этих факторов на разных уровнях проверялась при помощи множественного рангового критерия Дункана с доверительной вероятностью fl —0,95. Нормированная ошибка среднего равна Эффекты факторов на разных уровнях расположены в порядке возрастания их величин. Для фактора х? у(А) -27,41..............................у(С) =35,06 у(В) -43,82 y(D)-47,75 г.................................... 3,93 4,01 4,02 г-Sy................................. 18,83 19,15 19,25 у (D> — у ,А^ = 20,34 > 19,25 — различие значимое у —у<с> — 12,69 < 19,15 — различие незначимое 224
у <D* — у"<В) = 3,93 < 18,8 — различие незначимое у ,в* — у <А) = 6,41 < 19,15 — различие незначимое у (В> — у ,С) = 8,46 < 18,8 — различие незначимое у (С) — у (А) = 7,65 < 18,8 — различие незначимое Таблица 53. Дисперсионный анализ Источник дисперсий Число степеней свободы Сумма квадратов Средний квадрат Проверка значимости •*i 1 342,6461 342,6461 4*0 х, 1 2,6518 2,6518 4-0 Хз 1 276,0360 276,0360 4* о х4 1 552,3729 552,3729 4* 0 *5 1 1136,1904 1136,1904 4* о *6 1 7238,9555 7238,9555 4*0 X, 3 2980 933,991 4*о *8 3 4420 1454,35 4*о Ошибка (1) 3 361,3800 120,4597 Общая сумма 15 185378,610 12358,571 Ошибка (2) 4 364,03 91,007 Таким образом, реакция синтеза сильноосновных полиэлектролитов с разной эффек- тивностью протекает в среде изопропанола и бутанола. Различие между остальными растворителями незначимое. Для фактора xs у(1)= 27,52; р<0> = 33,22; у(2> = 40,22; у(3>=53,08; у (3) — у О) =- 25,44 > 19,25 — различие значимое у <з> — у (0) __ 19,74 > 19,15 — различие значимое у (3) — у (2) _ 12,74 < 18,8 — различие незначимое у — у = 12,7 < 19,15— различие незначимое у <2> — у = 7,0 < 18,8 — различие незначимое у W> — у И> — 5,7 < 18,8— различие незначимое Выход полимера существенно уменьшается при замене наиболее активного галоген- алкила— йодистого метила иодистым или бромистым этилом. Разница между остальными галогеналкилами незначима. Из анализа результатов следует, что увеличение температуры и продолжительности опыта приводит к возрастанию выхода полимера, а увеличение количества растворителя снижает скорость реакции. Из инициаторов наиболее эффективным оказался динитрил азоизомасляной кислоты (ДАК). Использование в качестве инициатора перекиси бен- зоила (ПБ) уменьшает скорость реакции радикальной полимеризации. Лучшими раство- рителями являются этанол и изопропанол. Из галогеналкилов наиболее реакционно- способен йодистый метил, однако эффекты других галогеналкилов также имеют 9-529 225
Время, мин Рис. 52. Кинетические кривые реакции МВП — С2Н5 в этаноле при различных температурах высокие значения. Таким образом, оптимальные усло- вия синтеза галоидсодержащих водорастворимых поли- электролитов получились следующие: температура 70°С, МВП / RX —1:1,1; МВП / растворитель — 1:1; продолжительность реакции 12 ч, концентрация инициа- тора (ДАК) — 1,2%, растворитель — изопропанол или эта- нол. В полученных оптимальных условиях были синте- зироаны водорастворимые полиэлектролиты на основе 2-метил-5-винилпиридных и различных галоген- алкилов. Выход полимера в оптимальных условиях приведен ниже. Учитывая положительное влияние температуры (табл. 52), для сокращения длительности процесса син- теза исследовали влияние дальнейшего повышения температуры. Для этого были сняты кинетические кри- вые МВП —CsHs в этаноле при температуре (°C): 60, 70, 75 и 80 (рис. 52). Дальнейшее увеличение темпера- туры лимитируется температурой кипения растворителя и возможностью частичной деструкции образующегося полимера. Увеличение температуры до 80°С позволило сократить продолжительность реакции до 7—8 ч. Полимер . . МВП — СНз МВП — СгНа Выход, %. . 99,0 97,0 МВП - СзН? МВП - СзНз 86,0 98,0 Пример 8. На стадии разработки лабораторного регламента исследовалась стадия твердофазной экстракции процесса извлечения биологически активного препарата фел- лавина из листьев бархата амурского. Лекарственный препарат феллавин рекомендуется применять в медицинской практике в качестве противовирусного и антигепатоксического средства. Решение. Для оптимизации процесса твердофазной экстракции феллавина из растительного сырья был использован сложный план — дробная реплика 26~’, совмещенная с одним латинским квадратом размером 4X4. В качестве параметра оптимизации (у) рассматривался выход феллавина в процентах от его содержания в сырье. Выбранные для исследования процесса экстракции факторы и диапазоны их изменения приведены в таблице: Факторы Обозначения Уровни факторов +1 -1 Время первой экстракции, ч Время второй и третьей экстракций, ч Соотношение сырье: растворитель Количество экстракций Температура экстракции Растворитель: метанол 50%-ный этанол 50%-ный изопропиловый спирт 50%-ный метанол Xi х2 Хз Х4 Х5 *6 6 6 1 : 10 3 Кипение 2 2 1 : 6 2 50—60°С 3 2 3 Размер частиц твердой фазы 1—2 мм. Процесс проводится в периодическом лабо- раторном экстракторе с мешалкой. Матрица планирования и результаты приведены в таблице (см. стр. 227). Каждый опыт в матрице был повторен два раза. Статистический анализ резуль- татов проводился методом факторного анализа. Эффекты факторов, введенных в план на двух уровнях, были рассчитаны по формуле (V. 133): 61 = 8,659, Ьа = 3,537, 63 = — 0,384, 64 = 2,671, 65 = 7,015. 226
Но- мер опы- та Xt Х2 Хз х4 Х5 -г6 Выход продук- та уу % Но- мер опы- та X, х2 Хз х4 •*5 х6 Выход продук- та у, % 1 -1 -1 -1 -1 -1 0 59,03 9 -1 -1 -1 +1 -1 2 60,08 2 +1 -1 -1 1 +1 1 91,69 10 +1 1 -1 +1 +1 3 87,9 3 -1 +1 -1 -1 +1 2 70,32 И -1 +1 -1 +1 +1 0 96,29 4 +1 +1 -1 -1 -1 3 80,73 12 +1 +1 1 +1 -1 1 87,5 5 -1 -1 +1 -1 +1 1 68,14 13 -1 -1 +1 +1 +1 3 77,58 6 +1 -1 +1 -1 -1 0 91,93 14 +1 -1 +1 +1 -1 2 65,32 7 -1 +1 +1 -1 -1 3 50,16 15 -1 +1 +1 +1 -1 1 79,59 8 +1 +1 +1 -1 +1 2 97,09 16 +1 +1 +1 +1 + 1 0 97,58 Дисперсия воспроизводимости, определенная по параллельным опытам, ^Оспр = 19,637; Лоспр” 16. Ошибка эффекта Значимость эффектов факторов, введенных в план на двух уровнях, проверялась по критерию Стьюдента для уровня значимости р —0,05 и числа степеней свободы /—16; fo,os(16)-2,12. Значение г-критерия для каждого фактора: 8,659 = 1 108 = 7,815 > 2» 12 — эффект значим 3,537 == j = 3,192 >2,12 — эффект значим 0,384 <а = у = 0,346 <2,12 — эффект незиачим 2,671 Ч = = 2,411 > 2,12 — эффект значим 1,108 7,015 <5 = ; = 6,331 >2,12 — эффект значим 1)1 08 Эффект фактора хз оказался незначим, таким образом, избыток растворителя не .влияет на выход феллавина. Увеличение времени экстракций, увеличение количества экстракций и повышение температуры, т.е. оставшиеся четыре фактора приводят к увеличению выхода феллавина. Значимость различия между эффектами фактора хе, веденном в плане на четырех уровнях, проверялась с помощью множественного рангового критерия Дункана. В таб- лице приведены значения среднего выхода для различных уровней фактора хе: Вид растворителя Уровни фактора Средний выход, % Метанол 0 86,207 50%-ный этанол 1 81,73 50%-ный изопропиловый спирт 2 73,202 50%-ный метанол 3 74,092 9* 227
Проранжир уем средние значения выхода в порядке возрастания; 73,202 74,092 81,73 86,207 у(0 уС>) jXO /1) Ошибка воспроизводимости результатов sy — 4,432%. Ошибка среднего равна «7= У s*/n = |Л19,637/4 = 2,216%. Выпишем значимые ранги из таблицы числа степеней свободы Лр~/ВОспр* Дункана ДЛЯ уровня значимости р — 0,05 и Р 2 3 4 Ранги . 3,01 3,15 3,23 Наименьшие значимые ранги (НЗР), умноженные на ошибку среднего sy, равны: Р..............2 3 4 НЗР X sy . . . . 6,67 7,003 7,202 Проверим значимость различия между средними; у’(0> — 7<2> = 86,207 — 73,202 = 13,005 > 7,202 — различие значимое —у <3) = 76,207 — 74,092= 12,115 > 7,003—различие значимое у (0> —= 86,207 — 81,73 = 4,477 < 6,67 — различие незначимое у (1> — у (2) = 81,73 — 73,202 = 8,528 > 7,003 — различие значимое у — у (3> = 81,73 — 74,092 = 7,638 >6,67 — различие значимое у — у ,2> = 74,092 — 73,202 = 0,89 < 6,67 — различие незначимое Из анализа результатов следует, что лучшими растворителями являются метанол и 50%-ный этанол. Выбираем в качестве растворителя для процесса твердофазной экстракции 50%-ный этанол, который является наиболее эффективным, удешевляет процесс получения препарата и менее ядовит. Таким образом, оптимальные условия процесса экстракции феллавина из листьев бархата амурского получились следующие: число экстракций — 3; время первой экстрак- ции—6 ч: время второй и тре>ьей экстракции —6 ч; соотношение сырье : раствори- тель — 1:6; растворитель — 50%-ный этанол; температура — 80°С (кипение). 11. Метод последовательного симплекс-планирования. В рассмотрен- ных планах типа 2к и 2к~р экспериментальные точки располагались в вершинах многомерного куба. В качестве экспериментального плана можно также использовать регулярный симплекс. Симплексом в fc-мерном пространстве называют выпуклый многогранник, имеющий ровно к+1 вершину, каждая из которых определяется пересечением к гиперплоскостей данного пространства. Примером симплекса в двумерном пространстве, т. е. на плоскости, служит треугольник. В трехмерном пространстве симплексом будет любая четырехгранная пирамида, имеющая четыре вершины, каждая из которых образована пересечением трех плоскостей — граней пирамиды. Симплекс называется регулярным, если расстояния между всеми его вершинами равны. Так, регулярными симплексами являются правильный треугольник (двумерный симплекс), тетраэдр (трехмерный симплекс). При планировании экспериментов обычно используют регулярные симплексы. Однако регулярность симплекса, как и на- правление градиента в методе крутого восхождения, и свойство 228
ротатабельности планов не будут инвариантными к масштабу коорди- нат факторного пространства. При изменении масштаба регулярный симплекс может стать нерегулярным. С другой стороны, всегда мож- но подобрать соответствующее преобразование системы координат, делающее нерегулярный симплекс регулярным. В экспериментальной практике симплексные планы наиболее широко используются для решения задач оптимизации на стадии движения к почти стационарной области. При этом, чтобы сделать симплекс регулярным, используется линейное преобразование где -J-я координата центра плана; Az7— интервал варьирования по j-му фактору. Для оптимизации используется следующее важное свойство симплек- са: против любой из его вершин Aj расположена только одна грань, на которой можно построить новый симплекс, отличающийся от прежнего расположением новой вершины Aj, тогда как остальные вершины обоих симплексов совпадают. Последовательным отбрасыва- нием вершин осуществляется перемещение исходного симплекса в факторном пространстве. Метод последовательного симплекс-планирования состоит в следую- щем; планируют исходную серию опытов так, чтобы точки, соответ- ствующие условиям проведения этих опытов, образовывали регуляр- ный симплекс в факторном пространстве. После проведения опытов выявляется вершина, отвечающая условиям, при которых получаются наихудшие результаты. Далее строится новый симплекс, для чего наихудшая точка исходного симплекса заменяется новой, расположен- ной симметрично относительно центра грани симплекса, находящейся против наихудшей точки. Новая точка вместе с оставшимися снова образует регулярный симплекс, центр тяжести которого смещен по сравнению с исходным в направлении; худшая точка—центр тяжести остальных точек. Это направление в общем случае не является наи- более крутым, однако оно обращено в сторону повышения качества процесса. После реализации опыта в дополнительной точке опять произво- дится сопоставление результатов, снова выявляется наихудшая точка, которая также заменяется ее зеркальным отражением, и т. д. Шаговое восхождение с последовательным отбрасыванием наихудших точек повторяется до области, близкой к экстремуму. На рис, 53 показаны схемы достижения экстремума одной и той же поверхности отклика методами крутого восхождения и симплекс- планирования. Рассмотрим движение к экстремуму на примере зада- чи отыскания наибольшего значения целевой функции двух факторов. Для достижения экстремума методом крутого восхождения (рис. 53, а) в окрестности точки М с известным значением целевой функции был поставлен полный факторный эксперимент 22 (точки 1—4), движение По градиенту осуществлялось в опытах 5—9 до тех пор, пока значение Целевой функции не начало ухудшаться. С центром в лучшей точ- 8-529 229
Рис. 53. Симплексный метод и крутое восхождение по поверхности отклика ке 7 пришлось вновь реализовать план 22 (точки 10—13). Новое движе- ние по градиенту (точки 14, 15) приводит к экстремальному значению целевой функции. При использовании симплекс-планирования (рис. 53, 6) в исходном симплексе (точки 1—3) худшей оказалась точка 2. Точ- ка 4 является зеркальным отражением худшей точки относительно ci—центра грани 1—3. В новом симплексе 1, 3, 4 худшей оказалась точка 1. В результате применения симплексного метода достигли области оптимума (симплекс 9, 10, 11). Таким образом, оба метода потребовали примерно одинакового числа опытов. Из рис. 53 видно, что вблизи оптимума при применении симплексного метода может возникнуть зацикливание. Достигнув области оптимума, симплекс начинает враще- ние вокруг вершины с максимальным значением отклика. Если симплекс располагается относительно поверхности отклика таким образом, что значение отклика в новой точке опять получается самым плохим, необходимо вернуться к предыдущему симплексу и попробовать следующее благоприятное направление. Наличие ошибок в определе- нии отклика снижает скорость движения к экстремуму. Исходный симплекс может быть по-разному ориентирован в фактор- ном пространстве. Если центр симплекса совпадает с началом коорди- нат, одна из вершин лежит' на координатной оси, а остальные располага- ются симметрично относительно координатных осей, плоскостей и гипер- плоскостей (в многомерном случае), то координаты вершин симплекса задаются матрицей X- *1 .. XJ • • *fe-i Xk ~*1 X2 .. Xj Xk 0 —2х2 .. Xj •• *h-i Xk Х = 0 0 .. .—jXj . • - Xh.i Xk (V.140) 0 0 .. 0 . •— (k— Xk 230 0 0 .. 0 . . 0
При длине стороны симплекса, равной 1, 1Z —!— V 2Д/+1) (V.141) Высота такого симплекса ht (расстояние от вершины до противо- положной грани)равна k 4- 1 hk = -—= , (V.142) V2k(k+ 1) где к— размерность симплекса. Число опытов в симплексной матрице для к независимых факторов равно N = к+1. Симплексные планы относятся к так называемым насыщенным планам, число опытов в которых равно числу коэффициентов в уравнении регрессии. В этой матрице соблюдаются условия = /. /=1.2, .... Л и 2*Л = 0. (V. 143) «=1 1=1 _ N „ но не соблюдается условие = N. Только для столбца хо, все элементы которого равны 1, N 2^. 1=1 Л’ Для любого y-го столбца L равна /“1 N 1 1 24< = /5П/Т17+'’57ТИГ=')-5' Поэтому для симплексного плана ковариационная матрица имеет вид (Л)'1 rIW2 О 1 2 .0 (V. 145) и коэффициенты регрессии определяются по формулам; 2j yi N /=1.2. ...,й. (V.146) i=i Симплексные планы —планы ротатабельные. Основным их не- достатком является отсутствие .D-оптимальности. Дисперсия коэффи- циентов в ортогональных планах определяется по формуле 8* 23]
s2 <v-,47> ' 2 4. i=l Для симплексного плана, согласно (V.147), (V.148) в то время как для планов типа 2к и 2к~р 9 ВОСПР 'ЬГ У ‘ Таким образом, коэффициенты уравнения регрессии, полученного по симплексному плану, определяются с меньшей точностью. Построить насыщенные планы с элементами ±1 удается только для числа факто- ров, равного 4а— 1, где а —целое положительное число. Например, для 3, 7, 11, 15 и т. д. факторов. Для практического использования симплексной матрицы (V.140) заранее подсчитаны по формуле (V.141) числовые значения ее элементов: 0,5 0,289 0,204 0,158 0,129 0,109... —0,5 0,289 0,204 0,158 0,129 0,109... 0 —0,578 0,204 0,158 0,129 0,109... 0 0 —0,612 0,158 0,129 0,109... х = 0 0 0 —0,632 0,129 0,109... (V. 149) 0 0 0 0 —0,645 0,109... 0 0 0 0 0 —0,655 План эксперимента в безразмерном масштабе для к факторов состоит из к столбцов и к+ 1 строки матрицы (V.149). После реализации исходного симплекса анализируются результаты для выявления наихудшей точки. Затем проводится отражение наихуд- шей точки относительно центра противоположной грани симплекса, и таким образом находятся условия для проведения нового опыта взамен исключенного. Условия проведения опыта в отраженной точке могут быть найдены следующим образом: х^+2) = 2х<с» — хр , 1,2...k, (V. 150) где x^—j-я координата наихудшей точки /; + 2>—у-я координата новой точки, получаемой в результате отражения; у-я координата центра противоположной грани: &-Н х?» = (V.151) z k 232
Исходный fc-мерный симплекс можно достроить до (к + ])-мерного, вводя только одну новую точку. Такая необходимость возникает, если на первом этапе исследования рассматривалась зависимость изучаемого процесса только от к факторов, в то время как он зависит от (fc+ 1)-го фактора. Величина (к+ 1)-го фактора по тем или иным причинам не изменялась в эксперименте. Тогда все точки fc-мерного симплекса в действительности представляют собой точки (Х:-|- 1)-мерно- го пространства, которые находятся в гиперплоскости xk+t = d, где d — фиксированное значение (к+ 1)-го фактора в безразмерном виде. Из геометрических соотношений следует, что для построения симплекса размерностью 1) из fc-мерного симплекса необходимо найти центр тяжести точек fc-мерного симплекса в (к+ 1)-мерном пространстве и провести через эту точку перпендикуляр к гиперплоскости, в которой лежат точки ^-мерного симплекса. Если на этом перпендикуляре отложить отрезок длиной hk+] (высота к+ 1-мерного симплекса), то полученная точка вместе с исходными образует (к+ 1)-мерный симплекс. Координаты новой точки х<°> , 40), , х<°»....40), d + hh+1, (V. 152) где xj -у'-я координата центра исходного симплекса. При обычном факторном методе добавление еще одного параметра приводит к необходимости увеличить число опытов в два раза. Отметим еще следующие преимущества симплексного метода. При использовании симплекс-планирования параметр оптимизации у может измеряться приближенно: достаточно иметь возможность проранжиро- вать эти величины. При этом можно одновременно учитывать не- сколько параметров оптимизации; выход продукта, стоимость, чистоту и т. д. Параметр оптимизации может не измеряться количественно. Метод не предъявляет жестких требований к аппроксимации поверхно- сти отклика плоскостью. Симплекс-план может быть использован как алгоритм при оптимизации процесса с применением управляющей машины. Пример 9. Сравнить эффективность симплексного метода оптимизации и метода крутого восхождения на основании результатов восьми опытов (см. табл. 38). Решение. Использованный в примере 1 (см. с. 175) план — Vie от ПФЭ 27 является О-оптимальным симплексом в семимерном пространстве. Этот план был ис- пользован в качестве исходного симплекса (опыты 1—8 в таблице). Номер опыта 2( z2 Z3 Z6 z7 У 1 0,022 0,028 0,035 1350 1,5 0,152 0,333 0 2 0,063 0,028 0,035 1300 2,0 0,127 0,333 0,129 3 0,022 0,0094 0,035 1300 2,0 0,152 0,5 0 4 0,063 0,0094 0,035 1350 1,5 0,127 0,5 0,177 5 0,022 0,028 0,10 1300 1,5 0,127 0,5 0,295 6 0,063 0,028 0,10 1350 2,0 0,152 0,5 0,404 7 0,022 0,0094 0,10 1350 2,0 0,127 0,333 0,2665 8 0,063 0,0094 0,10 1300 1,5 0,152 0,333 0,4305 9 0,069 0,031 0,109 1360 1,42 0,124 0,310 0,42 233
Продолжение Номер опыта Z1 z2 Z3 Z4 2b -в z7 У 10 0,082 0,013 0,1304 1310 1,91 0,115 0,469 0,336 и 0,0316 0,0129 0,1278 1370 1,16 0,147 0,47 0,510 12 0,023 0,033 0,154 1330 1,09 0,153 0,437 0,489 13 0,079 0,035 0,1346 1312 1,02 0,149 0,520 0,2630 г(с> = гз ztc) — *4 ~ Анализ результатов (таблица) показывает, что наихудшие результаты получены в опытах 1 и з. Заменим точку 3 ее зеркальным отражением — точкой 9. Координаты новой точки вычислим по формулам (V.150) и (V.151). Определим координаты точки с — центра грани, образованной точками 1, 2, 4, 5, 6, 7, 8: 0,022-3 + 0,063.4 п пяел г(с) = ------1--------= 0,0454, 0,028.4 + 3-0,0094 „ -------1--------= 0,020, 7 3-0,035+ 4-0,J „ ------—------= 0,0721, 7 4-1350 t3-1300= 1330( г(е)=.4±5±3.2,0| = 171> 3+U52 + + 0J27_ 6 7 4.0.g + 0,5.3g 7 7 Тогда координаты девятой точки выразятся следующим образом: zf9> = 2-0,0454 — 0,022 = 0,0688, z2(9> = 2-0,02 — 0,0094 = 0,0306, z<9> — 2-0,0721 —0,035 = 0,109, z|9) = 2-1330—1300 =1360, z<9> =2-1,71—2 = 1,42, z^9) = 2-0,138 — 0,152= 0,124, z<9> =2-0,405— 0,5 = 0,310. Аналогично при отражении первой точки были получены координаты десятой точки. В симплексе 2, 4, 5, 6, 7, 8, 9, 10 худшая точка 2- Ее отражение дает коор- динаты точки 77, отражение точки 4 — координаты точки 72. В симплексе 5, 6, 7, 8, 9, 10, И, 12 худшей является точка 7. Ее отражение дает координаты точки 13. Выход в точке 13 меньше, чем в точке 7. Отражение точки 13 приведет снова в точку 7- 234
Таким образом, симплекс зациклился. Определим выход в центре симплекса 5, 6, 7, 8, 9, 10, 11, 12. Координаты центра симплекса точки 5,- 2 0,022 + 2-0,063 + 0,069 + 0,082 + 0,0316 + 0,023 0,028-2 + 0,0094-2 + 0,031 +0,013 + 0,0129 + 0,033 0,10-4 + 0,109 + 0,1304 + 0,1278 + 0,154 4 > = -------Z-------“----я-----------Z-------= °’’ О (S) _ 1300 2+ 1350-2+ 1360+ 1310+ 1370+ 1330 _ 1,5-2+ 2-2,0+ 1,42+ 1,91 + 1,16+ 1,09 = 1,57; (S) 0,127-2 + 0,152-2 + 0,124 + 0,115+ 0,147 + 0,153 гб ' — о — 0,137; ?Я = 47 -- 0,5-2 + 0,333-2 + 0,310 + 0,469 + 0,47 + 0,437 8 = 0,420. В точке 5 был реализован опыт. Полученное значение оптической плотности ylS> — — 0,570. Таким образом, наилучшее значение критерия оптимизации получено в центре симплекса за 14 опытов. Метод крутого восхождения потребовал для решения этой же задачи 15 опытов. Пример 10. Изучалась реакция, протекающая по схеме Л + В + С» D в водно-спир- товом растворе. На качество и количество продукта DO’) влияли следующие факторы,- zi — время реакции, ч; гг — содержание спирта в водно-спиртовом растворе, мол. доли; хз — концентрация вещества С, мол. доли; z4 — концентрация вещества В, мол. доли; zs — молярное соотношение веществ В и А. Основной уровень и интервалы варьирования факторов приведены ниже Факторы . . г, z2 z3 z4 z5 Zj .... 2,0 0,65 0,10 0,25 1,20 Azy .... 0,20 0,15 0,025 0,05 0,20 Определить условия получения максимального количества продукта (Утах)- Решение. Воспользуемся симплексным методом планирования. Для к = 5 выделим из матрицы (см. V.149) подматрицу, содержащую пять столбцов и шесть строк. Ис- пользуя формулу кодирования (V.3), получим; _ г1 —2-° _ гг — 0.65 _ z3 —0,10 Х1~ 0,20 ’ Хг~ 0,15 ’ хз- 0 025 > z4 — 0,25 г6 — 1,20 Х4~ 0,05 ’ Хб= 0,20 Тогда матрица исходного симплекса в натуральном масштабе имеет вид (таблица). Номер опыта z, *3 *4 *5 У 1 2,10 0,693 0,105 0,258 1,225 0,760 2 1,90 0,693 0,105 0,258 1,225 0,491 3 2,00 0,564 0,105 0,258 1,225 0,513 4 2,00 0,650 0,085 0,258 1,225 0,675 5 2,00 0,650 0,100 0,218 1,225 0,693 6 2,00 0,650 0,100 0,250 1,075 0,666 235
Как следует из таблицы, наихудшим является опыт 2. Заменим точку 2 ее зер- кальным отражением — точкой 7. Координаты новой точки найдем по формулам (V.150) и (V.151). Определим координаты точки с—центра грани, образованной точками 1, 3, 4, 5, 6: г(о = !^2±^> = 2>02; 5 3.0,65 + 0,504 + 0,693 _____ гг' _ ------------------------= 0,641; * 5 ( 2-0,105 + 0,085 + 2-0,100 гг' = --------------------------= 0,099; л 5 г(О = 3-0,258 + 0,218 + 0,250 _ Q 5 г<Я= «3.225+1.07j_ ° 5 Тогда координаты точки 7 выразятся следующим образом: г<7> = 2-2,02 — 1,90= 2,14; 47) = 2 0,641 — 0,693 = 0,589; 47) = 2-0,099 — 0,105= 0,093; г^7) = 2-0,248 - 0,258 = 0,238; zg> = 2-1,195— 1,225= 1,165. Новая точка 7 вместе с оставшимися образует симплекс 1, 3, 4, 5, 6, 7 (таблица). Номер опыта Z] z2 23 z4 25 У 1 2,10 0,693 0,105 0,258 1,225 0,760 3 2,00 0,569 0,105 0,258 1,225 0,513 4 2,00 0,650 0,085 0,258 1,225 0,675 5 2,00 0,650 0,100 0,218 1,225 0,693 6 2,00 0,650 0,100 0,250 1,075 0,666 7 2,14 0,589 0,093 0,238 1,165 0,810 После проведения опыта в точке 7, наихудшей точкой сомплекса 1, 3, 4, 5, 6, 7, оказалась точка 3. Ее отражение относительно грани 1, 4, 5, 6, 7 дает условия следу- ющего опыта и т. д. После проведения седьмого опыта добавляется еще один фактор Ze — число оборотов мешалки. До сих пор ze поддерживался на постоянном уровне Zj — 800 об/мин. Тогда координаты точки 8 в безразмерном виде будут: „(*) г(л) г!!). + h Х1 > х2 ...........xk+l г ль+1- За единицу варьирования принимается Aze = 100 об/мин, за основной уровень — Zj — 800 об/мин. Тогда формула кодирования для ze примет вид ze — 800 Хв== 100 xg>=0. 236
Высоту шестимерного симплекса получим по формуле (V.142) Л—0,764. Определим значения факторов для опыта 8. Значения первых пяти факторов представляют координаты центра тяжести пятимерного симплекса 1, 3, 4, 5, 6, 7: ,(^^..^. + ^0 + 234^^ = z<8> = 0,633; z<s> = z|8> = 0,098; z = z<8> = 0,247; z|8) = 1,19; z<8> = 800+ 100 x£8) = 800+100 ( x^> +fte) = 877 об/мин. Опыт 8 вместе с точками 7-7 образует уже шестимерный симплекс 1, 3, 4, 5, 6, 7, 8 (таблица). После реализации восьмого опыта необходимо провести анализ результатов и во- зобновить процесс отражения уже с учетом шести факторов. Номер опыта г1 z2 *3 Z4 25 У 1 2,10 0,693 0,105 0,258 1,225 800 0,760 3 2,00 0,564 0,105 0,258 1,225 800 0,513 4 2,00 0,650 0,085 0,258 1,225 800 0,675 5 2,00 0,650 0,100 0,218 1,225 800 0,693 6 2,00 0,650 0,100 0,250 1,075 800 0,666 7 2,14 0,589 0,093 0,238 1,165 800 0,810 8 2,04 0,633 0,098 0,147 1,190 877 12. Ортогональные насыщенные планы Плакетта — Бермана. Ортого- нальные насыщенные двухуровневые .D-оптимальные планы можно построить, используя дробные реплики от ПФЭ для числа факторов к = 3 (и=4), к = 1 (7V=8), fc=15 (/V=16), fc—31 (N— 32) и т. д. Однако класс ортогональных насыщенных планов может быть значительно расширен. Плакетт и Берман разработали строгую математическую теорию построения и анализа ортогональных планов. В частности, было доказано, что в насыщенном плане вычисленные по методу наименьших квадратов оценки эффектов имеют максимальную для данного числа опытов N точность, одинаковую для всех эффектов, если матрица планирования имеет ортогональные столбцы. Чтобы матрица была ортогональной, необходимо и достаточно, чтобы: 1) каждый фактор встречался на каждом своем уровне одно и то же число раз; 2) каждые два фактора с любой комбинацией их уровней встречались одно и то же число раз; 3) число опытов делилось на квадрат числа уровней, т. е. # = п/2, (V.153) где п — целое число. При такой формулировке условий ортогональности проблема по- строения ортогональной матрицы (плана эксперимента) превращается в чисто комбинаторную проблему. Если /V— пР, то число факторов, эффекты которых можно вычислить При данном N, равно 237
л = («/«_ ])/(/_]) (V.154) или целой его части. Если число уровней для всех факторов равно двум, то задача по- строения оптимального плана сводится к построению ортогональной матрицы, состоящей из + 1 и - 1, размера Л’ХЛ’, где Л'— число, кратное четырем, т. е. А=4п. Максимальное число факторов, которое можно ввести в планирование, при этом равно k—N- 1. Для построения насыщенных планов для fc—11, 19, 23 и 35 восполь- зуемся строками из табл. 54. Таблица 54. Комбинации знаков, используемые при построении насыщенных планов для к — 11, 19, 23 и 35 к N Комбинации знаков 11 12 ++-+++ + - 19 20 ++--++++-+-+ + + - 23 24 +++++-+-++--++--+-+ 35 36 -+-+++ +++++-+++--+ +-++--+- При построении плана для = 11 (см. пример 11) в качестве элементов первого столбца берется строка из табл. 54. Второй столбец получим из первого, заменив в нем первый элемент на последний и сдвинув соответственно вниз все остальные элементы. Третий столбец получим, заменив в первом столбце первые два элемента на последние и сдвинув вниз остальные элементы и т. д. Элементами последней строки слу- жат- 1. Аналогичным образом строятся планы для fc=19, 23 и 35. Для k^ll при построении матрицы планирования используются три блока А, Ви С, приведенные в табл. 55. Эти блоки выписываются в порядке круговой перестановки: АВС С А В В С А и к ним опять добавляется строка, все элементы которой - 1. Таблица 55. Блоки для построения насыщенного ортогонального плана для к —У] А в С + - + + + + ++-+++ -+++++ +--+-++++ ++-+++ + + + + + - + + + - + + + + + + - + + + + + 1 + ! 1 4- > + 1 1 + 1 1 + 1 1 1 1 + 1 1 + 1 1 + 1 + 1 1 + 1 + 1 1 1 + 1 + 1 1 1 1 + + 1 1 1 1 + 1 + 1 1 1 + +1 1 1+1 1+’ ! 1 + + 1 1 + 1 1 + 1 1 1 + 1 ++-+-++-+ -++++-++- +-+-++-++ +-+++-+-+ ++--++++- -+++-+-++ +-++-+++- ++-++--++ -++-+++-+ 238
Плакетт и Берман показали, как могут быть построены насыщенные планы до 100 при N, кратном 4 (за исключением N=92). Применение планов Плакетта —Бермана позволяет получать раздельные оценки линейных эффектов всех факторов с максимально возможной при данном числе опытов точностью, одинаковой для всех эффектов. Любой коэффи- циент линейного уравнения регрессии определяется по формуле N У Xji У1 /=1’2.....к- Погрешность в определении bj при этом равна sb / — sBocnp/l^^> где ^воспр- ошибка измерения. Поскольку матрица планирования ортогональна, такая оценка линей- ных эффектов совпадает с оценкой, полученной по методу наименьших квадратов. Кроме того, вследствие ортогональности матрицы получен- ные оценки линейных эффектов не смешаны между собой. Отношение bj к sB0Cnp/ т/N имеет распределение Стьюдента для нуль- гипотезы, т. е. истинного значения В( =0. Это отношение можно исполь- зовать для проверки значимости эффектов. Для проверки значимости различия между эффектами можно использовать отношение 5воспр^2 N также имеющее распределение Стьюдента. Пример 11. Исследовалась возможность получения азотно-фосфорно-калийного удоб- рения путем частичной замены поташа аммиаком при нейтрализации азотнокислотной вытяжки. Процесс нейтрализации можно охарактеризовать суммарной реакцией: 6Са (NO3)2 + ЗНЭРО4 + 6NH3 + ЗК2СО3 = ЗСаНРО4 + 6NH4NO3 + + 6KNO8 + ЗСаСО3 При исследовании последовательной нейтрализации вытяжки аммиаком и поташем особый интерес представляло выяснение степени ретроградации усвояемых форм оксида фосфора (V). Поэтому показателем процесса (у) служила степень усвояемости обра- зующихся фосфорных соединений (процентное отношение количества водорастворимых и лимоннорастворимых форм фосфора к общему количеству фосфора в продуктах реакции). В качестве независимых факторов были выбраны следующие: zi — температура аммонизации (2570°С); z2 — продолжительность аммонизации (15—30 мин); za — норма аммиака (100^150% от стехиометрической нормы); z», zs, ze, z? — содержание примесей в исходной вытяжке, соответственно 0 3,16% Mg(NOs)2; 0 -ь 0,89% Fe(NOa)2; 0 -ь 0,56% А1(МОз)3; 0-5-0,88% HaSiFe; ze — температура при взаимодействии компонентов аммонизи- рованной вытяжки с раствором карбоната калия (25 -5- 70°С); га — продолжительность взаимодействия с карбонатом калия (30 ч- 60 мин); гю — норма карбоната калия (100 — 120% от стехиометрической нормы). Постоянными оставались содержание в вытяжке РгОе(6,9%) и СаО (11%). Решение. В качестве плана эксперимента использовали первые 10 столбцов плана Плакетта — Бермана (табл. 56). 239
Таблица 56. Матрица планирования и результаты экспериментов Номер опыта X, Х2 *3 Х4 *5 *6 X ? Х8 Хд Х]О У 1 +1 +1 -1 +1 -1 -1 -1 +1 +1 +1 -1 19,15 2 +1 +1 +1 -1 +1 -1 -1 -1 +1 +1 +1 34,44 3 +1 -1 +1 +1 -1 +1 -1 -1 -1 +1 +1 85,08 4 +1 +1 -1 +1 +1 -1 +1 -1 -1 -1 +1 92,88 5 +1 +1 +1 -1 +1 +1 -1 +1 -1 -1 . -1 90,91 6 +1 +1 +1 +1 -1 +1 +1 -1 +1 -1 -1 51,76 7 +1 -1 +1 +1 +1 -1 +1 +1 -1 +1 -1 101,33 8 +1 -1 -1 +1 +1 +1 -1 +1 +1 -1 +1 101,34 9 +1 1 -1 -1 +1 +1 +1 -1 +1 +1 -1 98,62 10 +1 +1 -1 -1 -1 +1 +1 +1 -1 +1 +1 87,85 11 +1 1 +1 -1 -1 -1 +1 +1 +1 -1 +1 84,49 12 +1 -1 -1 -1 -1 -1 -1 -1 1 -1 -1 89,89 bi 78,19 15,13 -3,43 -2,83 8,40 7,84 7,96 2,64 -13,23 -7,01 2,91 312,76 61,44 13,72 11,32 33,60 31,36 31,86 10,58 52,92 28,04 11,64 Средние значения степени усвояемости у определены по двум параллельным опытам. Дисперсия воспроизводимости равна .^воспр = 1,48. Число степеней свободы /ВОспр “ 12. Табличное значение критерия Стьюдента /о,оэ(12) — 2,18. Таким образом, все коэффициенты уравнения регрессии оказались значимыми и уравнение имеет вид у = 78,19— 15,36 *! —3,43*2 —2,83*3 + 8,40 *4 + 7,84 *6 + + 7,96*в + 2,64 *,— 13,23 *в — 7,01 *, + 2,91 *10. (V.156) Так как план эксперимента был ненасыщенный (N — 12, к= 10), имеется одна степень свободы для проверки адекватности уравнения эксперименту. Дисперсия адекватности равна 12 Л 2 2 (71 -yt) о _ 1=1________ ад 12—н = 4,26. Значение F-отношения F = з2ад/№В0СПр — 2,88. Табличное значение критерия Фишера Fo.eaU, 12) =4,8. Таким образом, уравнение адекватно эксперименту. Полученное уравнение регрессии позволяет определить условия, обеспечивающие получение на основе азотнокислотной вытяжки из фосфатов удобрений, содержащих весь фосфор в усвояемой форме. При отсутствии параллельных опытов для оценки пвоспр можно ис- пользовать эффекты так называемых мнимых факторов. Мнимые факторы вводятся, если план ненасыщенный, т. е. k<N-\. При этом свободным столбцам матрицы планирования можно поставить в соответствие не- которые мнимые факторы и подсчитать их эффекты по общему правилу, как для действительных факторов. Эти эффекты отличаются от нуля за счет ошибки в измерении у и неучтенных эффектов взаимодействия. Если bk+2, bN_ i~ эффекты мнимых факторов, то величина = [bk+i + ^+2 + • • • + bN-\ j ^lL-l 240
служит оценкой квадратичной ошибки в определении эффектов главных факторов,а 4спр= N ( bk+l + bl+2 + • • • + bN~l ) является оценкой квадратичной ошибки в измерении отклика, если считать, что эффекты взаимодействия отсутствуют. Планы Плакетта — Бермана являются в ряде случаев более эконом- ными планами по сравнению с дробными репликами для данной раз- мерности факторного пространства. 13. Отсеивающие эксперименты. Метод случайного баланса. Для умень- шения числа опытов часто без достаточных оснований стабилизируют значения некоторых факторов в процессе исследования. При решении задачи оптимизации это приводит к определению только локальных экстремумов процесса. Для многофакторных задач на первой стадии исследования проводят отсеивающие эксперименты. Поскольку интенсив- ность влияния фактора связана с диапазоном его изменения, многие факторы, подозреваемые как существенные на основании априорной информации, могут оказаться незначимыми. Поэтому отсеивающие эксперименты эффективны не только при исследовании новых процессов, но и как первая стадия изучения многофакторных процессов с доста- точной априорной информацией, если число факторов слишком велико, чтобы сразу планировать эксперимент, направленный на поиск опти- мальных условий процесса. Для отсеивания количественных и качествен- ных факторов при числе уровней, равном двум, можно использовать дробные реплики от факторного эксперимента достаточно высокой сте- пени дробности, а также насыщенные ортогональные планы Плакетта — Бермана. Эти планы позволяют получать раздельные оценки линейных эффектов всех факторов с максимально возможной при данном числе опытов точностью, одинаковой для всех эффектов. Последнее особенно ценно на этапе отсеивания, так как неизвестно, какие эффекты окажутся значимыми. К недостаткам указанных планов относится требование от- сутствия значимых эффектов взаимодействия. Для выделения существенных эффектов — линейных и парных взаимо- действий—Саттерзвайтом предложен метод случайного баланса. В этом методе план эксперимента предлагается делать сверхнасыщенным — число опытов W в матрице планирования эффектов, г. е. в начале исследо- вания число степеней свободы /<0. Метод случайного баланса не обосновывается теоретически, а носит в основном эвристический характер. Основная предпосылка эф- фективного применения метода слу- чайного баланса: среди большого числа рассматриваемых эффектов лишь несколько действительно су- щественно влияют на процесс, а все остальные могут быть при- меньше числа рассматриваемых Рис. 54. Диаграмма ранжирования эффек- тов 241
знаны незначимыми и отнесены к шумовому полю. Если распо- ложить эффекты» в порядке убывания вносимого ими вклада в величины дисперсии выходного фактора, то получим диаграмму ранжирования (рис. 54). Эффекты, попавшие в правую часть диа- граммы ранжирования, должны быть отнесены к шумовому полю. Отнесение части эффектов к шумовому полю позволяет расщепить исходную математическую модель: У =а Ьо 4- + Ь2Х2 + ... + bhXh + &12Х1Х2 + ^13Х1Х3 +• • •+&£—1, k xk-l xk + ®воспр> где .sвоспр— ошибка опыта. Считая, что некоторые Xj обозначают парные взаимодействия, рас- щепленную модель можно записать в линейном виде: I—т т 1—т У= Ьо+ У + 2 С} Xi + и== ** + “’ /=1 /=1 /=1 где I- т — число значимых эффектов; т -число эффектов, отнесенных к шумовому полю; т с>\+и- /=1 тогда т ^=2СН'.+ 5воспр- /=1 1 Оценка значимых коэффициентов будет производиться с большой ошибкой шумового поля sa. В связи с этим метод случайного баланса обладает меньшей чувствительностью, чем ПФЭ или ДФЭ (под чувстви- тельностью метода понимается способность выделять коэффициенты регрессии, значимо отличающиеся от нуля). Однако метод случайного баланса обладает большей разрешающей способностью: он позволяет выделить раздельно доминирующие эффекты среди очень большого числа эффектов. Цель эксперимента методом случайного баланса состоит в том, чтобы распознать истинную диаграмму ранжирования и произвести расщепле- ние модели. После этого план из сверхнасыщенного становится не- насыщенным по отношению к значимым эффектам, поэтому их можно оценить количественно обычным путем. Если же число действительно значимых эффектов велико, то экономии опытов за счет сверхнасы- щенности не происходит. С увеличением числа значимых эффектов (особенно эффектов взаимодействия) эффективность метода случайного баланса падает. Чем круче будет убывать ранжировочная кривая, тем эффективнее будет отсеивание. Чтобы совместные оценки эффектов были смешаны случайным об- разом, необходимо при построении матрицы планирования использовать какой-нибудь случайный механизм. Чаще всего факторы в методе слу- 242
чайного баланса варьируют на двух уровнях. Для построения матрицы планирования предлагается: 1) «чистый» случайный баланс, при котором выбор плана для каждого столбца не зависит от выбора для других столбцов; 2) случайное смешивание систематических дробных реплик факторного эксперимента. Чистый случайный баланс менее эффективен, его используют, если ближайшая степень двойки существенно увеличи- вает число пытов. Прежде чем использовать полученную таким обра- зом матрицу планирования, необходимо убедиться в ее пригодности. Матрицу нельзя использовать, если в ней имеются полностью закорре- лированные столбцы. Чем больше корреляция между столбцами, тем больше опасность выделения так называемых «ложных» эффектов. За меру оптимальности матриц планирования принимают следующие по- казатели: 1) число ортогональных столбцов; 2) минимум значения модуля коэффициента корреляции для всех возможных взаимодействий (линей- ных—парных, парных — парных); 3) условие =0 для всех факторов. /-1 По этим критериям на ЭВМ в результате случайного смешивания реплик 25~', 26~’и случайного выбора столбцов были получены матрицы планирования, представленные в табл. 57 и в табл. 8, 9 приложения. Эти матрицы также можно использовать для меньшего числа факторов. Рассмотрим в качестве примера задачу выделения значимых эффек- тов среди 14 линейных и 91 эффекта взаимодействия (Л=14). Матрица планирования и результаты эксперимента приведены в табл. 57. В матри- це планирования коэффициент корреляции /* для столбцов 1—4 равен нулю, для столбцов 1—10 г* <0,517, для столбцов 1—14 г* <0,7. Для визуального выделения значимых факторов по результатам эксперимента строят диаграмму рассеяния (рис. 55). На первом этапе обработки экспериментов диаграмму рассеяния строят только для ли- нейных эффектов. Эффект признается значимым, если он имеет большое Табл и ц а 57. Матрица планирования в методе случайного баланса Но- мер опы- та X, Х3 *3 *4 *5 *6 х7 хв *9 *10 *1 1 *12 *13 *14 У У1 У» ,1V yv. ,V1 1 — + + — + — + — + + 38,03 38,03 38,03 38,03 36,03 36,03. 14,93 2 + - - + - - - - - + - - - 58,0 38,0 33,0 37,6 73,6 36,5 36,5 3 - - + + - - + + + - 46,59 46,59 34,79 34,79 34,79 34,65 34,65 4 + + + + + - - + + - + - 78,63 40,63 33,83 38,43 36,43 35,33 34,23 5 - - - - - + + + - - - - - 65,41 47,41 35,61 35,61 35,61 34,51 34,51 6 - + - + + + - + - + 81,75 43,75 31,95 36,55 34,55 35,51 34,41 7 - + + - - + - + - + - 59,81 41,81 35,81 36,81 34,81 35,77 34,07 8 + - - - - - + - - + - - - 58,39 38,39 33,39 37,99 35,99 35,99 35,99 9 - - - - + - + + 58,99 40,99 40,99 40,99 38,99 38,85 37,75 10 + - - - - - - - - - - + 72,15 34,15 34,15 34,15 34,15 34,01 34,01 и - + - - + - - + - - - - 43,0 43,0 36,2 36,2 34,2 33,1 33,1 12 + + - + - + - 70,37 50,37 38,57 38,57 36,57 36,43 35,33 13 - - — + + - + - - 54,0 36,0 29,2 33,8 31,8 32,76 32,76 14 + - + - - + + - + + - - 59,85 39,85 33,05 37,65 35,65 34,55 33,45 15 — + + - - + + + + - + 29,51 29,51 29,51 34,11 34,11 35,07 33,97 16 + - + + - - - + - 74,43 36,43 31,43 36,03 36,03 34,93 34,93 243
У во- :1 . • : . • : ;1 • . : : : io- -J • ’ • ’ : - _ • : : : • : • : • • • • •• • • _____________ • • « — • • —' * : s + t " -г : s т _ r : f v : 'r 50- - • • ••• /«••••• •• • 40-.................. I 30- [. . . . . I . -1—1—1-1—I—I-1—1—1-I—-111 til 111 111 lit I i I _ i I I III t i 1 I t I +Х,- +X?- +Xj- +X4- +xr +x6- +xz- +Xg- +X9- +X,g- +X„- +x,r +X,j- +X/4- Рис. 55. Диаграмма рассеяния результатов наблюдений по уровням факторов различие между медианами \Ме. Однако этот критерий недостаточен, поскольку он не является однозначным. Эффект признается значимым, если он также имеет большое число выделившихся точек, расположен- ных выше (ниже) концов интервала изменения значений у для другого уровня фактора. При оценке значимости факторов по числу выделив- шихся точек можно использовать непараметрическую оценку вероят- ности р того, что из 2и=Л'точек в верхней и нижней части диаграммы рассеяния может выделиться случайно R точек: К С2п-Р + 2 С2л-1-Я __/=! Для упрощения расчетов в качестве критерия значимости факторов можно использовать произведение разности между медианами на число выделившихся точек g— \AMeR\. Использовав этот критерий, по диа- грамме рассеяния (рис. 55) отобрали для количественной оценки факторы хь х6, хд. Количественнаяоценка при ручной обрабогке результатов про- водится при помощи таблиц с несколькими входами. Чем больше входов у таблицы, тем точнее оценивается эффект. Однако сверхнасы- щенный план часто не дает возможности заполнить все клетки таблицы. Такая ситуация возникла при построении таблицы с тремя входами для факторов хь х6 и хд (табл. 58). Поэтому пришлось ограничиться построением таблиц с двумя вхо- дами (табл. 59). По данным табл. 59 определим коэффициенты уравнения регрес- сии и Ь6: У1 + Уз _ Уз — У* 2 2 У1 + Уз _ Уз + У4 2 2 :2 = 9,86; :2 = 8,86. 244
Таблица 58. Таблица с тремя входами для оценки линейных эффектов факторов хь Х6 И Хе Хе Х6 xj *7 хГ х; 78.63 81,75 59,81 59,85 38,03 46,59 43,0 29,51 х„ 72,15 74,43 65,41 58,99 54,0 58,0 58,39 70,37 Таблица 59. Таблица с двумя входами для оценки линейных эффектов факторов Xi и хе X* 78,63 81,75 72,15 74,43 65,41 59,81 58,99 54,0 •*6 58,0 58,39 70,37 59,85 38,03 46,59 43,0 29,51 Т “ 76,74 у2 - 59.65 Тз — 61,65 Л “ 39,28 Для проверки значимости /-го эффекта используют критерий Стью- дента: sp=sw у S l/nt , (V. 159) и,—число наблюдений в /-й клетке; $2 — остаточная дисперсия, вычислен- ная на основании данных по рассеянию относительно средних арифме- тических в каждой клетке. Число степеней свободы fw= Т-п^ а, где а — число средних арифметических в таблице. Для табл. 59 имеем sp=5,6 4 -j- =5,6. Табличное значение критерия Стьюдента гОО6(12) = 2,18 2-9,86 2-8,86 —- = 3,5>2,18; <,= —— = 3,1 >2,18. 0,0 0,0 Таким образом, оба коэффициента значимы. 245
Далее снимают эффекты значимых факторов для выявления более слабых эффектов. Для этого вычитают значения 2bj из всех значений у, для которых фактор Xj находился на уровне +1. Так, при снятии эффекта фактора %, вычли значение 2-9,86 из у2, у4, у6, ув, у10, у12, у14, У16, а при снятии эффекта фактора х6 вычли значение 2 • 8,86 из у4, у5, Ув- Уч- Уэ- Ую- Ti3> Tie- Полученные результаты значений у' приведены в табл. 57. Затем всю обработку опытных данных повторяют, начиная с построения диаграммы рассеяния для откорректированных значений у. Критерием для окончания отсева служит дисперсионное отношение F = ®ср/ ®аоспр ’ где у2р — дисперсия результатов относительно среднего арифметического этих результатов. В рассматриваемом примере пришлось повторять весь цикл семь раз, выделенные эффекты и их оценки приведены в табл. 60. Таблица 60. Сводная таблица результатов отсеивающего эксперимента Номер этапа Выделен- ные эффекты Оценка коэффици- ентов регрессии Дисперсия ?2 ср Номер этапа Выделен- ные эффекты Оценка коэффици- ентов регрессии Дисперсия 5Ср I Хб 9,86 8,86 214,6 V х|3 х3х5 -0,48 +0,55 2,84 II Х1Х3 Х6Х7 3,14 2,53 27,36 VI Хз 0,55 2,08 III х&х5 -2,31 10,45 VII х7 -0,25 -0,4 1,73 IV Xe-V ю 1,0 3,89 Дисперсия воспроизводимости ^Оспр=0Л8,/ВОспр=5- Вычисленное зна- чение /'-критерия F = 1,73/0,48 = 3,62 меньше табличного F0,es (15,5) =4,6. Следовательно, различие между дисперсиями у2р и незначимо. Ручная обработка результатов в методе случайного баланса чрез- вычайно трудоемка. Предложен алгоритм обработки результатов случай- ного баланса на ЦВМ, так называемая «ветвящаяся стратегия». Разрабо- тан алгоритм для выделения наибольших эффектов по диаграммам рассеяния. Этот этап не вносит ничего нового по сравнению с ручной обработкой. Для количественной оценки выделенных эффектов исполь- зуют обычный регрессионный анализ. Можно одновременно оценивать до двадцати коэффициентов регрессии. На этом этапе вносится уже существенное улучшение. Если оценивать вместо трех сразу двадцать эффектов, то остаточная дисперсия резко уменьшается и тем самым увеличивается чувствительность метода. Выделение значимых эффектов производят в два этапа. Сначала отсеивают эффекты, отличающиеся от нуля менее чем на Зу, в противном случае последующее отсеивание 246
методом ветвящейся стратегии превратилось бы в громоздкую задачу. Затем оставшиеся эффекты исключают при помощи ветвящейся страте- гии; в качестве критерия используют величину остаточной дисперсии. Смысл ветвящейся стратегии состоит в том, что эффекты исключаются последовательно во всех возможных комбинациях по одному, по два и т. д. Этот процесс вторичного отсеивания продолжается до тех пор, пока не будет отобрана группа эффектов, обеспечивающая минимум остаточной дисперсии. Если учесть коррелированность коэффициентов регрессии (вследствие неортогональности матрицы планирования), то ясно, что ветвящаяся стратегия имеет несомненные преимущества перед раздельной оценкой коэффициентов регрессии при помощи /-критерия. При раздельной оценке часто выделяются ложные эффекты. Весь про- цесс отсеивания повторяется несколько раз до тех пор, пока остаточная дисперсия не снизится до необходимой величины. 14. Планирование эксперимента при определения констант уравнений формальной кинетики. В настоящее время интенсивно развивается новое направление по применению статистических методов для изуче- ния механизма и определения кинетических констант сложных хими- ческих реакций. Рассмотрим наиболее простые приемы, основанные на использовании идей и методов планирования экстремальных экспери- ментов для определения констант уравнений формальной кинетики. Наибольшее распространение получил способ обработки кинетических данных, заключающийся в линеаризации кинетических зависимостей при помощи специальных преобразований. Например, скорость реакции т п (V.160) i=i /=1 где Aj и Bj —исходные вещества и продукты реакции соответственно; а, и bj — стехиометрические коэффициенты; можно описать формальным уравнением г = /(П • (V.161> /=1 где К— константа скорости реакции; р, — порядок реакции по /-му ве- ществу; [А, ] — концентрация /-го вещества. Если зависимость константы скорости от температуры подчиняется закону Аррениуса, то имеем где Ко— предэкспоненциальный множитель; £—энергия активации; Л —газовая постоянная; Г—абсолютная температура. Ло! арифмирование уравнения (V. 161) с учетом (V. 162) дает Е т 1пГ=1пК0-— + 2ргШ[Аг]. (V.163) 247
Обозначив переменные следующим образом: Л In W=-y, In l/r=Z1, In [Л2] — Z2, In Kq — — EIR = a1, Pi = a2< In [21m] = ^m+1, Pm — am +1 > (V.164) получим линейное уравнение Л т+> У = ао + ^а1г1- (V. 165) i=i Для определения коэффициентов уравнения (V.165) методом плани- рования экспериентов можно использовать линейные ортогональные планы с числом опытов т 4- 2. Пример 12. Исследовалась кинетика процесса сополимеризации а, р, p-трифторстирола с метакриловой кислотой при небольших степенях превращения исходных мономеров в полимер. Уравнение формальной кинетики процесса рассматривалось в следующем виде: UZ = K[Cl + C'2]"*[/Z]"*> (V. 166) где [Ci] и [Ci] — концентрации исходных мономеров, моль/л; [//]— концентрации ини- циатора (перекиси бензоила), моль/л; я, и пг — порядок реакции по суммарной кон- центрации мономеров и инициатору; Е — энергия активации, кДж/моль; К— суммарная константа скорости реакции. Уравнение (V.166) позволяет определить порядок реакции относительно суммарной концентрации мономеров и инициатора, энергию активации и константу скорости реакции. Константа скорости реакции К зависит ог температуры по уравнению (V.162). В экспе- рименте суммарная концентрация исходных мономеров изменялась в диапазоне 8,08-т -т-11,18 моль/л, концентрация инициатора —в диапазоне 0,0504<-0,1512 моль/л, темпера- тура реакции 60 -г- 80°С. Решение. Логарифмируя уравнения (V.166) с учетом (V. 162), получим lg W — 1g Ко + rij lg [Cj 4- C2] 4- n2 1g [//]—"^“Ige—" ’ (V. 167) к 1 или в общем виде: Л у = а04--а1г,+«гг2 — а3г3, (V.168) где у = lg W, a0=lgK0. ai = n1( a2 = n2, аз — + lge> 21 = 'g [Cj 4- C2], z2 = lg [й] и ?,= l/T. /\ В качестве плаца эксперимента выбран ПФЭ 24. Безразмерные факторы связаны с линейным преобразованием (V.3). Координаты центра плана и интервалы варьиро- вания приведены в таблице (см. с. 249). В соответствии с планом эксперимента (табл. 61) были получены кинетические кривые зависимости степени превращения исходных мономеров в полимер от времени. Зависимость степени превращения q от времени аппроксимировалась линейным уравне- нием регрессии q == d$ + dxit 248
Логарифм суммарной концентрации исходных мономеров z. Логарифм концентрации инициатора Температура Z3, К-1 Интервалы варьирования A z, 0,0703 0,2380 0,00008 Координаты центра Плана z4 0,9777 -1,0591 0,00292 коэффициенты которого определялись методом наименьших квадратов. По этому урав- нению определялась начальная скорость реакции Wo как произведение коэффициента d\ на исходную суммарную концентрацию мономеров. Ошибка воспроизводимости, полу- ченная по параллельным опытам, равна .v вое пр — 5,43 Ю2. /воспр — 8. Таблица 61. Матрица планирования процесса сополимеризации а, р, p-трифторстирола с метакриловой кислотой Номер опыта Условия проведения экспе- римента в натуральном масштабе Скорость сополи- мериза- Значение факторов в безразмерной Логарифм начальной скорости системе координат суммар- ная кон- центра- ция ис- ходных мономе- ров zb моль/л концент- рация инициа- тора пе- рекиси бензоила *2, моль/л темпера- тура реакции 23, °C ции W Юэ, моль л • с *0 X, л2 -*3 (среднее по двум опытам) у = lg Wo 1 11,18 0,0504 60 1,11 + + — — 3,0453 2 8,08 0,0504 60 0,76 + - 4,8808 3 11,18 0,0504 80 6,60 + + — + 3,8195 4 8,08 0,{)504_ 80 4,46 + - + 3,6776 5 11,18 0,1512 60 Т,85 •+ + + — 3,2672 6 8,08 0,1512 60 1,29 + - - 3,1106 7 11,18 0,1512 80 11,30 + + + + 2,0531 8 8,08 0,1512 80 8,17 + + + 3,9122 Коэффициенты линейного уравнения регрессии 1/ — b0 -j- bjXj -j- Ь2х2 4- Ь3Хд (V. 169) были определены по формуле (V.9J. По результатам эксперимента (табл. 61) имеем &0= —2,5292, &1 = 0,075, &2 = 0,115, &э = 0,3948. Ошибка коэффициентов определенная по формуле (V.14), составляет sbj — ®воспр 5,43-10-2 Nm = 1,35-10-а. Проверка значимости коэффициентов по критерию Стьюдента показала, что все коэффициенты значимо Отличаются от нуля, так как для всех коэффициентов (-отно- шение больше (табл = 2,31. Уравнение (V.169) адекватно эксперименту: s2 аД 8 [ Л \» 2 2 *8 wt~ te”7* / .•—1 ' ' 249
Дисперсионное отношение si* 2,96- КГ8 в иипр меньше табличного ^0,95(4,8)—3,8. В соответствии с (V.169) и (V.168) t>L 0,075 л, =-----— = ——— = 1,05 « 1, 1 Дг! 0,0703 b3R 0,3948 £ = —----22----= -г------- 1,987-10“8-2,3-4,186 = 89,67 кДж/моль, Az3lg« 8-10"6 «о= 1g Ко. г° г° г° а^Ьо + Ъ-------— + Ь2 2— + Ь3 ~—= 10,5123 и Ко = 0,3253-10**. Дз2 Дг3 Уравнение формальной кинетики сополимеризации а, 0, p-трифторстирола с мета- криловой кислотой на начальной стадии реакции имеет вид _ 89,67 «7= 0,3253- 1012 [Ci 4- С.) [Я]0,5 е RT . (V. 170) Воспользовавшись свойствами ортогональности использованного плана эксперимента, определим среднеквадратичные ошибки полученных констант; ®п» — sb3 Я Azs 1g e Дг 1,35-10-* ------— = 0,193, 0,0703 1,35-10"* ----—— = 0,057, 0,238 s»3 Az2 1,35-10-2-0,00198-2,3-4,186 = 0,323, (V.171) 0,00008 s"i ~ = 1,35 (0,977)* (—1,0591)* (0,00292)* _ (0,0703)» + (0,238)* + (0,00008)» “ ’ ’ Из (V.171) следует, что ошибки констант зависят от интервалов варьирования фак- торов. За счет расширения интервалов варьирования можно уменьшить ошибки опре- деления констант. Рассмотренный метод линеаризации кинетических уравнений приво- дит к получению смещенных оценок для констант, так как константы определяются из условия минимума квадратичной формы: 250
а не из Ф1_^)2=i=2(lgw'i~lg^i У, i=l 1=1 п к ф.= W'i)’- i=l ' Кроме того, зависимость (V.161) достаточно формальна. Опираясь на стадийный механизм реакций, было предложено определять констан- ты скоростей каждой стадии из условия минимума квадратов отклонений Фз (V. 172) где п~ число опытов; т~ число компонентов; sc. —ошибка воспроиз- водимости определения концентрации /-го компонента. Установлено, что при определении концентраций веществ без систе- матической ошибки оценки констант, минимизирующие квадратичную форму Ф3, будут несмещенными. Вычисление концентраций с- произ- водится или на основе интегральной формы кинетического уравнения, или численным интегрированием системы кинетических уравнений. Минимум квадратичной формы Ф3 определяют каким-либо методом нелинейного программирования. Сходимость решения зависит от началь- ного приближения. Для реакций, кинетика которых описывается системой обыкновенных дифференциальных уравнений с правыми частями в виде полиномов по концентрациям реагирующих веществ, предлагается для получения оценок констант пользоваться дифференциальными уравнениями, а не их интегральными формами. Например, для последовательно-параллель- ной реакции вида 2А — --------------С В + А--------»D--------► Е (V. 173) система кинетических уравнений имеет вид W'i = 44 = {kl + ki) (А]2 + *3 1А] 1В] ’ d [В] = kx [Ар - k3 [А] [В], = if! = [Ар, (V.174) аг d [D] U74= -^- = maj [В] — a4 [D], 251
= ^- = *4 Pl- Из (V. 174) следует, что уравнения кинетики для рассматриваемого класса реакций в общем виде соответствуют квадратичному полиному, обычно применяющемуся для описания почти стационарной области: У = baiXaXi + 2 h”*2' ’ (V.175) / «</ / в котором независимыми факторами х являются концентрации реаги- рующих веществ, а откликом у—скорость образования того или иного компонента. Константы скоростей реакций первого порядка интерпре- тируются при таком подходе как линейные эффекты fy, константы скоростей смешанного второго порядка —как эффекты взаимодействия bUj и константы скоростей реакции второго порядка —как квадратичные эффекты — bj/ Если схема реакций заранее неизвестна, но известны все те вещества, которые могут участвовать в реакции, то план эксперимента составляется так, чтобы по результатам опытов можно было найти независимые оценки всех коэффициентов полиномов второго порядка. Далее проводится проверка значимости коэффициентов и определяется схема реакции. При протекании реакции концентрации действующих веществ не- прерывно меняются, поэтому при планировании эксперимента в качестве факторов берут начальные концентрации реагентов, а в качестве, откли- ка—начальные скорости реакции. Для определения последних обычно проводят графическое или численное дифференцирование начальных участков кинетических кривых или обрабатывают данные, полученные на проточно-циркуляционных установках. Пример 13. Изучалась кинетика реакций каталитического окислительного дегидри- рования бутенов в дивинил. На основании предварительных исследований был принят механизм реакций, в котором исключены обратные превращения дивинила в бутилены, Здесь А, В, С, D соответственно бутен-1; траис-бутен-2; (/иг-бутен-2, дивинил. При изучении кинетики реакций окислительного дегидрирования был установлен нулевой порядок по кислороду и первый порядок по бутиленам; специальными опытами было доказано отсутствие тормозящего влияния продуктов реакции. Кинетика реакций представлена системой дифференциальных уравнений: —— = — + k3 + fe7) [А] 4- й2 [В] Д- kt [С], си d [В] -~= - (*1 + kb + Л8) [В] + йг [А] + kt [С], (V.176) 252
□ J = — (А* + + kt) [С] + k3 [А] + kt> [В] , dl = й, [А] + k8 [В] + А» [С], аг где k/(j — 1, 2, 9) —константы скоростей псевдомономолекулярных реакций; [А], [В], [С], [D] — концентрации реагентов в газовой фазе. Таким образом, необходимо определить по экспериментальным данным константы скоростей девяти реакций и показать, что система (V.176) адекватно описывает кинетику реакций. Решение. Обозначим начальные концентрации веществ А, В, С через zi, zi, гз соответственно. Рассматривая скорости накопления веществ как отклики уи, а начальные концентрации как независимые факторы, получим из (V. 176) Уи = b0u+blux1+b2ux.1 + b3ux3, и =1,2,3,4- (V.177) Переменные xi, х%, хз связаны с начальными концентрациями обычным линейным преобразованием *i = (zj - Z?)/Azy. Свободный член в уравнении (V.177) связан с линейными членами: 2° 2° 2° Ьо =Ь± —- + b2 — + b3 — . (V.178) °“ 1ц A2j “ Дг2 3“ Дг3 Кинетику дегидрирования бутенов исследовали при различных температурах. Для каждой температуры составлялась своя матрица планирования. Рассмотрим кинетический эксперимент при 7 — 669 К. Область исследования приведена в таблице (z —концентра- ция бутенов, мол. доли): Z2 % 3 Az; 0,01500 0,00500 0,01158 0,00386 0,00993 0,00331 Для каждой функции отклика (V.176) нужно найти только три коэффициента. По- этому при планировании достаточно взять '/а от ПФЭ 23. Здесь, однако, использован ПФЭ типа 23 (табл. 62), так как это позволяет точнее определить константы скоростей реакций и более подробно анализировать отклонения величин, предсказанных урав- нениями, от опытных данных. Для определения дисперсии воспроизводимости некоторые опыты дублировали. Таблица 62. Матрица планирования для исследования кинетики дегидрирования бутеиов Номер опыта -*1 х2 •*3 >1 Л Уз Л 1 -1 1 -1 -0,288 0,046 0,003 0,272 2 -1 -1 +1 -0,263 0,077 -0,102 0,255 3 -1 +1 -I -0,286 -0,124 0,041 0,257 4 +1 -1 -1 -0,737 0,068 0,033 0,370 5 +1 +1 +1 -0,678 -0,063 -0,060 0,426 6 +1 +1 -I -0,725 -0,043 0,058 0,342 7 +1 -1 . +1 -0,705 0,124 -0,130 0,356 8 -1 +1 +1 -0,276 -0,139 -0,180 0,262 253
Скорость накопления веществ у (мол. доли/с) определяли по формулам: [А]т— [A], [В]х - [В], У1 =------------ , yi = ----------- , (V. 179) [С]х- [С]о [D]X-[D]O Уз =------------ - У4 = ----------- • т т Здесь индекс «О» относится к начальным концентрациям бутенов, а индекс т—к кон- центрациям, соответствующим времени т. Таким образом, начальные участки кинети- ческих кривых были аппроксимированы прямой линией. При этом вычисляемые оценки скоростей накопления реагентов будут смещенными, причем смещения зависят от ско- рости реакции. Чем более активно в химическом отношении реагирующее вещество, тем большее смещение будут иметь соответствующие константы скорости. В таблице при- ведены значения констант и их ошибок, полученные по данным планированного экспе- римента и методом нелинейных оценок (МНО). Константы скоростей, с~' /.'1 ki кз к* кз кб ki Zs кц По плану 7,128 0,74 6,62 5,60 ЗА! 2,57 10,80 1,08 2,90 По МНО 9,07 0,75 9,38 6.51 3,64 2,58 29,59 1,И 3,10 ' (к) 1,8 2,6 1,8 3,5 2,6 3,5 1,8 2,6 3,5 Сравнение констант скоростей с их ошибками показывает, что ряд констант не выделяется на фоне шума. Для уменьшения ошибок констант необходимо увеличить интервалы варьирования. Оценки полученных констант были уточнены методом нели- нейных оценок (МНО). Согласно этому методу константы скоростей реакций должны быть подобраны таким образом, чтобы была минимальной сумма квадратов отклоне- ний (V.172). Концентрации с,у получены интегрированием системы (V.176) от t — О до Т—т при начальных условиях (см. таблицы на с. 253). Суммирование проводилось по всем опытам, причем слагаемые входили с равными массами, так как было доказано что ошибки воспроизводимости концентраций всех веществ однородны. В качестве начального приближения были использованы константы, определенные по плану. Затем по критерию Фишера была проверена адекватность математической модели (V.176) эксперименту: 2 ___ Ф (^)min S°CT“ 8.4-9 ’ гдеф(/с)тп — остаточная сумма квадратов отклонений. Отношение остаточной дисперсии к дисперсии воспроизводимости близко к единице, что указывает на адекватность системы (V.176). 15. Планирование эксперимента в производственных условиях. В про- изводственных условиях на показатели процесса помимо основного комплекса факторов, исследованных в лабораторных условиях, влияет также множество факторов, контролировать которые трудно или невоз- можно. Это приводит к тому, что оптимальные условия, найденные в лабораториях, часто не воспроизводятся в промышленности, а также к дрейфу координат оптимума в ходе эксплуатации объекта. В связи с этим необходимо периодически проводить эксперимент непосредствен- но на промышленном объекте для уточнения координат оптимума. Возможности экспериментирования на действующих промышленных установках, как правило, ограничены: в отличие от лабораторного 254
эксперимента в производстве экспериментирование поставлено в жесткие условия, факторы можно варьировать только таким образом (обычно в пределах, допускаемых регламентом), чтобы это не привело к получе- нию бракованной продукции. В производственных условиях значительно больше, чем в лабораторных, ошибка опыта, выше уровень «шума». Однако в отличие от лабораторных условий, где стараются минимизи- ровать число опытов, в промышленном эксперименте нет такой необ- ходимости уменьшать число опытов. Поэтому для уменьшения ошибки можно дублировать опыты для выделения слабого полезного сигнала на фоне шума. Задача планирования промышленных экспериментов —путем осто- рожных изменений процесса, не приводящих к браку, получить одно- временно с продукцией и информацию о смещении оптимума про- цесса и затем на основании этой информации перейти к новым опти- мальным условиям. Такая методика промышленного эксперимента получила название метода эволюционного планирования (ЭВОП) или адаптационной оптимизации. Метод был предложен Боксом и представ- ляет собой использование методов экстремальных экспериментов в промышленных условиях. Факторы варьируют на двух уровнях, реализуя полный факторный эксперимент или дробную реплику от него с включением опыта в центре плана. Такой эксперимент называют циклом. Поскольку интер- валы варьирования факторов в промышленном эксперименте невелики, а ошибка опыта большая, после реализации одного цикла, как правило, значимых эффектов выделить не удается. Поэтому циклы повторяют несколько раз. При этом происходит накопление результатов наблюде- ний, что дает возможность уменьшить ошибку, так как ошибка среднего в -/и раз меньше ошибки единичного измерения. Повторяющиеся циклы образуют фазу эксперимента. После окончания каждой из фаз проводят обработку результатов экспериментов. В одной фазе делается столько циклов, сколько необходимо для того, чтобы на фоне помех обнаружить значимый эффект от воздействия одной или нескольких переменных на функцию отклика. Число циклов зависит от величины интервалов варьирования и характера поверхности отклика. Чем больше интервал варьирования, тем меньше число циклов в фазе. Однако, как уже гово- рилось, интервалы варьирования в промышленном эксперименте нельзя сильно увеличивать. По окончании фазы выбираются новые базовые значения для варьи- руемых переменных, составляется и п раз реализуется новый план эксперимента. Обработка результатов эксперимента при эволюционном планировании, по сути дела, та же, что и при применении обычных факторных планов первого порядка (см. гл. V. 1, 2). Разница состоит в том, что расчет коэффициентов регрессии и проверка их значимости про- водятся не после завершения всех опытов фазы, а после каждого цикла. Это связано с тем, что заранее неизвестно, сколько циклов будет содер- жать фаза, чтобы можно было выявить значимые эффекты. Для облег- чения расчетов ошибку опытов считают после каждого цикла в данной фазе, начиная со второго, по параллельным наблюдениям методом размаха. 255
Пусть после проведения п циклов для N независимых опытов имеем: Усредненные значения после (л —1)-го цикла................yi, yi, Измеренные значения для л-го цикла.....................у1,у2,....у^ Разность (у,—у,)...............Ду,, Ай. .... l\yN Отсюда можно найти N 1=1 N— 1 (V.180) В то же время Sly (V. 181) Следовательно, после проведения п циклов дисперсию sj, характе- ризующую ошибку опыта, можно найти по формуле о л — 1 „ s2 = -----s2 {V 182) * п AV Для упрощения вычислений в ЭВОП-методе оценку s^y получают не по (V. 182), а используя размах величин Ду,-: sA^ = SA!//d> (V.183) где 8Д</ = | шах Ду, — min Дуг | ; d — константа для преобразования значения диапазона изменения Ду в оценку среднего квадратичного отклонения этой величины. Из (V. 182) и (V.183) следует, что Значения представлены в табл. 63. Таблица 63. Значения f„ Номер цикла Числов опытов N 2 "Т-1 4 I 5 | 6 I 7 I 8 Г~9 Номер цикла Число опытов У 2 3 4 5 6 7 8 9 10 0,63 0,72 0,77 0,79 0,81 0,82 0,83 0,84 0,84 0,42 0,48 0,51 0,53 0,54 0,55 0,55 0,56 0,56 0,32 0,40 0,42 0,43 0,44 0,45 0,45 Q46 0,46 0,30 0,35 0,37 0,38 0,39 0,40 0,40 0,40 0,41 0,28 0,32 0,34 0,35 0,36 0,37 0,37 0,37 0,37 0,26 0,30 0,32 0,33 0,34 0,34 0,35 0,35 0,35 0,24 0,27 0,29 0,30 0,31 0,31 0,31 0,32 0,32 0,23 0,26 0,28 0,29 0,30 0,30 0,30 0,31 0,31 11 12 13 14 15 16 17 18 19 20 0,84 0,85 0,85 0,85 0,86 0,86 0,86 0,86 0,86 0,86 0,56 0,57 0,57 0,57 0,57 0,57 0,57 0,57 0,58 0,58 0,46 0,47 0,47 0,47 0,47 0,47 0,47 0,47 0,47 0,47 5 6 7 8 9 0,41 0,38 0,35 0,32 0,31 0,41 0,38 0,35 0,32 0,31 0,41 0,38 0,36 0,32 0,31 0,41 0,38 0,36 0,32 0,31 0,42 0,38 0,36 0,33 0,32 0,42 0,38 0,36 0,33 0,32 0,42 0,38 0,36 0,33 0,32 0,42 0,38 0,36 0,33 0,32 0,42 0,38 0,36 0,33 0,32 0,42 0,38 0,36 0,33 0,32 2 3 4 256
Ошибка опыта определяется по формуле ^fn.N^y- (V.184) Регистрация и обработка результатов эволюционного планирования про- водится с помощью специальных рабочих таблиц. Рассмотрим порядок расчетов и заполнения рабочих таблиц на сле- дующей задаче. В процессе получения аммиачной селитры при взаимо- действии аммиака с азотной кислотой наблюдаются безвозвратные по- тери связанного азота (аммиака и селитры) с вторичным паром. Потери связанного азота зависят от режима в реакторе. В результате промыш- ленного эксперимента требуется минимизировать потери связанного азота (у, г/л), варьируя кислотностью щелоков (xt) и нагрузкой по аммиаку (х2). Для факторов были установлены основной уровень, со- ответствующий обычному технологическому режиму, интервалы варьи- рования, верхние и нижние уровни (табл. 64). Таблица 64. Область исследования Факторы Кислотность щелоков, г/л HNOa Нагрузка по NHa, м3/ч Основной уровень 0,7 1850 Интервал варьирования 0,4 80 х — +1 1,1 1930 XJ = 4 о,3 1770 План эксперимента представлен на рис. 56 и в табл. 65. к-2 Рассмотрим рабочую таблицу для расчетов, заполненную после первого цикла (табл. 66). После первого цикла строки 1, 2 и 4 блока «Расчет средних» не заполнены. В этом блоке в 3-й строке записаны результаты опытов в точках плана 1 -г 5, в строках 5 и 6 — средние значения отклика (потерь связанного азота) по всем опытам в каждой точке плана. Для первого цикла в строчки 5 и 6 записывают наблюдения. По результатам только первого цикла нельзя оценить ошибку опыта, сделать это можно, начиная только со второго цикла. Блок «Расчет 257
ошибки опыта» для первого цикла остается незаполненным. Однако для последующих экспериментов можно воспользоваться величиной ошибки опыта, оцененной в предыдущих фазах, а для первой фазы — априорной оценкой, приведенной в табл. 66 внизу справки. Таблица 66. ЭВОП, фаза 1, цикл л = 1 Расчет средних Расчет ошибки опыта Номера точек эксперимента 1 2 3 4 5 1. Сумма предыдущих циклов 2. Среднее предыду- щих циклов 3. Новые наблюдения 4. Разности (2) — (3) 5. Новые суммы (1) + (3) 6. Новые средние ~yt- 5,0 6,5 5,5 5,5 5,6 5,0 6,5 5,5 5,5 5,6 5,0 6,5 5,5 5,5 5,6 1. Сумма ошибок предыдущих циклов 5 = 2. Средняя ошибкапредыдущих циклов Sy = 3. Размах = 4. Новое значение ошибки Sy = размах <уи= 5. Новая сумма ошибок 5 = 6. Новая средняя ошибка sy = = (5) п - 1 ~ Расчет эффектов Расчет доверительных интервалов (ДИ) 1. Эффект кислотности Si = | (у3 + ул - у? - у5) = --0,505 2. Эффект нагрузки S2 = | (уз + Ь - уг -уд) = -0,45 3. Эффект взаимодействия S>2 = | (уз + уз -уд - Уз) — 0,45 4. Эффект изменения среднего М — у (уз + уз + уд + ys - 4у>) = 0,62 1. ДИ для новых средних 2 у = +1,0 vn Д ’ 2. ДИ для эффектов /'г =±1,0 vn 7 3. ДИ для эффекта изменения 1 70 среднего 4=1;. =±0,89 vn Д Выводы: значимые эффекты не выявлены Априорная ошибка опыта зу = 0,5 Решение: повторить опыт В блоке «Расчет эффектов» считают эффекты факторов и их взаимо- действий. Эффект некоторого фактора равен приращению значения пара- метра оптимизации (отклика) в результате перехода фактора с нижнего уровня на верхний. В случае двух факторов эффект х. эффект х2 . _ Уз + У4 — Уг~ Уь 2 , Уз + У» — Уа — У4 2 — А (V.185) (V.186) 258
эффект взаимодействия Blt = у?+уз2 (V.187) Таким образом, эффекты факторов равны удвоенным коэффициентам уравнения регрессии при использовании линейных ортогональных пла- нов типа 2к или 2к~р (см. формулу V.9). Результаты расчетов В}, В2 и В]2 заносят в 1, 2 и 3-ю строки блока «Расчет эффектов». В 4-ю строку этого блока записывают значение эффекта изменения среднего параметра оптимизации ( ц). Этот эффект подсчитывают как разность между общим средним по всем результатам эксперимента и значением у„ полученным в центре плана (на основном уровне): эффект изменения среднего У г + Уз + Hi + Us + У1 — Уг + Уз + У4 + Уъ — tyi „, , I* = -------------------~У1= --. (V. 188) О 5 Эффект изменения среднего характеризует поверхность отклика в облас- ти экспериментирования. Если поверхность имеет экстремум, а опыты проводятся далеко от него, эффект изменения среднего будет значи- тельным, причем если ц значительно меньше нуля, поверхность имеет максимум, если ц значительно больше нуля — минимум. При плоской форме экстремума или наличии седловой точки эффект изменения сред- него в области экстремума будет близок к нулю. В блоке «Расчет доверительных интервалов» рассчитывают довери- тельные интервалы (ДИ) для среднего, эффектов и эффектов изменения среднего. Для построения доверительных интервалов используют рас- пределение Стьюдента. Для эффектов факторов и эффектов взаимодействий 2 «у ДИ = ± t ; (V. 189) у N — 1 Vn. для эффекта изменения среднего ДИи = ± t (V-190) При Л' = 22+1=5 для доверительной вероятности В=0,95 значение t «2 и, следовательно, из (V.189) и (V.190) имеем su ДИ=±2 —, (V.191) Vn ДИ^ = ± 1,78 —. (V.192) К" Эффекты считаются статистически значимыми, если они равны или боль- ше по абсолютной величине доверительных интервалов. В рассматри- ваемом примере (см. табл. 66) при расчете доверительных интервалов использовалась априорная ошибка опыта sy =0,5. Сравнение величин эффектов с границами их доверительных интервалов свидетельствует 259
об отсутствии значимых эффектов и о необходимости перейти ко второму циклу данной фазы, т. е. еще раз повторить все опыты плана. Рабочая табл. 67 заполнена после второго цикла. Во втором цикле мы начинаем получать информацию об ошибке опыта из данных этой же фазы. Последовательность заполнения рабочей таблицы для второго цикла следующая. 1. Данные из строк 4 и 6 блока «Расчет средних» таблицы первого цикла (см. табл. 66) переносят в строки 1 и 2 того же блока таблицы второго цикла (табл. 67). Таблица 67. ЭВОП, фаза 1, цикл п = 2 Расчет средних Расчет ошибки опыта 1. Сумма предыдущих циклов 2. Среднее предыду- щих циклов 3. Новые наблюдения 4. Разности (2) — (3) 5. Новые суммы (1) + (3) 6. Новые средние 1 п Номера точек эксперимента 1. Сумма ошибок предыдущих циклов 5 — 2. Средняя ошибка предыду- щих ЦИКЛОВ = 3. Размах = 3,5 4. Новое значение ошибки sy = размах „ = 1,05 5. Новая сумма ошибок з = 1,05 6. Новая средняя ошибка " Г '-05 1 2 3 4 5 5,0 5,0 7,0 -2,0 12,0 6,0 6,5 6,5 5.5 1,0 12,0 6,0 5,5 5,5 4,0 JA 9,5 4,75 5.5 5,5 5.0 0,5 10,5 5,25 5,5 5,5 6,5 -1,0 12,0 6,0 Расчет эффектов Расчет доверительных интервалов (ДИ) 1. Эффект кислотности В\ = /г (уз + уз - У2 - уз) — -1,0 2. Эффект нагрузки В г = Уз (уз + уз - уг - У4) = -0,25 3. Эффект взаимодействия Вп = !4 (уг + уз - У4 - уз) = -0,25 4. Эффект изменения среднего М = Vs (Уг + Уз + У4 + J’s - 4yi) — -0,4 1, ДИ для новых средних 2 2 1,05 . ,0 r-Sy- FT -1,48 V п ’ УТ. 2. ДИ для эффектов 2 2 3 ' 4,05 л0 ~7=-Зу “ 1,48 ТЛ У 2 3. ДИ для эффекта изменения 1 78 1 78 среднего ’ з у =-2—1,05 — 1,32 7Г /Т Выводы: значимые эффекты не выявлены Априорная ошибка sy - 0.5 Решение: повторить цикл 2. Результаты опытов, полученные во втором цикле, записывают в строку 3. 3. В строку 4 заносят со своими знаками разности строк 2 и 3, наибольшие и наименьшие разности подчеркивают. Это разности 260
между средними результатами предыдущего цикла и новыми результа- тами. 4. Встроке5 блока «Расчет средних» записывают новые суммы резуль- татов наблюдений для каждой точки плана, т. е. суммы строк 1 и 3. 5. В строке 6 записывают новые средние для каждой точки плана как частные от деления новых сумм (строка 5) на число циклов к данному времени, т. е. в нашем случае частное от деления данных строки 5 на п — 2. 6. По формулам (V.185) —(V. 188) рассчитывают эффекты факторов, их взаимодействий и эффект изменения среднего. Полученные значения заносят в блок «Расчет эффектов». 7. В блоке «Расчет ошибки опыта» для второго цикла строки 1 и 2 не заполнены; в строку 3 записывают размах величин 5Ду, определен- ный как разница между подчеркнутыми в строке 4 блока «Расчет сред- них» наибольшим и наименьшим значениями разностей Ду. В нашем случае размах равен 8Ду = 1,5 - (- 2,0) — 3,5. 8. В строку 4 записывают величину новой ошибки опыта, которую считают методом размаха по формуле (V.183). Величину fNn находим из табл. 63. В нашем случае Л = 5, и = 2,/52=0,30. Величина ошибки 5 = 3,5 -0,30 = 1,5. К концу второго цикла еще’нет оценок ошибки опыта из предыдущего цикла, поэтому в строки 5 и 6 блока «Расчет ошибки опыта» переписывают величину новой ошибки (строка 4). 9. По формулам (V.189) — (V.192) определяют доверительные интер- валы для нового среднего, эффектов и эффекта изменения среднего, которые записывают, соответственно, в строки 1, 2 и 3 блока «Расчет доверительных интервалов». 10. Сравнивают величину эффектов с соответствующими доверитель- ными интервалами и делают вывод о статистической значимости эффек- тов, после чего принимают решение о следующем этапе. В нашем случае все рассмотренные во втором цикле эффекты оказа- лись статистически незначимыми, и было принято решение еще раз повторить все опыты плана, т. е. перейти к третьему циклу. Начиная с третьего цикла, заполняются все строки рабочей таблицы (табл. 68). Все вычисления проводятся так же, как для предыдущих циклов, только в блоке «Расчет ошибки опыта» в строки 1 и 2 пере- писывают результаты из строк 5 и 6 того же блока предыдущего цикла. В строку 5 вносят результаты, полученные суммированием строк 2 и 4, строку 6 получают делением строки 5 на п - 1. Оценка результатов третьего цикла свидетельствует о значимом отличии от нуля эффекта кислотности. В данной ситуации принимается одно из двух возможных решений. 1. Продолжить текущую фазу планирования для более четкого вы- деления значимых эффектов. 2. Начать новую фазу планирования. Начиная новую фазу, в качестве центра нового плана можно выбрать точку плана предшествующей фазы с наилучшим значением целевой функции. В рассматриваемом примере (табл. 68) было принято решение начать новую фазу с центром плана в точке 3 (рис. 57). В новой фазе планирования при необходимости можно изменить 261
Таблица 68. ЭВОП, фаза 1, цикл п = 3 Расчет средних Расчет ошибки опыта 1. Сумма предыдущих циклов 2. Среднее предыду- щих циклов 3. Новые наблюдения 4. Разности (2) — (3) 5. Новые суммы (1) + (3) 6. Новые средние Номер точек эксперимента 1 2 3 4 5 12,0 . 12,0 9,5 10,5 12,0 6,0 6,0 4,75 5,25 6,0 5,5 6,5 4,2 4,0 6,0 0,5 ~0,5 0,55 1,25 0 17,5 18,5 13,7 14,5 18,0 5,8 6,2 4,6 4,8 6,0 1. Сумма ошибок предыду- щих циклов з — 1,05 2. Средняя ошибка предыду- щих циклов sy = 1,05 3. Размах - 1,75’ 4. Новые значения-ошибки s у = размах Дг„-0,6 5. Новая сумма ошибок з ”= 1,65 6. Новая средняя ошибка Ъ=ТГ?Т-0,81 Расчет эффектов Расчет доверительных интервалов (ДИ) 1. Эффект кислотности Bi = -у (уз + У4 - уг - Уь) = -1,4 2. Эффект нагрузки В2 = -у (уз + J’s - уз - У<) •-0,2 3. Эффект взаимодействия #12 = (УЗ + уз ~ У4 - уз) — 0,0 4. Эффект изменения среднего 41 = (уз + уз + у4 + уз - 4yi) = 0,32 1. ДИ для новых средних 2 2 0,81 . ——sy =----=.—-0,90 тП. у 2. ДИ для эффектов ~^s у = 0,94 V П 3. ДИ для эффекта изменения среднего зу — 0,81 vn Выводы: эффект кислотности значим Априорная ошибка опыта sy = 0,5 Решение; начать новую фазу интервалы варьирования факторов, можно изменить и сами факторы: некоторые из прежних оставить на выбранном оптимальном уровне и включить в программу эксперимента новые факторы; можно добавить Кислотность (х^ Рис. 57. Схема перехода ко второй фазе факторы к уже имеющимся. Наиболее часто при эволюционном планировании варьируют два или три фактора. Расчеты для трех факторов во многом аналогичны двухфак- торной задаче. Для каждого фактора выби- рают по два уровня варьирования. Цикл представляет собой полный факторный эксперимент 23 (рис. 58). Однако в данном случае цикл делят на два блока, а в центре плана проводят два опыта (табл. 69). 262
Каждый блок является дробной репли- кой типа 23”1 и опытом в центре плана. Блок I представляет собой полуреплику 23'1 с определяющим контрастом 1= —Х1Х2Л3. Это позволяет получить следующую систему оценок; ?1 — ?гз> Й2^?г-?13. (V.193) ^3 “* ?3 — ?12 • Таблица 69. Матрица планирования Номер опыта Х1 Х2 хз XlX2 Xi ХЗ Х2Хз X1X2X3 У 1 0 0 0 0 0 0 0 2 -1 --I -1 +1 +1 +1 -1 Т2 j 3 +1 +1 -1 +1 -1 -1 -1 Уз блок 4 +1 -1 + 1 -1 +1 -1 -1 У* 5 -1 +1 + 1 -1 -1 +1 -1 6 0 0 0 0 0 0 0 -V6 7 -1 -1 +1 +1 -1 1 +1 Т? II 8 +1 +1 +1 +1 +1 +1 +1 Те блок 9 +1 -1 -1 -1 -1 +1 +1 10 -1 +1 -1 -1 +1 -1 +1 Д’10 с определяющим Опыты блока II составляют другую полуреплику 23 ~ контрастом 1=х^х2х3. Система оценок следующая: В” -> 31 + ?23 • В” “* ?2 + 313 > В” “► Зз + 31S’ (V» 194) Объединение опытов блоков I и II приводит к полному факторному эксперименту 23, который дает возможность получить несмешанные оценки для линейных эффектов и эффектов парного взаимодействия: В1 = ~ (S? + SV) - ?i. ^+в") * В3= у (5з + 5Г) ₽3. (V. 195) Bi2 — g (В” Bj) -> Э12, 263
Bis— j (^2I— ^2) “* ?is> B23=-i- (Bj' -Sj) -> ?»• Рассмотрим порядок заполнения рабочих таблиц в трехфакторной задаче на примере промышленного эксперимента по минимизации потерь связанного азота. Вторую фазу эксперимента было решено начать с центром в точке 3 (см. рис. 58). Введем в рассмотрение третий фактор — температуру (х3). Основной уровень, интервалы варьирования и границы области исследования приведены в табл. 70. Таблица 70. Область исследования Факторы Кислотность, Г/л Нагрузка по NH3, мз/ч Температура, °C Основной уровень 1,1 1930 65 Интервал варьиро- вания 0,4 80 5 Xj =+1 1,5 2010 70 0,7 1850 60 В результате трех циклов второй фазы получены следующие значе- ния отклика г/л (табл. 71). Таблица 71 Блок I II Номера точек эксперимента 1 2 3 4 5 6 7 8 9 10 Цикл 1 5,8 6,2 4,8 6,1 6,о 6,5 5,9 5,5 5,8 6,3 Цикл 2 6,2 5,6 5,9 5,5 5,6 4,9 5,7 5,1 5,0 6,3 Цикл 3 4,5 6 2 4,0 5,0 5,9 6,6 - 5,8 4,3 4,7 6,5 Расчеты для каждого цикла выполняются в двух рабочих таблицах, отдельно для каждого блока. В табл. 72 приведена рабочая таблица блока I третьего цикла второй фазы промышленного эксперимента по минимизации потерь связанного азота в производстве аммиачной селит- ры, а в табл. 73 — блока II того же цикла той же фазы. В блоке «Расчет эффектов» (табл. 72, 73) вычисляются оценки эффектов в соответствии с (V.193) и (V.194). В блоке «Окончательный расчет эффектов» рабочей таблицы для блока II усредняются оценки для эффектов в соответствии с (V. 195). Здесь же рассчитывается эффект изменения среднего по данным полного цикла усреднением соответствующих эффектов для блоков I и II. Расчет ошибки опыта проводится по данным каждого из блоков, при этом размах определяется как сумма наибольших и наименьших 264
Таблица 72. ЭВОП, фаза 2, цикл л — 3, блок I Расчет средних Расчет ошибки опыта 1. Сумма предыдущих циклов блока I 2. Среднее предыду- щих циклов блока I 3. Новые наблюдения 4. Разности (2) — (3) 5. Новые суммы блока I (1)4- (3) 6. Новые средние , , - (5) блока I у,- =—- J1 п Номера точек эксперимента 1 2 3 4 5 12,0 11,8 10,7 11,6 11,6 6,0 5,9 5,4 5,8 5,8 4,5 6,2 4,0 5,0 5,9 1,5 -о,з 1,4 0,8 -0,1 16,5 18,0 14,7 16,6 17,5 5,5 6,0 4,9 5,5 5,8 1. Сумма ошибок предыдущих циклов (все блоки) 5 — 1,05 2. Средняя ошибка предыду- щих циклов (все блоки) sy — 0,52 3. Размах — 1,8;/ед—0,35 4. Новое значение ошибки sy — размах fN,„— 0,63 5. Новая сумма ошибок (все блоки) s —1,68 6. Новая средняя ошибка s> = ~2^Т = 0’56 Расчет эффектов 1. Эффект кислотности в! = -L (уз + У4 - уг - уь) — -0,7 2. Эффект нагрузки Вз = (уз + J's - У2 - У4} — -0,4 3. Эффект температуры Вз = -j- (уз + уз - у* - уз) — -0,2 4. Эффект изменения среднего блока I М = -у (у> + J’s + у4 + J% - 4уЦ - 0,04 Выводы: разностей данного блока. При определении сумм ошибок используют данные по всем уже реализованным блокам данной фазы. Расчет доверительных интервалов выполняется только в рабочей таблице блока II (табл. 72). Доверительные интервалы в данном случае рассчитываются по следующим формулам: для новых средних 2 ДИ = —-sy> (V.196) /я для эффектов ДИ = 0,71 «у, (V.197) /л для эффекта изменения среднего 2 ДИ = 0,63 ----Sy. (V.198) Y~n 10—529 265
Таблица 73. ЭВОП, фаза 2, цикл л —3, блок 11 Расчет средних Расчет ошибки опыта 1. Сумма предыдущих циклов 2. Среднее предыду- щих циклов 3. Новые наблюдения 4. Разности (2) — (3) 5. Новые суммы (1) + (3) 6. Новые средние Номера точек эксперимента 1 2 3 4 5 11,4 11,6 10,6 10,8 12,6 5,7 5,8 5,3 5,4 6,3 6,6 5,8 4,3 4.7 6,5 -Д9 0 1,0 0,7 “0,2 18,0 17,4 14,9 15,5 19,1 6,0 5,8 4.9 5,1 6,7 1. Сумма ошибок предыдущих циклов (все блоки) s “ 1,68 2. Средняя ошибка предыду- щих циклов (все блоки) sy —0,56 3. Размах —1,9 4. Новое значение ошибки sy — размах Дг„= 0,67 5. Новая сумма ошибок (все блоки) s — 2,35 6. Новая средняя ошибка Расчет эффектов Расчет доверительных интервалов (ДИ) 1. Эффект кислотности SiU= (ув +ув - у? - yw) — -1,25 2. Эффект нагрузки Вз1= -у (ув + ую - уз - ув) — +0,35 3. Эффект температуры Вз^= (уз + ув - ув - ую)----0,55 4. Эффект изменения среднего Мг = -у- (у? + уе + ув + ую - 4уе) --0,3 1. ДИ для новых средних ~=s у - 0,69 v П 2. ДИ для эффектов 2 0,7\—F= Sy -0,49 ’ / п Л ’ 3. ДИ для эффекта изменения среднего 0,63 —p=sy = 0,43 У п Окончательный расчет эффектов В' = -Т (в} + Д,1) --0,98; Вз = 4" (в' + * В * *^> ~ “0,025; Вэ = -у- (йз + - “0,375; Й12 = Ц- №П- йз)——0,15 Bis = 4" (Й211- Вз) - +0,375 523 = 4- (В'1~ВЪ- “0,275 Эффект изменения среднего м=4~ (i*1 +g2) —°’13 Выводы: эффект кислотности значим Решение: начать новую фазу В рассматриваемом примере после третьего цикла второй фазы (табл. 72) статистически значимым оказался эффект Ву (0,98 >0,49), поэтому было принято решение перейти к новой фазе. Таким образом, метод эволюционного планирования дает возмож- ность проводить активный эксперимент в промышленных условиях без нарушения режима производства, при этом нет необходимости в спе- 266
циальном оборудовании и штате исследователей, все требуемые вы- числения легко могут быть проведены обслуживающим персоналом производственного объекта. В главе изложены методы планирования эксперимента, направленного на поиск экстремума в условиях, когда механизм процесса неизвестен. В этих случаях используют полиномиальную модель процесса. Выбор плана определяется постановкой задачи исследования. Нахо- дясь достаточно далеко от экстремума, исследователь ставит эксперимен- ты с целью приблизиться к оптимальным условиям. Для решения этой задачи применяются линейные ортогональные планы. Линейная модель используется для определения градиента в методе крутого восхождения по поверхности отклика. Для движения к экстремуму могут быть также использованы симплексные планы. Для описания области, близкой к экстремуму, «почти стационарной области», можно использовать композиционные планы 2-го порядка. Во многих экспериментальных исследованиях наряду с количествен- ными факторами необходимо варьировать также и качественными фак- торами. В таких ситуациях очень эффективными оказываются сложные планы — факторный эксперимент 22А, совмещенный с латинскими квадра- тами. Для многофакторных задач на первом этапе исследования проводят отсеивающие эксперименты. Для решения этой задачи могут быть использованы дробные реплики от факторного эксперимента высокой степени дробности, планы Плакетта —Бермана и метод случайного баланса. Для поиска оптимума в промышленных условиях применяют метод эволюционного планирования эксперимента, с помощью которого ре- шается задача выделения слабого полезного сигнала на фоне шума. Упражнения 1. Какими свойствами обладает матрица планирования полного факторного экспери- мента 2*? Построить матрицы планирования для к — 4 и к — 5. 2. Построить линейные ортогональные планы для к — 6, используя дробные реплики от полного факторного эксперимента и симплексные планы. Какими свойствами обла- дают эти планы? 3. Полный факторный эксперимент 22, приведенный в таблице: Номер опыта Z\ Z2 .У 1 80 11,34 83,1 85,2 2 20 9,75 60,6 62,5 3 80 9,75 71,8 73,9 4 20 11,34 83,7 81,9 использовался для изучения зависимости соотношения между водной и общей форма- ми PaOs (у,%) от температуры процесса аммонизации (zi, °C) и содержания воды в спирто- вой фазе (za, %) при получении монокальцийфосфата кислотным разложением фосфатов с применением жидкостной экстракции. Каждый опыт повторялся 2 раза. 10* 267
а) Определить уравнения регрессии в безразмерном и натуральном масштабах; б) оценить значимость коэффициентов; в) проверить адекватность уравнения регрессии эксперименту. 4. При дозревании суперфосфата, получаемого из апатита, исследовалась зависимость коэффициента разложения (у, %) от времени хранения (zi, сут) при различном содер- жании HaSO4(Z2, мае. части). Область исследования приведена в таблице Z2 min zj 7max 5 20 60 72 Был использован ортогональный план 2-го порядка (табл. 43), получены следующие значения коэффициента разложения: Номер опыта у, 7. Номер опыта У, % 1 96 6 85 2 85 7 93 3 76 8 81 4 91 9 88 5 91 Дисперсия воспроизводимости s2Bocnp равна 4%,/воспр “3. Определить: а) уравнение регрессии второго порядка; б) значимость коэффициентов и адекватность уравнения регрессии эксперименту; в) тип поверхности; г) оптимальные условия, обеспечивающие практически полное разложение (у — 100%); д) проанализировать чувствительность коэффициента разложения к изменению времени хранения и содер- жанию HjSO 4. 5. По условиям примера 12 для исследования кинетики сополимеризации: а) соста- вить ZJ-оптимальный симплекс; б) используя результаты эксперимента (табл. 61) и свой- ства симплексного плана, начать движение в сторону увеличения скорости сополиме- ризации. ГЛАВА VI ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ПРИ ИЗУЧЕНИИ ДИАГРАММ СОСТАВ - СВОЙСТВО 1. Метод симплексных решеток. При изучении свойств смеси, зави- сящих только от соотношений компонентов, факторное пространство представляет собой правильный (q - 1)-мерный симплекс. Для систем выполняется соотношение я 2 *i=i. <VE1) 1=1 где Xj >0 — концентрация компонента; д —количество компонентов. Для двухкомпонентных систем симплекс — прямая содержание компо- нентов определяется соотношением отрезков. При q—З правильный симплекс — равносторонний треугольник. Каждая точка треугольника от- вечает одному определенному составу тройной системы и, наоборот, 268
каждый состав представляется одной определенной точкой. Состав мо- жет быть выражен в мольных, весовых или объемных долях или про- центах. Вершины треугольника соответствуют чистым веществам, сто- роны—двойным системам. Опустив из каждой вершины треугольника высоту, разделив каждую из них на десять равных по величине отрезков и проведя через полученные деления прямые, параллельные сторонам треугольника, получим треугольную сетку. Приближение от каждой дан- ной стороны к противоположной вершине отвечает пропорциональному возрастанию содержания соответствующего компонента, поэтому пря- мые, параллельные данной стороне, при последовательном переходе от одной прямой к другой отражают возрастание третьего компонента на Рис. 59. Концентрационный треуголь- ник Гиббса Л. % С, % Рис. 60. Концентрационный треуголь- ник Розебума 10%. На рис. 59 на соответствующих высотах треугольника указано содержание каждого из компонентов (в точке </—30% А и 70% С). Практи- чески большей частью не прибегают к построению высот, можно откладывать содержание компонентов непосредственно на сторонах треугольника. Такой способ отсчета принят в треугольнике Гиббса. В треугольнике Розебума состав тройной системы отсчитывается по трем отрезкам одной стороны треугольника (рис. 60). В концентрацион- ном треугольнике точки, лежащие на прямой, выходящей из вершины треугольника, соответствуют смесям с постоянным отношением содер- жаний компонентов, изображаемых двумя другими вершинами. Свойство (у) обычно представляют проекциями линий равного значения на плос- кость концентрационного треугольника. При q=4 правильный симплекс — тетраэдр, каждая вершина которого соответствует чистым компонентам. Ребро представляет собой двух- компонентную систему, грань — трехкомпонентную. Точки внутри тет- раэдра соответствуют четырехкомпонентным системам. Так, компонент х, отсутствует на грани х2, Х& х4, а по сечениям тетраэдра, приближаю- щимся к верщине х}, содержание компонента xt увеличивается. Графически такую систему представляют в виде сечений трехмерного симплекса плоскостями, перпендикулярными одной из его осей. Состав 269
четырехкомпонентных смесей, лежащих в плоскости сечения, опреде- ляется уже двумерным симплексом, что позволяет изменение свойств системы представлять в виде контурных кривых. При этом в одном сечении варьируют только тремя компонентами. Переход от одного сечения к другому соответствует изменению четвертого компонента. При планировании эксперимента для решения задач на диаграммах состав — свойство предполагается, что изучаемое свойство является непрерывной функцией аргументов и может быть с достаточной точ- ностью представлено полиномом. Использование методов планирования эксперимента позволяет значительно сократить объем эксперимента при изучении многокомпонентных систем, отпадает необходимость в пространственном представлении сложных поверхностей, так как свой- ства можно определять из уравнений. При этом сохраняется возмож- ность графической интерпретации результатов. Поверхности отклика в многокомпонентных системах имеют, как правило, очень сложный характер. Для адекватного описания таких поверхностей необходимы полиномы высоких степеней и, следователь- но, большое количество опытов. Обычный полином степени п от q переменных имеет Сд+„ коэффициентов: y = b„ + S b‘Xi + 2 bVxW + 2' bi^ixjxk+--- (Vl-2) !<£</«? 4 Соотношение^ xt — 1 позволяет исключить q-й компонент и снизить t=i число коэффициентов до С,+„^. Однако по существу задачи желательно ввести в модель все 'q компонентов. Шеффе предложил описывать свойства смесей приведенными поли- номами, получаемыми из (IV.2) с учетом условия нормированное™ суммы независимых переменных (VI. 1). Покажем, например, как полу- чить такой приведенный полином второй степени для тройной системы. Общий вид полинома У = Ьц + bjXj + Ь2х2 + Ь3 х3 -|- Ь12х,х2 + b13XjX3 + b23x2x3 + + + Ьггх^ + b33Xj. (Vl .3) Так как xi + хг + х3 = 1, (VI. 4) То ЬцХ1 + Ь0х2 + Ь0*з = *о- (VI -5) Умножив (VI.4) последовательно на х2 и х3, получим = Х2 — XjX2 — х2х3, (VI. 6) Xj = Х3 — XjX3 — Х2Х3. 270
Подставим (VI.5) и (VI.6) в (VI.3) и приведем подобные члены: Л У — (&о + + &п) xi + (^о + ^2 + ьм) х2 + (Ь» + ьз + Ьаз) ха + + (&12 — ьп — Ьм) хгхг + (bis — Ьц — Ь33) Х}Х3 + (Ь23 — Ь22 — Ь33) х2х3. (VI. 7) Обозначим Pi = feo + bi + bii> ~ bil ~ bii~ b}j• (VI.8) Тогда получим приведенный полином второй степени от трех перемен- ных: У = Р1*1 + р2*2 + Рз*8 + Р12*1*2 + Pl3*l*3 + P2S*2*3- (VI.9) Таким образом, число коэффициентов уменьшилось с 10 до 6. При- веденный полином второй степени от q переменных J= ?iXf+ ^их1х) (VI. 10) l<i<? !<»</<« содержит q+C% коэффициентов. Приведенный полином непол- ного третьего порядка для трехкомпонентной смеси У — Р1*1 + р2*2 + Рз*3 + Р12*1*2 + Р13*1*3 + Рз3*2*3 + Р123*1*2*3 , (VI -11) для ^-компонентной смеси У= 2 ?«*<+ S hixixi + 2 Vijbxixixk- (VI. 12) i<i<q !<(</<« Приведенный полином третьего порядка для трехкомпонентной смеси У Р1*1 Н~ р2*2 ~Ь Рз*8 “Ь P12*l*2 ~"Ь Р13*1*3 ~Ь р23*2*3 “Ь 712*1*2 (*1 — xi) Т" + 713*1*3 (*1 — *з) + 723*2*3 (*2 — *з) 4- Р123*1*2*3 . (VI. 13) для (/-компонентной У = 2 *" Pu*i*l + 2 lUXiXJ — *7) + l<i<q \<i<j<q \<i<i<q + 2 $iikxixixk- (VI. 14) !<(</<*<? Приведенный полином четвертого порядка для трехкомпонентной смеси У — Р1*1 Ра*2 + Рз*3 + Р12*1*2 Р18*1*8 + р23*2*3 + 712*1*2 (*1 — *г) + + 713*1*3 (*1 — *з) + 723*2*3 (*2 — *з) + ®12*1*2 (*1 ~ *2>2 + «13*1*8 («1 “ *з)2 + + «23*2*3 (*2 — *з)2 + Р1123*1 *2*3 + P1223*l*f *3 + P1233*l*2*|. (VI • 1 5) 271
для ^-компонентной У = + ?i)XiX} + Wi (ч — + i<i<q + 2 (*i ~ ^)2 + 2 ?iMh^xh + \<i<j<q \<i<i<k<q + 9i}}hxi^Xh + 2 ^JkkXiXJX^ + i<i<j<k<q l<i<j<k<q + 2 ?iJMXiX}XhXi. (VI. 16) l<i</<*</<« Нелинейная часть этих полиномов называется синергизмом, если она вызывает увеличение отклика по сравнению с откликом, предсказывае- мым линейной частью уравнения, а антагонизмом — при уменьшении отклика. Наприер, Ву в полиноме второго порядка называют квадра- тичным коэффициентом бинарного синергизма компонентов i и J. В поли- номе третьего порядка синергизм трехкомпонентной смеси равен WtjXlXj + lijXiXj (Xj — + [PihX.Xh + 7i*x(xft (x( — xfc)J + + (PihVh + Vkxjxh (xj — xfc)l + ?ijkxtxjxh, (VI. 17) где в квадратных скобках — бинарные синергизмы в тройной системе; В,Л — кубический коэффициент тройного синергизма компонентов i, j, к. Возможно другое преобразование исходного полинома степени п от q переменных. Его можно свести к так называемому однородному поли- ному степени п, умножая члены степени з< п на (X х,)''"““ 1. Приведем полином (VI.3) к однородному: У = (*1 + Х2 + Х3)2 + JiXj (Xj + Ха Хз) + ЬгХг (Xj + Хг + Xg) 4- 4- ^зхз (xi 4- хг 4* хз) 4* ^jXjXj 4- Ь19х1хя 4- b23xgx3 4- ^цх^ 4- 4- ^33X3 = — (2Ь() 4* bi 4" bg 4- Ь1г) XjX2 4- (2Ь0 4* 4- *з 4* 1*1з) XjXg 4- (2Ь0 4- Ь2 4- 4- *3 4- b$g) XjXg 4- (bg 4- bj 4- ьп) xj 4" (^e 4" 4" ^22) ~b 4-(Ь04-Ьз4*Ьзз)4- (VI. 18) Обозначим в (VI. 18) = 2be 4- bi 4- bj 4- bi}, = b0 4- bi 4- Ьц. Получим однородный полином У = xtXg 4- ?;зХ1Хз 4- ^XgX3 + Х2 + х2 + ₽-3 х2 . (VI. 19) Число неизвестных коэффициентов в (VI. 19) то же, что и в (VI.9). Приведенные полиномы получили более широкое применение и в дальнейшем будем использовать только их. Таким образом, минимальное 272
число экспериментальных точек для определения коэффициентов поли- нома степени п от q переменных составляет С"+„^1 (табл. 74). Таблица 74. Число опытов для полиномов разных степеней Число компо- нентов Степень полинома Число компо- нентов Степень полинома 2 3 (неполная) 3 4 2 3 (неполная) 3 4 3 6 7 10 15 6 21 41 56 126 4 10 14 20 35 8 36 92 120 330 5 15 25 35 70 10 55 175 220 715 2. Симплекс-решетчатые планы Шеффе. В настоящее время наиболь- шее применение получили симплекс-решетчатые планы, предложенные Шеффе. Эти планы обеспечивают равномерный разброс эксперименталь- ных точек по (q - 1)-мерному симплексу. Экспериментальные точки представляют {q, и}-решетку на симплексе, где q — число компонентов смеси; и —степень полинома. Симплекс-решетчатые планы являются насыщенными планами. По каждому компоненту имеется (и+ 1) одина- ково расположенных уровней xz —0, 1 / п, 2/ п, ..., 1 и берутся все воз- можные комбинации с такими значениями концентраций компонентов. Так, например, для квадратичной решетки {q, 2}, обеспечивающей при- ближение поверхности отклика полиномами второй степени (и = 2), должны быть использованы следующие уровни каждого из факторов: О, 1/2 и 1, для кубической (и — 3)—О, 1/3, 2/3 и 1 и т.д. Некоторые {3, и}-решетки представлены на рис. 61, а {4, и}—на рис. 62. Эти планы частично композиционные. Неполную кубическую решетку {3, 3*}, например, можно получить из {3, 2} , добавив только одну точку в центре симплекса, решетку {3, 4}—добавлением точек к решетке {3,2}. Записав координаты точек симплексной решетки, получим матрицу планирования. Построим матрицы планирования для решеток {3, 2), {3,3} и {3,4}. Индексы у свойства смеси указывют на относительное содержание каждого компонента в смеси. Например, смесь 1 (табл. 75) Таблица 75. Матрица планирования для {3, 2}-решеткн X] Х2 хз Ъкс N Ху Х2 хз Ъкс 1 1 0 0 У1 4 1/2 1/2 0 У У 2 2 0 1 0 Уз 5 1/2 0 1/2 3^13 3 0 0 1 Уз 6 0 1/2 1/2 Т23 состоит только из компонента xt, свойство этой смеси обозначается у,, смесь 4 состоит из ’/ах, и Vzx^, свойство обозначается у, 2- Матрица планирования для симплексной решетки {3, 3} приведена в табл. 76. В табл. 77 приведена матрица планирования для построения поли- нома четвертой степени в трехкомпонентной системе. 273
a — второго порядка; Рис. 61. {3, л}-решетки для полиномов; 6 — неполного третьего порядка; в— третьего порядка; г—четвертого порядка Рис. 62. {4, лТрешетки для полиномов; а — второго порядка; б — неполного третьего порядка; в ~ третьего порядка; г — четвертого порядка Таблица 76. Симплекс-решетчатый план третьего порядка для трехкомпоиентиой смеси Xi Х2 Хз У N XI Х2 ХЗ у 1 1 0 0 6 0 2/3 1/3 У223 2 0 1 0 У2 7 0 1/3 2/3 У233 3 0 0 1 Тз 8 2/3 0 1/3 J'113 4 2/3 1/3 0 УЧ2 9 1/3 0 2/3 ^133 5 1/3 2/3 0 У122 10 1/3 1/3 1/3 J'123 I аблиц а 77. Матрица планирования для 0, 4}-решетки XI Х2 Хз У Xi Х2 ХЗ .У 1 1 0 0 9 3/4 0 1/4 _УШЗ 2 0 1 0 У2 10 1/4 0 3/4 J4333 3 0 0 1 Уз 11 0 3/4 1/4 J/2223 4 1/2 1/2 0 У12 12 0 1/4 3/4 J/2333 5 1/2 0 1/2 У13 13 1/2 1/4 1/4 У1123 6 0 1/2 1/2 У23 14 1/4 1/2 1/4 J/1223 7 3/4 1/4 0 }’1112 15 1/4 1/4 1/2 И 233 8 1/4 3/4 0 У1222 274
Коэффициенты приведенных полиномов получают, используя свой- ство насыщенности плана. Для получения коэффициентов полинома У — 31*1 + ?3Х2 + Зз*3 + 312*1 *2 + 313*1*3 + Ззз*2-’% будем последовательно подставлять в уравнение координаты всех шести точек матрицы планирования (табл. 75). Тогда при подстановке координат первой точки (xt — 1, х2“0, х3®0) получим У1 = 31- (VI. 20) Соответственно Зг = Уг и Зз = Уз- (VI.21) При подстановке в уравнение координат четвертой точки получим Уи — 31 х/г + Зг 1/г + З12 V<- (VI.22) Но так как р, =yh то У12 = У1 х/г + Уг Vs + З12 Vi, (VI. 23) отсюда 31г = 4yi2 — 2i/i — 2i/2. (VI.24) Соответственно 313 = 4У13 — 2У1 — 2Уз • Згз = 4{/23 — 2уа — 2уэ - (VI. 25) Три точки, определяющие коэффициент В,7 , лежат на одном ребре. Коэффициенты приведенного полинома второго порядка для ^-компо- нентной смеси У = 2 S 3o*i*y 1<1«J l<i< определяются аналогично: 31 = У1> Зм = 4уц — tyi — tyj- (VI. 26) При последовательной подстановке в полином третьего порядка для трехкомпонентной смеси У = 31*1 + Зз*2 + Зз*3 + 312*1*2 + 313*1*3 + Зг3*2*3 + 712*1*2 (*1 — *2> + + 713*1*3 (*1 ~ *3> + 723*2*3 (*2 — *з) + 3123*1*2*3 координат точек матрицы планирования (см. табл. 76) имеем: 31 — У1 > Зг — Уг • Зз — Уз « (VI 27) Унг — Уг 2/з + Уг V3 + 312 г/» + 712 2/г?> (VI .28) У122 = Уг. Vs + Уг 2/з + 312 V. - 712 Ч-, • (VI 29) Просуммировав уравнения (VI.28) и (V1.29), получим 312 =’/« (Унг+У1гг— Уг—Уг)- (VI.30) Вычитая из (VI.28) уравнение (VL29), получим 712 = •/« (Зуц2 — Зу122 — У1 + Уг)- (VI.3]) 275
Подставляя приведенный полином координаты точек 6 и 7, получим: Ргз = */< (Уггз + Уазз — Уг Уз) • (VI. 32) 7за — а1а (Зуггз Зумз — Уг ~Ь Уз) • И аналогично после подстановки координат точек 8 и 9 Pis — а1а (Уиз + Miss — У1 — Уз) • (VI. 33) 713 = ’/4 (Зуцз — Зу133 — У! +у3). Подставляя координаты последней точки с учетом, соотношений (VI.27) — (VI.33), получим У123 ~ У11/з + У г 1/з + Уз Vs + V4 (Унг + У122 — У1 — Уг) + -Ь V< (Уиз + У133 — У1 — Уз) + 1 /4 (Уггз + Угзз Уг Уз) Ч- 1 /27 Чгз > Р123 = 27у123 — г’/< (Уцг + У1гг + Упз + У1зз + Уггз + Угзз) + + »/2 (У1 + Уг + Уз) • (VI-34) Коэффициенты полинома третьего порядка для д-компонентиой смеси у = у М<+ 2 (*«-*/) + 1 </</<» Рг = УЬ (VI. 35) Pm = ’/< (yuj + yut — yi — yj). (Vi .36) 70 = V4 (Зуну — 3yi}] — yt +yj), (VI .37) Рмк = 27y(yh — 27/4 (yuj + ytj] + yah + yikk + УЯЛ + + УАк) + в/г(Уг+Уу + Ук)- (VI. 38) Аналогично выводятся соотношения для определения коэффициен- тов любого приведенного полинома при любом числе компонентов. Так, для полинома неполного третьего порядка для трехкомпонентной смеси имеем: У = Р1*1 + р2*2 + Рзх3 + Р12*1х2 + Р13*1*3 + Рг3х2-*3 + ?1МХ1Х2Х3 > рг=У1 И т. д, (VI.39) Р12 = 4у12 — 2у! — 2у2 и т. д., (VI. 40) Риз = 27у123 — 12 (у12 У1з + Угз) + 3 (yi + Уг + Уз) • (VI .41) Для g-компонентной смеси У= Р<Х<+ S hjkXiXJXk, l<i<q l<i</<fe<q Pi = y<. (VI.42) 276
= 4yiJ — 2jn — 2yj, (VI.43) 3i/h = 27j/ijfc — 12(Ум+Vu +УА) + 3(У< + Ю + ^)- (VI.44) Полином четвертого порядка для трехкомпонентной смеси: У — 31*1 + За *2 + Зз*3 + 312*1*2 + 313*1*3 -|- 3 23*2*3 + 112*1*3 (*1 — *2) 4* + 113*1*3 (*1 — *з) + 133*2*3 (*2 — *з) + *12*1*2 (*1 ~ *2>* + + *13*1*3 (*1 — *3)2 + *23*2*3 (*2 — *з)2 + 31123*^*2*3 + + 31223*1^*3 + З1233*1*2*з> (VI .45) 3i = J/iHT. д. (VI.46) 312 = 4ум — 21/, — 2у2, (VI. 47) 112 = 8/з(—У1 + 2У1112—21,1222 + у2) , 113 = 8/з (— Уг + 2t/iii3 — 2у1Э83 -f- у3), (VI.48) 123 = 8/з (— Уг 4" 21/2223 — 21/2333 + 1/з) . *12 = 8/з (— У1 4* tyiiii — 6^12 + 4^1222 — У г) • (VI • 49) *13 = 8/з (— Уг + 4ушз — 61/13 + 4j/i333 — Уз) • (VI • 50) *23 = 8/з (— Уг + 41/2223 — 5^23 + 41/2333 — Уз) • (VI .51) 31123 = 32 (31/1123 — 1/1223 — У123з) + 8/з (0^1 — Уг — Уз) I® (1/12 + У1з) — — 18/з (5ушг + 5ушз — 3i/1222 — 3|/13зз — J/2223 — Узззз) > (VI • 52) 31223 = 32 (Зх/1223 — 1/1123 — У123з) + 8/з (^Уг У1 —Уз) — ' 6 (1/12 + У1з) — — 18/з (51/1222 + 5l/2223 — 3t/1J12 — З1/2333 — «/1ЦЗ — </133з) • (VI • 53) 312зз = 32 (31/12зз —1/1123 —1/1223) + 8/з (^Уз — У1 —Уг) — 15 (У13 + Угз) — — 18/з (51/1ззз + 5^2333 — З^лз — 31/2223 — 4/1112 —1/1222)• (VI. 54) Для q-компонентной смеси У= 2 ^,Xi+ S S 7U*i*H*i — */)+ l<i<q l<i<.i<q + 2 bOxix/(xi —x/)2 + S 3iOfe*j*/*h + l<.i<j<q l<i<j<k<q + S 3wfe*i***h + 2 ?iAk*t*/« + Ki<j-<k<q ' \<i<j<k<q + 3iA/*i*/*h*/. (VI. 55) 1</</<Л</<? 3i=!/i. (VI. 56) 3i/= 4уц —2i/i—2t/^, (VI. 57) W= 8/з(— yt + fyitU — 2УИ)}+ У})< (VI. 58) 277
'JU = 8/з (— Hi + *Уии — §УЦ + 4yiJJJ—yi), (VI .59) Pii/ft = 32 (Зущк — yi)]k — yijhh) + »/3 (tyi — yj — yh) — \Q(yi} + yih) — — 1в/з (Ьуии + ЬУшь. — ^yijjj — 3yihkh — y]}jk — у}ккк), (VI .60) ?UJk = 32 (3УШй — ytijh — ytjkh) + 8/з (ty j— У1 — Ук) — 16 ytj + tjjb) — — 1в/з (tyiHi + tyjjjk — tyiuj — tyjhhk — yii(k — ytbkk)> (VI .61) Pijkk = 32 (tyijkk — уЦ)к — ytjjh) + 8/з (6i/s — Vi — yj) — 16 (ylh + yjk) — 18/з (бу/ййй T~ ^У]ккк ^ЦШк tyjjjk — Уiiij — Уин) ’ (VI .62) ?Ukl — 2^УНк1 — 32 (УШк + Уил + yiikl + УЦ]к + УИН + УНк! + + «/Цйй + Угкк1 + yjkkl + yiiN + У1к11 + У1ки) + За/з (УИН + УИ1к + УИН + + УИН + УШк + Уjjjl + Vikkk + Vjkkk + Уккк1 + УИН + УЛИ + Укш) (VI. 63) После определения коэффициентов уравнения регрессии необходимо провести статистический анализ полученных результатов: проверить адекватность уравнения и построить доверительные интервалы значе- ний отклика, предсказываемые по уравнению регрессии. При постанов- ке эксперимента по симплекс-решетчатым планам нет степеней свобо- ды для проверки адекватности уравнения, так как эти планы насыщен- ные. Для проверки адекватности ставят опыты в дополнительных, так называемых контрольных точках. Число контрольных точек и их координаты связаны с постановкой задачи и особенностями экспери- мента. При этом стараются предусмотреть возможность использования контрольных точек для улучшения модели при неадекватности. Точность предсказания отклика неодинакова в различных точках симплекса. Дисперсию предсказанного значения отклика можно определить по закону накопления ошибок. Покажем это на примере полинома второго порядка для трехкомпонентной смеси. При этом предположим, что х,- определяются без ошибок, дисперсия воспроиз- водимости Sy во всех точках плана одинакова и значения откликов являются результатом усреднения л, и пи параллельных опытов в соответствующих точках симплекса. Тогда дисперсии у, и равны; 4 = (VI. 64) И (VI. 65) »и Заменим в приведенном полиноме У = Mi + Ма + Мз + + ?1зХ1*з + ?аз*з*з коэффициенты их выражениями через отклики: ₽i = Hi. $и = *Уи — Ън — 2Нн Тогда получим У = У1X1 + У г х2 + Уз*э + ( 4Ги — 27i — 27а) *iXa + ( tyis — 2У1 — 2Уэ) *1*з + 278
+ (4 f/23 — 2Уа — 2ys) xaxs = yt (Xj — 2xjXa — гх^) + y2 (xa — 2XiXa — 2xax3) + +7з (*s — 2*i*3 — 2*а*з) + 47n*i*a + 47i3*i*3 + 47аз*а*з• (VI. 66) Используя условие Х1+хг+хз = 1, преобразуем коэффициенты при Xj — 2ххха — гх^ = Xj — 2xj (ха + Хз) = х1 — 2х1(\ — xj = = х1(2х1— 1) и т. д. (VI.67) Получим У = *i (2xj — 1) у[+ *а (2ха —1)7 + *з (2хз — 1) 7з + + 4xjxa7i2 + 4х1х371з + 4хах37з. (VI. 68) Введя обозначение at = xt (2х/— 1), аг;=4хгху, (VI.69) с учетом соотношений (VI.64) и (VI.65) получим выражение для дисперсии : аи пИ (VI. 70) Аналогично получены выражения для полиномов неполного третьего, третьего и четвертого порядков Для неполного третьего порядка 2 2 Л = sy У 1^.4. ±+ У ++ У 2Д_'. rtf Пн ПЦЪ 1 lJ 1<1<J<6<<7 J где q bt= ~ (6x2 _ 2x. + 1) _ 3 x}, /=1 btj = 4xtxj (Зхг + 3xy — 2), bijk = 27XiXjXh. (VI.71) (VI. 72) (VI. 73) (VI. 74) Для полинома третьего порядка 2 СШ tiJJ 2 ’ cijh nijk (VI. 75) где ci = 1/a*i(3xi-l)(3xi-2). (VI. 76) Cii> = ’/a*i*>(3xi-l), (VI. 77) cw = ’/2*i*;(3xj—1), (VI. 78) сцк = 27 xtx}xk. (VI. 79) 279
Для полинома четвертого порядка 2 Kist, "«' + 2 2 l<i<J<k<q niiJh n,^fc niihh где V l<i<j<k<l<q nilkt (VI. 80) di = V. x, (4x, - 1) (4x, - 2) (4x, - 3), dij = 4x<x; (4x; — 1) (4x; — 1), dijjj = »/, Xi*/ (4xj — 1) (4xj — 2), dttij = •/, xtx} (4x, — 1) (4xt — 2), dii/ft= 32xix;xfc(4x1 — 1), dljjk = 32xfxjxfc (4xy — 1), dijkk = 32xix;xft (4xfc — 1). (VI.81) (VI. 82) (VI. 83) (VI.84) (VI. 85) (VI. 86) (VI. 87) Если число параллельных опытов во всех точках плана одинаково, т. е. п, = ntj = п, все формулы для sj примут вид S — S А у п и (VI.88) где для полинома второго порядка Е- 2 “1+ 2 Xi<q i<i<Kq (VI. 89) для полинома неполного третьего порядка «= 2 ь> 2 6о+ 2 6ш- (VE90) \<i<q l<i<l<q l<i<i<k<q для полинома третьего порядка Е= 2 £1+ 2 с;„+ 2 е‘» + l<i<q t<i<l<q x«i<q + 2 c2(ik+ 2 ct’ <VL91> для полинома четвертого порядка Е- 2 «’+ 2 <+ 2 4,+ 2 <» + l<i<q l<i<i<q l<i<l<q l<i<l<q 280
\<i<j<k<q i<i< i<k<q + <VL92) l<l<i<Jt<l<q Так как в выражениях(VI.89) — (VI.92) £ зависит только от состава смеси, для трехкомпонентных смесей можно заранее построить линии равного значения £ для полиномов различных степеней (рис. 63, 64). Рис. 63. Изолинии £ для полиномов второго порядка (а) и неполного третьего порядка (6) Рис. 64. Изолинии для полиномов третьего порядка (а) и четвертого порядка (б) Зная дисперсию воспроизводимости, число параллельных опытов п, лег- ко найти ошибку предсказанных значений отклика в любой точке диаграммы состав — свойство, воспользовавшись для этого соответ- ствующей величиной £, снятой с графика. Проверку адекватности 281
проводят в каждой контрольной точке. Для этого составляют от- ношение (VI. 93) S' v у где Ly = 1УЭкс1ГтУрасч'; л —число параллельных опытов в каждой точке. Величина t, распределенная по закону Стьюдента, сравнивается с табличным значением tp/ (/), р — уровень значимости; / —число контроль- ных точек; /— число степеней свободы дисперсии воспроизводимости. Гипотеза об адекватности уравнения принимается, если /эксп< 7табл для всех контрольных точек. Адекватность можно также проверять по нескольким точкам с использованием х2-критерия. При построении доверительного интервала для значений отклика Л Л у — Д < у<у + Д> Л = 1р/к. f sr\ ' у где к— число определяемых коэффициентов в полиноме. С учетом (VI 88) (VI 94) (VI. 95) Sy (VI. 96) Для можно ставляя А — tp/k, f уГ~ г П тройных систем пои построении доверительных интервалов воспользоваться контурными каргами (см. рис. 63, 64), под- Sy в них к изолиниям вместо Е значение .-------------- gt/2 . ~ Р/Л»Г - У*"-’ Пример 1. Изучалась зависимость реакционной способности и пористости кокса от состава шихты. В качестве компонентов шихты были взяты угли четырех ихнологи- ческих групп: Гб — xi, 2Ж26 —хг, КТО —xs, К + К2 —х<. Опыты проводились на укруп- ненной Лабораторной установке. Характеристикой реакционной способности кокса (у₽) служила константа скорости реакции С+ СО2 — 2СО, определенная при 1000°С. Порис- тость кокса (уп) определялась по отношению истинной и кажущейся плотностей. По- лагая, что поверхности отклика физико-химических характеристик рассматриваемых смесей могут быть аппроксимированы полиномами невысоких порядков, определим уравнение регрессии в виде полинома второго порядка. Решение. Для решения задачи был использован симплекс-решетчатый план (4. 2). Матрица планирования второго порядка для четырехкомпонентной смеси и ре- зультаты опытов (каждый опыт был повторен два раза) приведены в таблице. Номер опыта А'! * 2 Хз Д’4 Обозначение отклика 1 1 0 0 0 1,48 54,0 2 0 1 0 0 0,32 55,2 3 0 0 1 0 >'з 0,50 43,3 4 0 0 0 1 Я 0,53 45,3 5 0,5 0.5 0 0 У12 0,63 53,1 6 0,5 0 0,5 0 -У13 0,92 48,0 7 0,5 0 0 0,5 .V14 1,08 49,0 8 0 0,5 0,5 0 .V23 0,39 46,3 9 0 0,5 0 0,5 у 2 4 0,38 47,1 10 0 0 0,5 0,5 V34 0,54 44,0 282
Коэффициенты уравнений рассчитаны по формулам (VI.26). Для зависимости реак- ционной способности от состава шихты имеем; £1=1,48, £2 = 0,32, £3=0,50, £4 = 0,53, £12 = 41/12 — 2j/i — 2уг = 4- 0,63 — 2-1,48 — 2-0,32 = — 1,08, £13 = 4«/1з — 2j/i — 21/з = 4-0,92 — 2-1,48 — 2-0,50 = — 0,22, £14 = 4</14 — 2уг — 2i/4 = 4-1,08 — 2-1,48 — 2-0,53 = 0,30, £23 = 41/23 — 2t/a — 2t/3 = 4-0,39 — 2-0,32 — 2-0,50 = — 0,08, £24 = 4ум — 2«/г — 2i/4 = 4-0,38 — 2-0,32 — 2-0,53 = — 0,18, £34 = 4j/34 — 2у3 — 2yi = 4-0,54 — 2-0,50 — 2-0,53 = 0,1. Таким образом, полином второго порядка для реакционной способности в четырех- компонентной системе имеет вид t/Р = 1,48 Хг + 0,32 х2 + 0,50 хз + 0,53 х4 — 1,08XjX2— 0,22 х1ха+ + 0,3 x1xt — 0,08 x2xs — 0,18 х2х4 + 0,1 Х3Х4. (VI.97) Для пористости £1 = 54,0, £2 = 55,2, £s = 43,3, £4=45,3, £12-_=-6,4, £lS = -2,6, £14 = -2,6, £зз = -11,8, £24=-12,6, £34 = -1,2 и уравнение регрессии у^ = 54,0 Xi Т“ 55,2 х2 T* 43,3 х3 45,3 Х4 — 6,4 х2х2 — 2,6 х2х3 — — 2,6 XjX4 — 11,8 х2х3 —12,6 х2х4 — 1,2 Х3Х4. (VI .98) Для проверки адекватности полученных уравнений были использованы 25 контроль- ных точек (таблица ниже). Номер опыта Обозначе- ние отклика ^экс ДуР уэкс Луп ъ <Р 1 у, 112 0,77 0,99 0,22 53,5 53,1 0,4 0,72 3,16 0,3 2 У-1113 1,15 1,19 0,04 51,0 50,8 0,2 0,72 0,575 0,15 3 j/1114 1,25 1,20 0,05 50,3 51,3 1,0 0,72 0,72 0,72 4 У2223 0,31 0,34 0,03 49,0 50,1 1,1 0,72 0,43 0,80 5 У2224 0,39 0,34 0,05 52,3 50,4 1,9 0,72 0,72 1,37 6 У3334 0,55 0,52 0,03 45,0 43,6 1,4 0,72 0,43 0,5 7 У1222 0,35 0,41 0,06 57,2 53,8 2.6 0,72 0,86 0,7 8 У1333 0,75 0,70 0,05 44,0 45,5 1,5 0,72 0,72 1,2 9 У1444 0,94 0,82 0,12 48,9 47,0 1,9 0,72 1,72 0,4 10 У2333 0,51 0,44 0,07 43,4 44,0 0,7 0,72 1,0 0,75 11 У2444 0,36 0,45 0,09 46,3 45,4 0,9 0,72 0,74 0,8 12 V3444 0,57 0,50 0,07 44,5 44,6 0,1 0,72 1,34 0,6 13 У1123 0,82 0,77 0,05 52,4 49,8 2,6 0,59 0,74 1,95 14 3^1124 0,90 0,81 0,09 51,5 50,1 1,4 0,59 1,3 1,2 15 У1134 0,17 1,00 0,17 47,0 48,4 1,4 0,59 2,54 0,3 16 У1223 0,49 0,51 0,02 50,6 49,5 1,1 0,59 0,3 0,5 17 У1224 0,52 0,53 0,01 48,0 49,8 1,8 0,59 0,15 0,4 18 У1334 0,76 0,75 0,01 46,7 45,8 0,9 0,59 0,15 1,3 19 У2234 0,44 0,40 0,04 48,4 46,5 1,9 0.59 0,6 0,7 283
Продолжение Номер опыта Обозначе- ние отклика ^экс Ду₽ „п -Изкс 5>п д>п 5 t₽ tn 20 3’2334 0,48 0,46 0,02 46,8 44,4 2,4 0,59 0,3 1,0 21 3’1233 0,58 0,63 0,05 45,7 46,7 1,0 0,59 0,74 1,4 22 у 1244 0,59 0,68 0,09 47,0 47,6 0,6 0,59 1,34 0,8 23 3’1344 0,78 0,80 0,02 49,0 46,4 2,6 0,59 0,3 1,2 24 3’2344 0,42 0,44 0,02 46,0 44,8 1,2 0,59 0,3 0,8 25 3’1234 0,60 0,65 0,05 48,0 47,0 1,0 0,44 0,78 0,79 Координаты контрольных точек выбраны таким образом, чтобы иметь возможность при неадекватности уравнений регрессии (VI.97) и (VI.98) построить полином четвер- того порядка (см. рис. 62, г). Для каждой контрольной точки составлялось t-отношение: Sy VT+5 Ошибка воспроизводимости при определении реакционной способности кокса = 0,075, при определении пористости — sJJ — 1,5. Число степеней свободы Д—35. Число парал- лельных опытов в каждой точке п = 2. Для каждой проверочной точки определялась величина 2 “<+ 2 “?/ l<i<q I <i< i <q где a, = х,(2х,- - 1); a,у = 4x,xy. При уровне значимости p — 0,05 и ty — 35 (табл “3,6. Следовательно, оба уравне- ния оказались адекватными эксперименту. Полученные уравнения позволяют определить величины реакционной способности и пористости кокса для любого состава шихты из углей рассмотренных групп. На основании найденных уравнений регрессии (VI.97) и (VI.98) были построены проекции линий равных значений свойств на сечения (рис. 65) х, —0,0 и х, —0,3. Рис. 65. Линии равных значений свойств: а — х, — 0; б — Xi — 0,3 284
Рис. 66. Системы эвтектического типа Симплекс-решетчатые планы Шеффе наиболее успешно используют для описания закономерностей в однофазных системах, для однофаз- ных участков сложных систем или если изучаемое свойство опреде- ляется только одной фазой. Попытки использовать метод симплекс- ных решеток для построения зависимостей свойств от состава цели- ком во всей многофазной системе часто оказываются неудачными. Точки симплекс-решетчатого плана могут не совпадать с критически- ми точками диаграммы, и аналитическое описание не улавливает участки скачкообразного изменения свойств. Например, попытки построения зависимости температуры начала кристаллизации целиком для всей системы эвтектического типа Pb - Cd - Bi не привели к успе- ху, хотя были построены полиномы от второй до четвертой степени включительно (рис. 66, а и 6). При построении зависимости свойств от состава для многофазной системы необходимо учитывать априор- ную информацию о строении изучаемой системы. Поверхность ликвидуса в системе эвтектического типа представляет собой три пересекающиеся поверхности первичной кристаллизации каждой фазы. Предлагается аналитически описать каждую из этих поверхностей, применяя симплекс-решетчатые планы, затем найти линии их пере- сечения и точку пересечения этих линий. Поверхности первичной кристаллизации можно выделить при помощи вспомогательного треугольника, вершинами которого служат точки двойных эвтектик двойных диаграмм (рис. 66, в). Образовавшиеся новые треугольники I, II и III рассматриваются как исходные. Для рассматриваемой 285
системы Pd - Cd - Bi внутри каждого треугольника был реализован неполно-кубический симплекс-решетчатый план (табл. 78). Таблица 78. Матрица планирования для получения иеполио-кубических полиномов в треугольниках I, II, III Номер опыта В кодированном масштабе В натуральном масштабе Температура ликви- дуса у, °C *з Х5 *6 РЬ Cd Bi 1 1 0 0 0 0 0 100 0 0 /1-327 2 0 1 0 0 0 0 82 18 0 /2-248 3 0 0 1 0 0 0 45 0 55 /з - 127 4 '/г ’/2 0 0 0 0 91 9 0 /12 — 276 5 'h 0 'А 0 0 0 72,5 0 27,5 /,з =228 6 0 ’А 0 0 0 63,5 9 27,5 /2э “ 180 7 'А № 'А 0 0 0 75,7 6 18,3 /12з — 230 8 0 0 0 1 0 0 0 100 0 /4 - 321 9 0 0 0 0 1 0 0 40 60 /5-149 10 0 'А 0 'А 0 0 41 59 0 /24 — 278 11 0 'А 0 0 ’А 0 41 29 30 /25 — 220 12 0 0 0 ’А 'А 0 0 70 30 J45 — 254 13 0 № 0 ’А 'А 0 27 53 20 /245 — 257 14 0 0 0 0 0 1 0 0 100 /в-271 15 0 0 ’А 0 0 22,5 20 57,5 /зв-127 16 0 0 'А 0 0 ’А 22,5 0 77,5 /зв — 204 17 0 0 0 0 'А 'А 0 20 80 /55 — 185 18 0 0 'А 0 ’А ’А 15 13,3 71,7 _У356 = 160 По результатам опытов (табл. 78) были найдены неполные куби- ческие полиномы: треугольник I у — 327 хх -f- 248 х2 + 127 х3 — 46 XjX2 + 4 ххх3 — 30 х2х3+ 108 х1х2х3; (VI .99) треугольник II у — 248 х2 321 х, -|- 149 х8 — 26 х2х, 86 х2х8 76 х4х8 69 х2 х, х8; (VI. 100) треугольник III у = 127 х3 149 хь + 271 хв — 44 х3х8 + 20 х3хв -|- 100 x8xe-f- 39 х3х8х,, (VI .101) где у—температура ликвидуса, °C, х,-РЬ; Х2 —сплав РЬ с 18% Cd; х3 — сплав Bi с 45% Pb; х4 —Cd; х5 —сплав Bi с 40% Cd; xe-Bi. Все полиномы оказались адекватными. Затем была проведена графическая экстраполяция (рис. 66, г), давшая возможность весьма точно определить линии кристаллизации двойных эвтектик в тройных сплавах и координаты точки тройной эвтектики. В симплекс-решетчатых планах при получении полиномов невы- соких степеней коэффициенты определяют по результатам опытов, в большинстве которых присутствуют не все компоненты. Естествен- но, что результаты опытов с чистыми компонентами несут мало информации о свойствах изучаемой системы. Для систем компонен- 286
тов q >4 можно использовать паланы Ламбра- киса — обычные симплексные решетки Шеффе, но не включать в эти решетки чистые компо- ненты, а вместо них ставить опыты в q точках с координатами Рис. 67. План Ламбракиса Xj =' *2 = Например, при построении полинома второй степени в четырехкомпонентной системе сле- дует четыре точки с координатами xi = х? = =Хз=х4=1 (см. рис. 61, а) заменить четырьмя точками с координатами xi = хг = хз = хд = ’/з (рис. 67). Таким образом, план Ламбракиса вместо четырех опытов в вершинах тетраэдра включает четыре опыта в центрах треугольников, образующих данный тетраэдр (х>2з, ш Х134 и Х234), и шесть опытов в центрах граней тетраэдра (xi2, хзз, Х14, Х23, Х24 И Х34). 3. Симплекс-центроидное планирование. В симплекс-центроидных планах Шеффе содержится 2’ -1 точек, q из которых приходится на чистые компоненты, Q —на двухкомпонентные смеси, Q —на трех- компонентные смеси и т. д. и одно наблюдение — на ^-компонентную смесь. Координаты точек в симплекс-центроидных планах (1, 0,...,0), (1/2, 1/2, 0,...,0),...,( 1 /q, 1/<?,...,1/<?), а также все точки, которые можно полу- чить из этих перестановками координат. Таким образом, план содержит точку в центре (центроид) симплекса и центроиды всех симплексов низшей размерности, его составляющих. Полиномы, получаемые по симплекс-центроидным планам, содер- жат столько же коэффициентов, сколько точек в плане, и для ^-компонентной смеси имеют вид У = S 3fXi + S xi xi + 1 < i <q I < l< j < q I < i < j <k <q + ₽12 ... V (VI. 102) Для данного числа компонентов q можно составить единственный симйлекс-центроидный план. Симплекс-решетчатый план для построе- ния полинома неполной третьей степени является симплекс-центроид- ным планом для трехкомпонентных систем (см. рис. 61, б). Построим в качестве примера симплекс-центроидный план для четырехкомпонент- ной системы (# = 4). Число опытов в плане N=2‘,-l = 24-l = 15. Расположение точек на концентрационном тетраэдре показано на рис. 61, в, а соответствующий симплекс-центроидный план при- веден в табл. 79. Полином (VI. 102) для q=4 содержит 15 членов и имеет вид У = 31*1 + ₽2*2 + З3Х3 + 34*4 + 312*1*2 + 313*1*3 + 314*1*4 + 323*2*3 + + 324*2*4 + Зэ4*3*4 + 3123*1*2*8 + 3124X1X2*4 + 3134*1*3*4 + 0234X2X3X4 Д + 31234 *1*2*3 *4- (VI. 103) 287
Таблица 79. Матрица симплекс-центроидного плана в четырехкомнонентнои системе Номер опыта XI Х2 хз Х4 Номер опыта XI Х2 ХЗ Х4 1 1 0 0 0 У' 9 0 'А 0 'А >>24 2 0 1 0 0 Т2 10 0 0 ’А ’А J34 3 0 0 1 0 Уз И 'А 'А 'А 0 >123 4 0 0 0 1 Я 12 'А 'А 0 'А >124 5 '/2 ’А 0 0 У12 13 'А 0 'А 'А У134 6 0 'А 0 >13 14 0 'А ’А 'А >гз4 7 'А 0 0 'А >4 15 % '/4 1/4 74 >234 8 0 'А ’А 0 >^3 Воспользовавшись свойством насыщенности плана, последователь- но подставляя координаты экспериментальных точек 1 -5-15 в полином (VI. 103), определим коэффициенты полинома: = ?з = Уг, Рз = Уз; P4 = W Pit ~ 4Уп “ 2</х — 2у2 Pis = 4«/13 - 21/! — 2у3 Р14 = 41/14 — 21/! — 21/4 P1S = 41/23 — 21/ 2 — 2(/з ₽24 = 4i/24—2i/2 —21/4 Ps4 = 4j/34 — 2у3 — 2i/4 Pits = 27у128 — 12 (y12 + t/1S yM) + 3 (i/j + j/2 -J- ys), P124 = 27i/124 — 12 (yJ2 4- ylt + у2<) + 3 (i/j 4- у2 + yt), Pis4 = 27j/!34 — 12 (y13 4- ylt 4* 1/34) + 3 (j/i 4- Уз + 1/4) > P1S4 = 271/234 — 12 (yM 4- 1/24 4" 1/34) + 3 (У».4- Уз + Уз) > (VI. 104) (VI. 105) (VI. 106) PltS4 — 256у12з4 — 1 08 (1/123 4- 1/124 + У134 + 1/234) + 32 (y12 4- 1/13 + 1/14 + У 23 + + Узз + Узз) — 4 (i/i + 1/2 + Уз + 1/4)- (VI. 107) Аналогично, для полинома (VI. 102) //-компонентной смеси имеем: Pi = yi( (VI.108) Pi/ = 4У// — 2yf — 2y} = 2 [2уц — (yf 4- yj)l, (VI. 109) Pi/K = 27t/i>ft — 12 (ytj 4- yih 4- у a) 4- 3 (yt 4- y} 4- yh) — = 3 I9yUh - 4 (yi} 4- yik + yjk) + (Vi +У] + Ук)], (VI. 110) Pi Аж — 2561/iAm — 108 (ytjk 4- уцт 4- yikm 4- y}km) 4- 32 (ytj 4~J/ife + + ytm + У]к + У)т + Укт) — 4 (yi + У) 4" УК + Ут) — 4 [64yijkm ~ (УИк. + + У ijm + Vikm) + 8 (УИ + У1к + Vim + У}к + У)т + Укт) ~ — (i/i + У] + Ук + Ут)]- (VI.111) 288
В общем случае формула для коэффициентов уравнения регрессии, полученного по симплекс-центроидному плану, имеет вид ₽«... = г (- О'"' SS,, (VI. 112) где г—число индексов у коэффициента В*,...; SS, — сумма результатов опытов всех смесей из r-компонентов, взятых в равных пропорциях (1/7). Например, для коэффициента имеем г-3(/, j, к) и три суммы: yt + yj + yk^SS! — для \Ц — 1. (VI.113) УН + У ft + У ft = SS8 - для 1Ц = i/t, (VI. 114) УНк — SSs —Для 1/I = i/S. (VI.115) Таким образом, = 3 [(- I)3-1 I»"1 SSt + (- I)*"* 2»-i SS2 + (- I)*"8 3»-» SS8] = = 3 I (у* + У) + Ук) — 4 (УН + у ft + У ft) + Vytft] (VI. 116) Проверку адекватности уравнения регрессии, полученного по симплекс-центроидному плану, и построение доверительных интерва- лов значений свойств, предсказанных , уравнением, осуществляют теми же способами, что и в методе симплексных решеток. Пример 2. Изучалось влияние состава на активность О’,) и прочность (уг) плати- нового катализатора на непористом металлическом носителе при 35О°С. Суммарное мас- совое количество компонентов от опыта к опыту поддерживалось постоянным. Приняв з его за единицу, можно записать, что £ х,- — 1, где х,- — компонент Pt / А1гОз — измельчен- 1 ный отработанный катализатор риформинга; хг и хэ — компоненты — неорганические окислы металлов II и III групп периодической системы элементов Д. И. Менделеева. Решение. Был применен симплекс-центроидный план для д — 3. Матрица пла- нирования и результаты экспериментов представлены в таблице. Номер опыта ч *3 у, % у2, % 1 1 0 0 97,4 62 2 0 1 0 3,0 73 3 0 0 1 4,7 47 4 0,5 0,5 0 70,0 64 5 0,5 0 0,5 66,0 55 6 0 0,5 0,5 6,8 72 7 0,333 0,333 0,333 95,4 67 По формулам (VI.39) и (VI.40) определены коэффициенты уравнений регрессии для активности Л У1— 97,4Xi + 3,0*2 + 4,7x8 + 79,3xjX2 4- 59, 9*^ + 11,8x3X3 + + 1175,35X1*2X3 (VI. 117) 289
и прочности катализатора у% = 62xj 73х2 47 Хд—14х!Х2 + 2xiXg 48х2 Xg -J-63XiX2Xg. (VI.118) Ошибка воспроизводимости при измерении активности катализатора jy, —3,24, при измерении прочности sy 2 — 2,37. Адекватность уравнений регрессии (VI.117) и (V1.118) проверялась по критерию Стьюдента в контрольных точках 8,9 иЮ (таблица). Номер опыта *1 *2 хз У1 У2 У2 8 0,333 0,667 0 46 52 72 66 9 0,667 0,333 0 96 84 63 70 10 0,580 0,320 0,097 91 98 62 65 Для всех контрольных точек значения 1-критерия для уровня значимости р —0,05 меньше табличного. На рис. 68 показаны линии равного значения активности катализа- тора yi и прочности y?t построенные по уравнениям (VI. 117) и (VI.118). Наибольшая активность катализатора соответствует области, где значения компонента xt > 0,4. Проч- ность, равная 65%, является вполне удовлетворительной. Наибольший интерес представ- ляют точки, лежащие на пересечении линии равного выхода у? = 65% с линией равного выхода yi —100%. Опыт 10 (см. таблицу и рис. 68), поставленный в указанной области, дал хорошее (в пределах ошибки опыта) совпадение расчетных и экспериментальных результатов. 4. Планирование эксперимента при исследовании локальных участков диаграмм. При изучении диаграмм состав —свойство ^-компонентных смесей часто возникает необходимость исследовать зависимость свойст- ва от состава не во всей области изменения концентрации компонен- тов ав локальном участке диаграммы: О < а{ с xt < bt < 1, i = 1, 2, ...» q. 1. Исследуемая область — симплекс. Изучаемая локальная область на диаграмме может представлять собой неправильный симплекс, координаты вершин которого Л, (^, Л2(У$ известны. Чтобы иметь возможность применять в этом случае планы, используемые для изучения полных диаграмм, проводят перенормиров- Рис. 68. Линии равных значений у< (—) и (-------------------) К2СО3 Рис. 69. Область исследования темпе- ратуры кипения в системе К2НРО4 - К2СОз - НгО 290
ку и принимают составы в вершинах Aj, j = 1, 2,...,<? за самостоятель- ные псевдокомпоненты так, чтобы для всей области локального симплекса выполнялось условие я 2г,= 1. (VI.119) 1=1 Планирование экспериментов осуществляется в системе координат псевдокомпонентов. Относительно новых переменных zp z2,...,zq, удовлетворяющих условию (VI. 119), могут быть построены все ранее описанные планы. Для проведения экспериментов необходимо перей- ти от псевдокомпонентов z,- к исходным компонентам х(. Для любой и-тл точки плана этот пересчет осуществляется по формуле х}“’ _ х(1) _]_ 2<«) ( х(2) _ хр) _|_ 2(и) ( х(3) _ х<1)^ + z<“’(xp’ —хР), (VI. 120) где х,—содержание I-го компонента в вершине z}(Aj). Реализовав план, рассчитывают коэффициенты уравнения регрес- сии в координатах псевдокомпонентов Л У = f(zlt zt, (VI. 121) используя ранее приведенные формулы для соответствующих планов, и проверяют его адекватность. Для практического использования уравнение (VI. 121) записывают в исходной системе координат при помощи формул перевода координат из одной афинной системы в другую: z> = г<'> + Х2 ( 2р - 2р) + Хз ( г<з> - 2р) + • • • + х, ( г<” - г<'>) , za = z’1’ + ха ( г<2’ - г<*>) + * ( г<3’ - 2<*>) + • • • + х„ ( г<” - г’1’), (VI. 122) z^ = z<0, + ха ( г^ - 2<!!t) + X, ( - г<2.) + • • • + х,( - ед. Значения zp находятся при решении (q—1) систем уравнений: хР гр *p 2р + хр 2р + • • • + хр 2р’ = 1 х<2’ 2р + х<2’ 2р + хр 2р + • • • + хр гр = о хр 2р + х<” 2р + хр’ г(Р + • • + хр г<” = 0 хР гр + хр гр + хр гр + • • • + хр г<” = 0 хргр + хр г(2) + хр 2(3> + ... +х(2) г(,)=1 хр’ 2р+хр гр+хРг|+... +хР 2<”=0 ................................................ (VI. 123) 291
х<» г<22, + х<» г^, + • • • + х<» = о х<2> <”t + х<2> г’2», + х<2> г<2, + • • • + х<2> = О . ,(<z) z(t) 4-х”) г<г) 4- х(,) г<3), 4___к х<7) z(,). = 1 *1 Z<7—1 4^ *2 zq— 1 4^ *3 z<7—1 4^ ' *Я Ч~ 1 1 где z*/1-содержание псевдокомпонента г,- в вершинах исходного симплекса; хр-содержание z-ro компонента в вершинах zj(Aj), j“ = 1, 2,...,q. Поскольку такой перевод координат возможен только для уравнений с независимыми переменными, исходное уравнение регрес- сии необходимо преобразовать, исключив одну переменную, на- пример последнюю q-ю: я— 1 z9= 1— 2 Zi- Z=1 (VI. 124) Пример 3. Изучалась температура кипения тройной смеси НаО - К2НРО4 - К2СО3. Необходимо было определить уравнение регрессии температуры кипения (у, °C) от состава смеси (%). Исследованию подвергался не весь концентрационный треугольник, а лишь подобласть ненасыщенных растворов при 20°С — локальный участок диаграммы в виде треугольника с вершинами zi (100, 0, 0), za (40, 60, 0), za (50, 0, 50), рис. 69. Решение. Для получения уравнения регрессии был составлен симплекс-решет- чатый план относительно псевдокомпонент zi, za, za; по формуле (VI.120) определено содержание исходных компонентов в экспериментальных точках. Уравнения регрессии второго и неполного третьего порядков оказались неадекватными. Используя свойство композиционности симплекс-решетчатых планов, матрица планирования была достроена для получения уравнения регрессии четвертого порядка. Матрица плаиироваиия и результаты опытов Номер опыта 2] ?3 X, Ъ *3 1 1 0 0 100 0 0 99,9 2 0 1 0 40 60 0 113,5 3 0 0 1 50 0 50 115,7 4 0,5 0,5 0 70 30 0 103,1 5 0,5 0 0,5 75 0 25 104,8 6 0 0,5 0,5 45 30 25 114,8 7 0,333 0,333 0,333 63,33 20 16,67 105,6 8 0,75 0,25 0 85 15 0 101,5 9 0,25 0,75 0 55 45 0 107,2 10 0,75 0 0,25 87,5 0 12,5 101,6 11 0,25 0 0,75 62,5 0 37,5 107,7 12 0 0,75 0,25 42,5 45 12,5 112,5 13 0 0,25 0,75 47,5 15 37,5 116,4 14 0,5 0,25 0,25 72,5 15 12,5 103,4 15 0,25 0,5 0,25 57,5 30 12,5 104,4 16 0,25 0,25 0,5 60 15 25 109,0 17 0,2 0,2 0,6 58 12 30 108,3* 18 0,5 0,125 0,375 73,75 7,5 18,75 103,3* 19 0,4 0,15 0,45 68,5 9 22,5 104,2* 20 0,3 0,175 0,525 63,25 10,5 26,25 106,2* * Контрольные точки. 292
Условия опытов выражены в псевдокомпонентах zy и в натуральном масштабе х, %. Средние результаты у измерения температуры получены по двум параллельным опытам. Ошибка воспроизводимости равна з^,—0,86. Число степеней свободы ошибки воспро- изводимости fy — 20. Коэффициенты уравнения регрессии четвертого порядка рассчитаны с использова- нием свойства насыщенности матрицы планирования по формулам (VI.46). Уравнение регрессии в псевдокомпонентах имеет вид y = 99,88zx+ 113,51z2 + 115,69zs — I4,22Z1z2 — 12, 13г12з+0,91z2z3+ + 6, leZiZa (Zj — z2) + 10,12zxz3 (Zi — z3) — 15,34z2zs (z2 — z3) + + б.ЭОг^а (zx — z2)2 — 17,61z1z3 (Zi — z3)2 + 6,32z2zs (z2 — z3)2 + + 1,07Z]Z2zs — 274,61Z!z| zs-|- 142,21zxzsz|. (VI. 125) В таблице сведены результаты проверки адекватности полученного уравнения регрессии. Номер опыта У У Ду t 17 108,3 110,7 2,4 1,3 2,16 18 103,3 100,9 2,4 1,0 2,27 19 104,2 107,0 2,8 1,0 2,66 20 106,3 108,7 2,4 1,1 2,16 Табличное значение критерия Стьюдента to,012520 ==2,8. Уравнение (VI.125) адекватно эксперименту. Перейдем в уравнении (VI.125) от псевдокомпонент zj к натуральным переменным Xj . Системы уравнений (VI. 123) для рассматриваемой задачи имеют вид Iz}1* +OZ<!2) +0zj3> = 1, О^гР + О.бг’2» +0z}3) =0, О.бг*!1’ +0z«) +0,5z{3) =0, (VI. 126) lz^> 4- 042) +0z*3) = 0, 0,4г<” +0,6z^2) +0z<3) = 1, 0,5z^+0z<2) +0,5z<3) = 0. В результате решения систем (VI. 126) получаем г|*> = 1, z<t)=o, z<2)=0,7, zf>=l,7, (VI. 127) z<3> = —1, г® = 0. Использовав полученные решения в системе уравнений (VI. 122), получим формулы связи между натуральными координатами ху и системой координат Zy : Zj= 1 — 1,7х2— 2х3 г2= 1,7х2, (VI. 128) 293
Zg — 1 Z । Z 2 — 2Xg . Подставив (VI.128) в (VI.125), получим уравнение регрессии в исходных координатах: Л 2 2 у = 99,88 + 20,82ха — 7,63х3 + 92,88x2xs — 107,83/ + 279,28х' — — 1373,69фд — 243,59х2х| + 2230,35х| х* + 312,78л^ — 965,12х^ + + 2146,05x^3— 179,60х2х| —212,96х^ + 1127,1хз. (VI.129) Для удобства использования по уравнению регрессии построены линии равных температур (рис. 70). К2СО3 Рис. 70, Линии равных значений температур 2. Исследуемая область — многогранник. При наличии ограничений на изменение концентраций компонентов исследуемая область в общем случае образует некоторый многогранник. При построении плана экспериментов надо некоторым образом распределить экспе- риментальные точки по получающемуся из условия 0 < at < Xj < bi < 1 (VI • 130) многограннику. При этом вырожденные случаи ч ч 2 а.> 1 и 2 Ь1<- 1 (VI. 131) (=1 i=t исключаются. Экспериментальные точки предложено выбирать следующим образом: 1) выписываются все возможные комбинации двух уровней а, и bj для каждого из компонентов, но в каждой комбинации пропускает- ся содержание одного компонента. Число таких комбинаций для ^-компонентной смеси равно 294
2) среди всех комбинаций выбирают те, где сумма компонентов •меньше единицы и выполняются ограничения (VI. 130). В выбранные комбинации добавляют пропущенные компоненты в количестве, удовлетворяющем соотношению Ех,= 1. Полученные таким образом точки плана, удовлетворяющие условию (VI. 130), расположены в вершинах ограничивающего многогранника; 3) к полученным таким образом точкам плана добавляют центры двух-, трех-,...,(^ -1)-мерных граней многогранника и его центр. С ростом q число комбинаций условий эксперимента быстро растет и становится значительно больше числа коэффициентов обычно применяемого для этих планов полинома второго порядка. Определение коэффициентов уравнения регрессии второго порядка проводится по методу наименьших квадратов. Поскольку план эксперимента ненасыщенный, проверку адекватности уравнения регрес- сии можно проводить, используя F-критерий. Рассмотрим построение плана Мак Лина и Андерсона для ис- следования и оптимизации яркости свечения смеси, компонентами которой являются магний (х,), сода (x2), нитрат стронция (х3) и свя- зующее вещество (х4). На содержание компонентов в смеси наклады- ваются следующие ограничения: 0,40 < Xj < 0,60, 0,10 < х2 < 0,50, 0,10 < х3 < 0,50 , 0,03 < х4 < 0,08- В табл. 80 приведены все возможные комбинации составов смеси с пропусками в комбинациях одного из компонентов. Таблица 80. Выбор вершин многогранника в плане Мак Лнна н Андерсона Номер опыта Содержание компонентов Номер опыта Содержание компонентов *i А2 *4 л‘| '''2 % 1 0,40 0,10 0,10 — 17(1) 0,40 0,10 0,47* 0,03 2 0,40 0,10 0,50 — 18(2) 0,40 0,10 0,42* 0,08 3 0,40 0,50 0,10 — 19 0,40 0,50 — 0,03 4 0,40 0,50 0,50 — 20 0,40 0,50 — 0,08 5 0,60 0,10 0,10 ‘ — 21(3) 0,60 0,10 0,27* 0,03 6 0,60 0,10 0,50 — 22(4) 0,60 0,10 0,22* 0,08 7 0,60 0,50 0,10 — 23 0,60 0,50 — 0,03 8 0,60 0,50 0,50 — 24 0,60 0,50 — 0,08 9(5) 0,40 0,47* 0,10 0,03 25 — 0,10 0,10 0,03 10(6) 0,40 0,42* 0 10 0,08 26 — 0,10 0,10 0,08 11 0,40 — 0,50 0,03 27 — 0,10 0,50 0,03 12 0,40 — 0,50 0,08 28 — 0,10 0,50 0,08 13(7) 0,60 0,27* 0,10 0,03 29 — 0,50 0,10 0,03 14(8) 0,60 0,22* 0,10 0,08 30 — 0,50 0,10 0,08 15 0,60 — 0,50 0,03 31 — 0,50 0,50 0,03 16 0,60 — 0,50 0,08 32 — 0,50 0,50 0,08 * Количество добавленного компонента. Таким образом получено 8 точек плана —вершин многогранника (рис. 71). Эти точки необходимо дополнить координатами центров всех граней многогранника и центра многогранника (табл. 81). 295
Таблица 81. Выбор центров граней в плане Мак Лина • Андерсона Номер опыта Содержание компонентов Точки, образующие грань xi х2 *4 (9) 0,50 0,10 0,345 0,055 (1), (2), (3), (4) (10) 0,50 0,345 0,10 0,055 (5), (6), (7), (8) (И) 0,40 0,2725 0,2725 0,055 (1), (2), (5), (6) (12) 0,60 0,1725 0,1725 0,055 (3), (4), (7), (8) (13) 0,50 0,2350 0,2350 0,030 (1),(3),(5),(7) (14) 0,50 0,2100 0,2100 0,080 (2), (4), (6), (8) (15) 0,50 0,2225 0,2225 0,055 Центр многогранника Координаты центра многогранника определяются усреднением соот- ветствующих координат всех восьми вершин плана, координаты центров граней —усреднением координат точек, образующих грань (табл. 81 и рис. 71). Целиком план Мак Лина и Андерсона для четырехкомпонентной смеси и результаты эксперимента приведены в табл. 82. Таблица 82. План Мак Липа и Андерсона для четырехкомпоиентиой смеси Номер опыта *1 -*2 *4 Лев Номер опыта *4 Хзв 1 0,40 0,10 0,47 0,03 75 9 0,50 0,10 0,345 0,055 220 2 0,40 0,10 0,42 0,08 180 10 0,50 0,345 0,10 0,055 200 3 0,60 0,10 0,27 0,03 195 11 0,40 0,2725 0,2725 0,055 190 4 0,60 0,10 0,22 0,08 300 12 0,60 0,1725 0,1725 0,055 310 5 0,40 0,47 0,10 0,03 145 13 0,50 0,235 0,235 0,030 200 6 0,40 0,42 0,10 0,08 230 14 0,50 0,210 0,210 0,080 410 7 0,60 0,27 0,10 0,03 220 15 0,50 0,2225 0,2225 0,055 425 8 0,60 0,22 0,10 0,08 350 Коэффициенты приведенного полинома второго порядка опреде- лены по методу наименьших квадратов. Уравнение регрессии имеет вид (0,1,0,0) (о,0,0,1) Рис. 71. План Мак Лина и Андер- сона у — — 1,558*! — 2,851х2 — 2,426хэ + 14,372x4 + 8,300xiX2 + 8>076xlxs — — 6,625x1x4-]-3,213x2xs — 16,998х2х4 — — 17,127xsx4. (VI. 132) Так как зависимость свойства от состава адекватно описывается уравне- нием регрессии второго порядка, ока- залось возможным определить опти- мальные условия, применив метод нелинейного программирования. Усло- 296
вия, обеспечивающие максимальную яркость свечения, определялись при ограничениях (VL131): Утах = 397,48 при *1 = 0,5233, х2 = 0,2299, х3 = 0,1608, х4 = 0,080. С увеличением числа компонентов смеси число экспериментальных точек в плане Мак Лина и Андерсона быстро возрастает. Для сокращения числа экспериментов можно исключить некоторые из центров граней или такие точки, после исключения которых остав- шиеся оказываются распределенными по исследуемой области более или менее равномерно. 5. D-Оптимальные планы. Среди различных известных критериев оптимальности планов важнейшими являются требования D- и G- оптимальности D-Оптимальным называется план, минимизирующий объем эллипсоида рассеяния оценок коэффициентов уравнения регрессии. Свойство G-оптимальности обеспечивает наименьшую максимальную величину дисперсии предсказанных значений отклика в области исследования. Симплекс-решетчатые планы обладают свойствами D- и G-оптимальности только при построении полиномов второго и неполного третьего порядка. Планы Шеффе более высоко- го порядка не являются D-оптимальными. D-оптимальная симплексная решетка для полинома третьего порядка была построена позднее Кифером. Если рассмотреть множество планов с координатами точек *i=l, *j = *fc = 0, Xf = 1 — Xj = b, хь = 0, b<1/i, (VI. 133) X, = xj = xh = l/3, то для построения полинома третьего порядка план будет D-опти- мальным при 6 = (1--/5)/2, т. е. точки на сторонах симплекса берут с координатами х,= 0,2764; х,= 0,7236. В табл. 83 приведен D-оптимальный план для построения поли- нома третьего порядка в трехкомпонентной системе. Таблица 83. О-ОпТимальиый план для полинома Третьего порядка в трехкомпоиентной системе Номер опыта X! х2 1 1 0 0 2 0 1 0 У2 3 0 0 1 ТЗ 4 0,7236 0,27,64 0 Л 12 5 0,2764 0,7236 0 J122 6 0,7236 0 0,2764 J1 13 7 0,2764 0 0,7236 J133 8 0 0,7236 0,2764 >>223 9 0 0,2764 0,7236 >>233 10 0,3333 0,3333 0,3333 JI 23 297 11-529
По этому плану определяются коэффициенты полинома третьего порядка того же вида, что и при реализации обычной симплексной решетки: У = 2 ^гХг+ 2 ^Hxix>+ 2 W («i — *>)+ l<i«7 !<«/<? + 2 ?ijkXiXjXh. (VI. 134) Фор'мулы для расчета коэффициентов полинома получены под- становкой координат экспериментальных точек в уравнение регрессии: Pi = Уг< Рм = 6/г (.УШ 4“ УШ 4" У1 — У]} > 7ii = s/2 [5 (yaj — ущ) —yt + yj], (VI. 135) Pi/fe = 27уиь — 1Ь1г{УШ-\-УЦ}-\-УНк 4" ythh + Vikh + УНь) 4~ 6({Ц -\-Ц} 4-J/fe). Проверка адекватности и построение доверительных интервалов при использовании D-оптимального плана (табл. 83) проводятся так же, как и в методе симплексных решеток. Зависимость £ от сцстава приведена на рис. 72. При построении полинома четвертого порядка для трехкомпонент- ной системы план будет D-оптимальным при 7 —/2Г *t =---Г;---; х}={ — х;; хь = 0, 14 или Xi =0,1727; х} = 0,8273; xk = 0. (VI. 136) Таблица 84. D-Оптимальный план для полинома четвертого порядка в трехкомионентной системе Номер опыта *1 х2 *з У 1 1 0 0 У\ 2 0 1 0 Уг 3 0 0 1 Уз 4 0,5 0,5 0 У) 2 5 0,5 0 0,5 У>з 6 0 0,5 0,5 У23 7 0,8273 0,1727 0 У1 1 12 8 0,1727 0,8273 0 У1222 9 0,8273 • 0 0,1727 Jl113 10 0,1727 0 0,8273 •У 1333 11 0 0,8273 0,1727 У 2223 12 0 0,1727 0,8273 У 2333 13 0,567 0,2165 0,2165 У1123 14 0,2165 0,567 0,2165 У1223 15 0,2165 0,2165 0,567 •У1233 298
Кроме того, в D-оптимальном плане четвертого порядка имеются точки с координатами 7-/5“ = = ; ** = 1 — (xi + xj), или Xl= xj — 0,2165; xk = 0,567. (VI. 137) В табл. 84 приведен D-оптимальный план четвертого порядка для трехкомпонентной системы. По этому плану определяются коэффициенты уравнения регрес- сии вида 1,0 1,0 1,0 1,0 1,0 Рис. 72. Изолинии £, для D-оптимального плана третьего порядка Рис. 73. Изолинии £ для D-оптимального плана четвертого порядка У = 31*1 + ?гХ2 + ?3х3 + 312*1*2 + 313*1 *3 + Зг3*2*3 + 712*1*2 (*1 — *2) + + 713*1*3 (*1 — *з) + 723*2*3 (*2 — *з) + 612*1*2 (*1 — *2)2 + 513 *1*3 (*1 — — *з)2 + 623*2*3 (*2— *з)2 + 31123 *? *2*3 + 31223*1*2 *з + 31233*1*2*3 • (VI . 138) Формулы для расчета коэффициентов полинома четвертого поряд- ка получены подстановкой координат экспериментальных точек в уравнение регрессии: ?i = yt, (VI. 139) ?ij = *yii-2yt-2yj, (VI. 140) 70 = 1 /в [3(-!/j + ю) + У^(Унц-ytjjj)\ , (VI.141) 8О = 7/в [- 3 (У1 + У]} - 8уи + 7 (уШ] + уш/)1, (VI. 142) ЗнА = 26,657 yt — 6,167 (У] + Ук)— \6,96 (У ij + у th) + 0,5111/, ь — — 32,18 (уtn} + ушь) + 17,196 (унл +yikhk) +5,72 (yjj}k + yjhhk) + + 84,11 yn}k — 23,237 (ytjjh-]- ytjhh)' (VI • 143) <+=/'+= A; i, j, k =1,2,3. 11 299
Рис. 74. Расположение точек в D-оптимальных планах: а — второго порядка; б— неполного третьего порядка; в — третьего порядка; г—чет- вертого порядка При проверке адекватности для определения зависимости от состава можно пользоваться контурной картой (рис. 73). D-Опгималь- ность плана обеспечила отсутствие на этой контурной карте изоли- ний q>l,0 (см. для сравнения рис. 62, б для простой симплексной решетки). Однако готовить смеси с содержанием компонентов 0,8273 и 0,1727 труднее, чем смеси с соотношением компонентов % И ’/4. Существенным недостатком рассмотренных D-оптимальных планов третьего и четвертого порядка является отсутствие композиционности. На рис. 74 показано расположение экспериментальных точек в D- оптимальных планах для трехкомпонентных систем. При необходи- мости можно от плана второго порядка или неполного третьего (рис. 74, а, б) перейти к плану четвертого порядка (рис. 74, г), сохранив свойство D-оптимальности. При этом точку в центре можно использовать как контрольную. При переходе от плана третьего порядка (рис. 74, в) к плану четвертого приходится или переделы- вать опыты, или работать по плану, не обладающему свойством D-оптимальности. Xj(H2O) 30% х2 [(NH4)2hpo4J а Рис. 75. Область исследования вязкости в системе (NH<)2HPO4 - К.2СО3 - Н2О (а) и план эксперимента (6) Пример 4. Изучалась зависимость вязкости (у) растворов в системе (ЫНфНРОд - К2СО3 - НгО от состава и температуры. Планирование эксперимента проводилось на локальном участке концентрационного треугольника, ограниченного линией насыщения при 0°С (рис. 75). Локальный участок диаграммы представлял собой треугольник с вер- шинами Z1 (42, 0, 58), Z2 (0, 30, 70), za (0, 0, 100). Решение. D-Оптимальный план третьего порядка был составлен относительно псевдокомпонентов zi, za, гз и по формуле (VI. 120) определено содержание исходных компонентов в экспериментальных точках. Условия опытов выражены в псевдокомпонен- тах zj и в натуральном масштабе (%) (см. табл.). 300
Матрица планирования и результаты измерения вязкости Номер опыта z2 X, у, (0°С) л (30°С) 1 1 0 0 42,0 0 58,0 8,33 3,83 2 0 1 0 0 30,0 70,0 4,99 2,54 3 0 0 1 0 0 100,0 1,79 0,80 4 0,2764 0,7236 0 И,6 21,71 66,69 4,22 2,09 5 0,7236 0,2764 0 30,4 8,29 61,31 6,32 2,77 6 0,2764 0 0,7236 11,6 0 88,4 2,20 1,13 7 0,7236 0 0,2764 30,4 0 69,6 4,30 2,26 8 0 0,2764 0,2736 0 8,29 91,71 2,30 1,09 9 0 0,7236 0,2764 0 21,71 78,29 3,93 1,90 10 0,333 0,333 0,333 14,0 10,0 76,0 3,59 1,64 11 0,22 0,22 0,56 9,1 6,5 84,4 2,00 1,23 12 0,22 0,56 0,22 9,1 17,0 73,9 3,68 1,82 13 0,56 0,22 0,22 23,9 6,5 69,6 4,70 2,12 Ошибка воспроизводимости sy— 0,53. Число степеней свободы ошибки воспроиз- водимости fy = 13. По формулам (VI.135) были рассчитаны коэффициенты урайнений регрессии третьего порядка вязкости при 0°С: уу = 8,33г! + 4,99 г2+ 1,79 г3 — 6,95ZjZj — 9,05 ztz3 — 1,37 z2z3 + + 17,90Z]Z2 (zt — z2) 4- 9,90 Z]Z3 (zt — z3) -f- 12,37 z2z3 (z2 — z3) -f- + 18,06z1z2z3 (VI. 144) и при 30°C: y2 ~ 3,83 Zi 4~ 2,54 z2 4~ 0,80 z3 — 8,77 z2z2 — 3,10 z^z3 0,87 z2z34~ -j-5,27 Z]Z2 (Zj— z2) 4-6,55 zTz3 (Zj — z3)4-5,77z2 z3 (z2 — z3)-|-3,00 ZjZ2z3. (VI. 145) Точки 11, 12, 13 (см. табл.) служат для проверки адекватности полученных уравнений регрессии. Результаты проверки адекватности уравнений (VI. 144) и (VI. 145) сведены в таблицу: Номер опыта Ау, Уз Л Ал '1 11 2,00 1,68 0,32 1,23 0,72 0,51 0,8 0,77 1,22 12 3,68 3,68 0 1,82 1,82 0 0,8 0 0 13 4,70 5,70 1,00 2,12 2,59 0,47 0,9 2,33 1,09 Табличное значение критерия Стьюдента zo,oie; is = 2,85. Для всех контрольных точек значения r-отношения оказались меньше табличного, следовательно, уравнения регрес- сии (VI. 144) и (VI. 145) адекватны эксперименту. Для объединения уравнений регрессии (VI.144) и (VI.145) в одно примем линейную зависимость коэффициентов (3 от темпе- ратуры (таблица): Т. °C Г, 03 (3l3 ^23 712 713 723 {3123 0 -1 8,33 4,99 1,79 -6,95 -9,05 -1,37 17,90 9,90 12,37 13,06 30 +1 3,83 2,54 0,80 -8,77 -3,10 -0,87 5,27 6,55 5,77 3,00 Для удобства расчета зависимости коэффициента 0 от температуры воспользуемся линейным преобразованием вида (V.3). Для данного случая 301
(VI. 7\ = (Т—15)/15. (VI. 146) Рассмотрим линейную зависимость от безразмерного параметра Г,: = 31У + ЗаУ Л- Тогда ^°)+3}ЗО) РтУ= п (VI. 148) где |р —соответствующий коэффициент в уравнении (V1.144); — соответствующий коэффициент в уравнении (VI.145). Подставив (VI.146), (VI.148) и (VI.149) в (VI.147), получим ₽(30) _ р(0) ₽у = Ру” + "о Т' <VI•150) 1 Z * 1D Окончательное уравнение регрессии вязкости растворов от температуры и состава имеет вид Л у = (8,33 — 0,150 Т) zx 4- (4,99 — 0,082 Т) г2 4- (1,79 — 0,001 T)z34- 4- (— 6,95 4- 0,106 Т) zxz2 4- (— 9,05 4~ 0,347 71) zxz3 4- (1,37 4-0,1667’) z2za 4- 4- (17,90 — 0,069 Т) zxz2 (zx — z2) 4- (9,90 — 0,008Т) zxz3 (zx — z3) 4- 4- (12,37 — 0,017 T) z2z3 (z2 — z3) 4- (13,06—0,720 T) zxz2z3. (VI .151) Получим уравнения связи псевдокомпонентов zj с натуральным переменным xj. Систе- мы уравнений (VI.123) для рассматриваемой задачи имеют вид 0,42гр 4- 0г*2> 4- 0,58 z(p = 1 Оz}1» 4-0,3z’2) 4-0,7гр» =0 Огр 4-Огр 4- 1г<р= О (VI. 152) 0,42 гр 4-Огр 4- 0,58 гр = О ОгР 4-0,Згр 4-0,7г<3> = 1 Огр 4-Огр 4- 1г»> =0 Решения систем (VI. 152) имеют вид гр = 2,38, гР=О, гр = О, гр = 3,33, (VI. 153) гр=О, гр = 0. Подставив (V1.153) в систему уравнений (VI.122), получим гх = 2,38 (1 — х2 — х3), г2=3,33хя, (VI.154) 302
z3 = 1 — zx — z2 = 2,38xg — 0,95*2 — 1,38. Пример 5. Определяли оптимальный состав многокомпонентного растворителя, применяемого в процессе очистки дрожжей от углеводородов. Основным показателем очистки дрожжей является содержание углеводородов в биомассе после экстрак- ции (у). Исходя из технологических и технико-эконо- мических соображений, планирование эксперимента проводили на локальном участке концентрационного треугольника (рис. 76). В области исследования со- держание в смеси (%): ацетона х, < 74, гексана х2 <90; воды х3<10. Локальный участок диаграммы пред- ставляет собой треугольник с вершинами z, (9,5; 89,5; 1), z2 (58,5; 40; 1,5), z3 (74, 16, 10). Решение- D-Оптимальный план четвертого порядка составлен относительно псевдокомпонентов z,, z2, z3 (табл. см. ниже). Для псевдокомпонентов удовлетворяется основное условие (VI.1) планов Шеффе. Рис. 76. Область исследования состава многокомпонентного раст- ворителя Номер опыта 21 22 гз *1 x2 *3 У 1 1 0 0 9,5 89,5 1 0,1 2 0 1 0 58,5 40 1,5 0,3 3 0 0 1 74 16 10,0 0,04 4 0,5 0,5 0 34 64,7 1,3 0,08 5 0,5 0 0,5 41,7 52,8 5,5 0,06 6 0 0,5 0,5 66,2 28,2 5,8 0,06 7 0,176 0,824 0 49,9 48,7 1,4 0,05 8 0,824 0,176 0 18,12 80,79 1,09 0,09 9 0,176 0 0,824 62,6 29,0 8,4 0,12 10 0,824 0 0,176 20,85 76,55 2,6 0,1 11 0 0,176 0,824 71,22 20,30 8,49 0,2 12 0 0,824 0,176 61,25 35,75 3,0 о,п 13 0,216 0,216 0,568 56,7 37,12 6,18 о,п 14 0,216 0,568 0,216 51,2 45,65 3,15 0,091 15 0,568 0,216 0,216 34,0 62,97 3,03 0,11 16 0,333 0,333 0,333 47,3 48,5 4,2 0,108 Переход к исходным компонентам для любой точки исследуемого локального симплекса осуществляется по формуле (VI.120). Согласно этому плану был поставлен эксперимент на смесях, каждый опыт повто- ряли два раза. По формулам (VI.139) — (VI.143) рассчитаны коэффициенты уравнения регрессии четвертого порядка в псевдокомпонентах: у = 0,1 Zj + 0,3 z2 + 0,04 z3 — 0,48 z2z2 — 0,04 z2 z3 — 0,44 z2z3 + 4-0,914 ZjZ2 (Zj — z 2) — 0,312 ZjZ3 (Zj — z3) — 1,39 z2z3 (z2 — z3) — - 1,003z1Z2 (Zj - z2)2 + 0,747 ZjZ3 (Zj - z3)2 + 0,782 z2z3 (z2 - z3)2 + + 1,398г, z2z3 + 8,416Zj z2z3— 4,703z!Z2z^ . (VI. 155) Системы уравнений (VI.123) с учетом ограничений на содержание компонентов в растворителе имеют вид 9,5z{‘>+ 89,5 zj2) + lzj3) = 1 58,5 zp +40z}2>+1,5z}3) =0 74 zp + 16z<2> + 10z*3) = 0 (IV. 156) 303
9,5 2<’» + 89,5 г<2< + 1г<3> = О 58,5 г<‘> +40z^>+l,5z<3) = 1 74z<‘> + 16г£2> + 10z<3> = 1 В результате решения системы (VI. 156) имеем z}1’= 0,0092; z<2>=0,0116; г<3> = 0,0495; г*0 = 0,0215; z<2) = 0,00051; г'3> = — 0,1583. Использовав найденные решения, получим формулы связи между натуральными координатами % и системой координат z: zt = — 0,92 + 0,0208х2 + 0,058х3, z2 = 2,15 — 0,022х2 — 0,18х3, (VI.157) z3 = 1 — 2Г — г2 = — 0,23 4- 0,001х2 + 0,121 х3. Проверка адекватности полученного уравнения регрессии проводилась по критерию Стьюдента в четырех контрольных точках. Результаты проверки адекватности приведены в таблице. X, Х2 -*з У У / *табл 47,3 48,5 4,2 0,1022 0,108 0,365 2,83 53 44 3,0 0,079 0,072 0,392 2,83 19 79 2,0 0,1 0,07 1,778 2,83 37,9 58,7 3,4 0,13 0,12 0,547 2,8'3 44,5 54,0 1,5 0,04 0,05 0,57 2,83 Уравнение (VI.155) адекватно эксперименту при уровне значимости р = 0,05. Качество получаемого продукта считается удовлетворительным, если содержание остаточных углеводородов в биомассе менее 0,05%. Для определения составов раство- рителя, обеспечивающих это требование, по уравнению (VI. 155) построены линии рав- ных значений у (рис. 77). Составы растворителя, удовлетворяющие требованию у < 0,05%, находятся в заштрихованной облети симплекса. 6. Планы с минимизаци- ей систематического смеще- ния. В планах, предложен- ных Дрейпером и Лоурен- сом, в отличие от симплекс- ных решеток все точки расположены внутри об- ласти исследования, т. е. эксперимент проводится только с ^-компонентными составами. В этих планах учитывается отсутствие априорной информации о поверхности отклика и тот Рис. 77. Изолинии остаточного содержания углево- дородов в биомассе факт, что желательно аппроксимировать неиз- 304
вестную поверхность отклика полиномами низ- ких степеней. Экспериментальные точки вы- бираются таким образом, чтобы обеспечить наилучшее представление сложной поверхности простыми полиномами. Точки плана для построения полинома степени л, выбирают таким образом, чтобы получить минимальную величину системати- ческой ошибки, связанной с тем, что функция отклика есть полином степени п2 > щ • Принци- пы, используемые при выборе ПОДХОДЯЩИХ Рис. 78. Система коорди- планов, были предложены ранее Боксом и нат для планов Дрейпе- Дрейпером. ра-Лоуренса Дрейпером и Лоуренсом построены планы для трех- и четырех- компонентных систем для степеней полиномов щ =1, п2 = 2, щ = 2 и «2 = 3. Для удобства построения планов Дрейпер и Лоуренс вводят новую систему координат. В трехкомпонентных системах в плоскости концентрационного треугольника (хр х2, Xj) новая система координат выбирается таким образом, чтобы начало коор- динат совпадало с центром тяжести треугольника, одна из вершин треугольника лежит на оси z2, а две другие симметричны относитель- но этой оси (рис. 78). Между треугольной системой координат (xi, х2, х3) и прямоугольной (z,, Zs) существует следующая связь. zi — “у — *1 + : z2 = —• — х1 — х2 4- 2х3 Xj— 1/3 ( 3Zj —Z2 Р'з'-Т/п), х2 = Vs ( 3z^ — z2 3 /л), Хз — 1/з ( 2za 3 m) , (VI. 158) (VI. 159) где /и~длина стороны концентрационного треугольника. При изучении всей диаграммы /п”1, при исследовании локальных участ- ков диаграммы т < 1. Точки плана для трехкомпонентных систем выбираются (в коорди- натах zp z^) из следующих множеств: 1) вершины треугольника, подобного концентрационному, с центром в начале координат и со стороной р: 2) вершины треугольника, подобного концентрационному, с центром в начале координат и со стороной g: 0. — ~y=r S V 3 1 Кз ±Tg’ ~8 305
3) вершины квадрата с центром в начале координат и со сто- ронами 2а, параллельными осям (±а; ±а); 4) точки на осях координат (±Л, 0), (0, ±/>); 5) вершины прямоугольника (с, d), (-с, -d),'(c, — d), (—c,d). После реализации того или иного плана Дрейпера —Лоуренса для трехкомпонентных систем строят полиномы для двух независимых переменных zy и z2 первого порядка (wt = 1 при и2 = 2) А у = Ьй 4*4* b2z2 (VI. 160) или второго порядка (л] =2 при и2 = 3) У = ba -j- b1z1 -J- b2z2 4- b12z2z2 4- &ii z| 4-^22 • (VI • 161) Таблица 85. Параметры планов Дрейпера — Лоуренса для q = 3, л = 1, л2 — 2 Множество точек Число опытов в центре «0 Общее число опытов Параметры (1,2) 0 6 р = 0,621, g = 0,339 (1, 2) 1 7 р- 0,662, g —0,381 (1, 2) 2 8 р- 0,699, g = 0,421 (1,2) 3 9 р = 0,733, g “ 0,457 (1,3) 0 7 р = 0,616, a -0,160 (1,4) 0 7 р = 0,616, b- 0,226 (1,5) 0 7 р = 0,616, c = V 0,051m2 - t/2* (1, 1,2) 0 9 Pi =0,606, g = 0,364 p2 — 0,500 (1, 2, 2) 0 9 р= 0,727, gt — 0,200 g, -0,425 * Значение d выбирается произвольно. Для построения полинома первой степени применительно к трехкомпонентным системам (<?=3) Дрейпер и Лоуренс предложили планы, содержащие от 6 до 9 экспериментальных точек. Параметры для некоторых планов Дрейпера —Лоуренса (в долях от т) при </ = 3, п} = 1 и п2 = 2 приведены в табл. 85. Если число точек плана больше числа точек в выбранных множествах, добавляется соответ- ствующее число точек в центре треугольника (с координатами z1 =0, z2 = 0). Построим в качестве примера план Дрейпера — Лоуренса (1,2), содержащий шесть точек (табл. 85). Точки множества 1 при т=1 имеют координаты (zp гг): 0 0. °-62Л (°’621 . 0.621 /з \ / 0,621 0,621 /з ’’/з/’\2’ 6 / ’ \ 2:— 6 306
или (0,0; 0,366); (0,3105; — 0,18); (—0,3105; — 0,18). Точки множества 2 имеют координаты ( 0,339\ ( 0,339 0,0; — —— ; +1/з-0,339;--------- \ /3 ) \ 6 У или (0,0; —0,196), (0,170; 0,098), —1/2-0,339; (—0,170; 0,098). От координат точек в системе (zb z2) по формулам (VI. 159) перейдем к координатам в треугольнике х, - х2 - х3. Переведем, например, первую точку с координатами z, ”0,0; z2 =0,366 (/и = 1). Для этой точки Х1 = 1/з( —0,366 Кз+ 1)= 0,12; *2 = 1/3 ( — 0,366 /ЗД-1 ) = 0,12; *3 = 1/з ( 2-0,366 /?+ 1) = 0,76. Можно проверить правильность расчета: *1 + *2 + *з = 0,12 +0,12 4- 0,76= 1,0. Расположение точек на концентрационном треугольнике показано на рис. 79, план эксперимента приведен в табл. 86. Таблица 86. Матрица планирования (1, 2) для ? = 3, и, = 1, л: = 2 Номер опыта z2 X. Х2 *3 1 0 0,366 0,12 0,12 0,76 2 0,311 -0,18 0,127 0,748 0,125 3 -0,311 -0,18 0,748 0,127 0,125 4 0,0 -0,196 0,447 0,447 0,106 5 0,170 0,098 0,106 0,447 0,447 6 -0,170 0,098 0,447 0,106 0,447 Для построения полинома второго порядка (VI. 161) применительно к трехкомпонентным системам Дрейпер и Лоуренс построили планы, содержащие от 8 до 15 экспериментальных точек. Параметры для планов Дрейпера — Лоу- ренса (в долях от т) при ? = 3, л] =2, л2=3 приведены в табл. 87. Так, например, построим план (1, 3, 4), содержащий 13 точек: 11 точек из множеств 1, 3, 4 и 2 точки в центре треугольника (рис. 80). Точки множества 1 при т=1 имеют координа- ты (z,, z2): Рис, 79. План Дрейпера — Лоуренса (1, 2) 307
или (0,0; 0,437), (0,378; —0,218), (— 0,348; — 0,218). Таблица 87. Параметры планов Дрейпера — Лоуренса для q = 3, пу = 2, ns — 3 Множество точек Число опытов в центре По Общее число опытов N Параметры (1,2) 1 7 р -0,670, g -0,385 (1,2) 2 8 р -0,698, g -0,421 (1, 2) 3 9 р =0,723, g = 0,450 (1, 1,2) 0 9 р,-0,715, р2 =- 0,233, g -0,430 (1, 1,2) 1 10 р,-0,729, Р2 =0,323, g =0,445 (1, 1, 2) 2 11 р,-0,738, р2 =0,398, g -0,462 (1, 1,2) 3 12 р, - 0,743. р2 - 0,465, g - 0,450 (1, 1, 2) 4 13 р, - 0,742, ъ - 0,532, g - 0,485 (1,2, 2) 0 9 р -0,716, 2,-0,342, g-0,342 (1,2, 2) 1 10 р -0,739, g,-0,367, 22“О,367 (1, 1. 1,2) 0 12 р, -0,751, р2 —0,422, рз = 0,189, 2 “0,47 (1. 1, 2, 2) 0 12 р,-0,748, р2 -0,445, g, -0,468, 22 “0,156 (1, 2. 2,2) 0 12 р =0,782, gy =0,348, g2 = 0,348, g3 = 0,348 (1,3.4) 2 13 р =0,756, а =0,183, b =0,258 (1, 3, 5) 2 13 р -0,756, а -0,300, с -0,547, <1 -0,130 (1,4,5) 2 13 р -0,756, Ь =0,212, с =0,130, d =0,257 (1, 5, 5) 2 13 р -0,756, с, = 0,094, </,=0,272, с2-0,172. </2 -0,125 (1, 1. 2, 5) 0 13 р,-0,297, р2 - 0,756, 2 = 0,295, с = 0,111, 2 -0,268 (1, 1,-2, 5) 0 13 р, -0,478, р2 -0,756, 2 -0,477, с =0,045, d =0,109 (1, 1, 2,5) 1 14 р -0,369, р2 -0,766, 2 =0,319’, с =0,112, d -0,270 (1, 1,2,5) 1 14 р,-0,514, р2 —0,762, g -0,481, с =0,058, d =0,140 (1, 1,2, 5) 2 15 р, =0,545, р2 =0,766, 2 =0,480, с =0,071, d =0,171 хг а=0ЛЗ хз р-0,1 56 Рис. 80. План Дрейпера — Лоу- ренса (1, 3, 4) Точки множества 3: (0,183; 0,183), (0,183; —0,183), (—0,183; 0,183), (—0,183; —0,183). Точки множества 4: (0,258; 0), (— 0,258; 0), (0; 0,258), (0;—0,258) План эксперимента приведен в табл. 88. Координаты х, - х2 - х3 связаны с z, -z2 соотношениями (VL159). 308
Таблица 88. Матрица планирования (1, 3, 4) для ? — 3, п, = 2, л2=3, jV=13 Номер опыта Z2 *1 X; хз 1 0 0,437 0,081 0,081 0,838 2 0,378 -0,218 0,081 0,837 0,082 3 -0,378 -0,218 0,837 0,081 0,082 4 0,183 0,183 0,044 0,410 0,546 5 0,183 -0,183 0,256 0,622 0,122 6 -0,183 0,183 0,410 0,045 0,545 7 -0,183 -0,183 0,622 0,256 0,122 8 0,258 0 0,076 0,591 0,333 9 -0,258 0 0,592 0,075 0,333 10 0 0,258 0,184 0,184 0,632 11 0 -0,258 0,482 0,482 0,036 12 0 0 0,333 0,333 0,333 13 0 0 0,333 0,333 0,333 Коэффициенты уравнения регрессии второго порядка у =f(zv z2) опре- деляют методом наименьших квадратов. Проверку адекватности про- водят по результатам опытов в контрольных точках по /-критерию. Уравнение адекватно, если экспериментальное значение /-критерия для всех контрольных точек меньше табличного. Экспериментальные значения /-критерия определяются по формуле (VI.93). Величины берут при этом с соответствующих контурных карт. При исполь- зовании планов Дрейпера — Лоуренса расчет зависимости от соста- ва можно провести только на ЦВМ. Такая контурная карта для плана (1, 3, 4), приведенного в табл. 88, показана на рис. 81. Как видно из рис. 81, уравнение регрессии хуже всего предсказывает значение свойства вблизи вершин концентрационного треугольника =-1,54-3). Для построения планов применительно к четырехкомпонентным системам Дрейпером и Лоуренсом также вводится система координат (zt, z2, z3). Центр новой системы координат совпадает с центром тяжести концентрационного тетраэдра (хр х2, х3, х4), а координатные оси расположены таким образом, чтобы четыре вершины тетраэдра в новой системе координат образовывали полуреплику от полного факторного эксперимента 23 с определяющим кон- трастом 1=2,2223. Координаты вершин тетраэдра в новой системе (2,, z2, z3): (т, т, —т), (т, —т, т), (—т, т, т), (—т, —т, — т) в общем случае и (1, 1, -1), (1, -1, 1), (-1, 1, 1), (-1, -1,-1) Рис. 81. Изолинии в плане Дрейпера — Лоуренса (1, 3, 4) при стороне тетраэдра т = 1. 309
Между системами координат (%,, х2, х3, х4) и (zb z2, z3) существу- ет следующая связь: Z1 = *1 -I- *2 — *з — *4 > z2 = *i — *2 + *з —*4. (VI. 162) Zg = — *1 + х2 4- х3 х^, и Х1 = V1 (гх + г2 — г3 4- т), х2 = 1h (zi — z2 + 2з 4- т) > (VI. 163) хз = i (— zi 4- z2 4- z3 4- m) > A4=1/4 (— Zx — Z2 — Z3 4-/П), Точки плана для четырехкомпонентных систем выбираются (в координатах zb z2, 23) из следующих множеств: 1) вершины тетраэдра, подобного концентрационному, с координатами вершин (а, а, — а), (а, — а, а), (— а, а, а), (— а, — а, —а); 2) вершины тетраэдра (6, 6, 6), (Ь, — Ь, — Ь), (Ь, Ь, — &), (— Ь, —Ь, Ь); 3) точки на осях (*ft, 0, 0), (0, Ztft, 0), (0, 0, Ztft); 4) вершины тетраэдров с координатами (—г, —s, —/), (—г, s, t), (г, —s, t) (г, s, —t); (—i, г, s), (t, —г, s), (/, г, — s), (—t, —r, —sy, (—s, t, r),. (s, — t, r), (s, t, —r), (—s, — t, —r). Таблица 89. Параметры планов Дрейпера — Лоуренса для ц = 4, л, = 1, л3 = 2 Множество точек Число опытов в центре п0 Общее число опытов N Параметры (1, 2) 0 8 а = 0,548, 6 = 0,315 (1, 2) 1 9 а = 0,567, b = 0,344 (1, 2) 2 10 а = 0,602, b = 0,371 (1, 2) 3 11 а = 0,626, b = 0,397 (h 2) 4 12 а = 0,650, 6 = 0,421 (1, 3) 0 10 а = 0,550, h = 0,628 (1, 3) 1 11 а = 0,568, h = 0,674 (1, 3) 2 12 а = 0,585, h = 0,718 (4) 0 12 г = 0,539, з = 0,248 / = 0,500, (4) 6 12 /•=0,616, « = 0,360 t = 0,300, 310
После реализации того или иного плана Дрейпера — Лоуренса для четырехкомпонентных систем строят полиномы для грех независимых переменных zp z2 и z3 первого порядка (и, = 1 при и2 = 2) Л У — + &1Z1 + &2Z2 + b3Z3 (VI .164) или второго порядка («j =2 при л2=3) У = ba + &izi + ^2Z2 + b3z3 Д- Ь12ггг2 + b13z1z3 + b23z2z3 4* + ^11Z1 +^22 z| +^зз z| • (VI. 165) Параметры (в долях от /и) некоторых планов Дрейпера— Лоуренса, содержащих не более 12 точек (при <7 = 4, п} = 1, д2 = 2), приведены в табл. 89. Таблица 90. Параметры планов Дрейпера — Лоуренса для q = 4, Hi = 2, Л2 = 3 Множество точек Число опытов в центре По Общее число опытов Параметры (1,1,4) 0 20 а\ Ъ,613 02 0,0945 Г 0,684 5 0,260 t 0,0524 (1,1,4) 1 21 0,679 0,179 0,694 0,270 0,0564 (1,1,4) 2 22 0,685 0,248 0,702 0,274 0,0532 (1,1,4) 3 23 0,690 0,315 0,708 0,268 0,0406 (1,1,4) 4 24 0,694 0,393 0,710 0,242 0,00912 (1,2,4) 1 21 а 0,676 b 0,165 /• 0,696 5 0,274 t 0,0784 (1,2,4) 2 22 0,680 0,220 0,706 0,281 0,106 (1,2,4) 3 23 0,683 0,272 0,717 0,274 0,144 (1,2,4) 4 24 ' 0,685 0,317 0,727 0,226 0,225 (1,3,4) 0 22 а 0,682 h 0,319 Г 0,0807 5 0,291 t 0,702 (1,3,4) 1 23 0,686 0,390 0,0925 0,306 0,708 (1,3,4) 2 24 0,690 0,459 0,104 0,321 0,710 (Г, 1,2,3) 0 18 а\ 0,292 02 0,667 b 0,279 h 0,765 (1,1,3,3) 1 19 0,337 0,672 0,292 0,776 (1,1,2,3) 2 20 0,380 0,674 0,305 0,786 (1,1,2,3) 3 21 0,420 0,676 0,318 0,795 (1,1,2,3) 4 22 0,460 0,674 0,332 0,805 (1,1,2,3) 5 23 0,501 0,669 0,346 0,814 (1,1,2,3) 6 24 0,548 0,656 0,359 0,822 (1,1 1,2,3) 0 22 ау 0,679 02 0,442 аз 0,132 b 0,326 h 0,805 (1,1,1,2,3) 1 23 0,683 0,455 0,191 0,332 0,814 (1,1,1,2,3) 2 24 0,691 0,441 0,288 0,340 0,822 (1,1,2,2,3) 0 22 ау 0,677 02 0,451 />, 0,126 Ьч 0,321 h 0,805 (1,1,2,2,3) 1 23 0,677 0,479 0,181 0,315 0,814 (1,1,2,2,3) 2 24 0,672 0,517 0,275 0,275 0,822 (1,1,2,3,3) 0 24 0,680 0,494 0,329 . 0,317 0,818 311
При #>12 значения параметров г, s, t и # определяются из системы уравнений r2+s2 + /2 = V«i2/20, (VI. 166) rst = <Vm3/180, где т — длина стороны концентрационного тетраэдра. Параметры планов (в долях от т) для четырехкомпонентных сме- сей при «, =2, и2=3, удовлетворяющих условию 18 <#<24, при- ведены в табл. 90. Все приведенные планы построены в предположении, что существует только систематическое смещение. На практике обычно кроме систематической ошибки экспериментальные данные содержат также и случайную ошибку. При минимизации общей ошибки можно сохранить основную форму планов и только умножить координаты точек плана на величину 0 > 1, т. е. для трехкомпонентных систем следует брать точки с координатами ( 0z„ 0z2), а для четырехкомпонентных — с координатами ( 0zb 0z2> 0Zg). Парметр 0 зависит от случайной ошибки и коэффициентов полинома и близок к единице, если случай- ная ошибка не доминирует. Поскольку в каждой конкретной задаче нахождение точного значения 0 затруднительно, в достаточно грубом приближении 0 можно считать равным 1,1 для трехкомпо- нентных систем и 1,2 для четырехкомпонентных. Трансформируем, например, для минимизации общей ошибки план (1, 3, 4) для # = 3, и, =2, и2=3, приведенный в табл. 88. Координаты первой точки с учетом параметра 0=1,1 получаются следующим образом: x1==i/3 (—362! —6z2K3 + «i) = 1/з (-1,1-0,437 Кз"+ 1) = 0,056, х*=1/з(+30г1 —вгв]/Т+/п) = 1/з(+ 3-1,1-0,0—1,1-0,437 /з-|- 1) = = 0,056, x3 = i/3 (20г2 /3 + т) = 2/3 (2-1,1- 0,437 /з + 1) = 0,888. Полностью план (1, 3, 4) для # = 3, п, =2, п2’=^, минимизирую- щий общую ошибку, приведен в табл. 91. Таблица 91. Матрица планирования (1, 3, 4) для ? = 3, л, = 2, л2 = 3, 0=1,1 Номер опыта #1 #2 #3 Номер опыта XI Х2 ХЗ 1 0,056 0,056 0,888 8 0,05 0,617 0,333 2 0,056 0,888 0,056 9 0,617 0,05 0,333 3 0,888 0,056 0,056 10 0,17 0,17 0,66 4 0,016 0,418 0,566 11 0,5 0,5 0 5 0,248 0,651 0,101 12 0,333 0,333 0,333 6 0,418 0,016 0,566 13 0,333 0,333 0,333 7 0,651 0,248 0,101 312
Рис. 82 Область исследования вязкости в системе (NH4)2HPO4 -- К2СО3 - Н2О при 30°С (а) и план эксперимента (б) Пример 6. Исследовалась зависимость вязкости при 30°С жидкого комплексного удобрения на основе диаммонийфосфата, поташа и воды от состава. В качестве области исследования была выбрана область ненасыщенных растворов по обеим солям при ЗО°С (рис. 82), сторона концентрационного треугольника при этом равна 0,5. Решение. Был Использован план Дрейпера — Лоуренса, содержащий 13 точек (см. табл. 88). Исследуемую подобласть удобно рассматривать как концентрационный треугольник в новой системе координат (х>; хг,' хз1): Л] 4" Связь между координатами x‘j и xj задается соотношениями: х{ = 2xlt х'2=2хг, (VI. 167) х3 = 1 — х, — х2 = 1 — 2хх — 2 х2. Учитывая соотношения (VI. 159), получим также Zl = 1/2 (-*1 + *2) = *1+*2) > (VI. 168) , , , А Кз / \ Кз7 Х1 + *2+2хз / = I 1 — 3*i — 3*2 I = —I Хз—2xj— 2х2 . / «5 \ / «5 \ / План эксперимента и результаты измерения вязкости (у) по двум параллельным опытам приведены в табл. 92. По данным табл. 92 методом наименьших квадратов на ЦВМ были определены коэффициенты уравнения регрессии вида (VI.161) у= 1,54 —0,94 2! — 1,01 г2 — 8,932^ + 10,48г^ + 0,76 . Полученное уравнение адекватно эксперименту. В натуральном масштабе с учетом соотношений (VI. 168) уравнение регрессии имеет вид у= 1,54 + 2, I*!+ 0,22x2— 0,58 ^+ 1,18х| + 21,81 xf — 18,93 XjX2 + + 4,14 х, х3— 6,17 х2х3 + 0,25 х| . 313
Таблица 92. Матрица планирования и результаты опытов Номер опыта Z1 22 X] Х2 Хз Х2 Хз У 1 0 0,437 0,081 0,081 0,838 0,040 0,040 0 920 1,033 2 0,378 -0,218 0,081 0,837 0,082 0,040 0,418 0,542 4,873 3 -0,378 -0,218 0,837 0,081 0,082 0,418 0,040 0,542 4,722 4 0,183 0,183 0,044 0,410 0,546 0,022 0,205 0,772 1,481 5 0,183 -0,183 0,256 0,622 0,122 0,128 0,311 0,561 3,294 6 -0,183 0,183 0,410 0,045 0,545 0,311 0,128 0,561 2,996 7 -0,183 -0,183 0,622 0,256 0,122 0,205 0,023 0,772 2,160 8 0,258 0 0,076 0,591 0,333 0,092 0,092 0,816 1,430 9 -0,258 0 0,592 0,075 0,333 0,241 0,241 0,518 3,624 10 0 0,258 0,184 0,184 0,632 0,038 0,296 0,666 2,423 И 0 -0,258 0,482 0,482 0,036 0,296 0,038 0,666 2,165 12 0 0 0,333 0,333 0,333 0,167 0,167 0,666 2,191 13 0 0 0,333 0,333 0,333 0,167 0,167 0,666 2,207 7. Планирование эксперимента при изучении зависимости свойства от соотношений компонентов. В некоторых практических задачах целесообразно рассматривать зависимость свойства от соотношений компонентов, а не от их абсолютных количеств. Если процентное содержание каждого компонента больше нуля, при наличии верхних и нижних ограничений на компоненты можно использовать отноше- ния компонентов для построения обычных факторных планов. Число отношений в ^-компонентной системе, для которой справедли- во условие Xj х2 4* «. * "Е х^ = 1, равно q- 1; Zj = t г2 = —2- , ..., zi = —.... zQ-1= —~ . (VI. 169) Х% Х2 Xj Xq Таким образом, при использовании отношений компонентов в качестве независимых факторов размерность задачи уменьшается на единицу и, следовательно, уменьшается количество опытов. На рис. 83 показаны планы Кенворси 22(а) и 23f67 для изучения зависимости свойства от соотношений компонентов z, = х,/х3 и z2=x3/x2. Точки, лежащие на линии, исходящей из вершины х2, имеют постоянное соотношение компонентов х, и х3. Аналогично линия, исходящая из вер- шины Xj, является ли- нией равных соотноше- ний хэ их,. Для выполнения условий ортогональности матрицы планирования ис- пользуется обычное линей- ное преобразование (V. 3). Рис. 83. Планы, использующие соотношения компонентов Пример 7. Исследовалось влия- ние состава исходного раствора на 314
Рис. 84. Область исследования состава исходного раствора силь- винита и план эксперимента процесс получения гидрокарбонатов на1рия и калия из сильвиниза. Показателем процесса (у), был выбран коэффициент использования калия в процессе карбонизации. В качестве независимых переменных приняты процентные соотношения двух компонентов из числа трех, входящих в систему: Zj = (NaClJ/ (KC1J и z2 = [Н2О]/[NaClJ. Решение. Для получения уравнения регрессии был использован ортогональный план второго порядка для it—2, N — 9, а=1 (рис. 84). Область исследования незави- симых факторов приведена в таблице Z2 3,315 5,53 1,935 1,53 +1 5,25 7,06 -1 1,38 4,0 матрица планирования — в табл. 93. Выборочные дисперсии однородны. Дисперсия воспроизводимости 9 2 4 , i=i 30,28 ^воспр g — g —3,37, fвоспр = ЛГ (т — 1) = 9, где т — число параллельных опытов. 315
Таблица 93. Матрица планирования Номер опыта XQ Х2 Х]Х2 Xt Х2 У' У У У у-У (y-ffi 1 +1 +1 +1 +1 Ч-’/з -НА 10 14 12 8 10,74 1,26 1,59 2 +1 -1 -1 +1 -на -НА 77,5 79,5 78,5 2 77,74 0,76 0,58 3 +1 +1 -1 -1 +'/э -НА 27 28,6 27,8 1,28 27,84 0,04 0,001 4 +1 -1 +1 -1 +'А +'А 59,5 62,5 61 4,5 60,64 0 36 0,13 5 +1 +1 . 0 0 -НА -% 18,5 17,5 18 0,5 19,3 1,3 1,69 6 +1 -1 0 0 + 'А -% 68,2 67,8 68 0,08 69,19 1,19 1,42 7 +1 0 +1 0 -% -НА 30 34 32 8 32,59 0,59 0,35 8 +1 0 -1 0 -% -НА 51 49 50 2 49,69 0,31 0,09 9 +1 0 0 0 -% -% 43 40,2 41,6 3,92 41,14 0,46 0,21 Коэффициенты уравнения регрессии и их ошибки определены по формулам (V.56) и (V.57): *0 = 43,21, &12= + 0,425, 51 = —24,95, Ьц=+3,1, ^2 = 8,55, />22 = “Ь 1»1 • s^=0,75, «йи> = 0,92, «Ъ7=1,3. Табличное значение критерия Стьюдента г о.оь(9) — 2,26. Коэффициенты Ьп и Ьг? незначимы. Уравнение регрессии имеет вид у = 41,14 — 24,95 Xt — 8,55 х2 + 3,1 х, • Дисперсия адекватности определена по формуле где /— число значимых коэффициентов. Уравнение адекватно эксперименту, так как Лад<^вдСПр • Из анализа последнего уравнения регрессии следует, что коэффициент использования калия в процессе полу- чения КНСОз из сильвинита тем больше, чем выше в нем содержание КС1 и чем меньшее количество воды используется для растворения исходной смеси сухих NaCl и КС1. В главе описаны методы планирования эксперимента для систем, являющихся смесями q различных компонентов. Факторное простран- ство при этом представляет собой (q - 1)-мерный симплекс. Целью исследования сложных многокомпонентных систем являют- ся построение графиков зависимости свойств от состава и решение задачи оптимизации. Если порядок аппроксимирующего полинома неизвестен, в общем случае целесообразно применение планов Дрейпера —Лоуренса, минимизирующих систематическое смещение. 316
При отсутствии априорной информации о поверхности отклика применение композиционных планов даст возможность подобрать адекватную модель. Если порядок полинома задан, применение D-оптимальных планов позволит построить полином с минимальными ошибками оценок коэффициентов. Упражнения 1. Каковы преимущества аналитического представления зависимостей состав — свой- ство для многокомпонентных смесей? 2. Составить симплекс-решетчатые планы для построения моделей третьей и чет- вертой степени для четырехкомпонентной системы. 3. Построить симплекс-центроидный план для пятикомпонентной системы. 4. Построить D-оптимальный план четвертого порядка для трехкомпонентной системы. 5. Записать координаты точек плана Дрейпера и Лоуренса (1, 2). содержащего 7 точек (табл. 87), для построения полинома второго порядка в трехкомпонентной системе. 6. Изучалась зависимость pH растворов в системе (ЫНф НРСН - К2СО - Н2О от состава. Планирование эксперимента проводилось на локальном участке концентрацион- ного треугольника (см. рис. 75, а), ограниченного линией насыщения при 0°С. Локаль- ный участок представлял собой треугольник с вершинами zi (42, 0, 58), zs (0, 30, 70), Z3(O, 0, 100). Был использован D-оптимальный план третьего порядка (см. табл, на с. 297). Результаты измерения pH в системе приведены ниже: Номер опыта . . . 1 2 3 4 5 6 7 8 9 10 11 12 13 pH.............. 12,52 9,25 7,42 9,75 11,45 11,50 12,15 9,25 9,0 10,7 10,61 9.50 11,75 1) Определить зависимость pH от состава. 2) По опытам в контрольных точ- ках 11, 12, 13 проверить адекватность уравнения регрессии третьего порядка экспери- менту; ошибка воспроизводимости звоспр —0,45, число степеней свободы / воспр = 13.
ЛИТЕРАТУРА Кафаров В, В. Методы кибернетики в химии и химической технологии. — М.: Химия, 1976. Налимов В. В., Чернова Н. А. Статистические методы планирования экстремальных экспериментов. — М.: Наука, 1965. Налимов В. В. Теория эксперимента. — М.: Наука, 1971. Налимов В. В., Голикова Т. И. Логические основания планирования эксперимента. — М.: Наука, 1971. Ахназарова С. Л., Кафаров В. В. Статистические методы планирования и обработки экспериментов. — М.: Изд-во МХТИ, 1972. Хнммельблау Д. Анализ процессов статистическими методами. — М.: Мир, 1973. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. — М.: Стастистика, 1973. Налимов В. В. Применение математической статистики при анализе вещества. — М.: Физматгиз, 1960. Адлер Ю. П., Маркова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий. — М.: Наука, 1976. Адлер Ю. П„ Грановский Ю. В., Маркова Е. В. Теория эксперимента: прошлое, настоящее, будущее. — М.: Знание, 1982. Хнкс Ч. Основные принципы планирования эксперимента. — М.: Мир, 1967. Рузннов Л. П. Статистические методы оптимизации химических процессов. — М.: Химия, 1972. Маркова Е. В., Лисенков А. Н. Планирование эксперимента в условиях неоднород- ностей. — М.: Наука, 1973. Горскнй В. Г., Адлер Ю. П. Планирование промышленных экспериментов (модели статики). — М.: Металлургия, 1974. Маркова Е. В., Лисенков А. Н. Комбинаторные планы в задачах многофакторного эксперимента. — М.: Наука, 1979. Хьютсон А. Дисперсионный анализ. — М.: Статистика, 1971. Балакирев В. С„ Володнн В. М., Цирлнн А. М. Оптимальное управление процес- сами химической технологии. — М.: Химия, 1978. Дубров А. М. Обработка статистических данных методом главных компонент. — М.: Статистика, 1978. Рузннов Л. П., Слободчикова Р. И. Планирование эксперимента в химии и хими- ческой технологии. — М.: Химия, 1980. Хартман К., Лецкнй Э., Шефер В. Планирование эксперимента в исследовании технологических процессов. — М.: Мир, 1977. Писаренко В. Н., Погорелов А. Г. Планирование кинетических исследований. — М.: Наука, 1969. Федоров В. В. Теория оптимального эксперимента. — М.: Наука, 1971.
ПРИЛОЖЕНИЕ № Таблица 1. Значения функции Лапласа Ф(х) — ~^= [ е 2 с|л- /2 Л JQ X Ф(х) X Ф(х) А Ф(х) X Ф(х) 0,00 0,0000 0,54 0,2054 1,08 0,3599 1,62 0,4474 0,01 0,0040 0,55 0,2088 1,09 0,3621 1,63 0,4484 0,02 0,0080 0,56 0,2123 1,10 0,3643 1,64 0,4495 0,03 0,0120 0,57 0,2157 1,11 0,3665 1,65 0,4505 0,04 0,0160 0,58 0,2190 1,12 0,3686 1,66 0,4515 0,05 0,0199 0,59 0,2224 1,13 0,3708 1,67 0,4525 0,06 0,0239 0,60 0,2257 1,14 0,3729 1,68 0,4535 0,07 0,0279 0,61 0,2291 1,15 0,3749 1,69 0,4545 0,08 0,0319 0,62 0,2324 1,16 0,3770 1,70 0,4554 0,09 0,0359 0,63 0,2357 1,17 0,3790 1,71 0,4564 0,10 0,0398 0,64 0,2389 1,18 0,3810 1,72 0,4573 о,п 0,0438 0,65 0,2422 1,19 0,3830 1,73 0,4582 0.12 0,0478 0,66 0,2454 1,20 0,3849 1,74 0,4591 0,13 0,0517 0,67 0,2486 1,21 0,3869 1,75 0,4599 0,14 0,0557 0,68 0,2517 1,22 0,3883 1,76 0,4608 0,15 0,0596 0,69 0,2549 1,23 0,3907 1,77 0,4616 0,16 0,0636 0.70 0,2580 1.24 0,3925 1,78 0,4625 0,17 0,0675 0.71 0,2611 1,25 0,3944 1,79 0,4633 0,18 0,0714 0,72 0,2642 1,26 0,3962 1,80 0,4641 0,19 0,0753 0,73 0,2673 1,27 0,3980 1,81 0,4649 0,20 0,0793 0,74 0,2703 1.28 0,3997 1,82 0,4656 0,21 0,0832 0,75 0,2734 1,29 0,4015 1,83 0,4664 0,22 0,0871 0,76 0,2764 1,30 0,4032 1,84 0,4671 0,23 0,0910 0,77 0,2794 1,31 0,4049 1,85 0,4678 024 0,0948 0,78 0,2823 1,32 0,4066 1,86 0,4686 0,25 0,0987 0,79 0,2852 1,33 0,4082 1,87 0,4693 0,26 0,1026 0,80 0,2881 1,34 0,4099 1,88 0,4699 0,27 0,1064 0,81 0,2910 1,35 0,4115 1,89 0,4706 0,28 0,1103 0,82 0,2939 1,36 0,4131 1,90 0,4713 0,29 0,1141 0,83 0,2967 1,37 0,4147 1,91 0,4719 0,30 0,1179 0,84 0,2995 1,38 0,4162 1,92 0,4726 0,31 0,1217 0,85 0,3023 1,39 0,4177 1,93 0,4732 0,32 0,1255 0,86 0,3051 1,40 0,4192 1,94 0,4738 0,33 0,1293 0,87 0,3078 1,41 0,4207 1.95 0,4744 0,34 0,1331 0,88 0,3106 1,42 0,4222 1,96 0,4750 0,35 0,1368 0,89 0,3133 1,43 0,4236 1,97 0,4756 0,36 0,1406 0,90 0,3159 1,44 0,4251 1,98 0,4761 0,37 0,1443 0,91 0,3186 1,45 0,4265 1,99 0,4767 0,38 0,1480 0,92 0,3212 1,46 0,4279 2,00 0,4772 0,39 0,1517 0,93 0,3238 1,47 0,4292 2,02 0,4783 0,40 0,1554 0,94 0,3264 1.48 0,4306 2,04 0,4793 0,41 0,1591 0,95 0,3289 1,49 0,4319 2,06 0,4803 0,42 0,1628 0,96 0,3315 1,50 0,4332 2,08 0,4812 0,43 0,1664 0,97 0,3340 1,51 0,4345 2,Ю 0,4821 0,44 0,1700 0,98 0,3365 1,52 0,4357 2,12 0,4830 0,45 0,1736 0,99 0,3389 1,53 0,4370 2,14 0,4838 0,46 0,1772 1,00 0,3413 1,54 0,4382 2,16 0,4846 0,47 0,1808 1,01 0,3438 1,55 0,4394 2,18 0,4854 0,48 0,1844 1,02 0,3461 1,56 0,4406 2,20 0,4861 0,49 0,1879 1,03 0,3485 1,57 0,4418 2,22 0,4868 0,50 0,1915 1,04 0,3508 1,58 0,4429 2,24 0,4875 0,51 0,1950 1,05 0,3531 1,59 0,4441 2,26 0,4881 0,52 0,1985 1,06 0,3554 1,60 0 4452 2,28 0,4887 0,53 0,2019 1,07 0,3577 1,61 0,4463 2,30 0,4893 319
Продолжение X Ф(х) X Ф(х) Л- Ф(х) X Ф(х) 2,32 0,4898 2,52 0,4941 2,72 0,4967 2,92 0,4982 2,34 0,4904 2,54 0,4945 2,74 0,4969 2,94 0,4984 2 36 0,4909 2,56 0,4948 2,76 0,4971 2,96 0,49846 2 38 0,4913 2,58 0,4951 2,78 0,4973 2,98 0,49856 2,40 0,4918 2,60 0,4953 2,80 0,4974 3,00 0,49865 2 42 0,4922 2,62 0,4956 2,82 0,4976 3,20 0,49931 2,44 0.4927 2,64 0,4959 2,84 0,4977 3,40 0,49966 2,46 0,4931 2,66 0,4961 2,86 0,4979 3,60 0,49984 2,48 0,4934 2,68 0,4963 2,88 0,4980 3,80 0,499928 2,50 0,4938 2,70 0,4965 2,90 0,4981 4,00 0,499968 5,00 0,499997 Таблица 2. Квантили нормального распределения р 1 - — 2 р р 1 2 0,80 0,60 0,25 0,05 0,975 1,96 0,50 0,75 0,67 0,04 0,980 2,05 0,40 0,80 0,84 0,02 0,990 2,33 0,30 0,85 1,04 0,01 0,995 2,58 0 25 0,875 1,15 0,005 0,9975 2,81 0,20 0,90 1.28 0,002 0,999 3,09 0,15 0,925 1,44 0,001 0,9995 3,29 0,10 0,95 1,64 0,0001 0,99995 3,89 Таблица 3. Квантили распределения Стьюдента Число степеней свободы f Уровни значимости р 0,20 0,10 0,05 0,02 0,01 0,005 0,001 1 3,08 6,31 12,71 31,82 63,66 127,32 636,62 2 1,89 2,92 4,30 6,97 9,93 14,09 31,60 3 1,64 2,35 3,18 4,54 5,84 7,45 12,94 4 1,53 2,13 2,78 3,75 4,60 5,60 8,61 5 1,48 2,02 2,57 3,37 4,03 4,77 6,86 6 1,44 1,94 2,45 3,14 3,71 4,32 5,96 7 1,42 1,90 2,37 3,00 3,50 4,03 5,41 8 1,40 1,86 2,31 2,90 3,36 3,83 5,04 9 1,38 1,83 2,26 2,82 3,25 3,69 4,78 10 1,37 1,81 2,23 2,76 3,17 3,58 4,59 11 1,36 1,80 2,20 2,72 3,11 3,50 4,44 12 1,36 1,78 2,18 2,68 3,06 3,43 4,32 13 1,35 1,77 2,16 2,65 3,01 3,37 4,22 14 1,34 1,76 2,15 2,62 2,98 3,33 4,14 15 1,34 1,75 2,13 2,60 2,95 3,29 4,07 16 1,34 1,75 2,12 2,58 2,92 3,25 4,02 17 1,33 1,74 2,11 2,57 2,90 3,22 3,97 18 1,33 1,73 2,10 2,55 2,88 3,20 3,92 19 1,33 1,73 2,09 2,54 2,86 3,17 3,88 20 1,33 1,73 2,09 2,53 2,85 3,15 3,85 320
Продолжение Число степеней свободы f Уровни значимости р 0,20 0,10 0,05 0,02 0,01 0,005 0,001 21 1,32 1,72 2,08 2,52 2,83 3,14 3,82 22 1,32 1,72 2,07 2,51 2,82 3,12 3,79 23 1,32 1,71 2,07 2,50 2,81 3,10 3,77 24 1,32 1,71 2,06 2,49 2,80 3,09 3,75 25 1,32 1,71 2,06 2,48 2,79 3,08 3,73 26 1,32 1,71 2,06 2,48 2,78 3,07 3,71 27 1,31 1,70 2,05 2,47 2,77 3,06 3,69 28 1,31 1,70 2,05 2,47 2,76 3,05 3,67 29 1,31 1,70 2,04 2,46 2,76 3,04 3,66 30 1,31 1,70 2,04 2,46 2,75 3,03 3,65 40 1,30 1,68 2,02 2,42 2,70 2,97 3,55 60 1,30 1,67 2,00 2,39 2,66 2,91 3,46 120 1,29 1,66 1,98 2,36 2,62 2,86 3,37 ОО 1,28 1,64 1,96 2,33 2,58 2,81 3,29 2 Таблица 4. Квантили распределения Пирсона X j_p Число степеней свободы f Уровни значимости р 0,99 0,98 0,95 ’ 0,90 0,80 0,70 0,50 0,30 1 0,00016 0,0006 0,0039 0,016 0,064 0,148 0,455 1,07 2 0,020 0,040 0,103 0,211 0,446 0,713 1,386 2,41 3 0,115 0,185 0,352 0,584 1,005 1,424 2,336 3,66 4 0 30 0,43 0,71 1,06 1,65 2,19 3,36 4,9 5 0,55 0,75 1,14 1,61 2,34 3,00 4,35 6,1 6 0,87 1,13 1,63 . 2,20 3,07 3,83 5,35 7,2 7 1,24 1,56 2,17 2,83 3,82 4,67 6,35 84 8 1,65 2,03 2,73 3,49 4,59 5,53 7,34 9,5 9 2, 09 2,53 3,32 4,17 5,38 6,39 8,34 10,7 10 2,56 3,06 3,94 4,86 6,18 7,27 9,34 11,8 11 3,1 3,6 4,6 5,6 7,0 8,1 10,3 12,9 12 3,6 4,2 5,2 6,3 7,8 9,0 п,з 14,0 13 4,1 4,8 5,9 7,0 8,6 9,9 12,3 15,1 14 4,7 5,4 6,6 7,8 9,5 10,8 13,3 16,2 15 5,2 6,0 7,3 8,5 10,3 11,7 14,3 17,3 16 5,8 6,6 8,0 9,3 11,2 12,6 15,3 18,4 17 6,4 7,3 8,7 10,1 12,0 13,5' 16,3 19,5 18 7,0 7,9 9,4 10,9 12,9 14,4 17,3 20,6 19 7,6 8,6 10,1 11,7 13,7 15,4 18,3 21,7 20 8,3 9,2 10,9 12,4 14,6 16,3 19,3 22,8 21 8,9 99 И,6 13,2 15,4 17,2 20,3 23,9 22 9,5 10,6 12,3 14,0 16,3 18,1 21,3 24,9 23 10,2 11,3 13,1 14,8 17,2 19,0 22,3 26,0 24 10,9 12,0 13,8 15,7 18,1 19,9 23,3 27,1 25 11,5 12,7 14,6 16,5 18,9 20,9 24,3 28,2 26 12,2 13,4 15,4 17,3 19,8 21,8 25,3 29,3 27 12,9 14,1 16,2 18,1 20,7 22,7 26,3 30,3 28 13,6 14,8 16,9 18,9 21,6 23,6 27,3 31,4 29 14,3 15,6 17,7 19,8 22,4 24,6 28,3 32,5 30 15.0 16,3 18,5 20,6 23,4 25,5 29,3 33,5 321
Продолжение Число степеней свободы / Уровни значимости р 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 1 1,64 2,7 3,8 5,4 6,6 7,9 9,5 10,8 2 3,22 4,6 6,0 7,8 9,2 10,6 12,4 13,8 3 4,64 6,3 7,8 9,8 11,3 12,8 14,8 16,3 4 6,0 7,8 9,5 11,7 13,3 14,9 16,9 18,5 5 7,3 9,2 11,1 13,4 15,1 16,3 18,9 20,5 6 8,6 10,6 12,6 15,0 16,8 18,6 20,7 22,5 7 9,8 12,0 14,1 16,6 18,5 20,3 22,6 24,3 8 11,0 13,4 15,5 18,2 20,1 21,9 24,3 26,1 9 12,2 14,7 16,9 19,7 21,7 23,6 26,1 27,9 10 13,4 16,0 18,3 21,2 23,2 25,2 27,7 29,6 11 14,6 17,3 19,7 22,6 24,7 26 8 29,4 31,3 12 15,8 18,5 21,0 24,1 26,2 28,3 31 32,9 13 17,0 19,8 22,4 25,5 27,7 29,8 32,5 34,5 14 18,2 21,1 23,7 26,9 29,1 31,3 34 36,1 15 19,3 22,3 25,0 28,3 30,6 32,8 35,5 37,7 16 20,5 23,5, 26,3 29,6 32,0 34,3 37 39,2 17 21,6 24,8 27,6 31,0 33,4 35,7 38,5 40,8 18 22,8 26,0 28,9 32.3 34,8 37,2 40 42,3 19 23,9 27,2 30,1 33,7 36,2 38,6 41,5 43,8 20 25 0 28,4 31,4 35,0 37,6 40,0 43 45,3 21 26,2 29,6 32,7 36,3 38 9 41,4 44,5 46,8 22 27,3 30,8 33,9 37,7 40,3 42,8 46 48,3 23 28,4 32,0 35,2 39,0 41,6 44,2 47,5 49,7 24 29,6 33,2 36,4 40,3 43,0 45,6 48,5 51,2 25 30,7 34,4 37,7 41,6 44,3 46,9 50 52,6 26 31,8 35,6 38,9 42,9 45,6 48,3 51,5 54,1 27 32,9 36,7 40,1 44,1 47,0 49,6 53 55,5 28 34,0 37,9 41,3 45,4 48,3 51,0 54,5 56,9 29 35,1 39,1 42,6 46,7 49,6 52,3 56 58,3 30 36,3 40,3 43,8 48,0 50,9 53,7 57,5 59,7 Таблица 5. Квантили распределения Фишера Fy-p для р — 0,05 fi 1 2 3 4 5 6 12 24 ОО 1 164,4 199,5 215,7 224,6 230,2 234,0 244,9 249,0 254,3 2 18,5 19,2 19,2 19,3 19,3 19,3 19,4 19,5 19,5 3 10,1 9,6 9,3 9,1 9,0 8,9 8,7 8,6 8,5 4 7,7 6,9 6,6 6,4 6,3 6,2 5,9 5,8 5,6 5 6,6 5,8 5,4 5,2 5,1 5,0 4,7 4,5 4,4 6 6,0 5,1 4,8 4,5 4,4 4,3 4,0 3,8 3,7 7 5,6 4,7 4,4 4,1 4,0 3,9 3,6 3,4 3,2 8 5,3 4,5 4,1 3,8 3,7 3,6 3,3 3,1 2,9 9 5,1 4,3 3,9 3,6 3,5 3,4 3,1 2,9 2.7 10 5,0 4,1 3,7 3,5 3,3 3,2 2,9 2,7 2,5 11 4,8 4,0 3,6 3,4 3,2 3,1 2,8 2,6 2,4 12 4,8 3,9 3,5 3,3 3,1 3,0 2,7 2,5 2,3 13 4,7 3,8 3,4 3,2 3,0 2,9 2,6 2,4 2,2 14 4,6 3,7 3,3 3,1 3,0 2,9 2,5 2,3 2,1 15 4,5 3,7 3,3 3,1 2,9 2,8 2,5 2,3 2,1 322
Продолжение /2 1 2 3 4 5 6' 12 24 ОО 16 4,5 3,6 3,2 3,0 2,9 2,7 2,4 2.2 2,0 17 4,5 3,6 3,2 3,0 2,8 2,7 2,4 2.2 2,0 18 4,4 3,6 3,2 2,9 2,8 2,7 2,3 2,1 1,9 19 4,4 3,5 3,1 2,9 2,7 2.6 2,3 2,1 1,8 20 4,4 3,5 3,1 2,9 2,7 2,6 2,3 2,1 1,8 22 4,3 3,4 3,1 2,8 2,7 2,6 2,2 2,0 1,8 24 4,3 3,4 3,0 2,8 2,6 2,5 2,2 2.0 1,7 26 4,2 3,4 3,0 2,7 2,6 2,4 2,1 1,9 1,7 28 4,2 з,з 2,9 2,7 2,6 2,4 2,1 1,9 1,6 30 4,2 3,3 2,9 2,7 2,5 2,4 2,1 1 9 1,6 40 4,1 3,2 2,9 2,6 2,5 2,3 2,0 1.8 1,5 60 4,0 3,2 2,8 2,5 2,4 2,3 1,9 1,7 1,4 120 3,9 3,1 2,7 2,5 2,3 2,2 1,8 1.6 1,3 ОО 3,8 3,0 2,6 2,4 2,2 2,1 1,8 1.5 1,0 Таблица 6. Квантили распределенияКохрена G*\_p для р == 0,05 п f 1 2 3 4 5 6 7 8 9 10 16 36 144 ОО 2 9985 9750 9392 9057 8772 8534 1332 8159 8010 7880 7341 6602 5813 5000 3 9669 8709 7977 7454 7071 6771 6530 6333 6167 6025 5466 4748 4031 3333 4 9065 7679 6841 6287 5895 5598 5365 5175 5017 4884 4366 3720 3093 2500 5. 8412 6838 5981 5441 5065 4783 4564 4387 4241 4118 3645 3066 2513 2000 6 7808 6161 5321 4803 4447 4184 3980 3817 3682 3568 3135 2612 2119 1667 7 7271 5612 4800 4307 3974 3726 3535 3384 3259 3154 2756 2278 1833 1429 8 6798 5157 4377 3910 3595 3362 3185 3043 2926 2829 2462 2022 1616 1250 9 6385 4775 4027 3584 3286 3067 2901 2768 2659 2568 2226 1820 1446 1111 10 6020 4450 3733 3311 3029 2823 2666 2541 2439 2353 2032 1655 1308 1000 12 5410 3924 3264 2880 2624 2439 2299 2187 2098 2020 1737 1403 1100 0833 15 4709 3346 2758 2419 2195 2034 1911 1815 1736 1671 1429 1144 0889 0667 20 3894 2705 2205 1921 1735 1602 1501 1422 1357 1303 1108 0879 0675 0500 24 3434 2354 1907 1656 1493 1374 1286 1216 1160 1113 0942 0743 0567 0417 30 2929 1980 1593 1377 1237 1137 1061 1002 0958 0921 0771 0604 0457 0333 40 2370 1576 1259 1082 0968 0887 0827 0780 0745 0713 0595 0462 0347 0250 60 1737 1131 0895 0765 0682 0623 0583 0552 0520 0497 0411 0316 0234 0167 120 0998 0632 0495 0419 0371 0337 0312 0292 0279 0266 0218 0165 0120 0083 ОО 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 * Все квантили G]~p меньше единицы, поэтому в табл. 6 приведены лишь десятичные зн-k следующие после запятой^ перед которой при пользовании таблицей нужно ставить ноль це."-' Например, при п — 6,/“ 3 имеем Go,95 — 0,5321. 323
Таблица 7. Значимые ранги множественного рангового критерия Дункана при р 0,05 "О р 2 3 4 5 6 7 8 9 10 12 14 16 18 20 50 100 1 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 18,00 2 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 3 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4 3,98 4,01 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 402 4,02 5 3,64 3,74 3,79 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 6 3,46 3,58 3,64 3,68 3,68 3,68 3,68 3,68 3,68 368 3,68 3,68 3,68 3,68 3,68 3,68 7 3,35 3,47 3,54 3,58 3,60 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,63 8 3,26 3,39 3,47 3,52 3,55 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 9 3,20 3,34 3,41 3,47 3,50 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 10 3,15 3,30 3,37 3,43 3,46 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,48 3,48 3,48 11 3,11 3,27 3,35 3,39 3,43 3,44 3,45 3,46 3,46 3,46 3,46 3,46 3,47 3,48 3,48 3,48 12 3,08 3,23 3,33 3,36 3,40 3,42 3,44 3,44 3,46 3,46 3,46 3,46 3,47 3,48 3,48 3,48 13 3,06 3,21 3,30 3,35 3,38 3,41 3,42 3,44 3,45 3,45 3,46 3,46 3,47 3,47 3,47 3,47 14 3,03 3,18 3,27 3,33 3,37 3,39 3,41 3,42 3,44 3,45 3,46 3,46 3,47 3,47 3,47 3,47 15 3,01 3,16 3,25 3,31 3,36 3,38 3,40 3,42 3,43 3,44 3,45 3,46 3,47 3,47 3,47 3,47 16 3,00 3,15 3,23 3,30 3,34 3,37 3,39 3,41 3,43 3,44 3,45 3,46 3,47 3,47 3,47 3,47 17 2,98 3,13 3,22 3.28 3,33 3,36 3,38 3,42 3,42 3,44 3,45 3,46 3,47 3,47 3,47 3,47 18 2,97 3,12 3,21 3,27 3,32 3,35 3,37 3,39 3,41 3,43 3,45 3,46 3,47 3,47 3,47 3,47 19 2,96 3,11 3,19 3,26 3,31 3,35 3,37 3,39 3,41 3,43 3,44 3,46 3,47 3,47 3,47 3,47 20 2,95 3,10 3,18 3,25 3,30 3,34 3,36 3,38 3,40 3,43 3,44 3,46 3,47 3,47 3,47 3,47 22 2,93 3,08 3,17 3,24 3,29 3,32 3,35 3,37 3,39 3,42 3,44 3,45 3,46 3,47 3,47 3,47 24 2,92 3,07 3,15 3,22 3,28 3,31 3,34 3,37 3,38 3,41 3,44 3,45 3,46 3,47 3,47 3,47 26 2,9] 3,06 3,14 3,21 3,27 3,30 3,34 3,36 3,38 3,41 3,43 3,45 3,46 3,47 3,47 3,47 28 2,90 3,04 здз 3,20 3,26 3,30 3,33 3,35 3,37 3,40 3,43 3,46 3,47 3,47 3,47 3,47 30 2,89 3,04 3,12 3,20 3,25 3,29 3,32 3,35 3,37 3,40 3,43 3,44 3,46 3,47 3,47 3,47 40 2,86 3,01 3,10 3,17 3,22 3,27 3,30 3,33 3,35 3,39 3,42 3,44 3,46 3,47 3,47 3,47 60 2,83 2,98 3,08 3,14 3,20 3,24 3,28 3,31 3.33 3,37 3,40 3,43 3,45 3,47 3,48 3,48 100 2,80 2,95 3.05 3,12 3,18 3,22 3,26 3,29 3,32 3,36 3,40 3,42 3,45 3,47 3,53 3,53 ОО 2,77 2,92 3,02 3,09 3.15 3,19 3,23 3,26 3,29 3,34 3,38 3,41 3,44 3,47 3,61 3,67 Таблица 8. Матрица случайного баланса Номер опыта *1 л2 *3 л4 Л5 *6 х7 Л9 Лю ЛИ Л,2 1 -1 +1 -1 +1 +1 4-1 4-1 -1 4-1 4-1 4-1 4-1 2 -1 -1 +1 -1 1 -1 -1 -1 4-1 4-1 4-1 -1 3 -1 +1 +1 -1 +1 -1 -1 -1 -1 -1 4-1 4-1 4 +1 -1 -1 -1 +1 4-1 -1 1 -1 4-1 -1 -1 5 +1 -1 -1 +1 -1 -1 -1 4-1 -1 4-1 4-1 4-1 6 -1 +1 1 -1 +1 -1 -1 -1 4-1 -1 -1 1 7 +1 +1 -1 -1 1 4-1 4-1 1 4-1 -1 -1 4-1 8 -1 -1 +1 +1 4-1 -1 -1 4-1 4-1 4-1 -1 -1 9 -1 -1 +1 +1 -1 -1 4-1 4-1 4-1 -1 4-1 4-1 10 -1 +1 +1 -1 -1 1 4-1 4-1 4-1 4-1 4-1 -1 11 +1 +1 -1 +1 4-1 4-1 -1 -1 -1 4-1 -1 4-1 12 -1 -1 -1 1 -1 4-1 4-1 4-1 1 4-1 4-1 -1 13 +1 +1 +1 +1 4-1 4-1 -1 -1 4-1 1 4-1 14 -1 -1 1 +1 1 4-1 4-1 1 -1 -1 -1 -1 15 -1 -1 -1 +1 -1 4-1 -1 4-1 4-1 -1 -1 4-1 16 +1 -1 -1 -1 4-1 -1 1 -1 4-1 4-1 4-1 1 324
Продолжение Номер опыта *, *2 -Хз *4 *5 *6 X-j *6 *8 -Хю Л-11 *12 17 +1 +1 +1 +1 -1 +1 -1 +1 +1 +1 -1 +1 18 +1 -1 +1 -1 +1 -1 +1 +1 -1 -1 1 -1 19 +1 -1 +1 -1 -1 1 +1 +1 -I -I +1 +1 20 1 +1 -1 +1 -1 +1 +1 +1 +1 +1 1 -1 21 -1 +1 +1 -1 +1 +1 +1 -1 -1 -1 +1 +1 22 +1 ,-1 +1 +1 +1 -1 -1 -1 +1 -1 +1 -1 23 +1 +1 +1 +1 -1 +1 +1 +1 -1 -1 1 +1 24 +1 +1 -1 -1 +1 -1 +1 +1 -I -1 +1 -I Таблица 9. Матрица случайного баланса Номер опыта *1 *2 Л-3 *5 Л 6 *7 *8 *8 Лю Л11 *12 *13 *14 *15 Л,6 *17 *,8 *19 1 ) -1 +1 +1 +1 -J +1 +1 +1 -1 +1 -1 -1 -1 -1 -1 I -1 -1 2 +1 -1 -1 +1 +1 -1 +1 +1 -1 -1 +1 +1 -1 +1 4-1 -1 4-1 4-1 -1 3 1 +1 +1 +1 +1 -1 +1 +1 +1 +1 -1 +1 -1 -1 -1 4-1 4-1 4-1 4 +1 +1 +1 +1 +1 -1 +1 -1 +1 -1 +1 +1 +1 -1 4-1 4-1 -1 4-1 -1 5 1 -1 -1 -1 +1 +1 -1 +1 +1 +1 -1 -1 -1 +1 4-1 4-1 4-1 -1 4-1 6 +1 -1 +1 -1 +1 1 +1 -1 -1 -1 +1 -1 -1 +1 4-1 -1 1 4-1 4-1 7 -1 +1 +1 -1 +1 1 +1 +1 -1 -1 1 +1 +1 1 -1 -1 4-1 4-1 -1 8 +1 +1 -1 -1 +1 +1 -1 -1 -1 -1 +1 -1 +1 -1 4-1 4-1 4-1 -1 -1 9 -1 -I +1 -1 -1 -1 -1 +1 -t 1 +1 -1 1 +1 -1 4-1 4-1 4-1 -1 4-1 10 +1 -1 -1 -1 -1 1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 -1 4-1 11 -1 +1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 -1 +1 4-1 -1 -1 4-1 -1 12 +1 +1 +1 -1 -1 1 -1 +1 -1 +1 +1 -1 +1 +1 -1 4-1 1 -1 -1 13 -1 -1 -1 +1 -1 +1 +1 -1 +1 1 -1 +1 +1 +1 -1 4-1 -1 4-1 4-1 14 +1 1 +1 +1 -1 -1 1 -1 +1 1-1 +1 -1 -1 -1 -1 4-1 4-1 -1 -1 15 -1 +1 +1 +1 1 +1 +1 +1 -1 +1 +1 1-1 -1 -1 4-1 4-1 -1 4-1 4-1 16 +1 +1 -1 +1 -1 +1 +1 +1 +1 +1 1 +1 -1 -1 4-1 -1 4-1 d 4-1 17 -1 -1 +1 +1 -1 +1 -1 +1 -1 -1 +1 -1 +1 4-1 -1 -1 4-1 -1 -1 18 +1 -1 -1 +1 -1 +1 -1 -1 -1 +1 +1 +1 +1 +1 4-1 -1 -1 -1 -1 19 -1 +1 -1 +1 -1 +1 -1 -1 -1 -1 +1 +1 -1 -1 4-1 -1 4-1 4-1 4-1 20 +1 +1 +1 +1 -1 -1 +1 -1 +1- -1 -1 +1 -1 -1 4-1 4-1 -1 -1 -1 21 -1 -1 -1 -1 -1 -1 +1 -1 -1 -1 -1 -1 +1 -1 -1 4-1 4-1 4-1 -1 22 +1 -1 +1 -1 -1 +1 -1 +1 -1 -1 -1 -1 -1 +1 1 4-1 -1 4-1 1 23 -1 +1 +1 -1 -1 +1 -1 -1 -1 +1 -1 -1 -1 -1 4-1 -1 4-1 4-1 4-1 24 +1 +1 -1 -1 -1 +1 +1 +1 -1 +1 -1 +1 +1 +1 4-1 -1 -1 4-1 -1 25 -1 -1 +1 -1 +1 -1 +1 +1 -1 +1 +1 -1 -1 +1 -1 4-1 4-1 -1 -1 26 +1 -1 -1 -1 +1 -1 +1 +1 +1 -1 +1 +1 +1 4-1 -1 -1 4-1 d 4-1 27 -1 +1 -1 -1 +1 +1 -1 - 1 +1 +1 1 +1 -1 4-1 -1 4-1 4-1 4-1 4-1 28 +1 +1 +1 -1 +1 -1 +1 -1 -1 -1 -1 -1 +1 4-1 -1 -1 -1 4-1 4-1 29 -1 -1 -1 +1 +1 +1 -1 -1 +1 +1 +1 +1 +1 -1 -1 -1 -1 -1 4-1 30 +1 1 +1 +1 +1 -1 -1 +1 +1 +1 -1 -1 +1 4-1 -1 4-1 -1 -1 4-1 31 -1 +1 +1 +1 +1 -1 -1 -1 +1 -1 -1 +1 -1 4-1 4-1 4-1 -1 4-1 -1 32 +1 +1 -1 +1 +1 +1 +1 -1 +1 +1 -1 +1 +1 -1 4-1 4-1 4-1 -1 4-1
ОГЛАВЛЕНИЕ Предисловие.................................................................. 3 Введение .................................................................... 4 желательности (205). 10. Сложные планы. Факторный эксперимент 2г\ совме- щенный с латинским квадратом (218). 11. Метод последовательного симплекс- планирования (228). 12. Ортогональные насыщенные планы Плакетта — Берма- на (237). 13. Отсеивающие эксперименты. Метод случайного баланса (241). 14. Планирование эксперимента при определении констант уравнений формаль- ной кинетики (247). 15. Планирование эксперимента в производственных усло- виях (254) Упражнения . ...................................................... Глава VI. Планирование эксперимента при изучении диаграмм состав — свойство 1. Метод симплексных решеток (268). 2. Симплекс-решетчатые планы Шеффе (273). 3. Симплекс-центроидное планирование (287). 4. Планирование эксперимента при исследовании локальных участков диаграмм (290). 5. Д-Оптимальные планы (297). 6. Планы с минимизацией систематического смещения (304). 7. Планирование эксперимента при изучении зависимости свойства от соотношений компонен- тов (314) Упражнения......................................................... Литература................................................................... Приложение . 267 268 317 318 319 Часть первая МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ЭКСПЕРИМЕНТА Глава I. Основные характеристики случайных величин.............................. 8 1. Случайные величины. Аксиомы теории вероятностей. Законы распределе- ния ( 8 ). 2. Числовые характеристики (11). 3. Свойства математического ожи- дания и дисперсии (14). 4. Равномерное распределение (16), 5. Нормальное распределение (17), 6. Системы случайных величин (20). 7. Стохастическая связь ( 23) Упражнения........................................................... 27 Глава II. Определение параметров функции распределения......................... 27 1. Генеральная совокупность и случайная выборка (27). 2. Метод максимального правдоподобия (30). 3. Оценка математического ожидания и дисперсии (33). 4, Классификация ошибок измерения (35). 5. Закон сложения ошибок (35). 6. Ошибки косвенных измерений (36). 7. Определение дисперсии по текущим измерениям ( 37). 8. Доверительные интервалы и доверительная вероятность (40 ). 9. Проверка статистических гипотез (43). ю. Оценка математического ожидания нормально распределенной случайной величины (45). 11. Оценка дисперсии нормально распределенной случайной величины (47). 12. Сравнение двух дис- персий ( 50). 13. Сравнение нескольких дисперсий ( 52). 14. Сравнение двух сред- них (54). 15. Сравнение нескольких средних (57). 16. Проверка однородности результатов измерений (59). 17. Сравнение выборочного распределения и рас- пределения генеральной совокупности (60). 18. Критерий согласия <о2 (65). 19. Критерий Вилькоксона (67), 20. Проверка гипотезы нормальности по сово- купности малых выборок (70 ) Упражнения........................................................... 74 Глава III. Дисперсионный анализ................................................ 74 1. Задача дисперсионного анализа (74). 2. Однофакторный дисперсионный ана- лиз (76). 3. Двухфакторный дисперсионный анализ ( 83). 4. Планирование экспе- римента при дисперсионном анализе. Латинские и гипер-греко-латинские квадра- ты (95). 5. Латинские кубы (108) Упражнения.......................................................... 119 Глава IV. Методы корреляционного и регрессионного анализов.................... 120 1. Выборочный коэффициент корреляции (120), 2. Коэффициенты частной кор- реляции (123). 3. Приближенная регрессия. Метод наименьших квадратов (125). 4. Линейная регрессия от одного параметра (128)' 5. Параболическая регрес- сия (134). 6. Полиномы Чебышева (135). 7. Трансцендентная регрессия (140). 8. Оценка тесноты нелинейной связи (141). 9. Метод множественной корреля- ции (142). Ю. Регрессионный анализ в матричной форме (146). 11. Метод груп- пового учета аргументов (МГУА) (150). 12. Метод главных компонент (153) Упражнения ......................................................... 157 Часть вторая МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА Глава V. Методы планирования экстремальных экспериментов........................ 159 1. Полный факторный эксперимент (159). 2. Дробные реплики (166). 3. Оптимиза- ция методом крутого восхождения по поверхности отклика (174). 4. Описание области, близкой к экстремуму. Композиционные планы Бокса — Уилсона (177). 5. Ортогональные планы второго порядка (183). 6. Ротатабельные планы второго порядка Бокса — Хантера (188). 7- Критерии оптимальности планов (196). 8. Ис- следование поверхности отклика. Решение задачи оптимизации (198). 9. Функция 326
Светлана Лазаревна Ахназарова, Виктор Вячеславович Кафаров Методы оптимизации эксперимента в химической технологии Зав. редакцией С. Ф. Кондрашкова Редактор Т. С. Костян Мл. редактор С. М. Ерохина Художник В. М. Боровков Художественный редактор Т. М. Скворцова Технический редактор А. К. Нестерова Корректор С. К. Завьялова ИБ № 4782 Изд. N? Хим — 738. Сдано в набор 12.06.84. Подп. в печать 17.12.84. Формат 60 X 90’ / 1в. Бум. офс. кн.-журн. Гарнитура литературная. Печать офсетная. Объем 20,5 усл. печ. л. 20,5 усл. кр.-отт. 21,75уч.-изд. л. Тираж 8000 экз. Зак. 529. Цена 1 р. 20 к. Издательство «Высшая школа», 101430, Москва, ГСП-4, Неглинная ул., д. 29/14. Ярославский полиграфкомбинат Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 150014, Ярославль, ул. Свободы, 97.