Текст
                    Д. ФИННИ
ВВЕДЕНИЕ
В ТЕОРИЮ
ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТОВ
' Перевод с английского
И. Л. РОМАНОВСКОЙ и А. П. ХУСУ
под редакцией
академика Ю. В. ЛИННИКА
от
Ш
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
М. О С K B A 19 7 О '


ОГЛАВЛЕНИЕ  Предисловие к русскому изданию . . . . . .  Предисловие  Г л а в а 1. Экспериментирование . О литературе по предмету . Сравнительные эксперименты  tr‘!-—‘b—-b——I:Ip1n.1gg:g тчошетюё  И математик  Экспериментатор и статистик  Терминология Понятие плана Рандомизация . . . . . . Экономические соображения .ИнтерпретаЦня экспериментов Глава 2. Дисперсионный анализ  2.1. Разбиение суммы квадратов 2.2. Нормальность . . . . . . . 2.3. Полностью рандомизованный план 2.4. Модели . . . . 2.5. Компоненты дисперсии  Глава 3. Рандомизованные блоки и ортогональ-  к: оърт „дром-  Г л а в а 4. Факторный  «>2?-r'=~r'>r'>  cn4>oow;—-  ные квадраты . . . .  .Рандомизованный блок-план . . . . .Применение рандомизованных блоков  Латинские квадраты . . . .  . Анализ эксперимента с латинским квадра-  том э� Греко-латинские квадраты . . . .  ‚Ортогональные квадраты более высокого  порядка . . . .  . ОРТОГОНЗЛЬНЬЮ РЗЗбИЕНИЯ ЛЭТИНСКИХ КВЗД-  ратов  эксперимент и дробные реплики . . . .  Факторный принцип . . . . . . .  . Планирование типа 2” . Факторные эксперименты . Единичная реплика . . . . . ‚дробная реплика . . . . . . . . .  11  11 13 14 15 15 18 24 27  29  29 31 33 34  38  38 43 44  48 52  54  56  62  62 65  72 73 
3-LT-uh  .ь„>›Ь щ›оэьэ ——C>g>a>\JQ>  ОГЛАВЛЕНИЕ  Г л а в а 5. Смешивание 5.  Глава 6  “”F”979°P’ ‘IZOD-iii‘!-—"—“  I  ~@@WWW@W@ oco_C>o_\lo=_CJ1g>.'oot\9  :._a ,__..—¢  P79’ 9’ 97979793979’ 4›соьэ——с>цэоо ya СПСП4>СоЬО——  5:4  ФСЛ „рое ю;-  Различные дроби одного плана 83 . Планирование типа п" . . . . . 84 . Единичная реплика плана типа 3" 88 Дробные реплики планов типа 3" 88 ‚Теорема Фишера . . . . . . . . . 90 . Число уровней, равное степени простого числа . . , . . . . . . . . . 90 . Смецшниые уровни 91 . Планы взвешиваний . . . . . 92 ‚Другие планы для нулевых взаимодей- ствий . . . . . . 94 95 Блоки . . . . . 95 . Простой смешанный план . . . . . 96 . Смешивание как форма дробной реплики 98 Общее смешивание планов типа 2" . 100 Частичное смешивание . . . . 102 .Смешивание в единичной реплике . 103 Смешивание дробных реплик . 104 Смешивание планов типа п" . . 107 .11робная реплика плана типа Л" . . . 110 . Теорема Фишера о минимальном смеши- вании . . . . . . . . 112 Смешанные уровни . . . . . . . ‚ 115 . Двойное смешивание и квазилатинские квадраты . . . . . . . . . -. . 117 . Планы с расщепленными участками . 118 . Дробная реплика и ортогональные квад- раты.......... .123 . Включение факторов . . . . , 123 . Достоинства факторного плана . 125 Неполные блок-планы ‚ 127 . Необходимость неполных блоков . 127 . Сбалансированные неполные блоки . 128 . Существование планов . . 130 .Теорема Фишера . . . . . 131 . Теорема Шютценберже . . . . . . . 132 . Анализ сбалансированных экспериментов с неполными блоками . . . . . 133 Дважды сбалансированные неполные блоки . . . . . . . 142 . Квадраты Юдена . 144 . Решетчатые планы . 146 . Прямоугольные решетки . 149 . Многомерные решетки . 151 . Решетчатые квадраты . . . . . 151 . Сбалансированные латинские квадраты 152 Анализ рандомизованньтх блоков . . . 153 
ОГЛАВЛЕНИЕ ‚ 5  6.15. Частично сбалансированные неполные  блоки . . . . . . . . . . . . .154 6.16. Частично сбалансированные квадраты Юдена . . . . . . . . . . . . .156 6.17. Выбор плана . . . . . . . . . . 157 Глава 7. Эксперименты, включающие изменение способов обработки . . . . . . . 160 7.1. Время как экспериментальный фактор 160 7.2. Сельскохозяйственный севооборот . . . 162 7.3. Плодовые культуры . . . . _ . . . . 170 7.4. Перекрестные планы . . . . . . . . 177 7.5. Сбалансированные последовательности . 183 7.6. Последовательное использование дробной ' реплики . . . . . . . . . . . . . 187 Глава 8, Последовательное экспериментирова- ние. . . . . . . . . . . . . .19О 81. Последовательный выбор . . . . . . 190 8.2. Последовательные эксперименты . . . 192 8.3. Последовательное оцениванне . . . . 197 84. ОЦениВание оптимальных условий . . . 201 85. Эволюционная операция в промышлен- ности . . . . . . . . . . . . . . 207  Гла в а 9. Эффективность экспериментирования 211  91. Анализ, план и планирование . . . . 211 92. Включение контролей . . . . . . . 213 9.3. Число способов обработки . . . . . 215 9.4. Уровни факторов . . . . . . . . . 222 9.5. Другой подход к выбору уровней . . . 230 9.6. Повторные реплики . . . . . . . . 234 9.7. Сбалансированность и ковариация . . 240 9.8. Выбор плана . . . . . . . . ‘. . 244 9.9. Отбор . . . . . . . . . . . . . 248 9.10. Отбор лекарств . ‚ _ ‚ . . . , . 254  Глава 10. ‘Экономика экспериментирования . . . 260 10.1. Внутренняя и внешняя экономика . . 260  10.2. Оценивание оптимальной нормы . . . 262 10.3. Оптимальный выбор Между двумя аль- тернативами ._ . . . . . . . ., 267 10.4. Внешняя экономика отбора . . . . I 272 10.5. «Маленький черный ящик» . . ���� . 277  Литература - .- » ‚ ж, ‚ .. ‚ ��&� P��� ;г281 
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ  Предмет планирования экспериментов целиком нельзя считать частью математической теории статистики, хотя исследования в рамках этого предмета продолжают по- ставлять новые классы планов и новые обобщения. Его также нельзя Целиком рассматривать как часть стати- стического аппарата, хотя успехи в развитии вычисли- тельной техники делают все более осуществимым весьма общий и исчерпывающий анализ. И статистическая тео- рия и статистическая практика жизненно необходимы для хорошего планирования. Однако центральным мо- ментом является связь между экспериментатором и ста- тистиком при определении вопросов, ответы на которые следует получить из эксперимента‚—о наложении ог- раничений, при которых нужно проводить эксперимент, и отыскании наиболее эффективной схемы размещения способов обработки по объектам. В настоящей книге предпринята попытка познако- мить статистика-математика с некоторыми комбинатор- ными и другими теоретическими задачами планирова- ния экспериментов, сохранив при этом практические ас- пекты плана, без которых предмет стал бы бесполезным. Я весьма обязан И. Л. Романовской и А. П. Хусу, взявшим на себя труд по переводу книги на русский язык, а также моему другу профессору Ю. В. Линнику за редактирование этого перевода.  Д. Дж. Финны  Сидней, август 1967 
ПРЕДИСЛОВИЕ  В 1954 г. я был приглашен прочитать ЦИКЛ лекций по математической теории планирования экспериментов в Мадриде в Институте статистических исследований, который является частью испанского Выстиего совета научных исследований. Хотя я читал лекции по-англий- ски, у слушателей имелся испанский перевод подготов- ленного мною заранее курса. И курс и перевод были сде- ланы несколько наспех, но позднее я согласился с поже- ланием профессора Снксто Риоса о публикации испан- ского варианта курса. Он был напечатан в 1957 г. под названием Tecrnica у teoria estadistica en el disefio de experimentos. Эти лекции первоначально были посвя- щены теории, но несомненно они несли на себе некото- рый отпечаток моей книги о практике планирования эк- спериментов в биологии «Планирование экспериментов и его статистическая основа»*),опубликованнойв 1955 г. Несмотря на то, что в последние годы появился це- лый ряд книг, посвященных планированию эксперимен- тов, ни одна из них не ставила своей целью заинтересо- вать математика, начинающего специализироваться по статистике, давая ему широкий обзор математического аппарата, встречающегося в планировании эксперимен- тов, но не вовлекая его чересчур глубоко в детали ис- следований или в конкретные приложения. Хотя спра- вочное руководство по составлению и статистическому анализу стандартных планов неоценимо для статистика,  *) Experimental Design and Its Statistical Basis. 
3 првдисловив  связанного с экспериментированием, формулы диспер- сионного анализа для различных планов утомительны для чтения. Никто не может быть больше чем я уверен в том, что статистик должен быть знаком с основными идеями в той области науки или технологии, вкоторой он работает, и должен быть подготовлен для интерпрета- ции своих методов и выводов в свете этой области. Од- нако математик, который впервые решится применить планирование экспериментов, может быть обескуражен, если окажется, что для понимания книги, написанной в основном для использования в конкретной области при- менений, требуется достаточное знание генетики, агро- техники, фармакологии или химической технологии. По- этому я подумал, что могла бы быть полезной книга на английском языке, умеренного размера, в духе моих испанских лекций. Я использовал английский текст этих лекций в каче- стве основы для книги, но сделал весьма существенные изменения. Поспешность в подготовке текста сказалась на его качестве, и в нем имелось много мелких ошибок и неясностей: надеюсь, что я исправил большинство из них. Я расширил объяснения и добавил новый материал там, где это казалось полезным. Первые семь глав охва- тывают Центральные идеи планирования экспериментов, образуюшие ядро большинства книг по этому предмету, хотя я умышленно выбрал не вполне традиционное изложение, чтобы подчеркнуть то, что казалось мне математически интересными связями между различными частями предмета. Уязвимым местом является недоста- точное освещение механизма дисперсионного анализа. Предполагается, что читатель имеет некоторые начальные сведения по статистике и, следовательно, по дисперсион- ному анализу, достаточные для того, чтобы вызвать у него скуку, если он будет натыкаться на правила ана- 
предисловие 9  лиза каждого встретившегося ему плана. Бесспорно, «планы» и «анализы» тесно связаны, и одно невозможно полностью понять без другого. Однако я убежден, что небольцкпо знакомства с исследуемьшит моделями (§§ 2.4, 2.5) И одного-двух типичных примеров ана- лиза (§§ 2.3, 3.1-3.4, 6.6) достаточно для понимания различных аспектов планирования.1Больпкю количество примеров можно было бы включить, или сделав эту кни- гу толще, чем мне хотелось бы, или же исключив из нее вопросьд которые я считал более интереснымпъ Глава 8 является очень короткишт введениемт в использование техники последовательного анализа в экспериментиро- вании, новой и енце сравнительно небольнлпё отрасли планирования,содерннпцей,однако,тппересные задачи. 14спанские лекции кончались тремя главами по пла- нированинэ биологических наблнцдений и сменппям во- просам, содержание которых я уже опубликовал на анг- лийском языке.11ля данной книги я заменил эти плавы двумя главами по.ырфективности и экономике при об- тцем планировании экспериментов,в которых я собрал воедино различные идеи выбора плана экспериментатнпт серии экспериментов.1Чо крайней мере некоторькэиз них не обсуждаются широко в книгах по планированию эк- спериментов,но статистик,ппилт›знаклЦий о характери- стиках конкретных планов,‹пце не будет полноценным: специалистом,еюли он не умеет подбирать подходяпппё план эксперимента для имекпцейся задачи. Я благодарен профюссору Сиксто Риосу и Вькппему совету научных исследований‚1жтпервьпс за приглаппь ние‚с которого и начались мои лекЦии,гагпъвторьпд за согласие на это независимое английское издание книги, так точно следукпцей их изданик›лекций.5Чблагодарен также г-ну Д. А. Холланду изИст Моллинской исследова- тельской станции за критические замечания,сделанные 
10 првдисловив  им после чтения первоначального варианта некоторых глав, конечно, не перекладывая на него ответствен- ность за последующие изменения. Я весьма признателен моему секретарю мисс Эйлин Е. Форбз за перепечатку варианта за вариантом, за помощь в чтении корректуры и за то, ЧТО она обнаружила многие ошибки, которые не были бы найдены, не будь она столь внимательна. На- конец, приношу свою благодарность г-м Е.-Р. Мюллеру и А. Д. Хендерсону за сделанные ими исправления.  Д. Дж. Финны  Абердин, июнь 1960 
Глава!  ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  1.1. О литературе по предмету  С момента первого издания в 1935 г. книги Р. А. Фи- шера The Design of Experiments появилось большое число книг, брошюр и статей, посвященных планирова- нию экспериментов, и практическое значение этого пред- мета для успешного развития многих областей науки и техники становится все более признанным. Книга Фи- шера остается классическим трудом, с которым должен ознакомиться каждый, кому приходится иметь дело с планированием эксперимента, трудом, многократное об- рашение к которому принесет читателю только пользу. Однако эта книга не является ни учебником для студен- тов, ни руководством для практиков. В настоящее время имеется несколько превосходных книг, которые хорошо удовлетворяют нужды тех, кто должен составлять и ана- лизировать планы в связи с исследовательскими про- граммами. Среди них особо выделяются книги Кох- рэна и Кокс [66], Кокса [62], Дэйвиса и др. [36], Федерера [93]‚ Пирса [76] и Kenya [53]. Таблицы Ф и ш ер а и Иэйтса [121] почти обязательны как руко- водство при выборе конкретного представителя из рас- сматриваемого класса планов. И, наконец, Китагава и Митоме [57] составили таблицы для более обшир- ного набора планов. Эти книги являются ценными справочными посо- биями не только для статистиков. Они могут быть ис- пользованы и другими учеными, чьи познания в области математики и статистики более ограничены. Кемпторн [52] опубликовал исчерпывающую работу по статистиче- ской теории анализа экспериментов с подробной инфор- мацией по составлению и свойствам основных планов. 
12 гл. 1. ЭКСПЕРИМЕНТИРОВАНИЕ и МАТЕМАТИК  Монография Иэйтса [45] является важной для изуче- ния факторных планов. Статистик, желающий специали- зироваться B применении статистики к эксперименти- рованию и лежащей в ее основе теории, может сделать перечисленные книги надежным базисом для своих за- нятий, хотя ему придется еще прочитать много статей, содержание которых следовало бы уже включить в книги. A Однако многие статистики могут пожелать приобре- сти достаточно широкие знания по планированию экспе- риментов без интенсивной специализации. Стандартные учебники по статистике часто содержат одну или две главы по планированию, но едва ли они достаточны для показа истинной широты предмета. Несколько лет назад (1955 г.) я опубликовал небольшую книгу для немате- матиков (биологов) [105], имеющую целью проиллюстри- ровать природу и возможности планирования экспери- ментов. В настоящей книге сделана попытка осветить некоторые из наиболее интересных математических аспек- тов предмета,т. е. ее можно рассматривать как введение для математиков-статистиков. Комбинаторные задачи планирования имеют гораздо больший самостоятельный  интерес, чем техника анализа результатов. Неотъемле-  мую часть процесса интерпретации экспериментов со- ставляет дисперсионный анализ, но, несмотря на замы- словатость во многих приложениях, он является по су- ществу разновидностью метода наименьших квадратов, который должен быть знаком всем статистикам. По- скольку необходимое для специалиста подробное изло- жение вычислений, соответствующих многим различным планам, утомительно для читателя, желающего полу- чить лишь общее представление о предмете, я резко со- крашу главу о дисперсионном анализе, поместив лишь набросок общей теории и один или два примера. Затем я рассмотрю более подробно не только комбинаторные  задачи, но и вопросы, относящиеся к эффективному ис-  пользованию планов, выбору между альтернативами и широкому планированию исследовательских программ. Я уделю также некоторое внимание более полному из- ложению одной или двух частных задач планирования, 
1.2. СРАВНИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 13  которые иллюстрируют современную статистическую теорию. Их выбор продиктован скорее личным интере- сом, чем их особой важностью. -  1.2. Сравнительные эксперименты  Анскомб [1] сделал полезное указание на разли- чие, которое долгое время не подчеркивалось в литера- туре по статистике, между экспериментами, имеющими Целью оценивание абсолютных констант, и сравнитель- ными эксперименталш. Он пишет:  Во многих областях экспериментирования мы находим следую- щую ситуацию: повторные наблюдения над одним и тем же или над сходными событиями в точности не согласуются дРУг с другом, при- чем экспериментатор не может сделать согласование точным, приняв какие-либо разумные меры предосторожности для сохранения усло- вий наблюдения постоянными... Например, в опытах из области сельского хозяйства урожаи с соседних участков, подвергнутых одинаковой обработке, или с одного и того же участка за разные годы при одинаковой обработке не равны... Аналогично в промыш- ленном экспериментировании мы находим, что последовательные предметы, производимые машиной, не являются идентичными и что, как бы тщательно ни была отрегулирована машина, колебания в ка-  ‘ЧЕСТВЕ ПРОДУКЦИИ не МОГУТ бЫТЬ УМЕНЬШЕНЫ НИЖЕ некоторого пре-  дела... Может, однако, случиться, что хотя абсолютная характери- стика меняется неустойчиво, относительная характеристика двух способов обработки (или процессов, или разновидностей и т, д.) оказывается довольно устойчивой. Вполне возможно утверждать, что в подобных обстоятельствах один способ обработки дает суще- ственно лучшие результаты, чем другой, даже если мы не можем установить в точности, какие результаты дает каждый. В таких об- ластях экспериментирования эксперименты, по-видимому, должны быть сравнительными, лишь второстепенный интерес здесь представ- ляют абсолютные характеристики.  В настоящей книге будут рассматриваться главным образом сравнительные эксперименты. Иначе говоря, они будут относиться скорее к таким предметам, как сравнение эффектов различных доз лекарства, чем к оп- ределению физических констант. Различие, по-видимому, не столь резкое, как предполагает Анскомб. Можно про- вести опыт по сравнению откликов на ряд выбранных доз лекарства, а затем использовать результаты для того, чтобы оценить дозу, при которой средняя реакция имеет определенную величину. Тем не менее идея срав- нительного эксперимента остается удобной п полезной, 
14 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  1.3. Экспериментатор и статистик  -В планировании экспериментов часто под словами экспериментатор и статистик удобно понимать разных лиц. Цель первого из них состоит в возможно более все- стороннем и точном проведении эксперимента, при этом с разумной экономией времени и материалов, другой дает специальные консультации и оказывает содействие по количественным аспектам как при планировании‚так и при интерпретации. Различие вводится главным обра- зом для простоты описания. Сотрудничество этих двух лиц должно быть весьма тесным: статистик может со- здавать хорошие планы только тогда, когда он понимает что-нибудь в конкретной области исследования, а экспе- риментатор получит большую помощь, если он знает общие принципы планирования и статистического ана- лиза. В действительности две роли можно объединить, если экспериментатора со слабой математической под- готовкой обучить теории планирования, чтобы он мог составлять планы своих собственных экспериментов. Некоторые типы планов сейчас стандартизованы до такой степени, что их можно выбирать, обращаясь к ка- талогу. В опытных руках такая стандартизация полезна, ибо исключается труд по придумыванию с самого на- чала расположений, соответствующих некоторым более сложным ограничениям, рассматриваемымвгл. 3-—7‚ но автоматическая и некритическая абстракция плана из каталога может привести к весьма неэффективному эк- спериментированттто. Подобно готовому платью, гото- вые планы удовлетворительно подходят ко многим за- дачам. Но для более эффективных результатов и почти всегда для задач особой сложности как портной, так и статистик должны быть готовы создать нечто более под- ходящее для их конкретной цели, при этом статистик имеет то преимущество, что он может иногда допустить модификацию как задачи, так и плана! Он на самом деле склонен заниматься приспосабливанием какого- либо из существующих стандартных планов для своих целей, и именно в изобретении подходящей модифика- ции и проявляются его статистическое мастерство и опыт. 
1.5 ПОНЯТИЕ ПЛАНА 15  1.4. Терминология  Интерес статистиков к экспериментам стимулиро- вался первоначально в основном сельскохозяиственны- ми исследованиями, и стандартная терминология (ис- пользуемая B этой книге) еще хранит признаки этого. В частности, единицу материала, подвергаемую обра- ботке, мы будем называть участком. В соответствии с исходным смыслом участок может быть площадкой земли, на которой созревает урожай, но он может быть и пациентом больницы, куском животной ткани, местом на теле животного, куда производится инъекция специ- ального назначения, или одной из ряда однотипных ма- шин. Цель эксперимента состоит в сравнении эффектов различных способов обработки, каждый из которых при- меняется к одному или более участкам, с помощью ко- личественной оценки результатов наблюдений, произво- димых на отдельных участках. Любая количественная мера, полученная с участка, может быть названа уро- жаем. Группа участков в структуре плана, имеющих не- которые присущие им общие черты, называется блоком (§ 5.1). Иногда испытываемые способы обработки объ- единены в несколько факторов (§ 4.1): эксперимент по выявлению оптимальных условий для производственного процесса может содержать множество из 24 способов обработки — комбинации трех температур, четырех раз- личных количеств одного сырья и двух альтернативных времен нагревания. Таким образом, здесь имеется три фактора (температура, количество сырья, время нагре- вания). Некоторые количественные или качественные состояния фактора называются урознялш. Например, в приведенном выше примере фактор температуры имеет три уровня, количественный фактор—четыре,авремя —— два.  1.5. Понятие плана  Под планом эксперимента понимают: i) множество способов обработки, выбираемых для сравнения: Щспецификацию обрабатываемых участков; 
16 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И MATEMATHK  iii) правила, по которым способы обработки следует размещать на участках; iv) спецификацию измерений или других данных, которые должны быть получены на каждом участке. Соответствие эксперимента исследуемой задаче п на- дежность результатов зависят от i) —iV). Все ПУНКТЫ до некоторой степени касаются статистика. Однако в насто- ящей книге во всей полноте рассматриваются только i) И iii), поскольку они наиболее важны в теоретических исследованиях и представляют наибольший интерес с точки зрения математики. Обычно окончательное реше- ние по пункту i) принимает экспериментатор, хотя часто для оптимального выбора способов обработки имеется статистическая теория. То, что можно было бы назвать классической теорией планирования экспериментов, за- ключено в пункте iii). Вопросы, относящиеся к обоим пунктам, будут обильно проиллюстрированы в следую- щих главах. Сравнительное пренебрежение пунктами ii) И iv) не следует понимать как указание на малое значение их для хорошего экспериментирования. Не следует также считать, что оно вызвано тем, что статистик мало что может сказать о них. Хотя здесь и не рассматриваются в деталях вопросы, связанные с размером и формой уча- стков земли или кусков материала для эксперименталь- ных проб, возрастом животных, размерностью единиц выборки и другими предметами, имеющими отношение к ii), статистик, искушенный в области приложений, дол- жен уметь делать полезные предложения по специфика- ции соответствующих участков. Основными моментами, которые следует иметь в виду, являются а) пригодность, б) осуществимость, в) точность, г) экономическая эффективность.‘ Например, в опытах по определению урожайности в сельском хозяйстве в некоторых разумных пределах можно с уверенностью предположить, что участки, ли- нейные размеры которых равны только нескольким мет- рам, пригодны для сравнения относительных достоинств обработок при нормальных условиях ведения хозяйства; 
1.5. понятив ПЛАНА 17  это может оказаться неверным, если участки уменьшены по размерам так, что на каждом помещается толькойдва или три растения, получающих специальный уход, хотя даже это могло бы быть удовлетворительным‘для уро- жая деревьев. В опытах с новыми лекарствами вопрос о том, позволяют ли опыты, проведенные на животных, перейти к исследованиям на человеке, требует тщатель- ного изучения. При этом по результатам проверки‚осу- ществленной на здоровых людях, еще нельзя судить о том, что может случиться с больным. Модель управле- ния производственным процессом может давать полез- ные указания на то, как протекала бы работа всего предприятия крупного масштаба; вопрос о том, будут ли небольшие части этой модели, рассматриваемые как участки для сравнения альтернативных условий опера- Ции, пригодны для определения наилучших условий для текущих производственных нужд, необходимо обсудить при конкретных обстоятельствах. Очевидно,‘ бесполезно иметь участки, которые пригодны для рассматриваемой задачи, но непригодны для опытного использования из-за их размеров или продолжительности во времени. Среди возможных участков, удовлетворяющих требова- ниям а) и б), выбор будет производиться в соответствии с ожидаемыми точностями основанных на них сравне- ний, или, если альтернативы сильно отличаются по стои- мости работы и материалов, в соответствии с ожидае- мыми точностями экспериментов, которые были бы примерно равны по стоимости. Хотя право окончатель- ного выбора, как правило, принадлежит эксперимен- татору, статистический анализ предшествующих опы- тов дает важные сведения о в) и г), и статистик тем самым часто может внести свой собственный вклад‘ в а) и б). ' Рассмотрение iv) нельзя полностью отделять от. рас- смотрения ii) и требования о том, что производимые из- мерения можно сгруппировать под одинаковыми. наиме- нованиями. Наиболее важными показателями являются те, которые непосредственно используются при д оценке способов обработки. Снова на первом месте стоищвод прос о пригодности модели, Например, могутли урожаи  2 Д. Финны 
18 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  плодовых кустарников в течение первых четырех лет эксперимента дать надежные указания о том, какие из возможных способов подрезания ветвей дадут эффект на протяжении всей жизни кустов? Будут ли объективные химические анализы на «участках» пищевых продуктов, хранящихся при различных тем- пературах, пригодны для определения коммерческой стоимости, которая основывается на таких субъектив- ных характеристиках, как вкус и запах? Осуществи- мость некоторых измерений часто сводится к воз- можности производить выбор; взвешивание всей продукции участка может оказаться более легким, но если требуется определить такие величины, как суммар- ное содержание лекарства или суммарный вес некоторой химической составляющей продуктадго соответствующий  ПРОЦЕНТ ПРИДЕТСЯ ПОЧТИ НЗВСРНЯКЗ определять на МЗЛЫХ  подвыборкахПроверки точностии эффективности тогда, очевидно, включат в себя всю стандартную статисти- ческую теорию выбора. Снова статистик должен играть главную роль, и снова какое-нибудь подробное рассмот- рение вопроса лежит за рамками нашей книги. Стати- стик может также дать полезные рекомендации о же- лательности использования в ковариационном анализе данных или измерений по другим характеристикам уча- стка (таких, как измерения, выполненные перед обра- боткой), которые приведут к увеличению точности глав- ных сравнений. Снова речь идет о вещах, о которых можно судить только на основе опыта однотипных ис- следований. Ключом ко всем этим вопросам является теснейшее сотрудничество между экспериментатором и статисти- ком, с тем чтобы природа экспериментального матери- ала могла быть использована с наибольшей пользой.  1.6. Рандомизация  Смысл 111) в ‘начале § 1.5 требует тщательного пояс- нения. Экспериментаторы часто думают, что достаточно определить способ обработки каждого участка, но это не так. Иногда два или более планов могут приводить к идентичным расположениям способов обработки в бло- 
1.6. РАНДОМИЗАЦИЯ 19  ках: например, любой эксперимент, провод_имь1й по схе- ме латинского квадрата (§ 3.3), MOI‘ бы иметь точно такое же расположение способов обработки по участ- кам, как если бы был выбран рандомизованный блок (§ 3.1) или даже полностью рандомизованный план (§ 2.3). План полностью определяется только с помо- щью множества всех допустимых расположений, из ко- торых был выбран один действительно принятый план. Более того, необходимым условием для получения несмещенных оценок разностей и их дисперсий является то, что принятое частное расположение выбрано случай- ным образом из множества всех возможных. Этот слу- чайный выбор, который достигается с помощью таблицы случайных чисел (см., например, Фишер и Иэйтс [121], таблица ХХХ1П) или других способов обеспечения безобидной лотереи, является сейчас, по общему призна- нию, существенной чертой планирования экспериментов. Изложение теории планирования мы будем проводить только для случая рандомизованных планов, если не оговорено противное. Следовательно, спецификация плана должна включать формулировку одного или боль-  шего числа процессов требуемой рандомизации. Однако  небольшой опыт в практике и терминологии делает яв- ную их формулировку не всегда обязательной. «Беспо- рядочное» расположение способов обработки или любое использование личного суждения при построении <<слу- чайных на вид» расположений не следует смешивать с точными процессами рандомизации, которые описаны Кохрэном и Кокс [66], Фишером и Иэйтсом [121] и другими. Рассмотрение процессов рандомизации до того, как описаны планы, к которым они относятся, несколько не- логично, но рассуждения эти настолько общие, что нам представляется уместным изложить их уже здесь, даже если большинство читателей предпочтет изучить конец этого пункта лишь после ознакомления с гл. 4 или даже гл. 7. Во всех планах, описанных в гл. 2——7, рандомиза- ция расположения способов обработки по участкам в пределах любого определенного блока или при сходных ограничениях является существеннои для полнои закон- ности интерпретации. Рандомизованный блок-план  2* 
20 гл. 1. Экспвримвнтировмчив и MATEMATI/IK  (ГЛ. 3) должен иметь в каждом блоке один участок, выбираемыйслучайным образом для каждого способа  обработки, при-этом рандомизация любого блокадолж-  на ‘быть независимой от всех других блоков. Факторные планы сосмешиванием (гл. 5) должны быть рандомизо- ваны аналогичным образом с той лишь разницей, что не все комбинации способов обработки встречаются здесь в?каждом блоке. Это же имеет место и для неполных блок-планов (гл. 6). Планы с некоторым видом дробле- ния участков (§ 5.13) включают два (или более) уровня рандомизации: сначала с помощью рандомизации к ос- новным участкам приписываются их способы обработки точно так же, как в случае рандомизованных блоков, а затем к частям каждого основного участка должны быть приписаны случайным образом соответствующие им "способы обработки. _ В случае, когъда одновременно действуют два класса блоковщ‘ ограничений, как это имеет место для латин- ского квадрата (глд- 4), идеалом снова является слу- чайный выбор расположения из множества всех тех расположений, которые согласуются с этими ограниче- ниямн. Иэйтс [41] и Фишер и Иэйтс [121] дали опи- сание схемы действий mum квадратов средних размеров: сначала выбирается тип квадрата, затем производится случайное изменение порядка как строк, так и столбцов и случайная нумерация размещаемых способов обработ- Kn. Для больших квадратов, размеры которых не могут быть полностью‘ перечислены, этого нельзя сделать. Тогда‘ приходится довольствоваться неслучайным выбо- ром частного типа квадрата и последующей рандомиза- циейстрок, столбцов инумерации. Отход от полностью случайного выбора здесь менее серьезен, чем в случае малыхквадратов, так как выполненная рандомизация достаточна для‘ страховки от, смещения, и число располо- жений, получаемых из большого квадрата, настолько ве- лико, что любое приближение к распределению диспер- сионного отношения, по-видимому, должно быть довольно хорошим (см. ниже). Аналогичная процедура может быть применена к другим планам, таким как квадраты Юдена (гл. 6) и квазилатннские квадраты (гл. 5). Однако точный механизм рандомизации имеет значение 
1.6. РАНДОМИЗАЦИЯ ` 21  ‘лишь для потребителей планов и не представляет тео- ретического интереса. Гораздо больший непосредственный интерес, чем правила рандомизации плана, представляет фундамен- тальньтй вопрос: почему необходима какая-либо рандо- мизация? В практике экспериментирования в действи- тельности должен ставиться вопрос: является ли допу- стимым какое-либо отклонение от случайности? Однако  ‘точка зрения, согласно которой рандомизацию следует  рассматривать как норму, требует некоторого оправ- дания. Прежде всего рандомизация является единствен- ным средством обеспечения того, что сравнения способов обработки не являются смещенными вследствие того, что один способ обработки приписан к «лучшим» участкам. Как бы ни был честен экспериментатор, если он имеет свободу выбора в рамках явных ограничений, он весьма вероятно должен быть предрасположен в пользу ре- зультатов за или против одного из способов обработки, выбирая для него соответствующим образом участки. Конечно,любое бросающеесяв глаза предпочтение было бы обнаружено и удалено, но имеется множество при- меров того, что даже малые подсознательные эффекты могут нарушить истинный объективный характер экспе- римента. Кроме того, экспериментатор рассчитывает на то, что его эксперимент не только удовлетворит его са- мого, но и убедит его собратьев по науке. Он будет до- статочно мудрым, чтобы вспомнить, что «не просто не- которое, а фундаментальное значение имеет принцип, согласно которому правосудие должно не только осуще- ствляться, но и должно явно и бесспорно выглядеть осу- ществленным» (Хьюарт [131]). Этого в большой степени можно было бы достигнуть рандомизацией, гораздо менее строгой, чем упомянутые выше способы. Если в рандомизованном блок-плане по- рядок способов обработки был рандомизован для пер- вого блока‚ и эта же рандомизация была использована для всех других блоков, то оценки разностей способов обработки будут несмещенньтми. Это же справедливо, если выбрать неслучайным образом любой латинский квадрат, а затем рандомизовать только нумерацию рас- положения способов обработки. Однако в этих случаях 
22 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  дисперсия разности средних урожаев для двух способов обработки не оценивается без смещения с помощью обычных процессов дисперсионного анализа или с помо- щью какого-либо другого из известных методов. Понятие случайного выбора наблюдений присуще всей теории ве- роятностей и всей теории статистического оценивания. Даже такое фундаментальное свойство, как состоятель- ность оценки, зависит от того обстоятельства, что вычис- ления произведены по наблюдениям, случайно выбран- ным из некоторого класса. Несмотря на сложность ограничений, накладываемых в некоторых планах экспе- риментов, здесь сохраняется то замечательное свойство, что стандартные методы дисперсионного анализа исклю- чают посторонние источники неслучайных колебаний, связанных с этими ограничениями, и приводят к стати- стически несмещенным оценкам дисперсии или диспер- сий разностей между средними значениями способов об- работки. Подходящая рандомизация имеет то следствие, что в дисперсионном анализе при нулевой гипотезе о том, что способы обработки дают одинаковый эффект, средние квадраты для способов обработки и ошибок имеют равные математические ожидания. Вэтом утверж- дении не требуется предположения о нормальности рас- пределений, и оно справедливо для большинства приня- тых планов экспериментов. Двух указанных свойств достаточно, чтобы сделать рандомизацию составной частью хорошего плана экспе- римента; ею не следует пренебрегать, если только нет очень серьезных причин, приводящих к неосуществи- мости или непригодности ее в конкретных обстоятель- ствах. Следует упомянуть еще иотретьем преимуществе. Если «ошибки», которым подвержены урожаи индиви- дуальных участков, т. е., иначе говоря, если отклонения полученных в действительности урожаев от их матема- тических ожиданий, соответствующих подходящей мате- матической модели (§ 2.4), нормально распределены, то (при нулевой гипотезе) отношение среднего квадрата по способам обработки к соответствующему среднему квад- рату ошибки в дисперсионном анализе будет следовать распределению дисперсионного отношения (Р-распреде- лению), одному из хорошо известных в теории статисти- 
1.6. РАНДОМИЗАЦИЯ 23  ки стандартных распределений. (Это утверждение тре- бует некоторой оговорки и обобщения в отношении конкретных средних квадратов для более сложных пла- нов, но основой всевозможных модифицированных кри- териев значимости остается Р-распределение.) Даже если «ошибки» индивидуальных участков не являются нормально распределенными, а должнырассматриваться как фиксированные количественные характеристики со- ответствующих им участков (модель рандомизации из § 2.4), то процесс рандомизации приведет к тому, что распределение отношения средних квадратов будет при- ближаться к Р-распределению (при альтернативных расположениях, из которых одно выбирается случайным образом). В действительности распределение будет дис- кретным, так как число альтернатив конечное (хотя часто и очень большое). Различные авторы (например, Питмен [78], Уэлч [92]) показали, что для частного типа планов приближение с помощью Р-распределения хорошее при экспериментах умеренно большого объема. Кохрэн и Кокс высказывают мысль, что рандомиза- цию можно рассматривать как аналог страхования, за- щиты от зла, которое по-видимому не может возникнуть, но имело бы серьезные последствия, если бы оно по- явилось. Несомненно, многие эксперименты привели бы к таким же выводам, даже если игнорировать рандоми- зацию, или нестрого ее использовать и по-прежнему при- менять стандартные методы статистического анализа; трудность состоит в опознании того, каковы эти экспе- рименты. Нет причин полагать, что ситуации, в которых рандомизация неудобна из-за технических трудностей, являются также ситуациями, в которых она наименее необходима! Многие экспериментаторы склоняются к убеждению, что обстоятельства, в которых они нахо- дятся, таковы, что делают рандомизацию ненужной. Может быть, они и правы, но, если они неправы, то их результаты могут полностью вводить в заблуждение, не возбуждая при этом подозрений, и даже если возникнут подозрения о смещениях, ничего нельзя сделать для их устранения. В производственном процессе условия про- ведения эксперимента по минимизации отклонения от обычного хода процесса могут быть такими, что все 
24 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  «участки» при одной температуре печи будут плавиться последовательно, но возможно также, что температура будет меняться в соответствии с систематической схемой. При опыте над ростом растений, когда контролируемыми условиями являются свет, температура и влажность, научно-исследовательский институт вряд ли должен иметь набор теплиц, помещений с постоянной темпера- турой, для того чтобы осуществить независимую рандо- мизацию экспериментальных объектов: все эти объекты, приписанные к одному и тому же способу обработки, могли бы рассматриваться в совокупности. Бесполезно делать вид, что необходимость в нерандомизованных экспериментах никогда не возникает, но каждый аргу- мент B пользу этого должен быть тщательно изучен перед тем, как его принять. Если экспериментатор в ко- нечном счете настаивает на том, что его эксперимент не может быть или не будет рандомизованным, то оконча- тельная ответственность лежит на нем; статистик может проанализировать опыт, как если бы он был рандомизо- ванным, но часть или даже весь этот анализ будут зави- сеть от того, что он основывается на личном суждении вместо статистической теории.  1.7. Экономические соображения  Эксперименты дорого стоят как из-за времени и тру- да экспериментатора и обслуживающего его персонала, так и из-за затрат на материалы. Даже самый заядлый защитник «чистого» научного исследования должен представлять себе, что чем больше усилий он тратит на одно исследование, тем меньше он может уделить дру- гому. Следовательно, важным долгом статистика долж- но быть составление таких планов, которые давали бы возможность получить как можно больше информации из каждого эксперимента. В этой книге под стоимостью эксперимента будем по- нимать любую количественную величину, выражающую суммарные затрачиваемые усилия. В прикладном иссле- довании они могут выражаться в денежных единицах; в чистой науке более подходящими единицами измере- ния могут оказаться время или количество Материалов. 
1.7. ЭКОНОМИЧЕСКИЕ СООБРАЖЕНИЯ 25  При попытке оценить в одинаковых единицах все важ- ные составляющие стоимости даже грубое приближение может иногда быть использовано весьма эффективно. Часто статистик сталкивается с задачей максимизации точности, с которой вычисляются’ некоторые контрас- ты*) при условии, что суммарная стоимость экспери- мента фиксирована. Ниже приведены три простых примера такого рода, имеющие широкую область при- тменимости. Предположим, что множество из t способов обра- ботки должно быть проверено с помощью суммарного числа N участков и что дисперсия на участок, относя- щаяся к сравнениям средних значений групп участков, равна 02. Обозначим через г, число участков с обработ- кой i; гд—положительное целое число. Очевидно,  t 2 г, = N. (1.1) z=l При любой попытке выбрать оптимальные значения для г, могут возникнуть разные соображения о стоимости. р i) Часто стоимость приближенно линейно связана с А/—суммарным числом участков; она состоит из на- кладных расходов на участок плюс пропорциональная числу участков стоимость операций. Дисперсия разности между средними для способов обработки i И j равна 1 1 ._ 2 __ _ У" G(r1+ r;)' (L2) Если все сравнения представляют одинаковый интерес, то надлежит минимизировать среднее значение Vi,-. Ус- ловием достижения минимума является равенство  N . r,-=7 для всех l. (1.3) Это возможно, только если N кратно 2‘, в противном слу- чае следует взять приближение  rl.=[—jt1] для Некоторых способов обработки, р N (1.4) г, = [Т]+1 для других,  *) Понятие «контраст» определено автором в § 2.1. -17/111.11. ред. 
26 ГЛ. 1. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  что приведет к дисперсии, близкой к теоретически опти- мальной. В действительности условия, внешние по от- ношению к требованиям плана, редко фиксируют N жестко, и может оказаться допустимой ориентация на ближайшее кратное t. ii) Условия симметрии делают «хорошую» процедуру в i) очевидной, но это не так, если единственными пред- ставляющими интерес контрастами являются контрасты между первым способом обработки (стандартом) и каж- дым из оставшихся. Среднее значение величины  .- 1 l V”-‘;O'2(;'1—‘+“;’—_') �6� ДЛЯ всех 1°95 1 достигает минимума при . N f1=fj(t—l)/2='i . �/d�  Когда t велико, г, и г, будут существенно отличаться друг от друга, но V1,- оказывается менее чувствительным к этому отличию. Действительно, если подставить значе- ния п, г, из равенств (1.6) в (1.5), то отношением полу- ченного значения И, к значению V” для случая, когда каждый способ обработки применяется к N/t участкам, или относительной эффективностью симметричной схе- мы, будет I2 __ / E = §+ �7]� (1.7) Эта величина при t= 10 уменьшается только до 0,8, а при t = 50 —— до 0,64. Условие, выражаемое (1.6), часто не может выпол- няться точно, но снова Целые числа, близкие к теорети- чески оптимальным, приведут к дисперсиям, почти та- ким же малым. 111) Если способы обработки сильно отличаются по своему характеру, то стоимость на участок может запи- сеть от способа обработки. Обозначим через с, стои- мость для 1-го способа обработки Среднее значение Vi,- для всех контрастов обращается тогда в минимум при  —1/? N“ (1.8)  ��$� Е” 1/2 Ё 
1.8. ИНТЕРПРЕТАЦИЯ ЭКСПЕРИМЕНТОВ 27  Сформулированные здесь результаты. по-видимому, проще всего получаются, если фиксировать N И искать значения r,-, которые минимизируют суммарную стои- мость. Альтернатива рассмотрения суммарной стоимо- сти как фиксированного числа и отыскания значений ri, минимизирующих дисперсии средних, является по суще- ству той же самой задачей, и оптимальные r.,- будут про- порциональны тем, которые получаются с помощью на- писанных выше равенств (1.3)‚ (1.6) или (1.8). В последующих рассмотрениях плана обычно будут предполагаться выполненными условия i). Если другие условия являются более подходящими, то можно пы- таться найти компромисс между данными здесь прави- лами и другими ограничениями на план. Часто это мож- но сделать с небольшой потерей эффективности или даже совсем без потери эффективности. Например, в условиях ii) при t = 10 эксперимент может быть спланирован так, как-будто он содержит 12 способов обработки вместо 10; все участки, к которым приписаны три из этих способов, можно затем рассматривать как подвергнутые стандарт- ному способу обработки, т. е. этому способу соответст- вует в три раза больше участков, чем любому из остав- шихся. В гл. 9 и 10 будет рассматриваться множество во- просов‚ связанных с экономической эффективностью планов экспериментов. В частности, § 9.6 посвящен дру- гим аспектам эффективного выбора порядка реплики  1.8. Интерпретация экспериментов  Весьма часто статистик считает, что его работа за- кончена, если он спланировал эксперимент, а затем к результатам применил дисперсионный анализ (или дру- гую подходящую статистическую процедуру). Не лишне подчеркнуть, что его ответственность простирается даль- ше и что он должен сыграть свою роль, разумеется в тесной связи с экспериментатором, в интерпретации статистического анализа. Голая схема дисперсионного анализа с критериями значимостиистандартными ошиб- ками средних —это не более чем строительные леса, около которых должен быть построен отчет, хотя иногда 
23 ГЛ. I. ЭКСПЕРИМЕНТИРОВАНИЕ И МАТЕМАТИК  подобную-схему преподносят так, как будто никакая дальнейшая ее интерпретация вовсе и не требовалась. Статистик должен быть готов выразить свое мнение в терминах той области науки‚в которой эксперимент был проведен, и Сотрудничать с экспериментатором при со- ставлении отчета, который объединяет все выводы в еди- ный ясный и объективный итог. Это существенно не только для правильного использования экспериментиро- вания, но и, как я уже писал в 1956 г.‚ потому, что «я сомневаюсь в том, действительно ли статистик пони- мает свой собственный анализ, если только он не может поставить себя на место читателя, которому его отчет адресован, и не может вразумительно описать свою об- щую идею и ее смысл» (см. [1О6]). Сказанного достаточно, чтобы подчеркнуть важность участия статистика в интерпретации экспериментов; было бы неуместно говорить об этом больше в книге, посвященной математической стороне планирования экспериментов. 
Глава2 " "  ДИСПЕРСИОННЫЙ АНАЛИЗ у д д �S� `gY� дд  2.1. Разбиение суммы квадратов  Хотя многое из логики планирования экспериментов можно понять без знания методов статистического ана- лиза урожаев, развитие дисперсионного анализа и близ- ких к нему методов было так тесно связано с планиро- ванием, что мы считаем полезным дать некоторые сведе- ния из области дисперсионного анализа Мы рассмотрим здесь лишь несколько основных идей; другие вопросы и примеры будут изложены в дальнейшем, однако и там мы не дадим исчерпывающего изложения методов этого анализа. Мы ожидаем от читателя некоторого знаком- ства с дисперсионным анализом, полученного- из- более общих руководств по статистике; оно должно включать не только знание алгебры, но также и опыт вычислений, без которого понимание «не может быть полным. ` ` Основная теорема дисперсионного’ анагшза касается разбиения суммы квадратов отклонений. Пусть  у1‚ yg, `uU� yN'+T— множество N числовых- наблюдений, а м, М, . . .`‚ KN — любое множество коэффициентов „та- ких, что й p�o� Ц Е N . - 2 ж, = от. ‚ .. 12.1)  Тогда величина I. ъ ‚  N г: L= Ему; p�m� " (2-2) называетсяь контрастом N наблюдений; „Предположим далее, что коэффициенты (энд), Мед) соответствуют двум таким контрастам 1,1 и- Ьъдва контраста назы-  {залотся ортоеонсгльгдгэдмцътогда. „и ггольнод тогда; жажда 
30 ГЛ. 2. ДИСПЕРСИОННЫЙ АНАЛИЗ  ВЫПОЛНЯСТСЯ раВеНСТВО N “W 2.12.1112, =0. �P��  Свойство быть контрастом и свойство ортогональности не зависят от конкретного у; и имеют отношение только к коэффициентам. Теорема. Для любого N может быть найдено та- кое множество (N — 1) контрастов, что каждая пара аз него будет ортогональной, причем коэффициенты м; (i=1, 2, ..., N—1; j= 1, 2, ...‚ N) никак не зава- сят от уд. Кроме того, для такого множества контрастов выполняется равенство  д N-1' L? )<y,—g>2=), __]\[__l——_ ‚ ‹2.4› i=-=1 i= д АЗ, где j: N “Й = �k�� ё/г- (2-5) I:  Доказательство этой теоремы можно найти во многих учебниках. Действительно, нетрудно проверить, что ко- эффициенты  A,-,=l при 1<j<i, K”: �+�� При p�%� 1, 0X��  удовлетворяют условиям теоремы. Результат следует из свойств ортогональных матриц. Теорема эта имеет важное значение, так как она при- водит к разбиению суммы квадратов отклонений наблю- дений на (N—1) квадратичную компоненту, а значит, K понятию о (N—l) степени свободы. Кроме того, за исключением тривиального случая N = 2, м; могут быть найдены неограниченным числом различных способов. Когда N наблюдений представляют собой урожаи с экспериментальных участков, то план эксперимента определяет подходящий метод разложения суммы квад- ратов на ортогональные компоненты: искусство планиро- вання экспериментов состоит в нахождении таких пла- 
2.2. НОРМАЛЬНОСТЬ 3]  нов, ортогональная структура которых позволяет прове- рять и оценивать с высокои точностью важные контрасты. Простое следствие теоремы состоит в том, что если 1/1, U2, ..., Ua-—CyMMbI п, r2, ..., га различных на- блюдений, где r,+r2+ ���� +r,,=N, (2.7)  то первые (a—— 1) ортогональных контраста могут быть определены таким образом, что для любого фиксирован- ного i коэффициенты м, будут постоянными для всех наблюдений в фиксированной сумме Up. Контрасты яв- ляются тогда контрастами между величинами Цр/гр- средними а групп. Кроме того, сумма  N‘ 2 Ё дё (1% W) :12! д? N N p=l Гр z-1 2 A3] j=l представляет собой сумму квадратов разностей группо- вых средних, и все оставшиеся (N—a) контрастов бу- дут ортогональны к каждому из этих (a—-— 1) контра- стов. Таким путем может быть развита идея ортогональ- ной группировки наблюдений, обладающей тем свойст- вом, что любой контраст между средними из одного множества групп будет ортогонален любому контрасту между средними из второго множества; сумма квадра- тов, соответствующая любому множеству сумм наблюде- ний или средних значений, может быть вычислена непо- средственно, без предварительного нахождения ее (а——1) квадратичных компонент, каждая из которых обладает одной степенью свободы. Пример этого будет дан в § 3.4. Наиболее важным для практики случаем яв- ляется случай, когда все гр равны между собой.  (2.8)  2.2. H0pMaJlbHOCTb  Обычно используемые в дисперсионном анализе кри- терии значимости основаны на предположении о том, что распределение вероятностей является нормальным (гауссовым), или же другим стандартным распределе- 
32 гл. 2. дисперсионный АНАЛИЗ  л-нием,- связанным с нормальным, .в частности, х2-‚ l- и ‘Р-распределением. Математическую формулировку этих законов можно найти в любом учебнике по математиче- ской статистике. ��� Основной теоремой является теорема о том, что если величины уд, у2, ...‚ ум независимы и нормально рас- пределены с одинаковыми средними м и дисперсиямио9, так-что величина 2(у—д)2  O-2  имеет распределение xfN_”, то квадрат каждой компо- ненты из ортогональных контрастов распределен незави- симо от всех остальных как 02%]. Следовательно, сум- ма компонент из_ равенства (2.8) будет распределена ака“ 027%’ ‘а . ` . На практике, хотя и не все у; имеют одинаковые нормальные распределения, план строится таким обра- зом, что квадраты для некоторых ортогональных контра- стов, изображающих «ошибку», ведут себя как 0974?” и прицопределенной нулевой гипотезе о способах обра- ботки другие контрасты также обладают этим свойст- вом. Тогда. отношение двух сумм квадратов распреде- ‘лено как отношение двух X2, И его значимость прове- ряется с помощью Р-распределения.  ‘В теории дисперсионного анализа обычно пренебре- ,  гают двумя моментами, которые между тем важны для практики: ‘г ‘  i) Эксперименты редко удается" провести с твердой верой в справедливость нулевой гипотезы о том, что не- которые способы обработки идентичны по_ эффекту. Экспериментатор может быть вполне уверен, что, уве- личив масштабы своего эксперимента п сделав его более точным, он сможет обнаружить, что разность между лю- быми двумя разными способами обработки статисти- чески значима!„ Гораздо более важным является оцени- ваниевеличины разности посредством меры точности, позволяющей сделать заключение о том, важен ли эф- -фект в действительности. Хороший план приводит к хо- 
2.3. ПОЛНОСТЬЮ РАНДОМИЗОВАННЫЙ ПЛАН 33  'рошему ОЦСНИВЗННЮ, И ГЛЭВНОЙ ЦЕЛЬЮ дисперсионного  анализа очень часто являются не критерии зничиляости, а вычисление дисперсии ошибки. ii) Применимость дисперсионного анализа в качестве метода разложения суммарного изменения в множестве наблюдений на компоненты, соответствующие различ- ным источникам, не зависит от какого-либо предположе- ния о нормальности. Требуется лишь, чтобы наблюде- ния были независимы и происходили из аддитивной мо- дели обычного типа. Если вдобавок все наблюдения имеют одинаковую дисперсию ошибки, то средний квад- рат ошибки в анализе дает несмещенную оценку этой дисперсии. Нормальность распределения случайной ошибки требуется только для строгой законности приме- нения обычных критериев значимости и вычисления фи- дуциальных границ для оценок. Действие центральной предельной теоремы будет, по-видимому, направлено на сглаживание умеренных отклонений от нормальности, т. е. на ликвидацию этих неправильностей.  2.3. Полностью рандомизованный план  Простейшим из всех планов, не представляющим са- мостоятельного математического интереса, но важным как в качестве основы для построения других планов, так и для практического применения, в ряде случаев является полностью рандомизованный план. Суть этого плана состоит в том, что сначала выбирается число участков, к которым следует применить каждый из спо- собов обработки, а затем производится рандомизация без каких-либо ограничений. Если имеется N участков и t подлежащих сравнению способов обработки, то выби- раются числа п, r2, �rq� rt, подчиненные лишь условию  2г=1\/.  Тогда правило размещения состоит в следующем: выби- раются случайным образом г, участков для первого спо- соба обработки, из оставшихся участков выбираются на- угад гг для второго способа и т. д., и последние rt уча- стков выделяются для способа обработки г‘. '  3 Д. Финни 
34 гл. 2, дисперсионным АНАЛИЗ  Дисперсионный анализ в этом случае не представ-'  ляет никаких трудностей и вытекает непосредственно из § 2.1. Вычисления сведены в таол. 2.1. Таблица21  Дисперсионный анализ для полностью рандомизованного плана *)  (2 WY Поправка для среднего I N Математическое ожидание СРЕДНЕГО квадрата ИСТОЧНИК изменчиво- ЁЁЁЁЁЁЁ, СУММЗ КВЭДРЗТОВ СТИ Между спо- t—l -2 Z у] 2 2 ч‘ (1,-p_7E)2 собами ��w� Yp д О’ + гр ё обработки Гр N р р Внутри спо- N —t д 2 у?) собов об- Z у] — Б Г 02 аботки Р р i р 1 2 2 (Хим Сумма N-1 Щ’ 1' P�v� j N *) Здесь Ур означает сумму Гр урожаев с участков, под- вергнутых обработке р; символы 2 , Еозначают соответствен- р i НО с мми ование по р=1,2, ...‚ t И j= 1,2, ..., N; У 1 Zlrflp Т = 1-70: .  2.4. Модели  Хотя для наблюдений описано много математических Моделей, приемлемых при дисперсионном анализе, все они, как правило, мало связаны с основными расчетами этого анализа. Когда же речь идет о критериях значи- 
2.4. модвли 35  мости и оценивании компонент дисперсии, модели при- обретают важное значение. Две основные модели можно проиллюстрировать, об- ратившись к полностью рандомизованному плану. Уро- жай на каком-либо участке может быть выражен равен- ством у“; = т] + Tp + 3]‘,  где п-общий средний урожай, который был бы полу- чен, если бы каждый способ обработки можно было испытать по очереди на всех участках при одинаковых условиях, а (т]+тр)—средний урожай, который был бы получен, если бы обработка р была применена к каж- дому участку. Символ удр используется для обозначения того, что в принятой конкретной рандомизации участок] (f в: 1, 2, ..., N) является одним из Гр (р = 1,2, �?�� t) участков, подвергнутых обработке р. Остаток ед пред- ставляет собой величину, на которую истинный урожай участка j отличается от среднего урожая для этого спо- соба обработки. В модели рандомизаиии ед рассматривается как ти- пичная для участка j величина, которая обычно остается фиксированной при всех возможных рандомизациях способов обработки. В модели нормальных ошибок ед считается нормально распределенной величиной со сред- ним нуль и дисперсией 02, причем предполагается, что дисперсия одинакова для всех j, a распределения ед при различных j независимы. Для более сложных планов обе эти модели уточняются включением дополнительных па- раметров в правую часть равенства (2.9), что дает воз- можность учесть эффекты наложенных ограничений (см. §§ 3.1, 3.4). Модель нормальных ошибок проще в том смысле, что если она применима, то отношения средних квадратов в дисперсионном анализе (для полностью рандомизованных И других планов) следуют распреде- лению дисперсионного отношения, когда верны соответ- ствующие нулевые гипотезы. Хотя модель рандомизапии имеет некоторые теоретические преимущества и содер- жит более легко оправдываемые допущения,чем вслучае модели нормальных ошибок, разница между ними имеет  3* 
36 ГЛ. 2. ДИСПЕРСИОННЫЙ АНАЛИЗ  малое отношение к предмету этой книги и редко будет упоминаться. Сейчас модно осуждать модель нормаль- ных ошибок как неподходящую для экспериментирова- ния и статистического анализа, но эта позиция кажется до некоторой степени педантичной. В любой области статистики предположения о нормальности должны быть тщательно проверены, но польза от статистика была бы существенно сужена, если бы он был ограни- чен рамками использования непараметрических методов, и вряд ли можно указать случаи, когда произошли серь- езные ошибки от доверия к методам, основанным на нормальном распределении. Слишком жесткий выбор модели рандомизации усложняет выкладки при анализе экспериментов, при этом часто без изменения основных свойств результатов. Таким образом, этот выбор может затемнить развитие предмета без большого компенси- рующего выигрыша. В действительности даже в про- двинутой теории авторы часто вынуждены принять мо- дель нормальных ошибок при рассмотрении более слож- ньтх планов. Можно признать большую важность модели рандомизации, однако это не будет аргументом в пользу ее превосходства по отношению к модели нормальньтх ошибок. Впредь для простоты будет предполагаться нормальность модели. В этой книге не рассматривается вопрос о преобразо- вании наблюдаемых урожаев, т. е. об использовании не- которой простой функции от урожая вместо действи- тельно сделанного измерения, для того чтобы более точ- но выполнялись допущения, лежащие в основе анализа. Бартлетт [6] и Кохрэн [65] дали поттезные элемен- тарные сведения об этом, кроме того, многое можно найти в учебниках и более поздних работах.  2.5. Компоненты дисперсии  При применении дисперсионного анализа может по- явиться необходимость вычислить Математические ожи- дания средних квадратов при использованной процедуре рандомизации. Для полностью раидомизованного плана в модели нормальных ошибок они могут быть Получены 
2.5. КОМПОНЕНТЫ ДИСПЕРСИИ 37  с помощью формул E(yjp)='n+Tps �#�� E[(y,-,,—'n—1:p)2]=02. (2.11)  Тогда легко показать, что средний квадрат «внутри спо- собов обработки» в дисперсионном анализе имеет мате- матическое ожидание 02 и, таким образом, не зависит от гр. По этой причине для него обычно используют на- звание «ошибки», Математическое ожидание среднего квадрата «между способами обработки» равно  t 2 г‚, (тр —i)2  02+ P“ ‚Ч ‚ (2.12)  где  2: 2 ’p"7p .. ___ @C�� 1:————-———N . (2.13) Следовательно, математическое ожидание этого среднего квадрата с необходимостью превосходит 02, если только все гр He равны между собой. Иногда разумно и полез- но рассматривать сами t способов обработки как слу- чайную выборку из большой генеральной совокупности возможных способов обработки, в которой дисперсия Тр  2 О равна от. Для этои совокупности математическое ожи- дание выражения (2.12) равно  N2 _ 2 02+ v�� ��  Для симметричного плана, в котором все Гр равны .‚ 2 между собои‚ множитель при от превращается в г, и он не очень отличается от среднего значения Гр, если только отдельные Гр не слишком разнятся по величине. 
Глава 3  РАНДОМИЗОВАННЫЕ БЛОКИ И ОРТОГОНАЛЬНЫЕ КВАДРАТЫ  3.1. Рандомизованный блок-план  В этой главе, а также в следующих четырех главах рассматриваются только планы для сравнительных эк- спериментов, вкратце описанных в § 1.2. Даже специаль- ные типы экспериментирования, рассматриваемые в гл. 8—1О, часто имеют эти планы в качестве составной ча- сти своей структуры. Полностью рандомизованный план, введенный в § 2.3, предусматривает сравнение любого числа способов обработки при репликах (т. е. наборах участков) из каждого способа обработки, полностью за- висящих от выбора потребителя. Несомненно, доводы § 1.7 будут обычно наводить на мысль, что или все об- работки имеют одинаковое число реплик, или некоторые из них имеют большее число репликвсоответствиистре- бованиями точности и со сведениями о стоимостях. Но- вичок в предмете, еще не имеющий никакого практиче- ского опыта экспериментирования, вполне может спро- сить: «Для чего нужна какая-либо дальнейшая теория плана?» Однако любой экспериментатор хорошо осве- домлен о выгоде, получаемой от сравнения способов об- работки при однородных условиях, и именно на это и направлена большая часть усилий при построении пла- на эксперимента. Полностью рандомизованный план всегда представляет собой обоснованный выбор, однако этот выбор редко бывает хорошим. Поясним это на простом примере. Фабрикант одеж- ды, желающий сравнить прочность брюк, сшитых из че- тырех различных типов сукна, мог изготовить 10 пар из каждой ткани А, В, С, D И договориться, что желающие будут носить их в течение шести месяцев, после чего брюки должны быть отобраны и оценены на износ. За- 
3.1. РАНДОМИЗОВАННЫИ БЛОК-ПЛАН 39  конной процедурой было бы предоставление пары брюк каждому из отобранных 40 добровольцев совершенно случайным образом. Однако если бы восемь из облада- телей А оказались фермерами, семь из обладателей B- служащими, девять из обладателей С—сталелитейщи- ками, а восемь из обладателей 0——статистиками‚ то  фабрикант мог бы справедливо усомниться в выводе,  что одежда из ткани А весьма подвержена протиранию, а одежда из ткани С—— разрывам! Объяснение, что рас- пределение было рандомизовано и что любое кажущееся предпочтение B И D могло бы с легкостью относиться и к партии А и С или любых двух других видов одежды, хотя формально и оправдывает критерий значимости, но является мало утешительным, когда неоднородный ис- ход рандомизации известен. Конечно, столь крайняя раз- нородность почти невероятна, но метод экспериментиро- вания, который полностью предохранял бы даже от меньшей неоднородности такого рода, дал бы огромное улучшение. Одна возможность улучшения состоит в ог- раничении исследования лицами одной профессии. Од- нако это не только ограничило бы применимость резуль- татов, но и просто оказалось бы невозможным, если бы не удалось найти большого числа добровольцев одной профессии. Очевидная альтернатива состоит в расслое- нии имеющихся добровольцев по профессиям (или груп- пам профессий) с последующим проведением ограничен- ной рандомизации, при которой каждый тип одежды распределяется между двумя фермерами, тремя сталели- тейщиками и т. д. Все сравнения между видами одежды будут тогда „сбалансированы в отношении профессиональ- ных различии в условиях носки, однако исследование по- прежнему имеет то достоинство, что оно проведено на большой группе лиц. К счастью, такой контроль рандо- мизации может быть выполнен без нарушения законно- сти эксперимента. Настоящая глава содержит формаль- ное изложение некоторых основных планов, включаю- щих ограничения Ha рандомизацию. Она начинается с самого важного момента, только что проиллюстрирован- ного на частном примере. Предположим, что нужно провести эксперимент длясравнения 2‘ способов обработки и что N, число 
40 гл. з. РАНДОМИЗОВАННЫЕ БЛОКИ  имеющихся участков, удовлетворяет условию N = rt, (3.1)  где г — Целое число. Часто при выборе суммарного числа участков имеет место достаточная свобода, что позво- ляет принять соглашение о том, что оно кратно г. Рас- смотрим следующее правило: «Участки делятся каким- нибудь способом (см. § 3.2) Ha r блоков из t участков каждый. Способы обработки распределяются по уча- сткам таким образом, что каждый из них встречается один и только один раз в каждом блоке. Затем в каж- дом блоке производят случайный выбор одного участка для первого способа обработки, другого—для второго способа обработки и т. д и устанавливают новый случайный порядок в каждом блоке». Это дает рандо- мизованньсй блок-план, иллюстрацией которого служит план 3.1.  Пл ан 3.1 Рандомизованное расположение для шести бло-  ков из пяти способов обработки в рандомизо- ванном блок-плане *)  Блоки Участок внутри блока 1 11 ш IV V VI 1 D D А В Е D 2 Е С С А D B 3 C А В D C Е 4 А В Е Е А С 5 В Е D C B A  *) Обработки обозначены буквами А, В, С, D, Е.  Всякий контраст между средними значениями спосо- бов обработки (§ 2.1), очевидно, ортогонален каждому контрасту между средними по блокам (если читатель не находит это очевидным, то он может убедиться в 
3.1. РАНДОМИЗОВАННЫИ БЛОК-ПЛАН 4]  справедливости утверждения проверкой для нескольких конкретных пар контрастов). Значит, из полной суммы квадратов можно выделить компоненты для этих двух групп контрастов соответственно с (t —— 1) И (г — 1) сте- пенями свободы, так что остаток с (r—— 1) (t-— 1) сте- пенями свободы будет ортогонален каждой из них. Дис- персионный анализ представлен табл. 3.1. Метод вычис- ления совершенно очевиден и весьма сходен с методом  Таблица 3.1  Дисперсионный анализ для рандомизованного блок-плана *)  Поправка для среднего y2 /rt Н Математическое источник число степеней 0}K”H:::§p(:1[1)':flHerO H3MeH‘lHB0‘ свободы сумма квадратов сти Между бло- Г 2 V1 2 . t ками r_1 _1_E‘y2.__!/.. 02+ .445} t '1 rt r — l i=1 Между об- 1 2 2 1 l r У T- работка- t_l lzy? __J_. 02+ .4 l МИ г ‘° rt t— l i=1 Остаток (г — 1) (t — 1) По разности о’ у 2 у? i» I 1 . *) 3l1€Cb М; = 2; у„‚ U1, ’= Z Удэ !/_. = Z ‘Jif- i i i, i  для латинского квадрата, рассмотренным в § 3.4. Он мо- жет быть удобно сформулирован, если изменить обозна- чения, использованные в § 24. Обозначим через y,-,- (i = = 1,2, . ., 1.‘; j = 1,2, r) урожай с одного участка соб- работкой i B блоке 1' И полагаем  1/21 =Tl+Tz ‘H3; +3t1» (33) 
42 гл. з. РАНДОМИЗОВАННЫЕ БЛОКИ  где т1—общий средний урожай, который был бы полу- чен, если бы каждый способ обработки испытывался по очереди на каждом участке, (ц + п) —— среднее для 2-го способа обработки, а (п + Вд) —среднее для всех спо- собов обработки одного 1-го блока. Остаток ед; представ- ляет собой величину, на которую удд отличается от значения, предсказываемого добавлением к т] средних «эффектов» по блокам и способам обработки. Он обус- ловлен некоторыми «взаимодействиями» между относи- тельными эффектами различных способов обработки, блоковой классификацией (см. § 4.2) И ошибкой экспе- римента. Очевидно,  .§1r;=0, §B,=0, 1212;-,=0. (за)  Если вдобавок о? определяется равенством Е (е?!) = 02 (3.4)  (CM. (2.11)), то математические ожидания средних квад- ратов вычисляются, как показано в табл. 3.1. Если спо- собы обработки можно рассматривать как случайную выборку из генеральной совокупности обработок, в ко- торой дисперсия величины 1: равна 02, то средний квад-  рат для компоненты способа обработки будет равен о? + mi,  И аналогичным образом можно вычислить средний квадрат для блоков. Эти схемы, наверное, более изве- стны, хотя при любом глубоком изучении структуры дисперсионного анализа необходима модель, аналогич- ная приведенной B табл. 2.1. Статистическая значимость различий между способами обработки в предположении нормальности (§ 2.2) может быть проверена сравнением средних квадратов для «обработок» и «остатка» в дис- персионном анализе—причина, по которой последний часто называется просто «ошибкой». Стандартные ошиб- ки средних значений способов обработки могут базиро- ваться на этой средней квадратичной ошибке. 
3.2. ПРИМЕНЕНИЕ РАНДОМИЗОВАННЫХ БЛОКОВ 43  3.2. Применение рандомизованных блоков  Среди всех планов этот план используется, по-види- мому, наиболее часто из-за его приспособляемости и легкости, с которой он может быть модифицирован. Оче- видно, он может быть построен для любых значений г и t, однако, в отличие от многих планов, которые будут рассмотрены позже, его структура не имеет никакого самостоятельного интереса. Тем не менее он является основой для многих других планов, в которых в более сложной форме используется принцип расположения в блоки с повторениями. Например, бывает выгодно использовать одновременно две или более системы блоков. Рандомизованный блок-план является обоснованным, как бы экспериментатор ни решил разбить свои N уча- стков на г блоков размера t, поскольку это делается до начала эксперимента, но разбиение на блоки может быть выгодным только в тех случаях, когда для этого разбиения дисперсия внутри блоков заметно меньше, чем дисперсия по всему множеству участков. В сельско- хозяйственных опытах соседние площадки, наверное, можно считать близкими по плодородию, а значит, объ- единенные группы смежных участков выгодно прини- мать за блоки. Листья на одном растении (при вирусной прививке), животные одного помета (при опытах с пи- танием), пробы крови одного человека (при сравнениях альтернативных методов подсчета клеток), колеса на одном экипаже (при сравнениях прочности шин) или ко- личества насекомых, проверяемых за один день (при сравнениях средств от насекомых), являются другими примерами полезных блоков из участков. Любое свой- ство участков, которое может быть определено до на- чала эксперимента, может быть использовано для груп- пировки участков в блоки. Опыт как экспериментатора, так и статистика подскажет свойства, достаточно тесно связанные с «урожаями», использование которых приве- дет к уменьшению дисперсии внутри блоков и вдобавок к некоторому облегчению работы. В рандомизованном блок-плане при стандартной об- работке можно осуществить добавочную реплику в со- 
44 гл. з. РАНДШИИЗОВАХ-{НЫЕ влокн  ответствии с идеями § 1.7, рассматривая ее формально как два или более способов обработки: рандомизован- нь1й блок-план для (t + u— 1) способов обработки может быть использован для того, чтобы дать стандарт- ную обработку и участкам в каждом блоке. При t= 10 для ситуации ii) ИЗ § 1.7 годилось бы значение и = 3, но для многих t B качестве значения и следовало бы выби- рать ближайшее к (t-— 1)‘/2 целое число. Такой же ме- тод <<фиктивнь1х способов обработки» можно использо- вать и в других планах.  3.3. Латинские квадраты  Нередко выбор между двумя (или более) альтерна- тивными системами блоков представляет трудности. Ла- тинский квадрат является расположением, позволяющим учитывать два множества блоковых ограничений (обь1ч- но называемых строками и столбцами), которые должны быть использованы одновременно. Его можно приме- нить для любого числа t способов обработки, для ко- торого  N = at2, (3.5)  где a— целое число, причем в основной ситуации а = 1. Кокс и Кох р э н [63] упоминают эксперимент для срав- нения пяти вирусных прививок на растениях, в котором роль участка играл отдельный лист. План 3.2 показь1- вает, как листья на одном растении и листья примерно одинакового размера были объединены совместно в блоки. Для опыта требовалось пять растений, каждое с пятью листьями. Каждая прививка была сделана один раз на каждом растении и один раз на листе каждого из размеров. Такая схема гарантирует, что строки, столбцы и способы обработки дают множества сумм та- ких, что соответствующие контрасты взаимно ортого- нальны, и тогда дисперсионныи анализ становится оче- видным обобщением анализа для рандомизованных блоков. Точность сравнений между способами обработ- ки определяется дисперсией остаточной ошибки. До тех пор, пока и строки и столбцы выбираются в соответ- 
31 ЛАТННСКИЕ КВАДРАТЬ1 45  План 3.2  Случайное расположение способов обработки А, В, С, D, E B эксперименте с вирусной прививкой на растениях по схеме латинского  квадрата Размер листа Номер растения 1 2 3 4 5 I А Е D C B II C D А В Е 111 в с Е А D IV Е А В D C V D B C Е А  ствии с принципами определения «хороших» блоков (§ 3.2), эта дисперсия будет меньше, чем в случае, когда рандомизованньлйт блок-план основан только на строках (или столбцах), а изменчивость между столбцами (или строками) включается в остаток. При небольшом числе способов обработки условие а =1 не дает возможности образования соответствую- щих реплик. Преимущества латинского квадрата можно сохранить, используя одновременно два или более квад- ратов. Так, объем эксперимента в плане 3.2 мог бы быть удвоен, если бы взять пять листьев на каждом из десяти растений, или десять листьев на каждом из пяти расте- ний, что дало бы план с двумя квадратами, расположен- ными бок о бок. Это особенно важно для случаев t= 2 и t = 3, когда для получения достаточного числа реплик и достаточного числа степеней свободы для ошибки не- обходимы несколько квадратов. Латинский квадрат существует для каждого значе- ния t. Приведем общее число квадратов различных раз- меров:  2><2... 2 3><3... 12 4><4... 576 5><5... 161280 б><6. . . 812 851 200 7><7. . . 61 479 419 904 ООО 
46 ГЛ. 3. РАНДОМПЗОВАННЫЕ БЛОКИ  Здесь перестановки букв подсчитаны отдельно: так,  ABBA BAAB  представляют собой два квадрата 2 X 2. Свойства ла- тинского квадрата, по-видимому, впервые были серьезно изучены Эйлером [137], который интересовался пере- числением решений некоторых математических голово- ломок. В процессе нахождения греко-латинских квадра- тов 6 >< 6 (§ 3.5) OH получил интересные результаты для латинских квадратов такого же и меньшего размера. В частности, он правильно определил числа стандарт- ных квадратов (т. е. квадратов, в которых в первой строке п в первом столбце длфавитгтый порядок) для квадратов со сторонами 2, 3, 4 И 5. Эти числа равны 1, 1, 4, 56. Только более чем через столетие было найдено соответствующее число для квадратов со стороной 6, равное 9408 (Тэрри, [91]). По частным задачам было опубликовано много других работ, часто неокончатель- нь1х или даже содержащих ошибочные рассуждения. Со- временные исследования статистиков берут начало от Фишера и Иэйтса [120], которые подтвердили ре- зультат Тэрри и дали систематический перечень и клас- сификацию квадратов размера 6 >< 6, а кроме того, уста- новили несуществование какого-либо греко-латинского квадрата 6 >< 6. Н о рто н [72] во введении к своей статье о квадратах 7>< 7 дал превосходный исторический об- зор. В его подсчет числа (16 927 968) стандартных квад- ратов 7 >< 7 внес поправку (16 942080) Сейд [84], а за- тем С а ксен а [83]. Метод последнего из них для весьма трудоемкой работы по перечислению является, по-види- мому, наиболее эффективным из развитых до сих пор. Ничего не известно о суммарном числе квадратов раз- мером 8 >< 8 или больше. Случайная перестан_овка строк, столбцов или буквенных символов преобразует любой латинский квадрат в новый латинский квадрат. Фишер и Иэйтс дали указания, как осуществить случайный вы- бор одного квадрата из множества квадратов любых размеров вплоть до 6 >< 6. Их правила включают слу- чайный отбор одного из множеств преобразований, в  И 
3,3. ЛАТИНСКИЕ КВАДРАТЫ 47  которые можно сгруппировать квадраты, а затем слу- чайные перестановки строк, столбцов и символов для типичного квадрата. На практике эти три перестановки достаточны лишь для исключения смещенного оценива- ния ошибки, а для квадратов, больших чем 6 >< 6, они могут применяться для получения случайного квадрата из любого конкретного квадрата без случайного отбора из множества преобразований. Если для одного экспери- мента требуется несколько квадратов, то они должны быть выбраны полностью независимым образом, если только какая-нибудь связь не вводится умышленно в качестве добавочного ограничения на эксперимент. То же самое можно сказать, если квадраты нужны для се- рии экспериментов. Важно отметить, что связь между строками, столб- цами и буквами симметрична. Латинский квадрат опре- деляет t2 сочетаний строк, столбцов и букв—свойства, которые неизменны при его различных представлениях. Например, квадрат  1 IV II III V III V IV II I II III V I IV  lTJbC3mL‘:>.  IV I III V II  означает в точности то же, что и план 3.2, но теперь он представлен так, чтобы показать, что каждое расте- ние имеет по одному листу каждого из размеров и под- вергается один раз каждому из способов обработки. Латинские квадраты оказались особенно полезными в экспериментах, связанных с урожаями в сельском хо- зяйстве, где строки и столбцы относятся к физической конфигурации маленьких участков земли. Сами участки не обязаны быть квадратными (обычно они и не имеют такой формы), но они располагаются как t строк по t участков в каждой строке. Таким путем исключается 
48 ц ГЛ. З. РАНДОМИЗОВАННЫЕ БЛОКИ  влияние на точность эксперимента каких-либо могущих повлиять на урожаи трендов в плодородии почвы, при условии, что ЭТИ тренды могут быть разложены на две ортогональные составляющие по строкам и столбцам.  3.4. Анализ эксперимента с латинским квадратом  Общая_ форма дисперсионного анализа в применении K планируемым экспериментам может быть хорошо про- иллюстрирована на примере малого латинского квадра- та. План 3.3 относится к части эксперимента (Де Л у р и [39])‚ в котором на кроликах испытывались четыре раз- личные дозы инсулина А, В, С и D, азатем сравнивалось содержание сахара в крови кроликов. При этом отдель- ные кролики сильно различались по уровням сахара в крови. Эффект инъекции инсулина, по-видимому, прохо- дит через несколько дней, что позволяет испытывать другую дозу на том же самом кролике без какого-либо осложнения от остаточных эффектов первой. Это, оче- видно, является основательным доводом для использова- ния кроликов B качестве блоков и проверки каждой дозы в различные моменты времени на каждом кролике. Од- нако вдобавок полезно включить блоковое ограничение, основанное на дне инъекции (каждый день испытывает- ся каждая доза), которое является предосторожностью против возможности того, что лабораторные условия кон- кретного дня могут влиять на всех животных в одном и том же направлении. Латинский квадрат 4 >< 4 со столб- цами, соответствующими различным кроликам, и строка- ми, соответствующими различным дням, дает возмож- ность ввести B рассмотрение оба ограничения. План 3.3 показывает такой квадрат, выбранный на- угад из 576 возможных квадратов, с множеством из 16 «урожаев», где результаты даны в мг глюкозы на 100 см?’ крови в фиксированный момент после инъекции инсулина. Для удобства расчетов в таблице выписаны суммы по строкам и столбцам и под таблицей выписаны суммы для четырех способов обработки. Нетрудно выполнить дисперсионный анализ, приве-  денный в табл. 3.2. 
3.4. АНАЛИЗ ЭКСПЕРИМЕНТА С ЛАТИНСКИМ КВАДРАТОМ 49  План 3.3  Эксперимент с латинским квадратом по проверке эффекта инсулина на содержание сахара в крови у кроликов *)  Номер кролика Номер дня Сумма 1 II III IV 1 B:47 A290 C279 D150 266 2 D246 C:74 B263 А:69 252 3 А:62 В:61 D:58 C:66 247 4 C:76 D263 /1:87 B259 285 Сумма 231 288 287 244 1050 Сумма А В С D 308 230 295 217  *) Результаты даны в мг на 100 смз крови.  Суммы квадратов для кроликов (столбцы), дней (строки) и доз (буквы) легко вычисляются; например, первая из них равна  2312 + 2882 + 2872 -+ 24 42 — 4 ><68 906,25 4 . Три классификации взаимно ортогональны, и сумму квадратов для остаточной ошибки можно найти вычита- нием. Пятипроцентньтёт уровень вероятности для диспер- сионного отношения с числами степеней свободы (3, 6) равен 4,76, так что разности между кроликами и разно- сти между дозами статистически значимы. Первая, по- видимому, не представляет самостоятельного интереса, но она подтверждает разумность использования отдель- ных кроликов в качестве блоковых ограничений. Хотя средний квадрат по дням не является существенно боль- шим, чем для ошибки, он достаточно велик, чтобы наве- сти на мысль о возможности настоящего различия И  4 д. Финни 
50 ГЛ.3.РАНДОМИЗОВАННЫЕ БЛОКИ  Т а б л И Ц а 3.2 Дисперсионный анализ для результатов плана 3.3  Поправка для 68 906,25 : среднего P��� f§§§;;;:;*;‘* o£§12eH“;iT§3§§§2?o источник СЕЁЁФ сумма Квадрата изменчивости СВО_ КВЗДРЗТОВ боды Между кроли- ‚ - 1 Хами 3 6ъ6,2) 215,4 оа-д- 3 Ева 5 2 4 5*! 2 Между днями 3 217.2 72,4 0 +—§- у Между способа- 4 ‘Ч ми обработки 3 156325 521›1 . 52+ЁЬТ2 Ошибка б 119,00 19,83 02 Сумма 15 2545,75  вместе с тем обрадовать экспериментатора, что он вь1- брал план с балансом как по дням, так и по животным. В табл. 3.3 приведены средние концентрации глюкозы и их стандартная ошибка. Мы видим, что дозы В и D уменьшают эту величину в значительно ббльшей степе- ни, чем А и С, причем разность между В и D, a также между А и С мала и лежит в пределах ошибки экспери- мента. Стандартная ошибка каждого среднего равна, конечно, 1/19,83/4.  Таблица 3.3  Средняя концентрация глюкозы в мг на 100 cm?’ крови  А В С D Станд. ошибка  77,0 57,5 73,8 54,2 12,2 
.3.4. АНАЛИЗ ЭКСПЕРИМЕНТА С ЛАТИНСКИМ КВАДРАТОМ 51  В основе этого анализа лежит предположение о том, что для общего латинского квадрата размера t><t ypo- жай ут (1, j, la = 1, 2, ..., t) для участка с Е-й обработ- кой, который оказался в столбце j И строке la, МОЖНО записать в виде  I/1j1a="]+171+l31+Y1a+3111a» (3-6)  что является очевидным аналогом равенства (3.2). Это влечет аддитивность эффектов по столбцам, строкам и способам обработки. Например, в рассматриваемом экс- перименте разности между эффектами доз должны иметь одинаковые математические ожидания для разных кро- ликов и для разных дней, если применима модель, опре- деляемая уравнением (3.6). Тогда математические ожи- дання средних квадратов для способов обработки равны  (I2 + TU‘ ET2, (3.7)  И аналогичные выражения имеют место для столбцов и строк. Если кроликов, используемых для эксперимента с инсулином, можно рассматривать как случайную вы- борку из генеральной совокупности кроликов, в которой дисперсия Величины [3 равна 0%, ТО МЗТСМЗТИЧЕСКОЕ ОЖИ- дание среднего квадрата для столбцов становится про- сто равным о2+4оЁ,  что, очевидно, есть частный случай общей формулы для математического ожидания выражения (3.7):  02 + tog. (3.8)  Математические ожидания средних квадратов также приведены в табл. 3.2. Наверное не будет слишком не- разумным мыслить подопытных животных как случай-  ный набор из лабораторной совокупности. Значит, оЁ можно оценить по формуле  215 4 — 19,8 $2 = ——r————— = 48,9.  В 4  Если бы отдельные кролики не были представлены в виде блоков и испытывалась бы только одна доза на  40 
52 ГЛ. З. РАНДОМИЗОВАННЫЕ БЛОКИ  каждом из 16 кроликов, то дисперсия ошибки возросла бы от о? до 02+0§, оцениваемых соответственно числа-  ми 19,8 и 68,7. Отношение этих чисел является мерой увеличения экспериментальной эффективности, получае- мой просто выполнением нескольких проверок на каж- дом кролике. Выгода достигается ценой увеличения дли- тельности эксперимента, ибо осуществляемые на каждом животном четыре проверки и уничтожение эффекта от предшествующей инъекции требуют дополнительного времени. Хотя разности между днями не являются ста- тистически значимыми, как это видно из табл. 3.2, ком- понента дисперсии от этого источника оценивается вели- чинои  Si: 72,44 19,_8=13,2, которую ни в коей мере нельзя считать пренебрежимой. Описанный здесь эксперимент слишком мал, чтобы дать вполне удовлетворительную информацию. Действи- тельно, это только часть эксперимента, в котором ис- пользуются 16 кроликов в четырех латинских квадратах. Суждение в целом как по кроликам, так и по дням по- казало высоко значимые разности.  3.5. Греко-латинские квадраты  Для некоторых, но не для всех латинских квадратов можно построить второй квадрат, ортогональный к пер- вому, т. е. каждая буква нового квадрата встречается не только один раз в каждой строке и один раз в каждом столбце, но также и один раз с каждой буквой первого квадрата. Экспериментатор плана 3.2 мог бы пожелать испытать одновременно прививки, произведенные пятью различными способами (ос, [3, ..., е). Он не может до- стигнуть идеального баланса с планом 3.2, но посред- ством небольшого изменения своего латинского квадра- та он может построить грека-латинский квадрат пла- на 3.4. Квадрат плана 3.3 также не имеет никакого орто- гонального к нему квадрата, 
3.5. FPEKO-JTATHHCKHE КВАДРАТЫ 53  Г1лг1н214 Греко-латинский квадрат 5><5 Размер листа Номер растения 1 2 З 4 5 1 Ар Ev .Da Сб В8 11 Ca .De Ау ВВ Еб 1П By Аб Се Ea D6 IV E8 СВ Вб Dy Aa V Об Ba ЕВ A8 Су  Если эффекты прививок и дат можно принять за про- стую добавку к эффектам растения и размера листа, то дисперсионный анализ по схеме табл. 3.4 является как допустимым, так и легко выполнимым. Таким образом, два множества способов обработки будут исследоваться одновременно в одном эксперименте. Этот способ можно принять или для того, чтобы сбалансировать первую се- рию блоковых ограничений (таких, как иметь прививки, сделанные пятью различными людьми) или чтобы вве- сти новое множество способов обработки в эксперимент, который уже находится в процессе становления, при  Таблица3А  Схема дисперсионного анализа для грекоалатинского квадрата t>< t  Изменчивость Число степеней Сумма Средний свободы квадратов квадрат Строки t-l Столбцы t-1 «iknfincxne» способы об- t-1 работки «Греческие» способьл об- t-1 работки Ошишш (t—1)(t—3) Сумма t2—l 
54 ГЛ. 3. РАНДОМНЗОВАННЫЕ БЛОКИ  условии, что нет никакого взаимодействия между двумя множествами способов обработки. Не все латинские квадраты могут быть переделаны в греко-латинские (для t= 4 —-TOJIbKO 1/4 всех квадра- тов, а для t= 5--TOJIbKO 3/28), но если If нечетно или кратно четырем, то легко построить примеры греко-ла- тинской конфигурации (Фишер и Иэйтс [121]). При выборе латинского квадрата для эксперимента это огра- ничение следует принимать во внимание, если может оказаться желательным последующее включение другого фактора. Еще со времен Эйлера высказывалось предпо- ложение, что нельзя построить никакого греко-латин- ского квадрата для t = 4u + 2, где и — целое число. Это, очевидно, для t= 2, a для tn 6 было доказано с по- мощью исчерпывающего перебора (Фишер и Иэйтс [120]). Хотя общее доказательство не удавалось многим из искавших его, Л а к ш м и н а р а й а H [68] доказал не- возможность греко-латинских квадратов для некоторых классов латинских квадратов с t= 4u + 2, именно для тех классов, которые специальным образом связаны с таблицей умножения для конечной алгебраической груп- пы. Недавно предположение было опровергнуто: в апре- ле 1959 г. Бозе, Паркер и Шрикхэнд представили в Аме- риканское математическое общество статью, в которой они предложили конструкцию греко-латинских квадра- тов для z‘= 10, 22 и 50 (New York Times OT 26 апреля 1959 г.). Решение проблемы почти двухсотлетней давно- сти является замечательным достижением, методы кото- рого несомненно оживят интерес к этому увлекательно- му предмету (Бозе и Шрикхэнд [15], П а р кер [73]).  3.6. Ортогональные квадраты более высокого порядка  Для некоторых латинских квадратов могут быть по- строены дополнительные ортогональные квадраты, по- зволяющие записать все (t— 1) множеств из t символов таким образом, что каждый символ будет встречаться один раз в каждой строке, один раз в каждом столбце и один ра3 с каждым символом из всякого другого мно- жества. План 3.5 показывает такой квадрат для t= 4. Первая цифра каждого трехзначного числа обладает 
3.6. ОРТОГОНАЛЬНЫЕ КВАДРАТЫ 55  План 35  ITOHHOCNMO ортогонализованный квадрат 4><4  111 '222 333 444 234 143 412 321 342 431 124 213 423 314 241 132  (г:  свойством латинского квадрата, так же как и вторая и третья. Кроме того, Цифра 1 из первого множества встре- чается только один раз с каждой из цифр 1, 2, 3, 4 вто- рого множества и один раз с цифрами 1, 2, 3, 4 третьего множества. Читатель может проверить, что к плану 3.4 можно добавить два дополнительных множества таким образом, что образуется полностью ортогонализованный квадрат 5 >< 5. Для любого простого числа полностью ортогонализованный квадрат может быть построен сле- дующим образом. В качестве первой строки берутся чис- ла 1, 2, 3, ...‚ 2,‘, каждое из которых повторяется (t ——— 1) раз, для того чтобы образовать 1.‘ составных элементов строки. Последующие строки для первого «алфавита», или множества символов, получаются циклическими пе- рестановками первой строки со сдвигом на один шаг вперед и для других алфавитов—циклическими пере- становками со сдвигом соответственно на 2, 3, 4, ��� ..‚ (z‘——— 1) шагов вперед. Таким образом, для квадрата 5 >< 5 первая строка состоит из чисел 1111, 2222, 3333, 4444, 5555. Первым элементом второй строки является число 2345, за которым следует число 3451 и другие циклические перестановки в этой строке. Первыми эле- ментами оставшихся строк являются числа 3524, 4253, 5432, причем каждая строка снова дополняется цикличе- ской перестановкой. Предлагаем читателю выписать этот квадрат полностью и, освоив метод построения, по- строить самому квадрат 7 >< 7. Полностью ортогонали- зованные квадраты можно также строить, когда t— лю- бая степень простого числа (Бозе [10], Стивенс [87]). Очевидно, эти квадраты можно использовать при дальнейшем обобщении идей § 3.5, дающем возможность 
55 гл. з. РАНДОМИЗОВАННЫЕ влоки  балансирования относительно большего числа источни- ков изменчивости или одновременной проверки большего множества способов обработки. Однако они не часто используются для Этих целей из-за того, что наложение различных ограничений, соответствующих различным се- риям разбиений на блоки в соответствии с высоким по- рядком ортогонального квадрата, может оказаться не- осуществимым, и возможность испытания различных множеств способов обработки лимитируется необходи- мостью предполагать, что разности, обусловленные од- ним множеством, независимы от разностей, обусловлен- ных другим. На языке гл. 4 два фактора не должны иметь какого-либо взаимодействия. Это станет более яс- ным из гл. 4 и 5. Тем не менее ортогональные квадраты представляют интерес, как прямой из-за их комбинатор- ных своиств, так и в качестве связующего звена между латинскими квадратами, дробными репликами и сбалан- сированными неполными блоками (§§ 5.14 И 6.8).  3.7. Ортогональные разбиения латинских квадратов  Рассмотренные в §§ 3.5 и 3.6 системы ортогональных квадратов можно считать примерами более общего типа подразбиения ячеек латинского квадрата, так как они основаны на крайних разбиениях числа t. B теории раз- биения символ  (plalj p2a2, pg3, о о о) используется для обозначения разбиения или подразбие-  НИЯ t=Zap  объектов на а, различных множеств из р1 объектов, a2 различных множеств из р2 объектов, a3 различных мно- жеств из p3 объектов и т. д., где все р, и все а, — поло- жительные Целые числа. Таким образом, любая группи- ровка 11 объектов на два отдельных объекта, три пары и тройку была бы разбиением типа (12, 23, 3). Для ла- тинского квадрата t><t возможно подразбиение ячеек, обеспечивающее одновременные разбиения строк, столб- 
3.7. ОРТОГОНАЛЬНЫЕ РАЗБИЕНИЯ 57  цов и букв, и обладающее определенными свойствами баланса и ортогональности. Греко-латинский квадрат представляет собой ортого- нальное разбиение типа (Н) латинского квадрата t><t B том смысле, что он определяет t различных множеств букв таких, что одна буква лежит в каждой строке и одна — в каждом столбце. Даже для латинских квадра- тов, для которых это невозможно, могут существовать менее крайние ортогональные разбиения. Квадрат 4><4‚ изображенный в виде плана 3.3, не имеет никакого гре- ческого решения. В плане 3.6 показан такой же квадрат с восемью буквами А, В, С, D,  и А,‚ В,‚ С,‚ D1. Индекс 1 встр_е- План 3.6 чается два раза при каждом из Ортогональное разбиение букв алфавита, два раза в каж- тИПа (22) Латинского дом столбце и два раза в каждой Квадрата 4 X 4  3.3 строке. Это есть ортогональное ИЗ Плана  разбиение типа (22). Существуют  различные разбиения квадратов B1 А C1 D 5 >< 5. D C1 B An Больший интерес представляет A1 B DI C существование разбиений для C D1 А B1  квадратов 6 >< 6. В плане 3.7 при- ведено разбиение (32) латин- ского квадрата 6 >< 6, которое можно было бы использоч вать для включения дополнительного способа обработки только с двумя уровнями или ограничения на блок с тремя участками для каждой обработки в каждом блоке.  План 3.7  Ортогональное разбиение типа (За) латинского квадрата 6 >< 6  В, E D1 F С, А Р, В, C А D E1 A1 С, F B1 Е D C А Е, D1 Р, В D F B E1 А, С, Е D1 А, С В Р, 
58 гл. з. РАНДОМЪХЗОВАННЫЕ Блоки  План 3.8 показывает самое крайнее разбиение из су- ществующих, именно разбиение типа (14, 2), в котором индексами 1, 2, 3, 4 отмечены четыре директрисы (одна буква каждого типа в каждой строке и в каждом столб- це). Комбинируя некоторые части плана 3.8, можно об- разовывать другие разбиения, как, например, (13, 3), (23), (2, 4), (32) (Ф и н н И [96], [98], [99]).  План 3.8  Ортогональное разбиение типа (14, 2) латинского квадрата б X 6  А, в C B3 А, F Е, Е, с C D2 A В, F3 Е, D F. E Е, с, в, Е ‚42 D F2 E в, с, в A3  Ортогональные разбиения латинских квадратов имеют ограниченное применение в экспериментировании, но иногда они дают путь к преодолению трудностей. Са- мой очевидной ситуацией является ситуация эксперимен- та, спланированного как латинский квадрат 6 >< 6, в ко- тором оказывается желательным наложение некоторого третьего ограничения. Если бы, например, эксперимент, описанный в § 3.4, включал более трудоемкие лабора- торные методы, то выполнение изхиерений над четырьмя кроликами за каждый день инъекции могло бы стать слишком тяжелым для одного человека. Если бы при этом можно было считать, что субъективные различия в искусстве измерения или колебания в методах проведе- ния опыта влияют на результаты эксперимента (что вполне могло бы иметь место в экспериментальной про- цедуре, менее стандартизованной, чем определение ко- личества сахара в крови), то могло бы оказаться жела- тельным балансирование по нескольким различным ра- бочим. Для четырех способов обработки этого можно было бы достигнуть использованием вместо плана 3.3 латинского квадрата 4 >< 4, для которого существует гре- 
3.7. ОРТОГОНАЛЬНЫЕ РАЗБИЕНИЯ 59  ческое решение, и распределением обязанностей между четырьмя рабочими в соответствии с греческими буква- ми. Однако для этого же опыта с шестью различными дозами инсулина отсутствие греко-лагинских квадратов 6 >< 6 привело бы к принятию в точности аналогичной схемы. Вместо этого можно было бы использовать раз- биение (23) латинского квадрата 6 >< 6, приписав с его помощью по два животных к каждому из трех рабочих на каждый день инъекции, или разбиение (14, 2), при- писав по одному животному к каждому из четырех ра- бочих и два животных к пятому. Другое применение мы встречаем, когда объекты, соответствующие эксперимен- тальным участкам, сравнительно дефицитны и должны использоваться более чем в одном эксперименте, не- смотря на возможность неполного Исчезновения к мо- менту второго опыта эффектов способов обработкирис- пользованных в первом. Например, сельскохозяйствен- ные научно-исследовательские институты часто строго ограничены в отношении земли, пригодной для полевых опытов, и площадку, на которой проводился один экспе- римент, приходится использовать снова через год или два. Если первый эксперимент проводился по схеме ла- тинского квадрата на площадке, выбираемой таким об- разом, чтобы имеющаяся разница в -плодородии почвы от севера к югу, а также от востока к западу была сба- лансирована по способам обработки, а впоследствии исключена, то могут иметься веские основания пожелать сделать это же и во втором эксперименте. Однако про- стой случайный выбор нового латинского квадрата, ве- роятно, оставил бы новые способы обработки несбалан- сированными относительно предшествующей истории участка: если бы продолжал существовать какой-нибудь эффект старых способов обработки, то заключения о но- вых способах обработки могли бы стать хуже по суще- ству по той же причине, что и при проверке тканей, рас- смотренной в начале § 3.1. Если бы на первоначальном латинском квадрате можно было построить греко-латин- ский квадрат, то его можно было бы использовать для новых способов обработки, но эти квадраты сравнитель- но редко существуют, и если`только эту возможность Не учесть при планировании первого эксперимента, это 
60 ГЛ. З. РАНДОМИЗОВАННЫЕ БЛОКИ  можно потом оказаться перед тем фактом, что таких ква- дратов просто нет. Тогда ортогональные разбиения исход- ного квадрата, имеющиеся в гораздо большем количестве, могут дать благоприятную возможность использовать площадку для эксперимента с меньшим числом способов обработки, чем в первом эксперименте (см. ё 7.3). Статистический анализ квадратов с ортогональным разбиением не представляет никаких трудностей. Дис- персионный анализ аналогичен анализу, данному в табл. 3.4, но «греческие способы обработки» имеют меньше (t—1) степени свободы, а «ошибка» соответ- ственно больше. Сумма квадратов для «греческих спосо- бов обработки» будет вычисляться, как в равенстве (2.8), при этом каждое гр будет соответствующим крат- ным 2‘, и стандартные ошибки средних значений способов обработки вычисляются с учетом числа повторенных участков для каждого способа обработки в отдельности. Кемпторн ([52], ё 19.6) правильно обратил внимание на возможность того, что в условиях модели рандоми- зации (см. ё 2.4) квадраты с ортогональным разбиением могут не обеспечивать несмещенных критериев значимо- сти. Если выбор разбиения, как это часто бывает, огра- ничивается специального типа латинским квадратом, то такое смещение может встретиться, однако ничего не известно о том, что случится, если квадрат с разбие- нием может быть выбран случайным образом без огра- ничения, за исключением значения 2‘. B нормальной мо- дели смещение исчезает, и по-видимому, оно не является главным практическим возражением против использова- ния таких планов. Число латинских квадратов, обладающих этими раз- биениями, очень велико. Например, все латинские ква- драты 6 >< 6 имеют разбиения (23), и 12 из 17 множеств преобразований, на которые Фишер и Иэйтс [121] разделили квадраты 6 >< 6, охватывающие 95 процентов всех квадратов, имеют разбиения (32). С другой сторо- ны, только три множества и три процента квадратов имеют разбиения типа (14, 2). Полное перечисление бо- лее общих разбиений не выполнено, так как некоторые весьма многочисленны. Квадраты с большим числом  множеств преобразований имеют по крайней мере 200 
3.7. ОРТОГОНАЛЬНЫЕ РАЗБИЕНИЯ 61  различных разбиений (23), и хотя бы в одном множестве преобразований имеются по крайней мере 976 различных разбиений типа (1, 2, 3) для каждого квадрата. Лак- ш М и н а р а й а н [68] недавно исследовал эти свойства и получил некоторые общие результаты. Ортогональные разбиения высокого порядка для квадратов 6 >< 6 известны, хотя они, по-видимому, встре- чаются гораздо реже. Например, план 3.9 показывает два взаимно ортогональных разбиения (13, 3) некоторого квадрата 6 >< 6 с помощью маленьких букв и цифр.  План 3.9  Два взаимно ортогональных разбиения типа (13, З) латинского квадрата 6 >< 6  Aal Bd2 Cb4 Dc4 Ed3 Fd4 Bd4 Ca3 Fd2 Ad4 Dbl Ес4 Cd4 F134 Bcl Ea2 Ad4 Dd3 Dd2 AC4 Ed4 Bb3 Fa4 Cdl Eb4 Da'4 Ad3 Fdl CC2 Ba4 Fc3 Edl Da4 Cd4 Bd4 A122  Это невозможно для разбиений (14, 2). Можно было бы надеяться на то, что следующим этапом по сравнению с полностью ортогонализованным квадратом 6 >< 6 было бы построениемножества из четырех взаимно ортого- нальных разбиений (23), HO возможно это или нет, неиз- вестно. 
Глава 4  ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  4.1. Факторный принцип  Большинство авторов в области планирования экспе- риментов подчеркивают преимущества включения в один и тот же эксперимент различных комбинаций нескольких факторов. Эта идея вкратце уже упоминалась в § 1.4. Независимо от того, чем занимается исследователь— чистой наукой или изучением технологии-на каждом этапе своей работы он, по-видимому, заинтересован в исследовании влияния отдельных факторов, каждый из которых он может изменять по своему желанию. Физио- лог может изучать реакцию человеческого тела на рабо- ту при высокой температуре, в частности, в зависимости от количества или типа одежды; «работу» при этом можно определить как выполнение некоторого стандарт- ного задания (подъем в гору, прыжки, езда на велоси- педе) в течение определенного времени. Тогда <<уро- жаем» для него может быть любая из многочисленных величин, доступных измерению: частота пульса, темпера- тура тела, скорость потоотделения или какая-нибудь более субъективная оценка расхода физических сил. Исследователь не только заинтересуется сравнением средних значений указанных величин для субъектов с различными состояниями одежды, но и пожелает узнать что-нибудь о связи этих величин с другими факторами, такими, как возраст и пол субъекта, температура, влаж- ность или характер стандартного задания. Здесь иссле- дователь, очевидно, занимается изучением соотношения между урожаем и уровнем или состоянием каждого фактора: он должен осознать это заранее и планировать эксперимент, имея в виду всю совокупность своих наме- рений-Несомненно, ему нужно испробовать много раз- личных комбинаций уровней факторов. Он может пред- ложить использовать каждого исследуемого только в 
4.1. ФАКТОРНЫЙ ПРИНЦИП 63  одном опыте, идти же необходимость ограничиться не- большим числом добровольцев, а также соображения эффективности эксперимента могут вынудить его плани- ровать целую последовательность опытов для каждого исследуемого субъекта. В последнем случае может воз- никнуть надобность в регулировании последовательности для различных испытуемых при помощи латинских квадратов или аналогичных схем (см. §§ 7.4, 7.5). Дей- ствительно, если изучается субъективный результат ра- боты, эксперимент особенно трудно осуществлять из-за специфики человеческой памяти и сложных путей, по которым реакция субъекта на определенный набор усло- вий зависит от его предшествующего опыта. Эта про- блема лежит вне сферы данной книги. Эта и следую- щая главы посвящены вопросам выбора расположения комбинаций факторов в эксперименте. В других обстоятельствах целью эксперимента мо- жет быть определение такой комбинации ряда факто- ров, которая максимизирует урожай. Например, иссле- дование глубоководных рыбных промыслов может при- вести к определению оптимальных условий хранения определенных пород рыбы. Среди факторов, которые могут варьироваться, в этом случае могут быть темпе- ратура хранения в море между выловом и прибытием в порт, продолжительность хранения в море, температу- ра хранения при транспортировке от порта до оптовой базы или торговца и метод упаковки (тип контейнера, пропорция льда и рыбы и т. д.). «Урожаем» будет мера качества рыбы в конце путешествия. Экспериментатор, отыскивающий оптимальную комбинацию всех этих факторов, может начать работу, экспериментируя с единственным фактором А (например, температурой хранения в море); для того чтобы сделать это, он дол- жен взять опытную партию рыбы при определенных со- стояниях всех остальных факторов В, С, ���� Найдя оп- тимальную температуру, он может затем взять следую- щий фактор В (например, метод упаковки) исравнивать альтернативы относительно этого фактора, конечно, ис- пользуя оптимальную температуру, полученную в его первом эксперименте. Однако если наилучший метод 
64 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛНКИ  упаковки окажется отличным от использованного в ка- честве стандартного в первом эксперименте, то возни- кает сомнение, является ли теперь найденный фактор А подходящим при вновь рекомендованном факторе В. Третий эксперимент только над фактором С может сно- ва спутать предыдущие результаты, если только первые два эксперимента не проведены на уровне С, который теперь оказался наилучшим. Если экспериментатор не очень счастлив, то он будет перебирать каждый фактор по нескольку раз в новых экспериментах, прежде чем сможет получить какой-нибудь вывод. В лабораторных исследованиях, в которых наблюдения могут быть про- изведены быстро, получающаяся задержка может быть несущественна, но даже в этом случае такая процедура может оказаться неэкономичной (ср. § 8.4). Что же ка- сается таких исследований, где требуется длительный период для получения результатов одного эксперимента, то здесь прогресс был бы недопустимо медленным, если бы оптимальные условия исследовались посредством экспериментов каждый раз только над одним фактором и- если бы результаты, полученные из одного экспери- мента, требовали бы повторения опытов над уже изученными факторами. Именно такими, очевидно, яв- ляются сельскохозяйственные исследования, в которых обычно один опыт должен продолжаться Целый год. Та- ким образом, не является неожиданным то обстоятель- ство, что стимулом развития теории планирования экс- периментов, позволяющей одновременно изучать влия- ние различных факторов, послужило сельское хозяйство. Если величина влияния изменений в уровне отдель- ного фактора зависит каким-то образом от уровней остальных факторов, то этот факт не может быть уста- новлен — и тем более не может быть измерена его важ- ность пока не испытаны различные комбинации уров- ней факторов. Целью эксперимента может быть просто сравнение урожаев при широком диапазоне условий или оценка оптимальных условий (поскольку даже некото- рое знание изменений урожая при слабом отклонении условий от оптимальных часто имеет практическое зна- чение). Во всяком случае независимо от цели экспери- мента целью статистика должно быть планирование 
4.2. ПЛАНИРОВАНИЕ ТИПА 2" 55  эксперимента с самого начала для изучения достаточ- ного набора комбинаций уровней факторов, а не слепая надежда на случайное накопление очевидностей, доста- точных для возможных интерпретаций.  4.2. Планирование типа 2"  Наиболее простым факторным экспериментом яв- ляется эксперимент, включающий n факторов, каждый из которых имеет два уровня. Эти факторы могут быть обозначены буквами А, В, С, ..., а соответствующие маленькие буквы можно использовать как символы для обозначений 2" комбинаций факторов. Для фактора, у которого очевидно, что один уровень «выше» другого (как, например, при сравнении двух температур или двух доз одного и того же лекарства), присутствие бук- вы условно обозначает высокий уровень, а отсутствие —— низкий уровень, для фактора, не имеющего такой осо- бенности (например, при сравнении двух альтернатив- ных методов производственного процесса или двух вза- имно исключающих лекарств), один уровень условно должен быть взят как «более высокий», тогда ade озна- чает способ обработки, состоящий из_комбинаций верх- них уровней факторов ADE с нижними уровнями фак- торов В, С и т. д. По причине, которая станет ясной из даЛЬНеЙШеГО‚ цифра <<1>> будет использоваться для ком- бинации нижних уровней всех факторов. Символ «А» также используется для обозначения главного эффекта фактора А—средней разницы в урожае между всеми способами обработки, содержащими а, и всеми способа- ми *), He содержащими а. Дополнительно к главным эффектам можно опреде- лить и измерить много типов взаимодействия между эф- фектами факторов. Например, АВ, двухфакторное взаи- модействие, равно половине разности между главным эффектом фактора А при верхнем уровне фактора В и при нижнем уровне фактора В; записывая это в соот- ветствующих символах, легко видеть, что эта величина  *) Далее в термине «способ обработки» слово «обработки» опускается в тех случаях, когда это не вызывает недоразумений.- Прим. ред,  5 Д. Финни 
66 ГЛ, 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  симметрична относительно а и Ь, и в действительности она является разностью между средними по всем ком- бинациям способов обработки, содержащих либо а и Ь, либо ни а, ни Ь, и средними по всем комбинациям спо- собов, содержащих только одно из а или Ь. Аналогично трехфакторное взаимодействие можно определять как половину разности между двумя измерениями двухфак- торного взаимодействия, полученными при двух уровнях третьего фактора. Таким образом, трехфакторное взаи- модействие АВС есть половина разности между АВ при верхнем уровне фактора С и АВ при нижнем уровне фактора С, оно сводится к разности между средними для всех способов, содержащих либо все три буквы а, Ь, с, либо только одну из них, и средними для всех спо- собов, содержащих точно две из указанных букв или ни одной из них. Аналогично ACDEF—- пятифакторное взаимодействие, представляет собой разность между средними для способов обработки, содержащих либо все буквы а, с, d, e, f, либо точно три из них, либо точно одну из них, и средними для способов обработки, содер- жащих либо четыре из указанных букв, либо две из них, либо ни одной. Если каждый символ в способе обработ- ки рассматривать- как средний урожай с участка в дан- ном способе, то приведенные выше утверждения можно записать символически в следующей форме:  2”“/1=(a——1)(b+ 1)(с+ 1)(d+l)..., 2”'1AB=(a——1)(b-—1)(c+1)(d+1)..., 2”"1ACDEF=(a—- 1)(b+1)(c—— 1)(d—— 1) >< ><(6—1)(f- 1)(§+1)-  B этом выражении каждый сомножитель справа, для которого слева нет соответствующей буквы, имеет знак +, при этом выражения должны перемножаться в соот- ветствии с правилами обычной алгебры, и, таким обра- зом, можно численно интерпретировать рассматривае- мые символы. Учитывая, что все способы обработки одинаково повторимы, п главных эффектов, n(n— 1)/2 двухфакторных взаимодействий, n(n —— 1) (н — 2)/6 трех-  (4.1) 
4.3. ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ 67  факторных взаимодействий и т. д. образуют 271“ взаим- но ортогональных контрастов и потому определяют полное разбиение степеней свободы между способами обработки.  4.3. Факторные эксперименты  Любой эксперимент, в котором способы обработки состоят из комбинаций уровней двух или более различ- ных факторов в духе § 4.2, И его очевидные обобщения (которые будут рассмотрены позднее) будут называться факторными. Такой факторный набор способов обра- ботки «может быть представлен как вполне рандомизо- ванный план или в виде блок-плана такого, как рандо- мизованные блоки, или же в виде латинского квадрата. Эксперимент, который рассматривался в § 3.4, конечно, является факторным, там имеются два инсулиновых препарата (А, В и С, D) И сравнение низкой и высокой доз (А и С— низкие дозы, В и D— высокие). В соот- ветствии с определениями (см. равенства (4.1)) основ- ные эффекты разницы препаратов (Р) и разницы коли- честв (Q) И взаимодействие этих эффектов оцениваются  K8K I  2‘ Q = ё (77‚0 - 57,5 + 73,8 — 54,2) = 19,5,  Р = (77‚0 + 57,5 -— 73,8 -— 54,2) = 3,2,  (77‚0 - 57,5 — 73,8 + 54,2) = 0,0.  IO]-—  PQ=  Стандартная ошибка каждой из этих величин равна 2,2. Ясно, что статистически значим только главный эффект дозы. Более того, для каждого из Р, Q, PQ B диспер- сионном анализе может быть рассмотрен квадрат с од- ной степенью свободы. Для Р, например,  (308 ‘Г 230” “$295 + “"2 -— 68,90625 = 42,25,  для Q ’  (308 д“ 295’”‘;‘23° + т” - 68,9О625 = 1,521o0.  5* 
68 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  вычитание этих двух величин из компонент для спосо- бов обработки в табл. 3.2 дает остаток для PQ, здесь случайно равный нулю. Таким образом, сумма квадра- тов для способов обработки, полученная раньше, может быть разделена на три компоненты с различным значе- нием, которые можно исследовать отдельно по их важ- ности; конечно, появление нуля для квадрата PQ —— слу- чайность, являющаяся следствием округления исход- ных наблюдений. Сравнение этих трех компонент со средней квадратичной ошибкой в табл. 3.2 делает ясным, что только уровень дозы (Q) имеет статистиче- ски значимый эффект на содержание сахара в крови, — заключение, которое уже очевидно из ё 3.4. Это разбие- ние суммы квадратов дает еще один пример общей тео- рии из ё 2.1. По существу тот же тип анализа и вычислений мо- жет быть принят в случае, когда факторы имеют более двух уровней. В ё 1.4 упоминалось исследование. в ко- тором производство на определенном периоде процесса можно вести при любой из трех температур, используя любой из четырех количественных вариантов затрат сырья и фиксируя температуру для одного из двух воз- можных периодов. Это 4 >< 3 >< ЕЗ-факторная схема. Та- кой эксперимент может быть приведен к шести рандо- мизованным блокам, причем блоком является неделя, в течение которой выпускается партия продукта при лю- бой из 24 возможных комбинаций способов. Урожаем может быть одно измерение (прочности, срока службы, цвета или других свойств) каждой из 6 >< 24 партий. Дисперсионный анализ производится просто (табл. 4.1). Первый шаг состоит в анализе полной суммы квадратов отклонений по компонентам для блоков, способов обра- ботки (23 степени свободы) и ошибки точно так же, как при обычном рандомизованном блок-плане. В соответ- ствии с общей теорией, изложенной в ё 2.1, компоненты способов могут быть разделены на 23 отдельных квад- рата для отдельных и взаимно ортогональных контра- стов. Однако во многих случаях достаточно плана табл. 4.1. Урожаи классифицируются по температуре и вычис- ляются результаты в группах из 48 урожаев безотноси- 
4.3. ФАКТОРНЫЕ эксперименты 59  Таблица 4.1  Форма дисперсионного анализа для 4 >< 3 >< 2-факторного эксперимента В РЗНДОМИЗОВЗННЫХ блоках  Источник изменчивости (ЗЗЪЁПОЁЁ КВЁЁЁДЁТЁВ ЕЕЁЁЁЁЁ Блоки 5 Температуры (Т) 2 Количества (Q) 3 Периоды (Р) 1 ТО 6 TP 2 QP 3 TQP 6 Способы обработки 23 Ошибка 115 Сумма . . . . 143  тельно к количеству сырья и периоду. Затем исполь- зуется равенство (2.8) для нахождения суммы квадратов для температур с (3—1) степенями свободы основного Эффекта фактора Т. Аналогичные вычисления прово- дятся для четырех групп из 36 урожаев, классифици- руемых по количеству сырья, и для двух групп из 72 уро- жаев‚ классифицируемых по периоду. При классифика- ции урожаев одновременно по температуре и количеству сырья образуется 12 групп по 12 урожаев. Сумма квад- ратов с 11 степенями свободы, Вычисляемая согласно формуле (2.8), должна содержать в качестве компонент суммы квадратов для Т и О, а остаток после их вычита- ния есть компонента с (З——1)><(4—1) степенями свобо- ды для взаимодействия между Т и Q. Аналогичные вы- числения делаются для взаимодействий ТР и ОР _и окончательное вычитание всех других компонент спосо- ба из суммы с 23 степенями свободы дает компоненту для взаимодействия ТОР с (3—1)><(4—1)><(2—-1) сте- пенями свободы. В некоторых экспериментах возможны другие способы вычислений—- более быстрые или осно- ванные на каких-либо других соображениях, но то, что было описано, представляет собой общий МШОД, 
70 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  допускающий распространение на любое число факто- ров с любым числом уровней. Приведенный выше анализ излагался как иллюстра- ция вычислительной техники многофакторного экспери- мента с отностельно простым планом. Не высказыва- лось никаких сомнений в том, что план идеален для за- дач, намечаемых к исследованию. Обсуждение этого вопроса бесполезно без более детальной информации о знаниях, имеющихся у экспериментатора до опыта, и о целях опыта, но, во всяком случае, у читателя, кото- рый изучит гл. 9, появятся сомнения относительно опти- мальности этого плана. Одно из свойств хорошо спланированного фактор- ного эксперимента, которое, вероятно, особенно привле- кательно для нестатистика, состоит в том, что часто простое усреднение результатов и систематизация их в табличной форме может выявить глубокие особенности результатов без вычисления дисперсий и стандартных ошибок. Я уже ссылался (Финни [105], § 6.3) на экс- перименты (К ал M ус [50]) с питательной средой, кото- рая должна быть использована для культивирования мошки Drosophila melanogaster-— вид фруктового вре- дителя, генетическое изучение которого так много дало для развития всей генетики. Широко рекомендованная питательная среда состояла из агар-агара, тростнико- вого сахара и виннокаменной кислоты с небольшим ко- личеством каждой из пяти обычных солей—магния, кальция, аммония, калия и натрия. Эксперимент касал- ся влияния включения каждой соли: было 3 >< 24 воз- можных опытов, в которых сопоставлялись отсутствие и два возможных количества фосфата калия и отсутствие и наличие остальных четырех солей. «урожаем» было число выращенных летающих насекомых, а <<участ- ком>>—стандартная единичная культура; использова- лись четыре участка каждой из 48 комбинаций способов обработки. Простое усреднение результатов показало. что «урожай» был незначительным, если отсутствовал либо фосфат калия, либо сульфат аммония, и следовало сосредоточить внимание на оставшихся 16 комбинациях, дающих ощутимые числа. Средние для этих 16 комби- наций показали последовательно, что сегнетова соль 
4.3. фАкторньтв ЭКСПЕРИМЕНТЫ 71  очень вредна (сернокислый Магний полезен, а хлорат кальция не дает заметного эффекта). Все эти выводы можно сделать при разумном рассмотрении получающих- ся цифр без каких-либо премудростей статистического анализа, и постоянство результатов при повторении опы- та не оставляет сомнения в его справедливости. Но для того чтобы более тщательно проверить среднюю выгоду, получающуюся при использовании высокого уровня со- держания фосфата калия по сравнению с низким уров- нем, и для того чтобы оценить доказательность вывода о том, что эта выгода получается только тогда, когда при- сутствует сернокислый магний, желательно прибегнуть к дисперсионному анализу и формальному критерию зна- чимости. Тем не менее экспериментатор, который будет впредь выбирать состав питательной среды для выра- щивания культуры на основе приведенного простого об- суждения, не будет слишком грешить против истины. Даже статистик, хотя он, по-видимому, не так стра- шится сложностей дисперсионного анализа, может этим методом успешно сделать быструю предварительную оценку результатов. Дойдя же до стадии написания от- чета, он будет приветствовать простоту, с которой мож- но сделать таблицы средних, живописующих историю факторных экспериментов, которая и так всем ясна без обращения к помощи корректировок и интерполяций, хотя и законных теоретически, но кажущихся подозри- тельными читателю —- He статистику! Для того чтобы сдержать неумеренный энтузиазм по поводу факторного планирования, нужно осознать, что даже при небольшом числе факторов полное число ком- бинаций велико. Часто основным лимитирующим факто- ром планирования эксперимента является полное число участков, которые можно использовать, поскольку их количество, вероятно, приблизительно пропорционально цене, или времени, или усилиям. Другое важное обстоя- тельство—-желательность сохранить блоки разумно не- большими и однородными; «разумность» здесь, по-види- мому, зависит от наименьшего числа животных, полу- чающихся в одном помете, или от числа циклов полнои последовательности операций и измерений, которые мо- жет выполнить за один день один человек, или от 
72 ГЛ. 4. ФАКТОЁНЫП ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛНКН  вместимости одной кормушки в инкубаторе. Нуждается в рассмотрении возможность проведения экспериментов над многими факторами при умеренном числе участков и без введения блоковых ограничений, так что размер блока может быть меньше, чем полное число комбина- ций факторов. Первый шаг состоит в обсуждении воз- можности объяснения экспериментов, проводимых в единичной реплике. Затем для дальнейшего уменьшения полного числа участков следует рассматривать дробную реплику, а для уменьшения размера блока—смешива- нив. Эти два действия тесно связаны математически и одно может быть представлено как развитие другого. Отчасти изо-за того, что для читателя незнакомого ни с одним из этих понятий, понятие дробной реплики может показаться проще, отчасти для того, чтобы дать изло- жение, отличное от принятого в большинстве книг, здесь сначала будет введена дробная реплика, а смешивание будет отложено до гл. 5. Исторически, однако, смешива- ние возникло первым, и это понятие до сих пор много важнее в практике экспериментирования.  4.4. Единичная реплика  Когда уровни фактора выражены количественно (различные количества, время, температура и т. д.)‚ полную зависимость урожая от факторов дает много- мерная регрессия. В планах типа 2" при умеренном чис- ле уровней р-факторное взаимодействие приблизитель- но пропорционально производной р-го порядка функции регрессии по каждой из р включенных переменных, и его влияние будет уменьшаться при возрастании р, во всяком случае если уравнение регрессии приближенно полиномиальное. Если уровни качественно различны, то это не всегда имеет место, но опыт показывает, что взаимодействия высокого порядка оказывают обычно незначительное влияние, по крайней мере, если альтер- нативные уровни не настолько отличаются, чтобы поро- дить эффект противоположного характера. В дисперсионном анализе пренебрежимое взаимодей- ствие будет иметь средний квадрат, практически равный квадрату средней ошибки. Следовательно, эксперименты 
4.5. ДРОБНАЯ РЕПЛИКА 73  МОГУТ бЫТЬ СПЛЗНИРОВЗНЫ С ЕДИНСТВВННЫМ УЧЗСТКОМ ДЛЯ  каждого способа обработки, причем для оценки ошибки,  .могут быть использованы средние квадраты взаимодей- ствий высоких порядков. Планирование типа 25 имеет 22 степени свободы для 4-‚ 5-, б-факторных взаимодей- ствий. В единичной реплике 64 участков контрасты для этих взаимодействий могут быть изолированы и их квад- раты добавляются для того, чтобы получить сумму квадратов, откуда можно вычислить среднюю квадрати- ческую «ошибку». При желании из ошибки могут быть выделены одно или два четырехфакторных взаимодей- ствия, которые представляют особый интерес. Допусти- мо не только это. Часто лучшим планированием экспе- римента является планирование, «насыщенное» факто- рами (§ 9.3). Экспериментатор, желающий изучить пять факторов каждый на двух уровнях с точностью, кото- рую можно получить от 64 участков, может включить добавочный фактор (и таким образом, иметь реплику типа 26 вместо двух реплик типа 25) без потери точно- сти по сравнению с пятью факторами. Только человек, полностью лишенный воображения, затруднился бы в выборе добавочного полезного фактора. На первый взгляд может показаться, что эти замечания о насыщен- ности противоречат уже сказанному о достоинствах вве- дения блоков (§§ 3.1, 3.2), но в гл. 5 (особенно в §§ 5.7, 5.15) эти противоречивые интересы будут согласованы.  4.5. дробная реплика  Возможно, является неожиданным, что использова- ние одного участка для каждой комбинации уровней факторов не лимитирует числа факторов, которые мож- но включить в эксперимент умеренного размера. Экспе- риментатор, интересующийся двумя уровнями каждого из п факторов, может са.м выбрать комбинации, напри- мер, всего q комбинаций, где с] < 2", и выполнять экспе- римент c одним участком для каждой из этих комбина- ций. Полное описание Влияния п факторов на урожай должно содержать (2"--1) параметров (за исключе- нием генерального среднего), которые некоторым обра- зом представляют все различия между возможными 
74 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  комбинациями, в точности как в Модели, описанной в § 2.3, с i=2". Если имеются в распоряжении данные только для q комбинаций, стандартные методы теории наименьших квадратов позволят оценить набор не более чем из (q——l) параметров или независимых линейных функций параметров, и в этом случае даже не останется степеней свободы для оценивания ошибки эксперимен- тов. Единственный выход из этого тупика, по-видимому, состоит в том, что экспериментатор также должен вы- брать некоторые параметры или независимые линейные функции параметров в количестве, меньшем (q— 1), та- ким образом, чтобы он мог считать все остальные пара- метры несущественными. После этого он может оценить выбранные им параметры, а оставшиеся (от исходных (q—— 1)) степени свободы использовать для оценки ве- личины о2—дисперсии на один участок. Очевидно, что вся трудность и все опасности заключаются в предполо- жении, что (2"——с]) параметров несущественны. Сказанное выше представляет собой краткое описа- ние общей процедуры линейного оценивания, исполь- зующей метод наименьших квадратов. В наиболее об- шей форме алгебра и арифметика, используемая при оценивании параметров и их дисперсий, может пока- заться очень скучной. На простом примере мы проиллю- стрируем, что можно и чего нельзя делать. Экспери- ментаторы, желающие изучить три фактора на двух уровнях, обычно выбирают для использования только комбинации способов обработки, обозначенных симво- лами  1, а, ab, abc, (4.2)  хотя, вероятно, они не узнали бы своих рекомендаций в этих обозначениях. Здесь 2" = 8, q = 4 И 7 возможных параметров удобно записать в виде А, В, АВ, C, АС, ВС, АВС, определив их в соответствии с формулами (4.1) и им подобными. Если у1, yg, уз, у‚,—— урожаи с од- ного участка, соответствующие способам из (4.2), то чи- татель, исходя из определения, может легко проверить, что математические ожидания разности между последо- 
4.5. ДРОБНАЯ РЕПЛИКА 75  ВЗТСЛЬНЫМН ПЗРЗМИ участков TEIKOBBII  E(y2—_L/,)=A—-AB——/1C+ABC, E(‘z/3—y2)=B+ /lB— ВС-АВС, (4.3) Е(у4—у3)=С+АС+ВС+АВС.  Из эксперимента можно оценить только эти функции и никакие другие, за исключением, конечно, их линейных комбинаций. В частности, главные эффекты этих трех факторов не могут быть оценены, пока мы не предполо- жим, что все взаимодействия несущественны. Включе- ние двух или большего числа участков для каждой из четырех комбинаций способов обработки дает воз- можность также получить оценку ошибки дисперсии, однако не поможет при оценивании наших семи пара- метров. Хотя такие особенности неизбежны всякий раз, когда используется неполная реплика факторных комбинаций, тщательный выбор дробления реплики может смягчить нежелательные эффекты, особенно когда число факто- ров не меньше пяти, а взаимодействиями высоких по- рядков вполне можно пренебречь (§ 4.4). Читатель, ин- тересующийся исследованиями схемы типа 25, аналогич- ной схеме типа 23, приведенной в (4.2), может выбрать некоторое множество комбинаций способов обработки в количестве, меньшем 64 (например, 32), и пытаться по- лучить оценочные равенства, аналогичные равенству (4.3) или равенствам (4.5) и (4.7)‚ приведенным ниже. Если только читатель не окажется очень удачливым или первым не откроет секрета удачного выбора, то он будет поставлен перед необходимостью выполнять трудоемкие математические вычисления и, что еще более существен- но, в результате он все еще будет не в состоянии оце- нить важные главные эффекты и двухфакторные взаи- модействия независимо один от другого и освободиться от различных помех кроме, может быть, незначимых и, возможно, несущественных взаимодействий высоких по- рядков. «Хитрость» может быть проиллюстрирована с помощью схемы типа 23, хотя при этом объеме ее до- стоинства помогают только при нахождении главных эффектов. Предположим, что вместо (4.2) используются 
76 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  комбинации 1, ab, ac, bc. (4.4)  По определению легко получить, что  E(--y4+y3+y2-y1)==2(A-BC), E(y4-y3+y2-y1)=2(B-— AC), (4-5) Е(у4+уз-у2—у1)=2(С-АВ)‚  так что каждый главный эффект можно было бы оце- нить, если бы не мешало взаимодействие другой пары. Может показаться, что выигрыш невелик, но он растет с ростом числа факторов. В 24-факторной схеме можно выбрать полуреплику из восьми участков  1, ab, ac, bc, ad, bd, сей, abcd. (4.6)  Используя обычные обозначения для урожая, составим математические ожидания типа  Е(уз—у7+ув-у5+у4—уз+у2—ш)=4(В+АСЕ). (4.7)  Эти соотношения показывают, как можно оценить каж- дый из четырех главных эффектов, если не обращать внимания на помехи трехфакторного взаимодействия, которыми, вероятно, можно пренебречь. ДРУГая возмож- ность состоит в том, что функция урожаев, используе- мая для оценивания В, также является оценкой взаимо- действия ACD. C небольшим изменением смысла обо- значений это можно записать в виде  BEACD,  понимая под этим идентичность оценок соответствующих параметров, хотя, конечно, о самих параметрах это не утверждается. Читателю рекомендуем проверить, что из (4.6) следует аналогичным образом  BDEAC  и ряд других соотношений идентичности. Говорят, что контраст ACD является переименованием (alias) B И АС——переименованием BD. Комбинации способов обра- ботки (4.6) таковы, что имеют знак + в оценке взаимо 
4.5. ДРОБНАЯ РЕПЛИКА 77  действия ABCD, и из удобного условного утверждения ABCDE1, (4.8)  смысл которого будет объяснен ниже, может быть полу- чено переименование любого контраста. Удовлетворительное использование дробных реплик зависит от выбора дроби, при котором никакой сущест- венный контраст не имеет другого существенного кон- траста в качестве своего переименования и при котором некоторые контрасты во всех своих переименованиях яв- ляются несущественными, так что их можно использо- вать при оценивании ошибки точно так же, как в экспе- рименте C единичной репликой. Комбинации способов обработки (4.4) удовлетворяют этим требованиям и име- ют один и тот же знак (отрицательный) во взаимодей- ствии АВС; комбинации (4.6) такого же типа и одного знака (положительного) во взаимодействии ABCD. Ta- кое отношение к взаимодействию самого высокого по- рядка в эксперименте с пятью или более факторами бу- дет сохранять требуемое свойство при условии, если все трехфакторные и некоторые двухфакторные взаимодей- ствия пренебрежимо малы. Общий случай для п факто- ров можно удобно изложить, используя теорию конеч- ных абелевых групп, хотя это использование не су- щественно, и от читателя требуется немногим больше, чем понимание элементарной терминологии теории групп. Предположим, что берется полуреплика в 2п-фактор- ной схеме, включающая каждую комбинацию способов обработки, обозначение которых содержит четное число букв (О считается четным числом). Полное число степе- ней свободы равно (2"“‘-1). Например, для плана типа 26 используемыми комбинациями будут 1, ab, ac, bcef, abcdef И другие комбинации подобного вида, ком- бинации вида abe И подобные им опускаются. Контраст, измеряющий А, является также единственной доступной мерой взаимодействия BCDEF, действительно, этот кон- траст оценивает сумму обоих взаимодействий. Это можно  записать в виде AE BCDEF, 
73 гл. 4. ФАКТОРНЫЙ эксперимент и дровныв реплики и BCDEF является переименованием для А. Аналогично можно найти другие переименования, например AD = BCEF, ADF = BCE.  Здесь имеется тесная связь с определенной группой Абе- ля, группой эффектов порядка 2", порожденной п эле-  ментами А, В, С, D �e�� И всеми их произведениями, под- чиненными условиям A2=B2=C2=D2=... =1, (4.9)  элементами которой (за исключением единицы) являют- ся (2’" — 1) главных эффектов и взаимодействий. В экс- перименте с n = 6 B формуле для ABCDEF все 32 ис- пользуемые комбинации способов обработки положи- тельнь1, так что не может быть получено никакой оценки этого взаимодействия. Если это выразить в виде соотно- шения ABCDEF;=.1, (4.10)  то оказывается, что переименование любого элемента является произведением его на элемент, отождествлен- ный с единицей. Например,  АВЕА2ВСО2ЕРЕВСЕР.  Если экспериментатор готов допустить, что трехфактор- ные взаимодействия незначительны, он может провести дисперсионный анализ эксперимента (табл. 4.2), исполь- зуя трехфакторнь1е взаимодействия для оценки ошибки и приписывая 21 контраст, не использованный для оцен- ки ошибки, к их однобуквенным или двухбуквенным пе- реименованиям. Если введено условие  а2=Ь2=с2=с12=...=1‚ (4.11)  то 2” символов способов обработки сами по себе обра- зуют абелеву группу, группу способов обработки, и эта группа изоморфна группе эффектов. Более того, спосо- бы, используемые в полуреплике и содержащие четное число букв, образуют подгруппу группы способов обра- ботки, поскольку формальное произведение каждой пары используемых комбинаций способов обработки при вы- 
4.5. ДРОБНАЯ РЕПЛИКА 79  Таблица 4.2  Форма дисперсионного анализа для эксперимента типа 1/2 (25)  Степени С С Источник изменчивости свободы Квайёздтёв КЕЁЁЁЁЁ Главные эффекты 6 Двухфакторные взаимо- 15 действия «Ошибка» (трехфакторная) 10 Сумма . . . . 31  полнении условий (4.11) также является комбинацией, которую можно использовать. Эту подгруппу способов обработки можно назвать ортогональной (Ф и н н и [97]) подгруппе переименований, которая состоит из элемента (в более общем случае из элементов) группы эффектов, отождествленного с единицей в определении дроби реп- лики. Подгруппой переименований для рассматривае-  мого плана типа 25 является 1, ABCDEF.  Эта структура станет яснее после рассмотрения по Щ-репликам эксперимента 27. Снова будем оценивать только 32 способа. Предположим, что они выбраны так, что каждый способ имеет четное число букв из а, c, f, g, a также четное число букв из а, b, d, e, f: очевидно, что каждый способ должен одновременно содержать четное число букв из ь, c, d, e, g И невозможна оценка взаимо- действий ACFG, ABDEF и BCDEG. Легко видеть, что по отношению ко всей группе способов обработки поряд- ка 27 эти 32 способа образуют подгруппу порядка 25, ко- торая может быть порождена наборами  1, af, bd, be, cg, abc  И всевозможными их произведениями. Эта подгруппа способов обработки содержит все элементы, ортогональ- ные ACFG И ABDEF и, следовательно, ортогональные их  д. 
80 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  произведения. Поэтому подгруппа 1, ACFG, ABDEF, BCDEG  может быть названа подгруппой переименований. Это может быть оправдано тем, что каждый эффект теперь имеет три переименования, которые можно получить, приравнивая единице все элементы подгруппы переиме- Нований, например, как легко проверить,  DEACDEGEABEFEBCEG.  Переименования каждого главного эффекта имеют до- статочно высокий порядок, чтобы не быть причиной пу- таницы, но каждое взаимодействие между любыми дву- мя из факторов А, С, F, G имеет двухфакторное пере- именование AFECGEBDEEABCDEFG.  Хотя контрасты, связанные с главными эффектами, могут быть с некоторой степенью уверенности отнесены к этим эффектам, поскольку все их переименования яв- ляются трехфакторными взаимодействиями или взаимо- действиями более высокого порядка, и поэтому мало- вероятно, чтобы они были велики, три переименованные пары двухфакторных взаимодействий строго лимитируют практическое использование этого плана. Если бы в экс- перименте можно было выбрать заранее группу, содер- жащую четыре фактора из семи (обозначим их А, С, F, G) B качестве группы факторов, которые а priori имеют малую вероятность каких-либо взаимодействий, то в конце концов мог бы быть сделан анализ в форме табл. 4.3. Если найдены контрасты с большими значе- ниями при альтернативных наименованиях AF и CG, то природа соответствующих главных эффектов может под- сказать, каким именно переименованиям они в действи- тельности принадлежат, однако опасность состоит в том, что два взаимодействия, действующие в противополож- ных направлениях, могут погаситься и не выявиться при анализе. Ошибка состоит из контрастов для взаимодей- ствий АВС‚ ABG, ACD, ACE, АБС, АЕС, у которых все переименования являются трехфакторными взаимодей- ствиями; или взаимодействиями более высокого порядка. 
4.5. ДРОБНАЯ РЕПЛИКА 81  T a 6 Л И ц а 4.3 Форма дисперсионного анализа для эксперимента типа 1/4 (27)  Степени Сумма Средний Источник изменчивости свободы квадратов Квадрат Главные эффекты 7 Двухфакторные взаимо- 15 действия без А, С, F, G ACEFG I AFEECG I AGECF 1 «Ошибка» 6 Сумма .. .. 31  Когда число факторов мало, дробная реплика яв- ляется не очень хорошей основой эксперимента, так как на переименования наложены ограничения, предотвра- щающие неодинаковое отношение кэффектам различных факторов и важным взаимодействиям. Однако так как в этом случае полное число комбинаций способов обработ- ки не очень велико, то, как правило, оказывается воз- можным использовать полную реплику. Когда число факторов велико, дробные реплики можно иногда при- менять с большой пользой. Д е й в И с и Х е й [38] иллю- стрировали некоторые практические притиенения дробей плана типа 2" R промышленных исследованиях даже в случае, когда п равно всего четырем,однако часто наи- меньшие полуреплики, которые с уверенностью можно рекомендовать, являются полурепликами плана типа 2’.  Андерсон (в книге Чоу [134]) дал ценное и четкое об-  суждение этого вопроса. Идеальной ситуацией для использования малых дро- бей реплики является ситуация, в которой наличие двух- факторных взаимодействий маловероятно и даже глав- ные эффекты встречаются редко. Например, некоторые сельскохозяйственные культуры чувствительны к отсут- ствию определенных химических элементов (либо поги- бают, либо плохо растут на почвах, в которых не хва- тает этих элементов), но развиваются совершенно  6 Д. Финни 
82 ГЛ. 4 ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  удовлетворительно, если восполнить недостающие их ко- личества. Не следует ожидать, что рассмотрение более общих ситуаций даст что-либо новое по сравнению с этим примером. Почвы, в которых отсутствует какой-нибудь один элемент, встречаются крайне редко, еще менее ве- роятно одновременное отсутствие в почвах двух или бо- лее элементов. Единственный удовлетворительный спо- соб обнаружения нехватки какого-нибудь элемента в почве и того, какого именно, —— эмпирический тест. Если иные сведения отсутствуют, то такие тесты могут пона- добиться с несколькими различными элементами на раз- личных уровнях. Для определения дефицита элементов достаточно (1/2)""-й дроби плана типа 2", состоящей только из комбинаций 1 и abcd 0�!� Здесь фактор А мо- жет быть связан с присутствием или отсутствием мар- ганца в качестве составной части, фактор В -—с присут- ствием или отсутствием меди, фактор С —~ с присутствием или отсутствием бора и т. д.‚ и любая разница в урожае двух рассматриваемых способов обработки должна ука- зывать на нехватку одного из этих элементов в почве. По-видимому, желательно иметь более двух участков и вместо того, чтобы повторять эти два способа обработки, можно ввести другие комбинации, для того чтобы допу- стить некоторое различие факторов. Например, исполь- зование 1, abd, сет, abcdefg дает возможность экспе- риментатору определить, является ли недостающим элементом один из элементов А, В,0или один из элемен- тов С, Е, F, G. B § 4.13 упоминаются схемы, в которых 4т комбинаций способов обработки дают возможность оценить главные эффекты для (4m — 1) отдельных фак- торов (т—любое Целое число) в предположении, что все взаимодействия равны нулю. Читатель, конечно, мо- жет предположить, что для т = 2, например, должны быть проделаны восемь способов обработки 1, а, b, с, d, e, f, g, хотя они едва ли представляют собой точную 24 реплику. Это правильно, если в действительности взаи- модействия равны нулю: однако преимущество наиболее разработанных схем этой главы состоит в том, что оставлена некоторая возможность определения взаимо- действия, когда его нельзя совсем исключить (см. § 4.6). 
46.РАЗЛИЧНЫЕ‚ДРОБИ ОДНОГО ПЛАНА 83  4.6. Различные дроби одного плана  Если произведение любого элемента в подгруппе спо- собов обработки с каким-нибудь другим символом спо- соба, не входящим в эту подгруппу, берется в соответ- ствии с соотношением (4.11), то образуется новая серия способов обработки (не являющаяся подгруппой, так как в нее не входит элемент 1), которая также может быть использована как дробь полной реплики. Напри- мер, если каждый элемент ‘/4-реплики из § 4.5 умножить на а, то образуется новый набор из 32 способов обра- ботки. Умножение на b И на ab дает еще два набора. Действительно, знаки способов обработки во взаимодей- ствиях ACFG, ABDEF и BCDEG делят 128 комбинаций уровней факторов на четыре набора по 32 комбинации, которые являются четырьмя возможными ‘/4-репликами для этой подгруппы переименований:  ACFG ABDEF BCDEG  Исходные (умноженные на а) (умноженные + на b) (умноженные —— —-- + на ab)  1+ + +| I  Теоретическое обсуждение дробных реплик наиболее просто в том случае, когда в качестве подгруппы спосо- бов обработки используется та возможная дробь, в ко- торой содержится комбинация 1. Однако в практических применениях не имеет значения, какой из наборов вы- бран. Если должно производиться более одного экспери- мента одинакового характера в различных местах или в различное время, альтернативные дроби должны ис- пользоваться подряд, так как их комбинация может при- вести к разделению переименований. Например, если имеются четыре эксперимента, каждый по ‘/4-реплике плана типа 27, содержащие четыре набора способов  6* 
84 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЬ1Е РЕПЛИКИ  обработки, о которых говорилось выше, то в целом их можно рассматривать как одну реплику всех комбина- ций способов обработки, а отдельные эксперименты бу- дут соответствовать четырем блокам, «смегпивающим» взаимодействия ACFG, ABDEF И BCDEG (§ 5.6).  4.7. Планирование типа л ’"  До сих пор большая часть обсуждения касалась фак- торов, каждый из которых мог быть на двух уровнях. Эксперименты с планами типа 2” справедливо популяр- ны и весьма удобны для задач, в которых все рассматри- ваемые факторы являются контрастами между наличием и отсутствием или положительностью и отрицательностью различных компонент. В качестве таких типичных фак- торов можно рассматривать например, следующие: сеять ли семена, разбрасывая их или же рядами, держать ли животных на фиксированном или на произвольном ра- ционе, взять для опыта самца или самку, выполнять не- который физиологический тест сидя или стоя, держать бутыль, в которой происходит реакция, открытой или за- крытой, получать ли вещество одним или другим воз- можным способом. Однако экспериментирование нельзя ограничивать такими ситуациями. Может понадобиться сравнивать три различных типа сеяния или четыре раз- личных способа получения вещества.Вероятно,наиболее важными являются факторы, изменяющиеся непрерывно, такие, как количество удобрений, пищи или реактивов, температура или другие измерения окружающей физи- ческой среды, продолжительность процесса, пропорция составных частей смеси. Если интерполяцией по экспери- ментальным результатам должна быть определена опти- мальная комбинация уровней количественных факторов, то существенно, чтобы в эксперимент были включены по крайней мере три уровня каждого фактора (темпера- туры, объема, времени и т. д.)‚ так как в противном слу- чае можно получить только линейную аппроксимацию зависимости урожая от уровней фактора и невозможна никакая максимизация. Например, для оценивания тем- пературы, при которой технологический процесс дает максимальный выход, могут оказаться недостаточными 
4.7. ПЛАНИРОВАНИЕ ТИПА 31171 85  три различные температуры, но их будет достаточно для изучения кривизны регрессии урожая в зависимости от температуры. Если она приближенно параболическая, то максимум уравнения квадратичной регрессии, оценивае- мый по полученным данным, дает оценку оптимальной температуры, а если испытываются лишь две темпера- туры, то нельзя получить ничего, кроме нелепого ответа о бесконечно высоком или бесконечно низком уровне температуры (ср. §§ 9.3, 9.4). Идеи дробной реплики пла- на типа 2" легко можно распространить на план типа п”, где л-любое простое число (Финни [97]). Обычно для факторов с более чем двумя уровнями используются обозначения ад, щ, a2, ..., a,,_1 (или ад, a2, ..., ад). Хотя эти обозначения предпочтительнее при выписывании плана, используемого в эксперименте, алгебраические операции при построении плана будут удобнее, если за- писывать индексы, как степени. Таким образом, символ  a°‘b5cV . . . представляет комбинацию уровней ос, [3, y, ��Y� факторов А, В, С, `�R� ос, [3, y МОГУТ принимать значения О, 1, 2, ..., л —— 1. Если символы интерпретировать в соответ-  ствии с обычными алгебраическими правилами с допол- нительным условием, что  ал=дл=Сл=_-___ =]‚ (4.12)  то п” символов различных способов обработки обра- зуют группу степеней простого числа п. (:m’"— 1) сте- пеней свободы между способами могут быть представ- лены элементами (исключая единицу) изоморфной груп- пы, образованной элементами /-1, B, C, �=I� так что В, 89, B3, .. ., Вт‘ образуют (л— 1) степень свободы глав- ного эффекта В, (л: — 1)? элементов вида B5’, CV’ ([3’ #= О, \/#0) являются контрастами для взаимодействия В и С и т. IL Говорят, что элементы двух групп  a°‘b5cV . . . И A°"B‘3'CV' . . . 0pTO8OHa/lbHbl, если оюъ’+ВВ’+уу’+ ���� =O(mod:rc). (4.13) 
86 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  (Отметим, что для п: = 2 ортогональность означает <<на- личие четного числа общих букв>>.) Легко видеть, что если из одной из групп образована какая-нибудь под- группа порядка пр, то элементы другой группы, ортого- нальные каждому элементу данной подгруппы, сами образуют подгруппу порядка n"“P. Всё дальнейшее в достаточной степени иллюстри- руется системой 3". Подгруппа способов обработки, ор- тогональных 1, А, A2, состоит из 3714 способов без а (то есть с ос = О). Умножение ее элементов на а и на а? дает набор элементов на двух других уровнях фактора А. Та- ким образом, установлено соответствие между подгруп- пой 1, A, A2 И главным эффектом А. Это соответствие существует во всех (3"—1)/2 подгруппах порядка трех в группе эффектов *), И аналогичное соответствие может быть установлено между каждой группой и парой степе- ней свободы для сравнения способов обработки. Читателю, который ранее был незнаком с фактор- ными планами, это последнее утверждение понять до- вольно трудно. Сумма квадратов для взаимодействия двух факторов A H B определяется как остаток после вычитания суммы квадратов для двух главных эффек- тов A И В (каждый с двумя степенями свободы или в более общем случае с (л- 1) степенью свободы) из суммы квадратов между всеми девятью (или п?) комби- нациями уровней двух факторов (эта последняя сумма имеет восемь степеней свободы, или в общем случае (n2— 1) степеней свободы, ср. § 4.3 И табл. 4.1). Таким образом, взаимодействие есть сумма квадратов с че- тырьмя степенями свободы или вобщем случае с (п— 1)? степенями свободы. Если эту оставшую сумму квадратов записать алгебраически и применить теорему § 2.1, то можно проверить, что возможное разбиение на две пары степеней свободы заключается в том, чтобы отнести одну пару к контрастам между средними значениями или ито- гами трех наборов способов обработки  1, ab? agb; а, a2b2, b; а? 122, ab.  *) B более общем случае (Tin -— 1)/(л-— 1) подгрупп порядка л. 
4.7. ПЛАНИРОВАНИЕ ТИПА лп 37  a другую——к контрастам между следующими тремя на- борами:  1, ab, a2b2; a, a2b, b2; a2, b, ab2,  где вместе с aabfi включены все другие символы спосо- бов обработки, имеющие данные степени а и b, незави- симо от того, включены ли туда другие буквы (a°‘bl3c2, a°‘bl3ce2 и т. д.). Подгруппа эффектов, ортогональных 1, ab2, a2b, есть 1, АВ, A2B2, a подгруппа эффектов, орто- гональных 1, ab, a2b2, есть 1, AB2, A2B. Если договорить- ся, что пара степеней свободы для взаимодействия при- водится после элемента соответствующей подгруппы эффектов, в которую первая буква входит в первой сте- пени, то эти две пары степеней свободы взаимодействия мы будем обозначать соответственно как АВ и АВ9. Бо- лее кратко, но и менее информативно И э й т с [45] назы- вал их компонентами взаимодействия J И 1. Подгруппа способов обработки, ортогональных 1, ABC-'3, A?B2C, со- стоит из всех способов, для которых  оъ-|-[3+2у=О(тос1 3), (4.14)  т. е. из всех символов способов, либо не содержащих ни одного из а, b, c, либо содержащих одну из комбинаций ab9, a2b, ac, a202, bc, b202, abc2, a2b2c. Контрасты между этими 3"°‘ способами и двумя множествами, опреде- ляемыми соотношениями  оъ+[3+2у=1(тос1 З), (4.15) оъ+В+2у=2(гпо‹1З), (4.16)  дают две степени свободы из трехфакторного взаимо- действия А, В и С, которые удобно назвать компонен- той ABC2. Восемь степеней свободы для взаимодействия трех факторов содержат четыре такие пары АВС, ABC’, AB2C И АВ2С2 (у Иэйтса они называются соответственно компонентами Z, Y, X И W). Полное взаимодействие трех факторов A, B, C можно обозначить А-В-С или А ><В >< С. Мы часто будем записывать его просто АВС, если нет опасности пере- путать это полное взаимодействие c конкретной парой 
88 ГЛ, 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  степеней свободы. Обобщения на другие взаимодей- ствия и на большее число уровней очевидны. Кишен [59] дал ценное краткое изложение теории факторного (и других типов) планирования на основе Математически более утонченной точки зрения, чем та, которая уместна в этой книге, с обширным набором ссылок на литературу.  4.8. Единичная реплика плана типа 3"  Аргументация в пользу употребления единичной реп- лики плана 3" (или любого плана типа п") точно такая же, как в § 4.4. Разумеется, план типа 39 на девяти участках был бы слишком мал и не дал бы полезной информации даже о двухфакторных взаимодействиях. Однако единичные реплики планов типа 33 и 34 исполь- зуются часто и являются наиболее ценными эксперимен- тальными планами. С другой стороны, насыщение фак- торами, а не реплика меньшего числа факторов часто является наиболее экономичным использованием фик- сированного числа участков.  4.9. Дробные реплики планов типа 3"  Любую подгруппу способов обработки порядка ЭР можно рассматривать как потенциальную (1/3)"‘Р-реп- лику эксперимента типа 3". Подгруппа переименований есть полная подгруппа элементов, ортогональных этим способам обработки, и приравнивание всех ее элементов тождественному дает возможность определить 3"’? пе- реименований каждого эффекта. Все это становится  "ЯСНСС после рЗССМОТрЕНИЯ ОДНОГО ИЛИ ДВУХ ПРОСТЫХ при-  меров. Для п=3 подгруппа способов обработки по- рядка 32 может быть получена из 1, аЬ2, ас. Она пред- ставляет собой  1, ab2, ад), ас, a2c2, a2b"'c, abc2, 19202, bc. (4.17)  Элементы ортогональной подгруппы эффектов, очевид- но, удовлетворяют соотношениям, полученным из (4.13) : а’ + 26’ = О (mod 3), от’ + у’ = О (mod 3), 
4.9. дровныв реплики ПЛАНОВ ТИПА an 89  a также соотношениям, которые можно вывести из этих. Следовательно, элементами подгруппы являются 1, ABC9, AQBQC. Переименования любого символа эффекта могут быть получены из  ABC? = ‚42В2СЕ 1 (4.18)  с использованием правил группового умножения (как в § 4.5). Например,  BEB - /lBC2EAB2C2 BEB-AQBQCE/12C.  Следовательно, так как элемент А2С ассоциирован с AC2 B подгруппе порядка трех, главный эффект В должен быть измерен с помощью контрастов, которые к тому же определяют как AC2, так и АВ9С2. Это можно про- верить, разбив символы в (4.17) на три группы для трех уровней фактора В и изучая разности между ними:  1 ас, (1202,  a2b, bc, abcg,  ab2, b202, (125920. Если нельзя игнорировать все взаимодействия, то 1 .‚ этот план типа §(33) бесполезен, поскольку каждын  главный эффект имеет в качестве переименования двух- факторное взаимодействие. Как легко проверить, ника- кая другая подгруппа переименований не лучше. Для плана типа 34 ЧЗ-реплика, получаемая из  АВС2Б2гА2В2СБЕ1 (4.19)  (или из любых из семи аналогичных соотношений) дает в качестве переименований для главного эффекта только трех- и четырехфакторные взаимодействия, но половина двухфакторных взаимодействий имеет в качестве своих переименований другие двухфакторные взаимодействия. Факторная схема типа 35 является первой широко используемой возможностью: переименования главных эффектов и двухфакторных взаимодействий с подгруппой 
90 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛНКИ  переименований 1, АВ2СБ2Е2, ‚42ВС2ВЕ (4.20)  имеют только взаимодействия более высокого порядка. Далее, имеется схема исследования пяти факторов с тремя уровнями лишь на 81 участке: более подробно об этом будет сказано в ё 5.9. Для п = 7 подгруппа пере- именований, порожденная 1, АВ9ВЕР2, ВС2Б9ЕО, приво- дит к 1/9-реплике плана типа 37, в котором все главные эффекты и двухфакторные взаимодействия имеют пере- именования более высокого порядка, и, таким образом, она более удовлетворительна, чем 1/4-реплика плана типа 27, рассмотренная в ё 4.5. Тишер и Кемп- торн [89] описали использование такого плана для исследования 2187 возможных комбинацией способов обработки на 243 участках. Из любой подгруппы способов порядка пр, соответ- ствующей Цлп-Р-реплике п" факторной схемы, остав- шиеся (л"‘1°—- 1) дроби-реплики могут быть образованы так же, как это было описано в ё 4.6. Сделанные заме- чания применимы и в этом общем случае.  4.10. Теорема Фишера  Фишер [115], [116] доказал теорему о факторных планах, эквивалентную следующему утверждению: Для любого п, удовлетворяющего неравенству  n<(n” — 1)/(TL-— 1), (4.21)  ВОЗМОЖНЗ Цлп-Р-реплика плана п" (ат-любое простое число), требующая п? участков, при условии, что ника- кие два главных эффекта не являются переименования- ми один другого. Об этой теореме в ее первоначальной формулировке более подробно будет сказано в ё 5.10.  4.11. Число уровней, равное степени простого числа  Планы экспериментов с п факторами, каждый из которых находится на ли’ уровнях (w=const), могут быть построены с помощью замены каждого фактора w квазифакторами и их взаимодействиями, составления 
4.12. СМЕШАННЫЕ УРОВНИ 91  плана для nw факторов на л уровнях и последующей  интерпретации этого плана в терминах исходных п фак- торов. Например, для факторов на четырех уровнях фактор A может быть заменен на два фактора А’ и А” на двух уровнях, таким образом:  /  а вместо а,  //  а вместо а2,  а’а” вместо a3.  Более утонченный подход состоит в использовании абе- левой группы порядка 4", в которой уровни, соответ- ствующие фактору А, записываются как 1, ад, а2, a3 с условиями a2=a2=a2=1'a а =а 1 2 3 * 1 2 з’  и, следовательно, адаз = а2, a2a3 =a1. Группа эффектов образуется аналогичным образом (Тхавани [90]). При использовании этих планов статистик должен тщательно следить, чтобы формальные взаимодействия высокого порядка среди квазифакторов не превраща- лись в главные эффекты или взаимодействия низкого порядка для истинных факторов.  4.12. Смешанные уровни  Если не все факторы имеют одинаковое число уров- ней, но все являются степенями одного и того же про- стого числа, то § 4.11 применяется с небольшими изме- нениями. Когда имеются различные простые числа, один из путей для образования дробной реплики состоит в том, чтобы взять подгруппу переименований только в одной системе простых чисел или взять несколько под- групп, каждая из которых Целиком находится внутри различных систем простых чисел. Например, 1/4-реплика для схемы 34 >< 25 легко образуется, если использовать только восемь подходящих комбинаций из 32 возмож- ных комбинаций для факторов на двух уровнях и взять их в сочетании со всеми комбинациями факторов на трех уровнях. В виде варианта можно было бы получить 1/6-реплику, взяв полуреплику типа 25 и 1/3-реплику 34 
92 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКП  и используя 432 комбинации из этих комбинаций спосо- бов обработки. Подробности такого объединения не представляют трудностей, но этот метод вряд ли имеет практическое значение, если число факторов невелико. Другая возможность состоит в использовании раз- личных дробей факторной схемы в одной системе про- стых чисел в комбинации с различными уровнями дру- гих факторов. Такой способ может быть полезным, когда уровни всех факторов, за исключением одного или двух, равны степеням одного простого числа. Например, для плана типа 3 >< 25 полуреплику можно образовать, взяв одну полуреплику части плана типа 25 на уровнях О и 2 для шестого фактора и другую полуреплику на уровне 1, вместо того, чтобы использовать ту же самую полуреплику плана типа 25 на всех трех уровнях шестого фактора, как это предлагалось в предыдущем абзаце. Эти планы в действительности сводятся к тому, чтобы взять одиночные блоки из «смешанных» схем для сме- шанных факторов, которые будут рассмотрены в § 5.1!. Моррисон [70] и Бозе и Коннор [13] представили ту же самую идею в несколько ином виде и рассмотрели возникающие при этом усложнения статистического ана- лиза.  4.13. Планы взвешиваний  Если с уверенностью можно предположить отсутст- вие всех взаимодействий, то идея дробных реплик может быть доведена до своей логической крайности. Одной из подобных ситуаций является случай взвешивания предметов на правильных весах: истинный общий вес двух предметов должен быть равен сумме их весов, и наблюдения должны близко соответствовать этой Mo- дели. Предположим, что требуется определить веса семи предметов. Очевидная процедура состоит из восьми взвешиваний, одного с пустыми чашками, для того чтобы дать нулевую поправку, и по одному взвешиванию на каждый предмет. Если о-стандартное отклонение ошибки при единичном взвешивании, то дисперсия оцен- ки веса каждого предмета (разница между наблюден- НЫМ весом и нулевой поправкой) есть 202. Иэйтс [42] 
4.13. ПЛАНЫ ВЗВЕШИВАНИИ 93  предложил сравнить следующие комбинации: 1, abcd, аде}, cafe)‘, aceg, bdeg, деде, adfg, где 1 символизирует измерение нулевой поправки. Тогда вес любого предмета оценивается как средняя разность между двумя набоч рами из четырех взвешиваний. Если эти восемь наблюде- ний обозначить через год, то вес а без труда оценивается с помощью контраста  1 'Z(“w1+w2+w3“w4+w5 -‘w6“w7'+w8),  дисперсия которого равна только 02/2. Контрасты для семи предметов взаимно ортогональны. То же самое полное число взвешиваний произведено таким образом, что уменьшает дисперсию каждой оценки в четыре раза. Позднее будет показано, что если для каждой комби— нации все «невключенные» предметы помещены на про- тивоположной тарелке весов, так что наблюдаются ра3‹ ности весов, то оценкой веса а служит величина  1 33"("Ш1+Ш2+Ф3"Ш4+Ш5“Ш6“Ш7+Ш8)‚  имеющая дисперсию 02/8, T. e. получаем дальнейшее уменьшение дисперсии в четыре раза. Эта процедура взвешивания основана на 1/16-реп- лике плана типа 27. По теореме Фишера максимальная схема для восьми участков такова, что никакие два глав- ных эффекта не могут быть переименованиями один дру- гого. Аналогичным образом для 15 предметов можно получить оценки их веса при 16 наблюдениях с диспер- сиями 02/4 или 02/16 B зависимости от того, на одну или на обе тарелки весов помещаются предметы. Если используется меньшее число предметов, контрасты, со- ответствующие оставшимся предметам, могут быть использованы для оценивания 02. Плэкетт и Бермен [80] ослабили условие о том, что число предметов должно иметь вид (2"—-1), И на- шли аналогичные планы для взвешивания (4m—— 1) предметов за 4т операций. Например, для 11 предметов набор из 12 взвешиваний может быть следующим: <<1>› (т. е. оценка нулевой поправки), abdefj, bcefgk, cdfgha и т. д., где последние 10 комбинаций получаются цикли- ческой перестановкой abdefj. Такой план взвешиваний 
94 ГЛ. 4. ФАКТОРНЫЙ ЭКСПЕРИМЕНТ И ДРОБНЫЕ РЕПЛИКИ  является 12/2”-репликой 2“ факторной схемы, и легко проверить, что он имеет свойство, состоящее в том, что 11 взаимно ортогональных контрастов оценивают веса с дисперсиями 02/3 или 02/12 в зависимости от того, кладутся невыбранные предметы на противоположную тарелку весов или нет. Эти плапы не являются подгруп- пами группы способов обработки. Авторы предлагали использовать эти планы при определении изменений раз- личных компонент некоторых «наборов», применяемых в научно-исследовательской работе и производстве, опять-таки при условии, что можно игнорировать взаимо- действия. В статье рассматривается связь этой теории с ортогональными матрицами.  4.14. Другие планы для нулевых взаимодействий  Идеи § 4.13 были в дальнейшем обобщены (Бозе и Буш [12], Буш [25], Плэкетт [79], Рао [81])для получения наборов способов обработки для систем ти- па п", в которых все главные эффекты (каждый с (л- 1) степенями свободы) оцениваются посредством ортогональных контрастов и доказываются различные теоремы о максимальном числе факторов или минималь- ном числе комбинаций способов обработки. В качестве примера рассмотрим систему типа 37. [Ложно доказать, что минимальное число комбинаций способов обработки равно 18. Набор  1, bd2e2fg, bcgd/‘2g2, abcdef, ab2cf2g, ab-?d2eg2, a2b2c2d2e2f2, a2c2deg, a2ce2fg2,  cd2ef9, Ждет, b2cde2g2, abc2e2, ade2f2g, ac9d9/‘g2, a2b2df, a2bcd2g, agbefggg  таков, что каждая из девяти комбинаций любой пары факторов встречается дважды. Таким образом, этот на- бор представляет собой 2/343-pemmxy плана типа 37 с желаемым свойством. И опять-таки комбинации спо- собов, которые следует использовать, не образуют подгруппы. 
Глава д  СМЕШИВАНИЕ  5.1. Блоки  В гл. 3 подчеркивались преимущества такого разде- ления экспериментального материала на блоки, при ко- тором участки, принадлежащие одному блоку, были бы более схожи, чем участки в различных блоках. В этом случае точность экспериментальных результатов зави- сит только от внутриблоковой дисперсии. Использование факторного плана означает, что полное число способов обработки может быть очень большим и значительно превосходить число участков в наиболее удобном по раз- меру блоке. Например, ЗЗ-факторное расположение могло бы использоваться в рандомизованном блок-экспери- менте с блоками по 27 участков, однако такой большой блок может оказаться неосуществимым, если каждый блок должен состоять из растений приблизительно оди- накового возраста или животных одного помета. Даже если природа экспериментального материала и не пре- пятствует такому размеру блока, обычно встречающаяся отрицательная корреляция между числом участков в блоке и однородностью участков внутри блока может привести к потере всех преимуществ от разбиения на блоки. Здесь не может быть дано никакого общего пра- вила: блоки из 27 участков могут быть весьма удовле- творительнь1ми‚ когда они представляют собой 27 парал- лельных бактериальных культур, и безнадежно разно- родными, если это 27 последовательных недель работы завода, в течение которых должны испытываться раз- ные комбинации сырья. При изучении эффективности различных методов обучения детей для устранения се- мейной неоднородности могут быть подобраны блоки из двух детей одинакового возраста и происхождения, но не больше. При изучении питания растений в теплице 
95 гл. 5. СМЕШИВАНИЕ  с отдельными горшками в качестве участков размер блока может зависеть от удобства экспериментатора. С увеличением размеров блока неоднородность, по-ви- димому, будет расти крайне медленно, но размеры пар- ников накладывают некоторые ограничения. В экспе- риментах с пробами человеческой крови каждый блок состоит из проб, полученных от одного индивидуума за один раз: неоднородность внутри блока может совер- шенно не зависеть от размеров блока, но число <<участ- ков» в одном блоке будет несомненно зависеть от спо- собности экспериментатора убедить испытуемого. Для того чтобы использовать преимущества неболь- ших блоков без серьезных ограничений на использование факторных схем, был придуман особый механизм сме- шивания. Основная его идея состоит в том, что нужно пожертвовать определенными взаимодействиями, имею- щими небольшое значение, и вместо того чтобы распро- странять Ha все контрасты способов обработки погреш- ность из-за больших и неоднородных блоков, сконцен- трировать ее на этих смешанных взаимодействиях таким образом, чтобы для оставшихся контрастов получалась такая же точность, что и в случае меньших блоков. При желании смешанные взаимодействия могут быть раз- личными в различных репликах, так что мы будем те- рять часть информации для большого числа взаимодей- ствий вместо полной потери для небольшого их числа. В комбинации с дробными репликами смешивание дает возможность использовать факторное планирование в полной мере, с большой гибкостью и применимостью к специальным обстоятельствам.  5.2. Простой смешанный план  Предположим, что желательно иметь план типа 23, НО в каждом блоке может быть только по четыре участка. Эксперимент можно организовать так, чтобы имелось равное число блоков двух типов:  i) 1, ab, ac, bc,  ii) a, b, c, ада. 
5.2. ПРОСТОЙ CMEIIIAHHbI1"i ПЛАН 97  Легко видеть, что контрасты для шести из семи членов группы эффектов А, В, С, АВ, АС и ВС ортогональны блоковым разностям‚ и поэтому на них влияет только внутриблоковая дисперсия. Трехфакторное взаимодей- ствие АВС совпадает с разностью между всеми блоками типа ii) И всеми блоками типа i); говорят, что взаимо- действие ABC CMBLHCZHO с блоками. Если число блоков невелико, информация, которую можно получить об этом взаимодействии, мала, и ею можно пожертвовать ради возможности исследовать остальные шесть степеней сво- боды с точностью, соответствующей блокам по четыре участка. Однако если полное число участков равно восьми, так что в эксперименте будет по г блоков каж- дого из двух типов, то информация о смешанном взаимо- действии может быть получена, как если бы взаимодей- ствие было просто сравнением двух возможных спосо- бов обработки в полностью рандомизованном плане с размерами участков, вчетверо большими стандартного! г блоков типа i) выбираются случайным образом из 2/‘ блоков, а (2г——1) степеней свободы между блоками разлагаются затем на одну степень свободы для сме- шанного взаимодействия и (2г—2) степеней свободы «между блоками одного типа». Средний квадрат этой последней компоненты является тогда оценкой межбло- ковой ошибки, используемой при проверке значимости или других утверждений, касающихся взаимодействия ABC. Вариант, полезный для случая, если г не очень мало, состоит в использовании рандомизованного блок- плана для ABC, T. e. группировки пар блоков в качестве полных реплик с выбором пар, которые из каких-либо соображений должны быть похожими, и случайным при- писыванием типа i) одному блоку из каждого «супер- блока>>, типа ii) ОСТЗВШИМСЯ блокам. Тогда анализ дис- персий производится как в табл. 5.1, и эта таблица будет такой же, как в предыдущем плане, но со степенями свободы между блоками одного типа, разделенными на (г—1) степеней свободы между суперблоками и на (г—— 1) степеней свободы внутри суперблоков, дающими дисперсию ABC. B практических приложениях фактор- ного планирования число блоков редко оказывается до- статочным, для того, чтобы внутриблоковые оценки  д 7 Д. Финни 
93 гл. 5. СМЕШНВАНПЕ  дисперсии имели Ценность, и поэтому статистик, исполь- зующий смешанный план, часто должен в качестве взаи- модействий для смешивания выбирать те, которыми он может полностью пожертвовать.  Таблица 5.1  Форма дисперсионного анализа для эксперимента типа 23, смешивающего трехфакторное взаимодействие  Степени Сумма Средний Источники изменчивости свободы квадратов Квадрат Пары блоков или <<су- г—1 перблоки» АВС Межблоковая ошибка г — 1 Блоки 2r — 1 А 1 В 1 С 1 АВ 1 AC 1 BC 1 Ошибка бг — 6 Сумма . . .. 8г—1  5.3. Смешивание как форма дробной реплики  С точки зрения построения планов смешивание мож- но рассматривать как тип дробной реплики, в котором  а блоки играют роль добавочных факторов (Ф и н н и [97],  Кемпторн [51]). Например, можно создать план типа 23 § 5.2, введя квазифактор Х, представляющий разность между двумя типами блоков. Рассмотрим полуреплику плана типа 24 с подгруппой переименований  1, АВСХ. (5.1)  Символы способов: 1, ab, ac, ax, bc, bx, cx, abcx.  Если х интерпретировать как «отнесение к блоку типа Н)», а отсутствие х—как «отнесение к блоку 
5.3. СМЕШИВАННЕ КАК ФОРМА ДРОБНОЙ РЕПЛИКИ 99  типа 1)», то мы получим смешанную схему для плана типа 23. Ввиду (5.1) справедливо  ABCEX, (5.2)  откуда ясно, что трехфакторное взаимодействие равно контрасту между типами блоков. Равным образом имеет место соотношение  ABECX (5.3)  и другие аналогичные соотношения: взаимодействие между любой парой факторов А, В, С измеряется с по- мощью того же самого контраста, который проверяет, меняется ли третий главный эффект от блока к блоку. Лучше, если блоки, которые будут блоками типа i), ВЫ‘  у бираются случайно. Это безопаснее, так как если экспе-  риментатор осуществлял заранее обдуманный выбор блоков и оказалось, что выбранные им г блоков типа 11) выявляют больше эффектов С, чем г блоков типа i), то появится ложное взаимодействие АВ. Предположим теперь, что введены два квазифакто- ра Х и Y и берется 1/4-реплика плана типа 25 с пере- именованиями‚ определенными из соотношении  ` ABXE/lCY_=_-BCXYE1. (5.4) Она состоит из 1, аху, bx, аду, су, асх, Ьсху, abc; НИ х,  ни у, только х, только у и ху можно рассматривать как разбиение на четыре типа блоков, именно:  1): 1‘, abc, (x) ii): b, ac, (у) 111): с, ab, (ху) iv): a, bc.  Это есть план для 23 B блоках по два элемента, который можно выполнить при числе блоков, кратном четырем. Он одновременно смешивает АВ, АС, ВС, и из соотно-  шений (5.4) следует AEBXECXEABCXY И т. д.,  так что любой главный эффект имеет в качестве пере- именований взаимодействие каждого из остальных  эффектов с блоковыми разностями. Если такие взаимо-  7* 
100 гл. 5. СМЕШИВАНИЕ  действия можно игнорировать, то в смешанной схеме можно оценить не только каждый из главных эффектов А, В и С, но и трехфакторное взаимодействие, хотя мы и пожертвовали взаимодействиями АВ, АС, BC. Схема дробной реплики была введена в гл. 4 с целью уменьшить общее число участков, требуемых для экспе- римента. Здесь мы не преследуем такой цели, поэтому в эксперимент можно включать несколько повторений бло- ков каждого типа. Напротив, наша цель состоит в умень- шении размера блока. Имеются практические ситуации, в которых выгодны блоки размером два, например, когда в качестве двух «участков» блока используются двойни крупного рогатого скота.  5.4. Общее смешивание планов типа 2"  Теперь будет ясна общая модель смешивания планов типа 2" (Фишер {115]). Для того чтобы смешивать в блоки по 21’ элементов, следует взять дополнительно (n—p) квазифакторов Х, Y, ..., главные эффекты и взаимодействия среди которых должны быть согласо- ваны с (2"‘P—1) степенями свободы между блоками. Тогда любая 1/2""Р-реплика плана типа 22"‘? дает воз- можную схему смешивания при условии, что никакие элементы подгруппы переименований не состоят только из квазифакторов. Например, для смешивания типа 25 в блоки по восемь элементов нужно ввести квазифакто- ры Х и Y И образовать 1/4-реплику плана типа 27. Более того, в хорошем плане только взаимодействия высокого порядка будут отождествляться с контрастами блока, так что элементы подгруппы переименований должны содержать столько букв, сколько можно получить из ре- альных факторов. Например, в качестве подгруппы можно выбрать  1, АВСХ, CDEY, ABDEXY. (5.5)  Первый тип блоков состоит из восьми элементов без х и у, ортогональных подгруппе переименований, именно:  1, ab, de, abde, acd, bcd, ace, bce. (5.6)  Остальные три типа блоков получаются поочередным 
5.4. ОБЩЕЕ СМЕШИВАНИЕ ПЛАНОВ ТИПА 2n 10]  обобщенным умножением этих элементов на ах, dy и adxy, символы квазифакторов опускаются при записи содержимого блоков. Каждый тип входит столько раз, сколько требуется в реплике. Конечно, квазифакторы нужны только для того чтобы показать связь с дробными репликами. В качестве аль- тернативы можно сказать, что план типа 2" может быть смешан в блоки по 210 элементов с помощью выбора смешивающей подгруппы порядка 271-19, элементами ко- торой (кроме 1) должны быть смешанные эффекты. Об- общенное произведение любых двух смешанных эффек- тов само должно быть смешанным. Первый блок, вну- триблоковая подгруппа, состоит из всех элементов спо- собов обработки, которые ортогональны смешивающей подгруппе; тогда умножение этих 21’ элементов на любой другой элемент образует другой блок. Таким образом, для плана типа 25 в блоках по восемь элементов одна из возможностей состоит в использовании смешивающей подгруппы  1, АВС, CDE, ABDE, (5.7)  которая соответствует выбору подгруппы переименова- ний в (5.5). Восемь элементов, ортогональных указан- ным, перечислены в (5.6)‚ и поочередное умножение На а, d, ad дает другие три типа блоков:  а, b, ade, bde, ..., abce, d, abd, е, аде, . . .‚ bcde, ad, М, ае, be, .р..‚ abcde.  Для пяти отдельных факторов число различных смеши- вающих подгрупп этого типа, очевидно, равно  5-с3„%=45.  Другими типами смешивания для плана типа 25 в три блока по восемь элементов могут служить  AB, CDE, ABCDE, ,АВ‚ CD, ABCD, A, BCDE, ABCDE, 
102 гл. 5. смвшивАнив  и т. д.‚ но первый тип смешивания является единствен- нь1м‚ который не смешивает ни главных эффектов, ни двухфакторных взаимодействий.  5.5. Частичное смешивание  Когда в эксперименте должны быть использованы несколько полных реплик всех комбинаций способов обработки, экспериментатору нет необходимости полно- ‚стью жертвовать некоторыми взаимодействиями при смешивании. Исключение составляет та информация, ко- торая может быть получена из междублоковых сравне- ний. Экспериментатор может в качестве альтернативы получать внутриблоковую информацию обо всех эффек- тах, смешивая различные взаимодействия в различных репликах. Например, четыре плана типа 23 в блоках по четыре элемента могут быть расположены так, чтобы каждое из взаимодействий ABC, AB, AC, BC.cMeum- валось только в одной реплике. Точно так же четыре реплики плана типа 25 в блоках-по четыре элемента могут иметь одну реплику, построенную так, чтобы сме- шивать каждый из четырех наборов с тремя степенями свободы, например,  АВС, ADE, BCDE, ABD, BCE, ACDE, ACE, BCD, ABDE, ACD, BDE, ABCE.  Такое частичное смешивание дает возможность изучать каждое смешанное взаимодеиствие в репликах, в кото- рых они не смешаны. Последняя схема интересна тем, что добавление пятой реплики, смешивающей АВЕ, CDE, ABCD, балансирует смешивание наличием каж- дого из десяти трехфакторных и четырехфакторных взаимодеиствии, смешанных в однои пятой эксперимента. Хотя такое сбалансированное смешивание интересно с точки зрения комбинаторных свойств, часто предпочти- тельнее полное смешивание некоторых взаимодействий в действительно проводимых экспериментах (см. § 5.15). 
5.6. СМЕШИВАНИЕ В ЕДИНИЧНОП РЕПЛИКЕ [03  Это частичное смешивание в планах типа 2" не вно- сит новых проблем B построение планов. Каждая реп- лика образуется так, будто она получена от смешивания взаимодействий в единичной реплике (§ 5.6), причем в каждом блоке порядок обработки участков рандоми- зуется. Статистический анализ эксперимента с частич- ным смешиванием сложнее и более трудоемок, чем в случае полного смешивания. В частных случаях воз- можны упрощения, но при общем подходе следует рас- сматривать отдельно каждый из (271-— 1) ортогональных контрастов между способами обработки. Те из контра- стов‚ которые не смешиваются, вычисляются обычным образом и индивидуальные квадраты входят в диспер- сионный анализ. Каждый смешанный контраст следусг вычислять только по тем репликам, в которых он не смешан, и квадрат должен быть вычислен на этой осно- ве. Сумма квадратов для блоков образуется обычным путем и суммы квадратов ошибок появляются как оста- ток от вычитания всех остальных компонент из общей суммы.  5.6. Смешивание в единичной реплике  Возможность проведения эксперимента в единичной реплике не влияет на введение смешивания. Например, план типа 25 в блоках по восьми способов можно осу- ществить как одну только реплику смешивания  АВС, ADE,BCDE, BDE, ACDE, ABEF, CEF. (5.8)  Символы должны быть так приписаны факторам, чтобы четыре трехфакторных взаимодействия, которые должны быть‘ смешаны, не представляли интереса сами по себе и оставшиеся 16 взаимодействий этого порядка могли быть изучены при дисперсионном анализе, как показано в табл. 5.2. Первый блок содержит элементы, ортогональные к смешивающей подгруппе, состоящей из 1, abd, ace, аса? и их произведений внутри группы способов обработки, умножение каждого из этих восьми элементов на а порождает другой блок и т. д. и 
104 гл. 5. СМЕШНВАНПЕ  Таблица52  <Ьорма дисперсионного анализа для эксперимента типа 2“ B единичной реплике,сшкинанной в блоки по восемь участков  Степени Сумма Средний Источники изменчивости свободы квадратов квадрат Блоки 7 Главные аффекты 6 11вухфакторные взаи- 15 модеиствия Трехфакторные взаи- 16 модействия Ошибка (высшие взаи- 19 модействия) Сумма .. .. 63  5.7. Смешивание дробных реплик  Хотя смешивание было введено как форма дрббной реплики, в § 5.3 было отмечено, что эти две схемы пре- следуют несколько различные цели. Иногда смешивание и дробные реплики выгодно использовать одновременно. Например, наилучшее смешивание типа 27 в блоках по восьми элементов имеет подгруппу смешивания, со- стоящую из семи трехфакторных, семи четь1рехфактор- ных, и одного семифакторного взаимодействия. Если используется только половина этого плана соответ- ствующая  ABCDEFGE1, (5.9)  то каждое из трехфакторных взаимодействий бтбжде- ствляется с четырехфакторным взаимодействием, и мы получаем превосходную полуреплику. В 64 участках все главные эффекты и двухфакторные взаимодействия по- лучаются как внутриблоковые контрасты, переимено- вания которых являются взаимодействиями очень высо- кого порядка, и во многих обстоятельствах оставшиеся трехфакторные взаимодействия могут быть достаточно 
5.7. СМЕШИВАНИЕ ДРОБНЫХ РЕПЛИК 105  хорошо использованы для`оценки ошибки. Если зара- нее предполагается, что некоторые трехфакторные взаи- модействия представляют особый интерес, то их можно выделить, чтобы изучать специально, вместо того, чтобы использовать для оценки ошибки. Следует сравнить табл. 5.3 с табл. 5.2 и табл. 4.3. Таблица 53 <Ьорма дисперсионного анализа для  1/2 (27)-эксперимента, смешанного в блоках по восемь участков  Степени Сумма Средний Источник изменчивости свободы квадратов Квадрат Блоки 7 Главные аффекты 7 11вухфакторные взаи- 21 модействия Силибка (взаимодей- 28 ствия выспкжо по- рядка) Сумма .. .. 63  Для того чтобы построить 1/2Ч-репл-ику плана типа 2" B блоках по 219 элементов, сначала следует выбрать под- группу переименований порядка 29, пытаясь в соответ- ствии с обычными принципами сделать так, чтобы ни- какой важный эффект не имел никакого важного переименования. Затем должна быть выбрана подгруп- па смешиваний порядка 2"“? так, чтобы подгруппа пере- именований целиком содержалась в ней (т. е. являлась подгруппой подгруппы смешиваний), и так, чтобы все эффекты, представимые ее элементами, могли быть сме- шаны без существенных потерь. Элементы группы эф- фектов, ортогональные к подгруппе смешивания, как обычно, образуют внутриблоковую подгруппу. Другие блоки получаются из указанного блока стандартным об- разом при умножении на другой элемент, но уже теперь с ограничением на выбор элемента-множителя. Этот элемент должен быть Элементом подгруппы способов 
106 гл. 5. смвшивАннв  обработки—подгруппь1 порядка 2"“1, ортогональной к подгруппе переименований (Финни [97]). Этот процесс станет яснее после рассмотрения при- мера. Предположим, что 1/8-реплика плана типа 210 (128 участков) разделена на блоки по 16 участков. Под- группа переименований, которая удовлетворяет требова- нию, что никакой главный эффект или двухфакторное взаимодействие He должно иметь среди всех своих пере- именований взаимодействия меньшего порядка, чем трехфакторное, порождена тождественным соотноше- нием *)  ABCDEEABFGHEACFJKEI, (5.10)  причем различные встречающиеся‘ здесь произведения дают восемь элементов подгруппы. Элементы AGK, ACEHJK, ABCDEFGHJK И все их произведения как ме- жду собой, так и с элементами подгруппы переименова- ний образуют подгруппу смешиваний из 64(= 2"‘P) эле- ментов; ни один из этих элементов (кроме <<1>>) не имеет в своем обозначении меньше трех букв, так что главные эффекты и двухфакторнь1е взаимодействия не смешаны. Следовательно, план, соответствующий этому переиме- нованию и схеме смешивания, вполне приемлем; не- сколько трехфакторных взаимодействий (AGK, EFH, CDG, DFJ, BEK) являются смешанными, и эти символы могут быть связаны с факторами таким способом, кото- рый делает их малоинтересными. Существуют ли луч- шие планы, в которых эти переименования или смешива- ние в «меньшей степени препятствуют интерпретации ре- зультатов, с первого взгляда сказать нельзя. Это может быть установлено только при более тщательном изучении имеющихся возможностей. Комбинации способов обработки  adgj, aehk, bcgk, befj  OpTOFOH8JIbHbI КЗЖДОМУ ЭЛЕМЕНТУ подгруппы СМЕШИВЗ- НИЙ; ЭТО УТВЕРЖДЕНИЕ МОЖНО ПРОВЕРИТЬ ДЛЯ КЗЖДОГО ИЗ ПРИВЕДЕННЫХ ВЬПЦЕ ШЕСТИ ЭЛЕМЕНТОВ, И, ТЗКИМ o6pa3oM,  *) Буква «1» исключена из символов факторов, чтобы избежать путаницы. 
5.8. СМЕШИВАНИЕ ПЛАНОВ ТИПА п" 107  оно справедливо для подгруппы их произведений. Далее, ни одна из комбинаций способов обработки не равна произведению других. Следовательно, внутриблоковая подгруппа——один блок из 16 комбинаций способов об- работки для плана — получается, если взять произведе- ния этих четырех элементов подгруппы способов обра- ботки. Второй блок можно образовать из произведений каждого элемента внутриблоковой подгруппы с любым элементом подгруппы способов обработки, например, с abcd или de (которые ортогональны всем элементам подгруппы переименований), но не с элементом ad или cfg (которые не ортогональны им). С этой точки зрения построение всех восьми блоков—почти механический процесс.  5.8. Смешивание планов типа п"  Идеи §§ 5.3—5.7 без труда переносятся на смешива- ние экспериментов, в которых все факторы находятся на л уровнях, где л — любое простое число (Ф и ш е р [116], К е M п т о р н [51], К и ш е н [58]). Если ввести подходя- щие квазифакторы, то с фактором, число уровней кото- рого само по себе представляет степень п, можно поступать так же, как в § 4.11. Наиболее важный тип для практического использо- вания——серии типа 3"—в достаточной мере иллюстри- рует новые особенности этих планов. Снова будут ис- пользованы группы способов, обработки и эффектов, определенные в § 4.7. ’ Например, для того, чтобы смешать 27 способов для эксперимента типа 33 в блоки по девять элементов, следу- ет выбрать подгруппу смешиваний третьего порядка. Оче- видный выбор состоит в выборе любой пары контрастов из трехфакторного взаимодействия, т. е. любой пары из  AB5’CV' (f3’=l, 2; y’=l,2).  Если выбрать ABC2, то внутриблоковая подгруппа со- стоит из всех элементов группы способов обработки, ортогональной к АВС9, и, таким образом, эта подгруппа образована всеми степенями и произведениями 1, ab2, ac. Умножение этих девяти элементов на любые два 
103 ГЛ. 5. СМЕШИВАНИЕ  Таблица 5.4  Форма дисперсионного анализа для эксперимента типа 33, смешивающего ABC” из трехфакторного взаимодействия  Степени Сумма Средний  Источник изменчивости Свободы квадратов Квадрат  Блоки 2 А 2 B 2 С 2 АВ 4 АС 4 BC 4 Ошибка (АБС, AB2C, AB'~’C'~’) 6 Сумма . . . 26  ЭЛЕМСНТЗ, удовлетворяющие УСЛОВИЯМ  oL+[3+2y=1(mod3),  a+{3+2y=2(mod3), (511) дает соответственно два других блока. Эти три блока представлены в плане 5.1: это один из четырех возмож- ных планов, план <<Y>>, no терминологии Иэйтс а [45]. Табл. 5.4 показывает, как можно провести диспер- сионный анализ для единичной реплики, в которой все двухфакторные взаимодействия (будучи не смешан- ными) могут быть оценены И проверены, а несмешанные контрасты из трехфакторного взаимодействия могут быть использованы в качестве ошибки. Согласно об- Щему правилу для ошибки получается девять степеней свободы, так вак включается одна степень свободы ‘из каждого двухфакторного взаимодействия, которое выби- рается как наименее важное из набора по четыре сте- пени свободы (если оба фактора количественные, то взаимодействие квадратичных компонент). Тот же план можно получить. введя квазифактор Х для представления блоковых разностей и выписывая 
5.8. СМЕШИВАНИЕ ПЛАНОВ ТИПА rm 109  План 5.1 Система блоков для смешивания АВС2 в эксперименте типа 33 l II III I II III 1 а а2 12с а12с а212с ab? а2122 122 122с2 а122с2 а2122с2 (1212 12 ab а12с2 1121202 12с2 ac а2с с 1121220 122с а122с а2с2 с2 ас2  1/3-реплику для элементов 1, АВС2Х, А2В2СРС2.  Частичное смешивание можно использовать для этих планов без каких-либо новых трудностей. Если экспери- ментатор желает получить две реплики, то он может ис- пользовать уже рассмотренный план на обоих наборах по 27 участков, конечно, с новой рандомизацией блоков и участков внутри блоков для каждой реплики, с другой стороны, он может смешать АВС2 в первых трех блоках и любую другую пару степеней свободы, например АВ2С2, во втором. Лица, неопытные в практике планирования экспери- мента, часто бывают до некоторой степени очарованы математической элегантностью сбалансированных пла- нов и думают, что этим планам придается специальное  значение. Сбалансированное смешивание схемы типа 33-  достигается при наличии четырех реплик, каждая из ко- торых смешивает каждый из АВ“’С*’‚ И, таким образом, требуется 108 участков. Если трехфакторные взаимодей- ствия считать важными, то этот план ценен, хотя непол- ное балансирование, достигнутое в трех репликах, весь- ма мало удовлетворительно. Если же трехфакторное взаимодействие считать несущественным, то нелепо на- стаивать на 108 участках для изучения лишь трех фак- торов. Экспериментатор, собирающийся руководить та- ким широким экспериментом, должен посмотреть, не может ли он включить больше факторов. Наиболее 
110 ГЛ. 5. СМЕШНВАНИЕ  важная возможность-это единичная реплика типа 34 снова в блоках по 9 элементов. Имеется восемь планов этого типа, в которых смешаны только трехфакторные взаимодействия. Один такой план имеет подгруппу сме- шивания, порожденную 1, АВС2, АВ9Б2 и, следователь- но, содержащую также ACD И BCD9. Элементы внутри- блоковой подгруппы могут быть получены при решении уравнений  0£+B+2Y=0(mOd3),} (5.12)  oL+2[3+2<3=O(mod3),  И, таким образом, эта подгруппа может быть получена из 1, abcz, ab2d2 составлением всевозможных степеней и произведений.  5.9 дробная реплика плана типа п"  Для того чтобы построить 1/пЧ-реплику плана типа 21;" B блоках по п? элементов, сначала следует выбрать подгруппу переименований порядка пЧ, пытаясь в соот- ветствии с обычными принципами обеспечить выполне- ние того условия, чтобы никакой важный эффект не имел важного переименования. Подгруппа смешивания порядка 31""? должна быть выбрана таким образом, что- бы она включала подгруппу переименований и чтобы все эффекты, представимые своими элементами, могли быть смешаны без существенных потерь. Внутриблоко- вая подгруппа определяется как ортогональная к под- группе смешивания, и весь эксперимент состоит из т“! способов обработки ортогональных к подгруппе пере- именований (Финни [97], [102]; Кемпторн [51]). Этот процесс в основном совпадает с описанным в § 5.7 процессом для схемы типа 2". На возможность изучения четырех факторов, каждый из которых может находиться на трех уровнях, и их двухфакторных взаимодействий в эксперименте, вклю- чающем 81 участок, мы ссылались в § 5.8. Можно ска- зать, что этот план «насыщен» факторами, в нем встре- чается только один участок с каждым возможным способом обработки. Дробная реплика приводит к пере- 
5.9. ДРОБНАЯ РЕПЛИКА ПЛАНА ТИПА an 111  насыщению И дает возможность при очень небольших потерях поместить в этот план пятый фактор. Например, 1/3-реплика, определенная соотношением  АВ2С02ЕЕА2ВС2ОЕ2Е 1, (5.13)  может быть использована в связи с подгруппой смеши- вания, порожденной 1, АВС2, ABQDQ. Здесь смешиваются как СЕ, так и АВЕ, ACD, ВСЕ? ADE9, BD2E9 И различ- ные четырех- и пятифакторные взаимодействия. План без смешивания хотя бы одной пары степеней свободы у одного двухфакторного взаимодействия невозможен, но, если хотя бы на одно из десяти взаимодействий, имеющихся для пяти факторов, можно указать как на малоинтересное, то план этого типа будет чрезвычайно эффективен при исследовании взаимоотношений пяти факторов. В только что описанном случае элементы 1, abc2e, ab2d2 порождают внутриблоковую подгруппу, и остальные восемь блоков могут быть образованы у.мно- жением внутри подгруппы способов обработки. Чинлой, Иннес и Финни [133] описали исполь- зование 1/3-реплики схемы типа 35 в эксперименте по удобрению сахарного тростника и полностью проиллю- стрировали анализ и интерпретацию результатов. K со- жалению, они выбрали менее удовлетворительную схе- му смешивания, чем только что описанная. В их эксперименте 1/3-реплика определялась соотношением  ВС2Б2ЕЕВ2СОЕ2Е 1, (5.14)  а не одним из тех шестнадцати соотношений тождества для пятифакторного взаимодействия, типичным пред- ставителем которых является соотношение (5.13). Кон- трасты ВС, АВБ2, их квадраты, взаимные произведения и произведения с элементами подгрупп переименований являются смешанными. Легко проверить, что ВС, В2С9-— единственное двухфакторное взаимодействие, которое смешано, но соотношение (5.14) имеет результатом три другие пары несмешанных двухфакторных взаимодей- ствий, отождествленных между собой, например  ВС2ЕБЕ2. 
112 гл. 5. СМЕШИВАНИЕ  Этот недостаток возник из-за ошибки при выписывании способов обработки для девяти блоков и был обнаружен только через некоторое время после начала эксперимен- та. K счастью, эти вредные эффекты были незначитель- ны, и в эксперименте было получено большое количество полезной информации, значительно большее, чем можно было бы получить, если бы эксперимент представлял собой просто единичную реплику плана типа 34 или плана типа 33. Последствия могли быть значительно серьезнее: конечно, немного стыдно, что такой недоста- ток встречается, даже когда за план ответствен стати- стик, но это может служить предупреждением о необ- ходимости тщательной проверки сложных планов перед их использованием. Т и ш е р и K e м п т о р н [89] про- анализировали значительно более претенциозный экспе- римент, представляющий собой 1/9-реплику схемы типа 37, смешанную в девяти блоках по два элемента так, чтобы каждый блок представлял собой однодневную ра- боту по определенным лабораторным действиям и про- веркам.  5.10. Теорема Фишера о минимальном смешивании  Важно знать, насколько можно уменьшить размер блоков с помощью смешивания без потери информации о существенных контрастах. Метод проб и ошибок быст- ро показывает, что, когда число факторов велико, можно без смешивания важных эффектов использовать блоки много меньше, чем блок из п" участков, потреб- ный для полной реплики. Фишер [115] доказал сле- дующее утверждение: 2п-факторная схема может быть расположена в 2"‘? блоках по 2P участков в каждом без смешивания главных эффектов и двухфакторных взаи- модействий при условии, что n < 21’. Позже [1116] он обобщил эту теорему и доказал сле- дующее: лп-факторная схема может быть расположена в :rc"“P блоках по п? участков в каждом без смешивания главных эффектов или двухфакторных взаимодействий при условии, что л1’—1  n<';{:_—r (5-15) 
5.10. ТЕОРЕМА ФИШЕРА О МИНИМАЛЬНОМ СМЕШИВАНИИ 113  Доказательство дается построением внутриблоковой подгруппы для требуемой системы смешивания, когда п равно верхнему пределу, определенному в неравенстве (5.15); это почти так же просто для общей теоремы, как и для случая л = 2. Построение, иллюстрируемое табл. 5.5 для п = 3, р = 2, состоит в следующем: i) Введем р псевдофакторов Х, Y, каждый на л; уровнях и запишем столбцом элементы их группы спо- собов обработки x°‘y5zV, ..., B каком-то систематическом порядке. ii) Образуем (пр ——— 1)/(n— 1) параллельных столб- цов, соответствующих наборам (л——1)степеней свобо- ды, на которые делится группа эффектов для псевдофак- торов. Таким образом, будет введен типичный столбец X°"Y5'ZV' ..., причем (л; ——- 1) степеней свободы соответ- ствуют этому элементу и всем его степеням, состав- ляющим одну из тех подгрупп порядка п, о которых мы упоминали в § 4.7. iii) B каждый из этих столбцов вписать вычет овод’ + 66’ + W’ + ... (mod л) на строке, начинающейся с x°‘yBz\’. . . iv) B последний столбец вписать п? элементов груп- пь1 способов обработки для п" множителей, где  п: лд—1 л——1 ’ а индексы п символов а, b, c, ���� представляют собой соответствующие вычеты в п предшествующих столбцах. В этом случае последний столбец есть внутриблоко- вая подгруппа требуемого смешивания, а остальные (л"-Р——1) блоков могут быть получены из нее, как обычно, умножением на другие элементы внутри группы. Эту процедуру можно пояснить с помощью табл. 5.5. этом простом примере заголовками столбцов будут Х, Y, XY, XY9, как представители четырех подгрупп вто- рого порядка для двух псевдофакторов. Значения (осой + [3[3’ + W’) B строке ху? равны соответственно 1, 2, 3 и 5 и их остатки по модулю 3 приведены в таблице. Остатки 1, 2, О, 2 соответствуют элементу 61172032 для 34 множителей (п == (9 — 1)/(3 — 1) = 4).  8 Д. Финни 
114 ГЛ. 5. СМЕШИВАНИЕ  Таблица 5.5  Построения внутриблоковой подгруппы в минимальном смешивании в 34-факторной схеме  Псевдофакторы ВнуТрибЛО_ ковая подгруппы эффектов подгруппа сЪроУёЁёЁв Si X | Y ‘ XY XY2 . . 1 0 О 0 О 1 1 0 1 1 d 3:2 2 О 2 2 350242 у О 1 1 2 130612 ху 1 1 2 О abc2 x2y 2 1 О 1 a2bd g2 о 2 2 1 b2c9d xy2 1 2 О 2 ab2d2 x2y2 2 2 1 О a2b2c  Остается доказать, что пр элементов последнего столбца удовлетворяют необходимым условиям. i) Символу 1 в первом столбце должна соответство- вать 1 в последнем столбце. Более того, обобщенное про- изведение любых двух элементов первого столбца яв- ляется элементом этого столбца, набор их остатков содержит суммы пар остатков, приведенных по модулю п, и, следовательно, то же отношение для произведений выполняется в последнем столбце. Например, в табл. 5.5 произведение ху и ху? есть x-'3, a произведение абс? и аЬ2с19 есть а9с2с12. Следовательно, элементы последнего столбца образуют подгруппу. ii) B последнем столбце каждый уровень каждого из п, факторов встречается пр“ раз, так как остатки ка- ждого из n предыдущих столбцов содержат каждое из О, 1, 2, . . ., (л— 1) по 31:?“ pas. iii) B последнем столбце каждая из п? комбинаций уровней любой пары факторов встречается пр‘? раз. Это происходит из-за того, что эта пара факторов соответ- ствует паре столбцов для подгрупп эффектов И ортого- нальность наборов из (р — 1) контрастов, определенных этими столбцами, требует, чтобы все пары вычетов были представлены в равной мере. 
х  5.11. СМЕШАННЫЕ уровни 115  План, для которого табл. 5.5 дает внутриблоковую подгруппу, один из тех, которые упоминаются в конце § 5.8. Для любого меньшего значения п требуемая схема смешивания получается вычеркиванием всех букв, не зависящих от внутриблоковой подгруппы, и одновремен- ным вычеркиванием из подгруппы смешивания всех взаимодействий, содержащих эти буквы: при таком вь1- черкивании не может быть введено никакого нового сме- шивания, но при каждом таком вычеркивании число блоков в реплике уменьшается в л раз. Например, дан- ное правило приводит к плану типа 27, смешанному в 16 блоков по восемь элементов (л = 2, р = 3), для ко- торого внутриблоковой подгруппой служит  1, aceg, bcfg, abef, делец acdf, bode, abdg; (5.16)  15 степеней свободы смешивания суть ABC, ADE, BEG,  СЭС и все их обобщенные произведения. Если требуется план типа 25 в блоках по восемь элементов, то его мож- но построить, опуская любые две буквы, например F И G: внутриблоковой подгруппой является  1, асе, bc, аде, de, acd, bcde, abd.  Смешанными взаимодействиями будут ABC, ADE И их произведение BCDE: для полной реплики теперь тре- буется только 32 участка вместо 128. Теорему Фишера, кроме того, можно интерпретиро- вать в терминах дробных реплик, как уже указывалось в § 4.10.  5.11. Смешанные уровни  Для того чтобы смешать эксперименты, в которых количества уровней различных факторов представляют собой различные простые числа, следует использовать другой тип частичного смешивания. План 5.2 иллюстри- рует смешивание типа 3 >< 22, а план 5.3—смешивание типа 32 X 2 B блоках по шесть элементов. Легко видеть, что в первом плане каждый контраст ортогонален всем блокам, кроме ВС и ABC: тем не менее ни одно из их взаимодействий не отождествляется с блоковой  8* 
116 гл. 5. смвшивАнив  разностью. Каждая из трех пар блоков представляет собой реплику и разность между двумя членами пары равна также мере ВС плюс компонента ABC. Эти три пары используются для того, чтобы сбалансировать сме- шивание АВС‚—шаг который здесь более желателен, чем в ранее рассмотренных типах смешивания, так как без него не только ТРУД-Нее провести оценку взаимодей- ствия АВС, но и имеются трудности при получении оцен- ки ВС независимо от влияния АБС. Можно аналогичным образом построить план, смешивающий 3><23 в блоках по 12 элементов, единственное, что следует сделать, — это добавить к каждому блоку bd и cd B комбинации с уров- нем а, который входит с bc, а также d и bcd B комбина-  План 5.2  Система блоков для частичного смешивания ВС и АВС в эксперименте типа 3><22  Уровниа 1 11 111 IV V VI bc bc bc bc bc bc 0 00 10 10 00 10 00 0 11 01 01 11 01 11 1 10 00 00 10 10 00 1 01 11 11 01 01 11 2 10 00 10 00 00 10 2 01 11 01 11 11 01 План5.3  Система блоков для частичного смешивания АВ и ABC B эксперименте типа 32><2  Уровни 1 11 111 IV V VI VII VIII IX X XI XII b c a а а а а а а а а а а а 0 0 0 1 2 0 1 2 0 2 1 0 2 1 0 1 1 2 0 2 0 1 2 1 0 1 0 2 1 0 1 2 0 1 2 0 2 1 0 2 1 0 1 1 2 0 1 0 1 2 1 0 2 0 2 1 2 0 2 0 1 2 0 1 1 0 2 1 0 2 2 1 О 1 2 1 2 0 0 2 1 2 1 0 
5.12. двошнов смвшивАнив 117  ции с уровнем а, который входит с b. Тогда взаимодей- ствия BCD И АВСБ будут частично смешаны. Смешивание типа 32><2 совершенно такое же: все эффекты, кроме АВ и АВС, измеряются контрастами, ортогональными блокам. Каждая из четырех троек бло- ков есть реплика, внутри которой эти два контраста ча- стично смешаны, разность по блокам совпадает с сум- мой компонент АВ и компонент АВС. Для полного балансирования этого смешивания необходимо 12 бло- ков (четыре реплики и 72 участка). Здесь также жела- тельно такое балансирование, хотя приемлемо и менее полное балансирование шести блоков. План легко мо- жет быть распространен на смешивания типа 33>< 2, 32><22ит.д.... Такие планы анализировать и интерпретировать труд- нее, чем планы типа п". Кроме того, они менее гибки в том смысле, что редко удаются такие изменения пла- на, как включение добавочных факторов или другие мо- дификации. Статистики избегают употреблять смешан- ные планы, предпочитая им схемы типа п". Для факто- ров, уровни которых имеют количественные выражения, это не представляет проблемы, так как легко можно до- бавить дополнительные уровни: план типа 3 >< 22 с 36 участками обычно имеет мало преимуществ, чтобы его «можно было рекомендовать вместо плана типа 33 с 27 участками, а план типа 39 >< 2 с 72 участками мо- жет быть заменен на план типа 33 и 34 или даже на план типа 35 с 81 участком ценой небольшого количества до- полнительных участков. Такой совет не универсален и планы со смешанными уровнями (за исключением пла- нов семейств 3>< 2) представляют большое практиче- ское значение, но статистик должен иметь в виду, что лучше иногда изменить осуществляемый эксперимент с тем, чтобы иметь план типа п", чем некритически ис- пользовать первое же предложение экспериментатора.  5.12. Двойное смешивание и квазилатинские квадраты  При некоторых обстоятельствах путем смешивания можно получить преимущества, присущие латинским квадратам. Пусть, например, для плана типа 26 выбраны две отдельные группы смешивания, образующие блоки 
113 ГЛ. 5. СМЕШИВАНИЕ  по восемь элементов, причем так, что эти подгруппы He имеют общих элементов. Тогда можно построить план, в котором один набор смешан по столбцам, а дру- гой по строкам. Такими двумя наборами могут быть сле- дующие:  ABC, ADE, BCDE, BDF, ACDF, ABEF, CEF; ABD, AEF, BDEF, BCE, АСОВ, ABCF, BDF.  Если эти внутриблоковые подгруппы записать в каче- стве первой строки и первого столбца квадрата 8 >< 8 (в качестве первого элемента строки и столбца 1) и все остальные клетки заполнить обобщенными произведе- ниями элементов на соответствующих местах первой строки и первого столбца, то получится план требуемого типа. Строки, а следовательно, и столбцы, должны быть затем перераспределены в случайном порядке. При дис- персионном анализе строки и столбцы должны быть пе- редвинуты точно так же, как для латинских квадратов. Фишер [117] назвал такие планы планами с двойным слъецшваниела, и они являются одной из форм квазила- тинских квадратов И э й т с а [45]. Их построение требует осторожности, поскольку если эти планы получены не из смешанных взаимодействий, то существует опасность не получить ортогональности. Другая встречающаяся опасность состоит в получении рандомизации с неже- лательной регулярностью и, может быть, должны быть введены дополнительные ограничения при рандомизации (Гранди и Хили [32]). Иэйтс [45], Кохрэн и Кокс [66] и Кенуй [53] дали примеры планов этого типа и вариантов, получаемых при использовании ча- стичного смешивания.  5.13. Планы с расщепленными участками  Иногда для некоторых факторов требуются экспери-  Ментальные ЕДИНИЦЫ меньшего размера, ЧЕМ ДЛЯ ПрО-'  чих. Например, некоторые факторы (скажем, рацион) должны быть применены только к животному как к це- лому, а в других случаях (например, инъекции различ- 
5.13. ПЛАНЫ с рАсщвплвнньтми УЧАСТКАМИ 119  ных ‘доз вакцины) могут быть применены к разным Me- стам одного и того же животного. В сельскохозяйствен- ном эксперименте способы внесения удобрений могут изменяться от одного небольшого участка к другому, но сравнение способов ирригации должно быть основано на больших площадях. Эксперименты, в которых неко- торые факторы или комбинации факторов используются на основных участках, а другие факторы сравниваются на их частях (нодучастках), называются планами с рас- щспленньсма участками. Такой план так же хорошо мо- жет быть описан, как смешивание главных эффектов и взаимодействий факторов основных участков: основные участки соответствуют блокам, а подучастки соответ- ствуют обычным участкам. Имеются три причины, по которым используются рас- щепленные участки: i) непрактичность или невозможность дифференциа- ции основных экспериментальных единиц для некоторых факторов; 11) необходимость включения дополнительных факто- ров в уже проводящийся эксперимент; 111) желание более точно оценить эффекты факторов частей участков и их взаимодействий с факторами ос- новных участков при некоторой потере точности на фак- торах основных участков. Первая из этих причин уже обсуждалась. В продол- жающихся длительное время экспериментах возмож- ность расщепления исходных участков может позволить испытать новые идеи, появившиеся у экспериментатора с момента начала эксперимента. Это имеет особенное значение в сельскохозяйственных опытах, которые про- должаются по нескольку лет. В хорошо спланированных экспериментах с малым числом участников не должна возникать необходимость в подобной модификации. Всегда следует рассматривать альтернативу выбора но- вых факторов на целых участках с помощью смешива- ния или дробного повторения (например, делая единич- ную реплику типа 34 одной третью реплики 35), по- скольку это не требует добавочных участков. Пункт 111) является причиной, на которую чаще Всего ссылаются экспериментаторы при использовании 
120 ГЛ. 5. СМЕШИВАНИЕ  расщепленных участков, но в действительности это ме- нее общее соображение, чем может показаться на пер- вый взгляд. Часто желательно получить, если это воз- можно, все оценки главных эффектов с разумной точ- ностью, и смешивание взаимодействий высокого по- рядка (с использованием подучастков в качестве Целых участков) может быть лучше, чем неявное смешивание главных эффектов в планах с расщепленными участ- ками. Например, эксперимент типа 23 в пяти репликах может быть организован как пять рандомизованньтх блоков двух основных участков для испытания факто- ра С; при этом каждый основной участок расщеплен на четыре подучастка, на которых должны быть рандоми- зованы комбинации уровней факторов А и В. Диспер- сионный анализ показан в табл. 5.6, а контрасты сле- дует сравнивать с соответствующими ошибками основ- нь1х участков или подучастков. Если С—фактор, который может быть соотнесен лишь целому объекту, равному четырем подучасткам, то такои план может  Таблица 5.6  Форма дисперсионного анализа для эксперимента типа 23 c основными участками, расщепленными на четыре подучастка  Степени Сумма Средний Источники изменчивости свободы квадратов квадрат Блоки 4 С 1 Ошибка (главная) 4 Главные участки 9 ~ 1 B 1 AB 1 АС 1 ВС 1 АВС 1 Ошибка (расщепления) 24 Сумма . 39 
5.13. ПЛАНЫ С РАСЩЕПЛЕНПЫМН УЧАСТКАМИ 121  быть превосходным. Если эксперимент начат как простое испытание одного фактора С в пяти репликах, а позднее становятся интересными факторы А и В, то расщепление исходных участков, по-видимому,—единственный путь введения новых факторов, но это будет встречаться не часто в таком простом эксперименте. Если эксперимен- татор хочет получить высокую точность при испытании А и В и в меньшей степени заинтересован в С, то этот план не будет хорошим, кроме, может быть, крайнего случая, когда эффект С представляет меньший интерес, чем взаимодействие АВС. Лучший вариант обычно дол- жен состоять в использовании одной и той же экспери- ментальной единицы, но в рассмотрении подучастков в качестве участков, а основных участков в качестве блоков, и затем в смешивании ABC. Получающийся план был описан в § 5.2 (вторая форма), а анализ по- казан в табл. 5.1 с г = 5. Поучительно сравнить табл. 5.1 и табл. 5.6. Встречающаяся иногда крайне неправильная форма расщепления участков состоит в использовании в экспе- рименте рандомизованной блоковой схемы для одного из нескольких факторов, в последующем расщеплении каж- дого участка для уровней второго фактора, расщеплении каждого подучастка для уровней третьего фактора и т.д. Либо непонимание Целей, либо лень могут привести к применению такого иерархического расщепления, кото- рое должно быть строго осуждено, если нет лучших до- водов в пользу его применения. Несмотря на критику  ТЗКОГО рода расЩепленные ПЛЗНЫ ИМЕЮТ ВЗЖНОЕ прак-  тическое значение. Расщепление участков может быть иногда скомбини- ровано со смешиванием некоторых взаимодействий меж- ду новыми факторами (T. e. смешиванием между основ- ными участками), для того чтобы ввести большее число комбинаций новых факторов, чем даст расщепление од- ного основного участка (Финни [100], [1О1]). Пример представляет собой латинский квадрат размера 4><4 для четырех уровней одного фактора А, в котором участки расщеплены пополам для комбинаций двух факторов, каждыйс двумя уровнями. Используя (22)-ортогональное 
122 гл. 5. СМЕШИВАННЕ  разбиение квадрата (§ 3.7) п полагая, что половина пар участков имеет комбинации 1, bc, a другая половина комбинации b, с, получаем, что главные эффекты В, С и взаимодействия АВ, АС, будучи ортогональны основным участкам, имеют точность сравнений подучастков, в то время как ВС имеет точность лишь сравнений основного участка, а АВС теряется вообще. Этот пример (см. план 5.4 для латинского квадрата плана 3.6) несколько тривиален, но эту идею можно использовать, если должны быть введены новые факторы, скажем, в латин- ский квадрат размера 6><6.  План 5.4  Латинский квадрат размера 4 X 4 с расщеплением участков пополам для введения дополнительных 22-факторных систем  щ!) ад а2с a3 ада аОЬс (1212 a3bc a3bc ага адЬс аос a3 agb а, aob ад?) а, a3b azbc aoc albc аза (22 a2 a3b aobc аде а2Ьс азс ад ад!)  _ В экспериментах, спланированных как квазилатин- ские квадраты (§ 5.12), природа некоторых способов обработки может потребовать, чтобы целыестроки или  столбцы получали один и тот же уровень фактора, так  что главные эффекты одного или более факторов смешивались бы со строками или столбцами. Иэйтс Назвал такие планы шотландским *) квадратом. Напри- мер, в эксперименте по вирусным прививкам растениям могут возникнуть привходящие обстоятельства, анало- гичные описанным в §3.3, НО с восемью листьями на каж; дом из восьми растений, что дает квадрат размером  *) B оригинале «р1а1с1»—-плед, шотландка.—-Прим. перед,’ 
5.15. ВКЛЮЧЕНИЕ ФАКТОРОВ A 123  8><8. Можно проектировать не только восемь различных прививок, но и 25-факторную систему, включающую раз- личные типы вирусов и другие факторы, и может быть выбран план с двойным смешиванием. Если некоторые из факторов (например, источник семян, дата посева, влажность в течение недели, следующей за прививкой) могут быть даны только для всех растений, то необхо- димо использовать шотландский квадрат. Иногда и строки и столбец имеют смешанные с ним главные эф- фекты.  5.14. дробная реплика и ортогональные квадраты  Нет ничего дурного в том, что латинский квадрат можно рассматривать как схему дробной реплики. Например, квадрат размера 5><5 в плане 3.2 является репликой плана типа 53, т. е. всех комбинаций пяти ра- стений, пяти размеров листьев и пяти способов обра- ботки. Кроме того, это смешанный план для единичной реплики плана типа 52 (размеры листьев и способы об- работки) в пяти блоках (растения), четыре степени сво- боды взаимодействия смешаны, Отсюда ясно, что взаимо- действие столбцов И способов в квадрате имеет четыре степени свободы, отождествленных со строками, а остав- шиеся степени свободы используются как ошибки. В этой ситуации возникают некоторые ограничения на использование латинских квадратов. Греко-латинский квадрат плана 3.4 представляет собой 1/52-реплику пла- на типа 54, устроенного так, что никакой главный эф- фект не имеет другого главного эффекта в качестве своего переименования. Частный случай теоремы Фи- „шера (§ 4.10) с р = 2 показывает, что для любого про- _стого числа п: можно построить реплику 1/л“‘1 плана „типа ил”, удовлетворяющую этому условию на пере-- именовании главных эффектов, и что она эквивалентна вполнеортогональному квадрату (§ 3.6). ‘я  5.15. Включениефакторов  Как уже упоминалось в § 4.4, обычно желательно ввести в эксперимент достаточно факторов, чтобы обра- 
124 гл. 5. СМЕШИВАНИЕ  зовать по крайней мере единичную реплику. Если экспе- риментатор, задача которого приведена к плану § 5.7, решил, что в интересах соответствующей точности он me- лает дважды повторить все комбинации имеющихся шести факторов, то ему следует посмотреть, не яв- ляется ли включение добавочного фактора в единичную реплику плана типа 27 более предпочтительным для удвоения этого плана, чем частичное смешивание двух подобных наборов взаимодействий. Седьмой фактор мо- жет быть введен без увеличения размеров и без влияния на смешивание исходных шести факторов, так что его главный эффект, все его двухфакторные взаимодействия и многие трехфакторные взаимодействия оказываются свободными от смешивания в эксперименте, размер ко- торого определяется потребностями шести факторов. Вся эта дополнительная информация дешево достается экс- периментатору после беспокойства о возможности при- менения еще одного фактора. Аналогично экспериментатор, намеревающийся про- извести сбалансированное смешивание плана типа 25 в блоках по восемь элементов (§ 5.5), используя пяти- кратную реплику на 160 участках, должен посмот- реть, не будет ли благоразумнее уменьшить экспери- мент до 128 участков и иметь единичную реплику плана типа 27. Потери точности для исходных пяти факторов не ве- лики, поскольку экспериментатор по-прежнему имеет четыре реплики всех комбинаций этих факторов, но, кроме того, получается еще информация по двум доба- вочным факторам. Конечно, нельзя установить никакого абсолютного правила, но в тех исследованиях, где число потенци- ально интересных факторов велико по сравнению с воз- можностями экспериментатора (что бывает в большин- стве случаев), включение дополнительных факторов в общем выгодно с точки зрения экономики исследова- тельской программы. Часто предпочтительнее увеличить число факторов настолько, что становится необходимой дробная репли- ка, чем иметь единичную реплику меньшего числа фак- торов. Эта тема развита в дальнейшем в §9.3. 
5.16. ДОСТОИНСТВА ФАКТОРНОГО ПЛАНА 125  5.16. Достоинства факторного плана  Существуют три различные, но тесно связанные между собой причины использования факторных экспе- риментов. Они приведены в § 4.1, но может быть по- лезно напомнить их еще раз: i) расширение основания для выводов, относящихся к одному фактору, испытывая этот фактор при изменяю- щихся других факторах; ii) оценка степени, до которой эффекты одного фак- тора изменяются уровнями остальных; iii) экономия экспериментального материала вслед- ствие получения информации о различных факторах при том же размере эксперимента, который требуется толь- ко для одного или двух факторов. Если два фактора He взаимодействуют, так что уро- вень одного фактора He влияет на эффект другого, то мы ничего не потеряем, включив в опыт все комбинации уровней, поскольку эффект каждого фактора может быть усреднен по уровням другого и затем оценен  столь же точно, как если бы второй фактор находился  все время на одном уровне. В то же время основания для выводов становятся более законными при таком исследовании различных уровней. С другой стороны, если взаимодействия существуют, то они могут быть весьма существенны при практическом использовании результатов; они, однако, не могут быть обнаружены, пока не исньлтаньс различные кшибанацнн уровней. Таким образом, факторный план является хорошей страховкой, так как если нет взаимодействия, то мы ничего не теряем, если же взаимодействия существуют, то такой план обеспечивает единственный способ их изу- чения. Более того, факторное планирование в значительной степени помогает экономике экспериментирования даже при отсутствии взаимодействий. Эксперимент с одним фактором на двух уровнях потребовал бы шести——восьми повторений для получения приемлимой точности (на- пример, в рандомизованных блоках по два элемента); отдельные эксперименты над пятью факторами, таким образом, использовали бы 6О—80 участков. В то же 
126 гл. 5. СМЕШИВАНИЕ  время единичная реплика плана типа 25, использующая только 32 участка, дает 16 повторений двух уровней каж- дого фактора‚ а при смешивании в блоки по восемь эле- ментов эти дополнительные реплики будут соответст- венно компенсированы большим размером блока. Таким образом, используется только половина участков, для каждого фактора получаются результаты по крайней мере такой же точности, и вся информация о взаимо- деиствиях получается из одного I-1 того же эксперимента без дополнительных затрат труда (§ 9.3). 
Глава 6  неполные влок-плАны  6.1. Необходимость неполных блоков Существенная особенность смешивания состоит в том, что t комбинаций способов обработки расположены в блоках по la участков (k<t). Поэтому эксперимент проводится так же, как в случае рандомизованных бло- ков, т. е. участки внутри блока расположены совершен- но случайно. Группировка способов обработки в блоки производится так, чтобы контрасты между блоками были переименованиями взаимодействий высокого по- рядка или других относительно неинтересных сочетаний способов обработки. Если t велико из-за того, что охватываются комбина-  ,ции многих факторов, то такая процедура обычно  является наилучшей. Однако иногда в эксперимент включен только один фактор, но у него очень много уров- ней, или даже если число уровней не слишком велико, может быть очень сильно ограничен размер блока (k)_. Естественно, что экспериментатор не хочет полностью или даже частично жертвовать информацией о некото- рых контрастах, но все же неизбежен некоторый тип смешивания. Поэтому он (экспериментатор) попытается  сделать так, чтобы все контрасты между способами были  смешаны в одинаковой или почти одинаковой степени. Необходимость в блоках с меньшим количеством уча`- стков, чем полное число способов обработки, возникает во многих обстоятельствах. Примерами могут служить следующие: i) B эксперименте, проводящемся на одном поле, по урожайности должны сравниваться много видов (100 или более) сельскохозяйственных культур. При таком количестве участков введение блоков нежелательно,так как они неизбежно будутотражать неоднородность почвьь 
128 гл. в. нвполныв влок-плмты  11) Машина для сравнения прочности образцов во- локна может проверять одновременно пять образцов. е всегда можно непосредственно сравнивать результаты испытаний, полученных в разное время, так что одно- временное испытание образцов должно образовать блок, однако часто требуется сравнивать образцы более чем из пяти источников. 111) Сравниваются семь различных средств от насе- комых по результатам опрыскивания каждым средством  ‘В ПЯТИ КОНЦЭНТрЗЦИЯХ ДЛЯ H3C€KOMbIX p2l3HbIX ВИДОВ.  Полное опрыскивание всех групп утомительно, и за один день можно произвести только три опрыскивания, но из-за того, что чувствительность насекомых меняется ото дня ко дню, желательно использовать дни в каче- стве блоков. iv) Требуется сравнить три различных метода обез- боливания с помощью самовнушения во время родов: естественно, различия между индивидуумами велики, но невозможно просить одну роженицу испытать более двух методов.  6.2. Сбалансированные неполные блоки  Важный класс решений этой задачи планирования, хотя по разным причинам он не всегда практически при- меним, предусматривается сбалансирова-нньсмъ: неполны- ми блоками. Приведенный ранее пример iv) хорошо ил- люстрирует, как в некоторых простых ситуациях можно выбрать такие планы интуитивно. В данном случае есте- ственно предположить, что различные лица будут испы- тывать различные пары методов и что три возможные пары (А, В; А, С; В, С), используемые для симметрич- ности одинаковым числом лиц, дают, таким образом, три типа неполных блоков. При сравнении четырех техноло- гических приемов будет необходимо шесть пар и, сле- довательно, шесть типов блоков опять с одинаковым чис- лом предметов в каждом. Обобщение для блоков, со- ставленных более чем из двух участков, состоит снова в том, чтобы взять все возможные наборы соответствую- щего числа способов обработки, но существуют планы 
6.2. СБАЛАНСИРОВАННЫЕ неполные влоки I729  расположения, которые обладают подходящей симмет- рией с меньшим числом реплик. Предположим, что можно найти план расположения для t способов обработки в блоках по k участков, для которого i) каждый способ встречается на г участках; ii) каждая пара способов встречается в 7» из Ь бло- ков, где г и ?ь— константы данного плана. Симметрия должна быть такой, чтобы обеспечить одинаковую точ- ность для всех контрастов между способами, как это будет ясно из примера, приводимого ниже (§ 6.6). Здесь рассматривается только структура таких сбалансирован- ных планов из неполных блоков. Если всего исполь- зуется N участков и требуется р блоков, то очевидно, что  N=rt=bk. (6.1)  Te r блоков, в которых встречается каждый отдельный способ, содержат г(/г — 1) других участков, и эти участ- ки должны быть поровну распределены между оставши- мися (t—l) способами; следовательно,  7ь(23—1)=г(/г-—1), (6.2)  где 7»— Целое число. Эти два необходимых условия на- кладывают тяжелые ограничения на целые числа la, t, r, b, НО и их выполнения недостаточно для сущест- вования плана. . Для любых in la всегда можно найти план, если брать Всевозможные наборы по la ИЗ I‘ способов обра- ботки, так что  Ь = t!/[k! (t — k)!], r= (23 -— 1)!/[(/г— 1)! (23 — /г)!]‚ (6.3) 7» = (23 —- 2)!/[(/г -— 2)! (23 — /г)!]. Однако если t и la достаточно велики, то такой игумень- щенный план требует очень большого числа участков. Интересно поэтому найти наименьшие значения г и Ь, для которых при определенных t И k можно построить  план. Из этого плана можно построить другие повторе- нием исходного плана, умножая г, Ь и 7» на 2, 3, 4 ���  9 Д. Финни 
130 ГЛ. 6. НЕПОЛНЫЕ БЛОК-ПЛАНЫ  6.3. Существование планов  То что уменьшенные планы должны существовать, легко следует из рассмотрения двух классов планов, свя- занных с полностью ортогональными квадратами (§ 3.6). Предположим, что известен такой квадрат размера п >< n; пример квадрата 4 >< 4 дан в плане 3.5. Запишем различные символы способов обработки в каждую ячей- ку квадрата и образуем блоки размера n, выбирая спо- собы обработки сначала по строкам, затем по столбцам, а затем по очереди по каждой из ортогональных класси- фикаций. Результатом, очевидно, будет схема сбаланси- рованных неполных блоков, в которой  /г=п, 23=п2‚ r=n+1, b=n(n+1), A=1. (6.4)  План для (112 + n + 1) способов легко можно получить отсюда следующим образом: образовать блоки по (п, + 1) элементу, устанавливая первый дополнительный способ в очередь с каждой строкой, второй ——с каждым столбцом, третий-с каждой группировкой из первого набора ортогональных группировок и т. д. н, наконец, записывая все добавочные способы обработки как один блок. Для этого плана  /г=п+1, =n2+n+1,r=n+1,  b=n2+n+1, 7&=l. (65)  Так, полученный план в случае, когда rz=2, А, В, С-- «добавочные» способы и квадрат 2><2 образован из D, E, F, G, может быть записан в виде семи блоков:  ADE, АРБ, BDF, BEG, СЭС, CEF, ABC. (6.6)  Здесь, так же как в гл. 2 и 3, буквы А, В, С, ���� обозна- чают способы, а не используются специально для обо- значения факторных планов. План расположений (6.6) представляет собой пример симметричных планов, для которых k = r, t = b. Другой симметричный план может быть построен, если взять дополнение каждого блока в (6.6); это означает, что блоки состоят из способов, опу- щенных ранее, так что  ~k==r=n2,t=b=n2+n+1,?»=n(n——1). (6.7) 
6.4. ТЕОРЕМА ФИШЕРА 131  Для rz = 2 эти блоки могут быть записаны в ином по- рядке следующим образом:  ACEG, BCFG, ABEF, DEFG, ACDF, всвв, ABDG. (6.8)  Это сделано для того, чтобы показать интересную связь с (5.16), внутриблоковой подгруппой для плана типа 27, смешанного в блоках по восемь элементов, о которой мы говорили в § 5.10. Из любого сбалансированного неполного блок-пла- на можно образовать дополнительный план, в котором каждый блок состоит из всех способов обработки, ony- щенных B соответствующем блоке. При теоретическом обсуждении можно, следовательно, без потери общности ограничиться случаем 1г<1/2. Известно много других планов, но может быть дано лишь немного общих правил их построения. У Фише- р а и Иэйтс а [121] и в стандартных работах по плани- рованию экспериментов перечислены размещения для сравнительно малых k И t; примерами служат 11 столб- цов плана 6.2 и 18 столбцов плана 6.3 (k=r=5, г‘: Ь = 11 и k = 4, z‘= 9, г = 8, Ь = 18). Известны одна или две теоремы, которые показывают, что при некото- рых комбинациях k, t, r, b, 7» нет решений. Две такие комбинации приводятся ниже как примеры.  6.4. Теорема Фишера  Фишер [114] показал, что для любого сбалансиро- ванного неполного блок-плана г>1г, и, следовательно, b>/t. Bose [11] и Кищен и Рао [60] дали другие до- казательства, но здесь по существу мы приводим дока- зательство Фпшера. Теорема показывает, что при k = 6, t= 16, r = 3, b = 8, Ж = 1 плана не существует (но он существует, когда 1г = г = 6, 1= Ь = 16, A = 2). Для любого плана отметим буквой 2 каждый блок, за исключением произвольного блока, который мы бу- дем считать первым. 2,—метка блока, i определяет число способов обработки из первого блока, которые  также встречаются в блоке i. Если знак �۪� , означает  9* 
132 гл. 6. НЕПОЛНЫЕ БЛОК-ПЛАНЬ1  суммирование по всем блокам кроме первого, то  Z (г) = k (r -— 1), (6.9)  так как каждый из k способов обработки в блоке 1 дол- жен появиться в других блоках (г — 1) раз. Более того, 2%, очевидно, превосходит г, на удвоенное число пар  способов обработки, которые встречаются и в блоке 1 и в блоке i, И, следовательно,  223=/г(г—1)+-’Ё$%`д-2(ж-1).  Далее, если 2`—средняя метка, то из соотношений (6.1) и (6.2) получаем  ‹ь—1›2‹2—г›2=<ь—1›2‹22›—[2‹2›Г= =/г(Ь——1)(г-—1)-|—1г(1г—1)(Ь—1)(?ь— 1)—/г2(г—— 1)2= =(rt—k)[r—k+7&(le—- 1)]—k2(r—- 1)2=  = ”“’° [rt——/et+r/e2—2r1e+ze]—/e2(r— 1)2=  t—l rU—kVU—k) t—l '  (6.10)  Это выражение неотрицательно и, следовательно, r>/z.  6.5. Теорема Шютценберже  Шютценберже [136] доказал, что (r--~— K) должно быть точным квадратом для любого симметричного пла- на (t=“b) с четным t. Шрикхэнд [135] дал чрезвы- чайно элегантное доказательство, которое приведено ниже. Эта теорема показывает, например, невозмож- ность планов, для которых  t=b=22, r=k=7, ?»=2, t=b=34, r=k=12, ?»=4.  Для любого сбалансированного неполного блок-пла- на определим  (6.11)  { 1, если способ i встречается в блоке j, u 1‘ " 0, в противном случае 
6.6. АНАЛИЗ СБАЛАНСИРОВАННЫХ ЭКСПЕРИМЕНТОВ 133  И выпишем матрицу U = (I/ljj) размера t>< b. Тогда  [г A A...A‘ ArA...A -. (HF: A A г„.Ж юлщ �+�� i .7L}\.7&...rA и  является квадратной матрицей размера ix t. Ee опре- делитель легко подсчитать, вычитая первый столбец из" каждого следующего и прибавляя, кроме того, все остальные строки к первой:  r+?.(t—1) О О �6�� О 7» r—7L О ���� О IUU’|= A 0 r—A... о = A O O ...r—7&  = (r — 70"‘ [r + A(t—1)]= rk (r — мы. (д.13)  Если план симметричен, то г = k и lUU’\ представляет собой квадрат целого числа )Щ. Следовательно, (г-—?ь) ‘"‘ есть квадрат целого числа и теорема дока- зана.  6.6. Анализ сбалансированных экспериментов с неполными блоками  Монография Кохрэна и Кокс и другие стандартные учебники содержат подробные формулы для анализа сбалансированных неполных блоков. Мы не будем при- водить здесь эти формулы, однако обсуждение отдель- ных арифметических примеров поможет выявить при- роду этого метода и дать дальнейшую иллюстрацию принципов и практического использования дисперсион- ного анализа. Табл. 6.1 содержит слегка видоизмененные резуль- таты эксперимента по изучению степени болезненности шести различных доз внутримышечных инъекций  . ....щ...„ 
134 ГЛ. 6. НЕПОЛНЬ1Е БЛОК-ПЛАНЫ  Таблица 6.1  ИССЛСДОВЗНИС СТЕПЕНИ бОЛСЗНСННОСТИ при внутримышечных ИНЪВКЦИЯХ пенициллина  Доза в единицах на мг СУММЫ 9 НСПЫТ ° N емогоу 180 330 500 710 940 1130 H”ge§j‘,§‘f{§1;‘A А В С D E F 1 2 3 1 6 2 3 4 4 1 1 3 4 1 2 7 4 1 2 1 4 5 4 1 3 8 2 6 2 2 6 7 2 1 1 4 8 2 1 7 9 4 3 4 2 9 10 4 4 4 12 74 11 1 O 3 12 1 2 1 б 13 3 4 1 1 5 14 4 3 3 10 15 З 1 1 5 16 3 3 9 17 3 3 1 6 18 2 2 1 5 19 3 1 2 1 5 20 3 2 2 7 61 21 2 1 4 22 3 1 1 7 23 З З 1 1 5 24 4 2 1 7 25 1 1 1 3 26 3 2 1 6 27 3 3 1 7 28 2 1 1 4 29 2 1 О 3 30 4 3 2 9 55 Сумма 43 38 38 34 19 18 190 
6.6. АНАЛИЗ СБАЛАНСНРОВАННЫХ ЭКСПЕРИМЕНТОВ 135  пенициллина (Хервик, Уэлч, Патнем, Гамбоа, [128]). Каждое из 30 лиц получало три дозы. Каждая доза вводилась в один из трех участков тела. Для этого плана k = 3, t= 6, г = 15, b = 30, ж: 6, и план состоял из трех повторений расположения с г= 5, b =10, 7м=2. А, В, ...‚ Р—обозначения доз в воз- растающем порядке, а болезненность измерялась по шкале от нуля (отсутствие боли) до четырех (сильная боль). Хотя эти очень маленькие числа едва ли могут удовлетворять всем требованиям нормальности, они дают превосходный иллюстративный пример благодаря про- стоте арифметических операций. Блоковые суммы приве- дены в таблице; табл. 6.2 содержит необходимые для анализа добавочные суммы: Тд—-сумма по 15 участкам с Е-м способом обработки, Вд-сумма по 15 блокам, в которых встречается Е-й способ обработки. Остальные суммы объяснены в дальнейшем. - Таблица 6.2  Суммы для анализа табл. 6.1  ЕДИЁЁЁЁ‘ ,Ё:“„:':"‘"` 180 330 500 710 940 1130 Сумма Сим BOo6a1pb;6c:)r;c:{<:[o6oB А В С D Е F T 43 38 38 34 19 19 190 В 96 107 91 102 91 83 570 3Q = 3T — B 33 7 23 О ——34 —29 О U=37‘—5B+380 29 ——41 39 ——28 —18 19 О  Предположим теперь, что «урожай» (мера болезнен- ности) любого <<участка>› можно представить аддитивно (соотношение (3.2)) B виде  Hi)‘-=7l+17i+[31+8z1, (5-14)  где ц-общее среднее, тъ-отклонение истинного сред- него по i-My способу от п, [Зг-отклонение истинного среднего для j-ro блока и ед; — «отпибка» отклонения от- дельного участка от его математического ожидания (n-+ „мы. Должно быть ясно, что величины Q.-, 
135 гл. в. неполные БЛОК-ПЛАНЫ  определенные по формуле kQ,- = kTi — B,-, (6.15)  являются Мерами эффектов способов, независимыми от [3,-. Это легко проверить, рассмотрев разность двух Qi И показав, что она включает только соответствующие разности т, и члены, содержащие ошибки. Например,  kQ1-/€Q2=[k7\+(/3- 1)(r—7\)](T1-T2) i i lea (OT каждого из 2?» участков) -J: i (la — 1)е (от 2 (г — ж) участков) ш i 8 (OT 2(k — 1) (r — ж) участков). (6.16)  Это следует из представления (6.14) для (2Г—-7\‚) блоков, участки которых входят в /г@,—1г@2 И 7» из них содержат оба способа обработки, (r—?.) имеют только способ 1 и (г-ж) —только способ 2. Символ е исполь- зуется для обозначения любого из ед; lee входит с раз- личными индексами и знаками, соответствующими каж- дому участку со способом 1 или 2, в блоки, где встре- чаются оба способа, (k— 1)в входит для каждого ‘участка с одним из этих способов в блоки, в которых от- сутствует другой способ, и е входит для каждого уча- стка этих 2(г—— ж) блоков с любым другим способом об- работки. Используя (6.2), перепишем (6.16) B виде  Е (kQ1" kQ2)=(7)(171“ 172)- (5-17)  Таким образом, все контрасты между Q.,- ортогональны блокам и измеряют лишь разницы в способах. Если набор способов обработки сначала случайным образом распределен по блокам, а затем способы внутри ‘блоков случайным образом распределены по участкам, то В; и е“ представляют собой соответственно межблоко- вые и внутриблоковые ошибки. В этом примере можно случайным образом выбрать трех испытуемых со спосо- бом АСЕ, следующих трех со способом ВСЕ и т. д., после чего у каждого испытуемого должны быть panne- ‘MI/I3OBaHb1 места инъекций для различных способов. Межблоковые и внутриблоковые дисперсии определя- ‘ются соотношениями  Е @��� = 0%, Е (е?!) = 03. (6.18) 
6.6. АНАЛИЗ СБАЛАНСИРОВАННЫХ ЭКСПЕРИМЕНТОВ 137  Из членов, содержащих а в (6.16)‚ получаем  D(kQ1 — kQ2) = [2Мг2 + 2 (r — x)(Ie -1)? + + 2 (r — ж) (la —1)jog= шага; (6.19)  Поскольку величина (kQ1—kQ2)9/2 ДОЛЖНа быть квад-  ‚рЗТОМ ДЛЯ ОДНОГО ИЗ контрастов В CyMM€ КВЗДрЗТОВ OT-  клонений 2[(1г@)2], то отсюда следует, что при объеди- нении отдельных участков величина  2[(kQ>21  W (6.20)  является суммой квадратов с (t — 1) степенями свободы в дисперсионном анализе способов обработки после устранения блоковых разностей. Таким образом, могут быть подсчитаны суммы квадратов в табл. 6.3 по блокам (29 степеней свободы) и по способам (пять степеней сво- боды) без каких-либо особенностей, внутриблоковые же ошибки получаются вычитанием из общей суммы. Вчаст-  ности‚ а Z квот ———1—O—8———- = 33,9259. Т а б л и-ц а 6.3 Дисперсионный анализ для табл. 6.1 Поправка для среднего 401‚1111 Средний квадрат сумма наблю- ожида- - источник изменчивости ст. св. квадратов денный емый Копии 2 6,2889 3,1444 . . . Блоки (компонента спосо- 5 13,7037 2,7407 . бов обработки) 2 2 Остаток 22 32,8963 1,4953 301 + 02 CyMMa no блокам 29 52,8889 . Способы обработки (внут- 5 33,9259 6,7852 . . . ри блоков) Ошибка 55 26,0741 0,4741 . . . CyMMa . . . 89 112,8889 
133 гл. в. нвполныв БЛОК-ПЛАНЫ  Сравнение средних квадратов для способов со сред- ними квадратами для ошибок производится с помощью критерия значимости, причем результат в данном случае слишком очевиден, чтобы нуждаться в обсуждении. Да- лее, добавляя к общему среднему для эксперимента ве- личины (ср. (6.17)) kQ  —-if (6.2l)' И приписывая им дисперсию (ср. (6.19)) leag T, (6.22)  можно получить средние для шести способов обработки, оценки для (ц + п). Дополнительную информацию о разностях между спо- собами можно получить из блоковых сумм Bi, хотя выигрыш часто бывает слишком мал по сравнению с за- траченными усилиями. Имеющаяся запись рассматривае- мого эксперимента не объясняет точно, как наборы способов, образующие блоки, распределены по испытуе- мым. Расположение этих способов подсказывает, что, вероятно, метод состоит в неслучайном разделении 30 испытуемых на три группы или копии (возможно, в зависимости от времени, когда они могут находиться в распоряжении экспериментатора) и в последующем на- значении по жребию каждой из десяти троек доз одному случайно выбранному испытуемому из каждой копии. В дальнейшем мы будем считать, что эксперимент осу- ществляется именно так. Далее можно подсчитать сум- му квадратов разностей между копиями (две степени свободы), оставляя компоненту с 27 степенями свободы для отклонения между блоками внутри копий. Наиболее общей будет ситуация, в которой весь эксперимент со- стоит из р копий (с независимой рандомизацией внутри копий) основного плана, в котором параметрами плана являются la, 2‘, г/р, b/p, Mp. Сумма квадратов разностей между блоками должна быть затем разложена на ком- поненту с (р—1) степенями свободы для копий и на компоненту с (b—p) степенями свободы для блоков внутри копий. 
6.6. АНАЛИЗ СБАЛАНСИРОВАННЫХ экспвримвнтов 139  Если В; определить более точно как среднее отклоне- ние на участок блока f OT общего среднего по копии, то процедура, аналогичная процедуре для соотношений (6.16) и (6.17), приводит к межблоковой оценке разно- стей способов обработки. Таким образом, имеем  В1-— B2 = (r —- 7&)('c1—— 1:2) : /26 (из 2 (г —- ж) блоков) .-1:  .-_i-. е(из 2k (r —— ж) участков). (6.23) Следовательно,  Е (131 - B2) = (Г — M (И — 172) (5-24)  D(B, — B2)=2k2(r—}»)o§+2k(r—7&)0§= _ = 2k (r —- ж) (/20? + 03). (6.25)  Далее, сумма квадратов для блоков внутри копий содер- жит в качестве компоненты величину  §1<B—§>2  с (t — 1) степенями свободы, зависящую от способов об- работки; оставшаяся часть с (b —p—- t + 1) степенью свободы является в чистом виде мерой внутриблоковой дисперсии и средний квадрат ее оценивает (ЁО%+ОЁ). Следовательно, второй набор оценок средних по спосо- бам обработки дается величинами  Вд-В ` —————r_A , (6.27) добавленными к общему среднему, дисперсия которого равна О 9 /e(/e0l‘+O§)  r_ A . (6.28)  Поскольку мы можем оценить 0% из строки ошибок табл. 6.3, то (ko5f+0§) можно оценить из «оставшейтся» компоненты блоков. Две оценки средних для способов обработки можно затем скомбинировать с весами, об-  ратно пропорциональными их дисперсиям. Во многих экспериментах бывает слишком мало степеней свободы 
140 гл. 6. НЕПОЛНЬ1Е БЛОК-ПЛАНЫ  для межблоковой оценки, чтобы ее стоило использовать, и заключения должны быть основаны только на внутри- блоковой оценке. Оценку для (/г‹т%+0ё) можно в даль-  нейшем улучшить, корректируя В) так, чтобы исключить разности между способами, и вычисляя по ним суммы квадратов с (t— 1) степенями свободы. Рассмотрим ве- личины й U,-=(t—k)T,-—(t—l)B,-+(le—1)G, (6.29)  где О-общая сумма по всем участкам. Легко видеть, что любая разность между U) не зависит от параметров способов обработки. Например,  U,— U2-= i t(k—1)[3 (от 2(r—7&) блоков) i i (t—k)e (от 2?» участков): i (k— 1)е (от 2(г—?ь) участков) -J: i (t— 1)e (от 2(k—1)(r—7&) участков) (6.30) и, следовательно, Е([/‚— Н2)=0, (6.З1) D (U1— U2)=2t2(k—1)2(r—A)0§+2o§[7»(t—k)2+ +(rj—7&)(k—1)2+(t— 1)2(k—1)(r—7&)]= =2M2(k— 1)(t—k)0‘f+2M (t—le)(t—1)0§=  _.,. 22¢ (t — /2) (г - 1) [63 "ff," + 6;] . (6.32)  Ё U2 м (t— la) (t— 1) (5-33)  Отсюда  есть требуемая сумма квадратов, и ее среднее является оценкой для величины  % 0% + cg. (6.34)  Если добавить эту сумму квадратов к «остаткам» для блоков с (b — p—-13+ 1) степенями свободы, то полу- чающиися средний квадрат будет оценкой величины  (Ь— 1)le——t 9 ”b+_p (Ii-F03. (6.35) 
6.6. АНАЛИЗ СБАЛАНСИРОВАННЫХ экспериментов 141  В примере с пенициллином сумма квадратов разно- стей между копиями (две степени свободы) равна  (742+ 612+ 552- 30 >< 401,llll) I 30 = 62889.  Из выражения (6.26) И табл. 6.2 получаем  5702 6  E(B_§)2 962-I-1072+ ��� +832- /2(I‘—7\.) _ 3><9  = 13,7037  при пяти степенях свободы. При вычитании этой величи- ны из ранее подсчитанной суммы квадратов по блокам получается остаток-дисперсия между блоками 32,8963 с 22 степенями свободы. Из выражения (6.33) И табл. 6.2 получаем 202 5512 7(t(t—:e)(t-1): 6><6><3><5  = 10,2074.  Таким образом, из выражения (6.35) получаем, что ве-  личина 32,8963 + 10,2074  27 = 1‚5964  служит оценкой для 78  __ 2 2 27 01+02. 2 2 2 ЕСЛИ 81 И $2 служат соответственно oIJ,eHKaMu ДЛЯ 0'1 И 2 02, ТО  зё = 0‚4741 (6.36)  35% + $3 = 1‚5964 + $5 (1‚5964 —— 0‚4741)=1‚6396. (6.37)  Из (6.22), таким образом, дисперсия внутриблоковых оценок эффектов способов обработки оценивается как 2  332 т = 0‚03951, (6.З8)  а из (628) дисперсия межблоковых оценок оценивается как 2 2 3(3s1+S2)  9 = 0,5465. (6.39) 
142 ГЛ.6 НЕПОЛНЫЕ1КЛСПЛАНЫ  В комбинации наблюдений из двух источников требуемые веса обратно пропорциональны соответственно величинам  W2 = 25,31, W1: 1,83.  B табл. 6.4 приведены межблоковые и внутриблоковые оценки средних для способов обработки, полученные из  Т а б л и ц а 6.4 Средние по способам обработки для табл. 6.1  Средняя Способы А В С D E F квадратичная обработки Ошибка Межблоко- 2,22 3,44 1,67 2,89 1,67 0,78 0,74 ВЫе Внутрибло- 3,03 2,31 2,75 2,11 1,17 1,31 0,20 KOBb1€ Взвешен- 2,98 2,39 2,68 2,16 1,20 1,28 0,19 НЫе  (6.21) И (627), и взвешенные средние, образованные как  W (Me>K)+W (внутри) I „На , (5.40)  1 —l-:l_-V2 = 0,0368.  B этом примере мы мало выигрываем от включения межблоковых оценок, так как дисперсия средних умень- шается только на 7%.  дисперсия которых равна W  6.7. Дважды сбалансированные неполные блоки  Естественное обобщение принципа сбалансированных неполных блоков было предложено Кельвином [67]. Он предложил дважды сбалансированные неполные блока-расположения, которые обладают всеми свойства- ми, установленными B § 6.2, и для которых, крометого, каждый набор из трех разновидностей встречается в блоке одно и то же число раз. Очевидно, что все непри- водимые сбалансированные неполные блоковые распо- ложения (§ 6.2) при la > 2 удовлетворяют этому усло- вию, но об общей теории приведенных планов известно 
6.7. ДВАЖДЫ СБАЛАНСИРОВАННЫЕ НЕПОЛНЫЕ БЛОКИ 143  мало. Кэльвин смог Найти еще только один сбалансиро- ванный неполный блок-план, отличный от уже опублико- ванного, который сбалансирован также для троек спосо- бов. Для этого плана k = 4, t= 8, r = 7, b = 14, ж = 3, и каждая из 56 троек встречается только раз. План можно получить, поставив А, В, С, ...‚ Н в соответст- вие с комбинациями 23-факторной схемы и затем обра- зуя 14 блоков из четырех элементов в качестве положи- тельных и отрицательных комбинаций при выделении семи отрогональных контрастов для главных эффектов и взаимодействий. Одна из причин такого малого коли- чества известных дважды сбалансированных расположе- ний состоит в том, что приведенные планы с этими свой- ствами встречаются только при весьма значительных г, в то время как поиск расположений с простым балансом концентрируется на г< 10, Кэльвин дал метод построе- ния планов, когда I является степенью двойки и k = 4. Этот метод имеет отношение к теории факторного плани- рования. Кэльвин также отметил непредвиденную воз- можность особым образом скомбинировать два сбалан- сированных неполных блок-плана так, чтобы получить двойное балансирование. План. 6.1 он построил именно таким образом. Для большинства экспериментальных целей двойное балансирование любопытно просто с комбинаторной . План 6.1 Блоки дважды сбалансированного  блок-плана для k=4,t=10,r=12,b=30,?»=4  ABCD AEFG CDEH АВЕН Анд! CDFG ABFJ BCEF con ABG1 BCGJ CEGI ACE] BCHI CFHJ ACF1 BDEG DEF] ACGH ВОР! DGH1 ADE] BDHJ EFHI ADFH ВЕН EGHJ АБС! BFGH' РОД! 
144 гл. в. нвполныв БЛОК-ПЛАНЫ  точки зрения и не представляет интереса как средство улучшения информации, полученной в ходе экспери- мента. Кэльвин пришел к таким планам, так как он на- толкнулся в экспериментах на ситуацию, в которой уро- жай с участка зависел, вероятно, не только от способов обработки или блока, в котором находится участок, но также от конкретного набора других способов, входящих в этот же блок Например, в органолептических испыта- ниях блок обычно представляет собой работу одного члена группы экспертов за один сеанс. Если требуется сравнить похожие пищевые продукты в терминах оценок группы экспертов и количество испытуемых продуктов превышает количество, которое может быть представ- лено эксперту за один сеанс без риска разнобоя в оцен- ках ввиду усталости, то следует принять некоторую форму неполного блок-плана. На мнение о любом об- разце может повлиять запах остальных образцов, вклю- ченных в тот же самый блок. При использовании пол- ных блоков, конечно, мог бы появиться тот же самый эффект, но в простой аддитивной модели он будет усред- няться. Кэльвином был развит общий метод анализа сбалансированных неполных блоков, основанный на ад- дитивной модели для эффектов корреляции других спо- собов B блоке. Он показал, что уравнения оценок стано- вятся много проще, если план, кроме того, обладает свойством двойного балансирования. Интересная особен- ность этой ситуации состоит в том, что неполный блок- план дает информацию, которую нельзя получить из полных блоков, так как неполный блок-план допускает оценивание и проверку статистической значимости самих корреляционных эффектов, а двойное балансирование заметно упрощает этот процесс. Кэльвин описал анализ эксперимента по субъективному оцениванию количества ванили в шести сортах мороженого при использовании неприводимого плана с k = 4.  6.8. Квадраты Юдена  Для любой симметричной сбалансированной непол- ной блок-схемы преимущество двух одновременных сис- тем блоков можно получить, используя план, аналогич- ный латинскому квадрату, известный под названием не- 
6.8. КВАДРАТЫ ЮДЕНА 145  полный латинский квадрат или квадрат Юдена. Пример такого плана легко построить, если опустить последнюю строку латинского квадрата n >< n (Иэйтс [43]).  План62  1Тлан квадрата К3дена с 11 способами обработки B пяти репликах  Столбец Строка 1 2 3 4 5 6 7 8 9 10 11 1 A B СТ I) .Е F G II I I K’ .2 B F Z) Е I (Ё А С? 17 K’ I 3 C L) I II I K’ F B A Е G 4 1) K’ I (? B E‘ J (3 F II А 5 Е I II F G I C K’ B A D План6З 1Тлан квадрата К)дена с 9 способами обработки В восьми репликах Столбец Строка 1 2 3 4 5 6 7 8 9 1 A A B B C C L) l) E 2 B C C .Е .D I7 F F G 3 C E II F E (? II I I 4 L) G I II F F A G A Столбец Строка 10 11 12 13 14 15 16 17 18 1 ‚Е F F G G II II I I 2 I A I B II 1) .E A G 3 .B B A .D A G C’ L) F 4 L) Е C C B .E I II B  10 Д. Финни 
146 гл. в. нвполныв БЛОК-ПЛАНЫ  Оставшиеся n(n— 1) участков затем группируются по (n— 1) строкам полных реплик, и п столбцов образуют сбалансированную неполную блок-схему с k = r = =` n'— 1, t = b = n. План 6.2 демонстрирует схему с ана- логичными свойствами, у которой число строк He меньше числа столбцов. У этого плана k = r = 5, t = b = 11.  Планы этого типа были впервые использованы Юде-_  ном [139], [140] в экспериментах, подобных плану 3.2. В экспериментах по сравнению прививок вируса табач- ной мозаики строки соответствуют растениям, столб- цы——расположению листьев на растении (нижний лист, второй лист и т. LL). Квадрат Юдена может быть построен из любого сбалансированного неполного блок- плана с k = r (CMHT H Хартли [85]). Это верно и для г, кратных la, с небольшим видоизменением, заключаю- щимся B том, что каждая строка должна содержать He-  й сколько полных реплик (Х а р T Л и, Ш р и к х э Н д, Т е й -  лор [125]). Примером служит план 6.3, а другой при- мер можно построить из плана 6.1. Доказательство этих результатов не сложно и может просто состоять в опре- делении последовательности изменений первоначального произвольного порядка, которая должна непременно уменьшить размер до такого, при котором строки пере- стают быть полными репликами. При использовании этих планов необходима такая же рандомизация строк и столбцов, как в латинских квадратах. Метод анализа совершенно такой же, как для обычных сбалансирован- ных неполных блоков, но компонента для строк уда- ляется.  6.9. Решетчатые планы  При большом числе способов обработки сбалансиро- ванные неполные блоки могут потребовать как очень большого числа участков, так и очень большого числа  реплик. Из-за практических ограничений может ока-у  заться необходимым пожертвовать полным балансирова- нием. Если число способов обработки есть квадрат це- лого числа, то можно построить план из двойной репли- ки, записывая символы способов в случайном порядке в  виде квадрата и беря строки И столбцы этого квадрата 
6.9. РЕШЕТЧАТЫЕ ПЛАНЫ 147  в качестве двух наборов блоков. Таким образом, для 2‘: п? = 16 решеткой может служить  “Фбёъ 2'~«tU‘r: both «mks  Первыми четырьмя блоками будут А, F, L, C; M, B, H, K; И т. д., вторыми четырьмя блоками—А, М, О, Р; F, B, I, N; И т. д. и способы обработки должны быть рандомизованы на участках внутри блоков. Это простой решетчатый план. Естественно, что он приводит к более высокой точности (меньшая стандартная ошиб- ка) при сравнении таких двух способов, как L И D, однажды встречающихся в одном и том же блоке, чем при сравнении таких способов, как L И В, которые ни разу не попадают в один и тот же блок. В этом случае анализ в принципе очень похож на анализ в случае сба- лансированных планов. Хотя будут получаться две раз- личные дисперсии для двух типов сравнения средних, во многих практических результатах среднее значение можно принять в качестве аппроксимации для всех раз- ностей. Этот план можно также рассматривать как ква- зифакторный; 15 степеней свободы между способами обработки можно отнести к главным эффектам и взаи- модействиям двух факторов, каждый из которых нахо- дится на четырех уровнях. Если квазифакторы взяты в соответствии со строками и столбцами решетки, то план частично смешивает главные эффекты, один в первом по- вторении реплики и один — во втором. Если желательно иметь более Двух реплик, то эту схему можно провести вновь с дополнительными парами реплик, используя ту же самую основную решетку, но, конечно, делая новую рандомизацию способов внутри дополнительных блоков. Однако по форме решетки можно предложить лучшую возможность Третью реп- лику можно образовать, выбирая в качестве набора блоков для четырех способов обработки наборы,  10* 
143 ГЛ. в. нвполныв БЛОК-ПЛАНЫ  соответствующие наложению латинского квадрата на решетку. Например, если используется первый набор символов плана 3.5, то третья реплика будет тогда со- стоять из четырех блоков А, В, G, J; F, M, Е, D; L, K, O, N; C, H, 1, Р. Отметим, что рандомизация шестна- дцати букв решетки устраняет необходимость рандоми- зации латинских квадратов перед использованием. Третья реплика смешивает (n——1) степеней свободы (в данном случае три степени свободы) от взаимодей- ствия квазифакторов. Теперь план является тройной pe- щеткой. Хотя все еще имеется два различных уровня точности при сравнении способов обработки, но они более близки, чем раньше. Процесс может быть продол- жен, если для некоторого Целого п существуют ортого- нальные квадраты более высокого порядка. План 3.5 мо- жет дать четвертую и пятую реплики для решетки 4><4. Для 23:36 таким способом можно образовать только три различные системы блоков с k=6, И если требуются до- полнительные реплики, то эти системы следует провести вновь. Комбинируя пары строк, пары столбцов, пары букв и объединяя разбиения типа (23), из плана 3.8 при 12:12 можно получить четыре взаимно ортогональные системы блоков. План 6.4 показывает структуру одной  План 64  Структура решетчатого плана для t=36, k==12 B четырех ортогональных системах блоков  11 13 21 22 33 32 12 12 33 31 21 23 23 21 13 12 32 31 23 31 32 13 22 11 32 22 11 33 11 23  31 33 22 21 13 12  такой решетки, основанной на плане 3.8. Если 36 симво- лов способов обработки наложены на этот квадрат 6><6‚ то три блока по 12 способов задаются парами последо- вательных строк, три блока по 12 способов— парами по- следовательных столбцов, три блока —наборами из 
6.10. ПРЯМОУГОЛЬНЫЕ РЕШЕТКИ 149  12 клеток, выбранными по значению первого индекса, три блока получаются аналогично по значению второго индекса. Вероятно, можно продолжить этот процесс, найдя больше ортогональных классификаций наборов по 12 клеток. Если можно образовать (n+1) ортогональных систем блоков из квадратной решетки для п? способов обра- ботки, то главные эффекты квазифакторов и все (п- 1)? степеней свободы от их взаимодействий будут одинаково смешаны, и тогда схема становится такой же, как для сбалансированных неполных блоков, определен- ных выше равенствами (6.4). Три последовательные пары строк и три последова- тельные пары столбцов следует рассматривать вместе в качестве блоков.  6.10. Прямоугольные решетки  Как станет ясно из § 6.17, требование, чтобы число способов обработки было полным квадратом, не так серьезно Практически, как это может показатьсяВдей- ствительности существуют другие возможности для чис- ла способов обработки, которое не является полным квадратом. Если число способов можно представить как произведение двух целых чисел (оба >1), например, как rL(n+ p), то символы способов обработки могут быть записаны в прямоугольник размера п >< (n+p). Иэйтс „[44] предложил брать строки и столбцы этого прямо- угольника в качестве систем блоков, так что получается n блоков по (n+p) участков и (п+р) блоков по п, участков. Использование блоков двух размеров может, во-первых, быть неудобным практически, а во-вторых, вызывать теоретические возражения против такого плана из-за того, что о? может быть больше в блоках большего размера. Однако для небольших р ни одно из этих воз-  ражений, вероятно, не будет слишком серьезным. Огра- .  ничение на р = 1 удваивает число различных значений t, для которых могут быть построены решетчатые планы. В другом типе прямоугольных решеток, предложен- ном Харшбаргером [126], [127], все блоки имеют одинаковый размер. Если символы способов записать в 
150 ГЛ. 6. НЕПОЛНЫЕ БЛОК-ПЛАНЫ  случайном порядке в клетке любого латинского квадрата размера (rz + р) >< (rt + ,0) при условии, что все клетки для n букв квадрата не заняты, то строки и столбцы могут быть взяты в качестве двух систем блоков для n(rL+p) способов. Например, 15 способов при n=3, p = 2 MOI‘yT быть вписаны в план 3.2 в клетки, занятые  только буквами С, D, E. Таким образом, получаем  F L А С М �g�� P�2� В Н K p�/� O E ��!� ��3� l G D ���� J N  Блоками' тогда будут десять троек способов F, L, А; C, M, В; D, J, N; C, E, D; 0�/� B, O, G. Это про- стая прямоугольная решетка. Если можно построить ортогональные квадраты или подходящие ортогональные разбиения латинского квадрата, то можно получить до- полнительные системы блоков из задаваемой так пере- крестной классификации и образовать таким путем трой- ную прямоугольную решетку или решетку более вь1со- кого порядка. Хотя прямоугольные решетки Харшбаргера эстети- чески более приятны, чем решетки Иэйтса, сомнительно, имеют ли они большее практическое использование. Про- стая прямоугольная решетка имеет четыре различных типа сравнения способов (зависящих от комбинаторных соотношений между любыми отдельными парами спосо- бов) и, следовательно, четыре различные дисперсии для разностей средних по способам. Троек прямоугольная решетка имеет не меньше семи. Часто эти тройки не бу- дут сильно отличаться по величине, так что можно использовать среднее значение, но обоснованность этих требований нуждается в проверке при практическом анализе. Прельщает значительная простота вычислений для прямоугольных решеток Иэйтса. В действительности случай р = 1 включает большинство необходимых пла- нов, и предположение о равечстве внугриблоковой дис- персии для блоков размера п и (п + 1) часто бывает не- далеким от истины. 
6.12. РЕШЕТЧАТЫЕ КВАДРАТЫ 151  6.11. Многомерные решетки  Если I есть куб Целого числа (t = I13), то символы для способов можно считать случайным образом распо- ложеннь1ми в кубической решетке. Повторение по п? бло- ков из п участков можно тогда получить тремя раз- личными способами из прямых, перпендикулярных гра- ням куба, и эти три системы блоков образуют один тип кубического решетчатого плана. С другой стороны, мож- но тремя способами получить систему п блоков по и? участков из плоскостей, параллельных граням; так мы составляем второй тип кубического решетчатого плана. Здесь видна очевидная аналогия с пЗ-факторньтм плани- рованием. Рассмотрение квазифакторов может помочь при построении планов, особенно если мы добиваемся высокой степени сбалансированности, используя боль- шее число реплик. В этом случае помогает также ана- лога латинского квадрата, известный как латинский куб. Эта идея очевидным образом распространяется на число способов, равное любой более высокой степени це- лого числа. При этом мы используем многомерные ре- шетки.  6.12. Решетчатые квадраты  Из квадратных решеток, основанных на t= n2, МОЖ- но построить планы, аналогичные латинским квадратам. Если взять любые две системы блоков, каждая из кото- рых состоит из к блоков по п способов, то их можно «сплести» в квадрат размера п >< п, у которого строки состоят из одной системы, а столбцы —- из другой. Квад- рат из букв, используемых в определении решетки, всегда является таким же квадратом. Для решетки раз- мера 4 >< 4, рассмотренной в § 6.9, вторым квадратом  служит А В G J Н С Р 1 E D F M N O K L  y которого строки соответствуют первому набору симво- 
152 гл. 6. НЕПОЛНЫЕ БЛОК-ПЛАНЫ  лов плана 3.5, а столбць1—второму набору. В каж- дом полученном квадрате строки и столбцы расстав- ляются в случайном порядке, а затем квадрат исполь- зуется для определения пространственных или логиче- ских соотношений между n2 участками как латинский квадрат. Когда должна быть употреблена кратная реплика, для каждой единичной реплики следует использовать две различные системы блоков, до тех пор пока не будет до- стигнута полнота ортогональных систем. При этом мы получаем план, возможно более близкий к симметрич- ному при сравнении пар способов обработки. При п = 6 лучшее, что можно сделать,—это взять в каче- стве первого квадрата решетку (без рандомизации), в качестве второго взять квадрат, у которого исходные строки являются столбцами, а латинская система стро- ками, а в качестве третьего—квадрат с той же самой латинской системой вместо столбцов и исходными столб- цами вместо строк и повторять их до полного числа тре- буемых реплик.  6.13. Сбалансированные латинские квадраты  Если существует полностью ортодонализованный квадрат и если можно использовать (n + 1)-реплику, то можно построить решетчатый квадратный план, в кото- ром каждая из (п + 1) систем блоков встречается по од- ному разу как столбцовая и как строчная классифика- ция. Таким образом достигается балансирование со всеми преимуществами сбалансированных неполных блоков, но, конечно, с недостатками из-за весьма боль- шого числа участков. Если п — нечетное число, то мож- но осуществить меньшее балансирование в (п+1)/2- репликах, причем каждая система блоков появится толь- ко один раз либо как столбцы, либо как строки; иногда этого достаточно, но схема все же не так хороша, как схема с (п + 1)-репликами, если только не предпола- гаются равными компоненты дисперсии между столбца- ми и между строками. План 6.5 дает три сбалансированных решетчатых квадрата для t = п? = 25, основанных на вполне ортого- 
6.14. АНАЛИЗ РАНДОМИЗОВАННЫХ БЛОКОВ [53  нализованнь1х квадратах 5 >< 5, построенных в соответ- ствии с правилом § 3.6. 30 наборов по 5 способов, обра- зованных столбцами и строками, обладают свойствами сбалансированной неполной блок-схемы. Полезным упражнением для читателя будет построить вполне орто- гонализованныи квадрат и затем следить за происхож-  дением группировок в плане 6.5. Конечно, для практиче-  ских целей 25 букв должны быть приписаны способам обработки случайным образом, а порядок строк и столб- ЦОВ должен быть рандомизован внутри каждого квад- рата. Одна возможная схема для плана в шести репли- ках должна использовать три квадрата плана 6.5 и еще три квадрата, полученных перестановкой строк и столб- ЦОВ в каждом из первых трех квадратов (точно так же, как при транспонировании матриц), затем в новых квад- ратах снова случайным образом изменяем порядок строк и столбцов, не изменяя соответствия букв и способов. При этом гарантируется, что каждая из шести систем блоков встречается один раз в качестве столбцевой и один раз в качестве строчной классификации.  _ П л а н 6.5 Схема латинского квадрата для t=25 B трех репликах  ABCDE AJNRV ASGYM FGHIJ WBFOS QJWKD KLMNO TXCGK HUNBT PQRST LPYDH XLERF UVWXY IMQUE ocpzv  6.14. Анализ рандомизованных блоков  Полный анализ решетчатых планов значительно бо- лее трудоемок, чем анализ сбалансированных неполных блоков, из-за отсутствия полной симметрии. Однако эти планы обладают одним очень хорошим свойством. Если блоки в каждой реплике рассматривать как суперблоки и расположение различных наборов способов, образую- щих блоки в экспериментальном материале, случайно внутри суперблока, то законен дисперсионный анализ, производимый, как в случае вполне рандомизованных 
б 154 гл. 6. нвполныв БЛОК-ПЛАНЫ  -блоков. Если дисперсии между блоками реплик не пре- небрежимы относительно дисперсий между репликами, то полученные таким путем критерии значимости будут ме- нее чувствительными, а стандартные ошибки больше, чем ошибки, полученные при полном анализе. При полном анализе средние по способам приспособлены для меж- блоковых разностей, и они последовательно сравнива- ются с более высокой точностью. Тем He менее анализ рандомизованных блоков может быть весьма полезен при предварительном рассмотрении результатов. Кроме того, если на одном участке делается много различных измерений (вес, высота, длина и т. д. различных частей экспериментального материала), то для менее важных измерений может быть достаточно более простого ана- лиза. Пэйтс [46] показал, что основной критерий зна- чимости является несмещенным, хотя оценка ошибок для отдельных контрастов может быть и смещенной (Кем пторн [52]). Решетчатые квадратные планы мож- но анализировать так, как если бы каждый квадрат был рандомизованным блоком, содержащим по одному уча- стку для каждого способа. Простота анализа рандомизованных блоков не должна заслонять от экспериментатора, использующего решетчатые “тланы, достоинства полного анализа. Пла- нирование эксперимента как решетки при большом чис- ле способов обработки может быть не плохим делом, так как если изменчивость невелика, то будет достаточно анализа рандомизованных блоков, а если существует какой-то признак, указывающий на большой разброс между блоками, то можно произвести полный анализ. Выигрыш от использования полного анализа может быть весьма велик. В эксперименте, длящемся недели или ме- сяцы, удвоение точности сравнения способов является хорошей платой за дополнительный труд.  6.15. Частично сбалансированные неполные блоки  Многие рассмотрененые в этой главе планы явля- ются частными случаями очень общего класса частично сбалансированных неполных блок-планов (Б о з е, Наир [14])..Обо_бщение сбалансированных планов про- 
6.15. ЧАСТИЧНО СБАЛАНСИРОВАННЫЕ НЕПОЛНЫЕ БЛОКИ 155  исходит, если отказаться от ограничения, что A посто- янно. Любой такой план имеет следующие свойства (Кемпторн [52]): i) Имеется t способов обработки в b блоках по/гуча- стков в каждом, содержащих по г участков каждого способа. ‘ 11) Относительно любого фиксированного способа об- работки оставшиеся (t—1) способов образуют т набо- ров таких, что ё-й набор содержит п, способов, каждый из которых встречается как «блоковая связка» (block- mate) фиксированного нами способа в 7», блоках. Числа пд, м не зависят от того, какой способ обработки фикси- рован, H способы 1-го набора называются б-ми союзни- ками этого способа. 111) Число способов обработки, общих для i-x союз- ников одного определенного способа и 1'-x союзников другого, зависит исключительно от отношений связи этой определенной пары. Число таких способов обо- значается через р?! для фиксированной пары h-x союз-  НИКЁЁ} параметры отнюдь не независимы между собой, и существует ряд связеи между ними: N == rt = bk, n,+n2+ py�� +nm=t—1, I117»; + пуд + ... + п.‚„7ь„, = г (la -1),  р’:,=р5?‚‚ ‚1 (641) пнрё}; = ntpflj = “урйт h _ щ, если мы, 2,:"U"_{rzL-—1,ecJ1Hh=i. J  Планы наибольшей общности имеют ограниченное практическое значение, но некоторые простые типы пла- нов весьма полезны. При т = 1 план сбалансирован. Ре- шетчатые планы, происходящие из вторых, третьих и бо- лее высоких степеней целого числа, частично сбаланси- рованы, но в этот класс не попадет ни один из типов прямоугольных решеток описанных в § 6.10; Многие 
156 ГЛ. 6. НЕПОЛНЫЕ БЛОК-ПЛАНЫ  частично сбалансированные планы могут быть получены из геометрических конфигураций, а не только из решеток. Например, конфигурация Дезарга двух тре- угольников в перспективе дает 10 точек, лежащих на на- борах по три из десяти прямых. При соответствующих наименованиях точек образуются 10 блоков плана 6.6, для которых ' /г=3, t=10, r=3, b=lO,  02 “=0, ”1=3’ p:'i:(2 4)’  1 2  При построении этих планов существенно используется теория конечных геометрий и полей Галуа.  Г1ла11 66  Частично сбалансиро- ванный неполный блок-план («план Дезарга»)  АВЕ BC! ACF FGH АБС EGI CDH EFJ BDI HI!  6.16. Частично сбалансированные квадраты Юдена  Если г равно или кратно k, то частично сбалансиро- ванная неполная блок-схема может быть расположена по строкам и столбцам таким образом, что каждая строка представляет собой одну или большее число пол- ных реплик, а столбцы являются исходными блоками. Если опустить две или больше строк из некоторых (но не всех) латинских квадратов, то мы получим планы указанного типа (Иэйтс и Хейл [49]). План 6.7 дает частично сбалансированный квадрат Юдена, построен- ный из плана 6.6. 
6.17. вывор ПЛАНА 157  План 6.7  Частично сбалансированный квадрат Юдена, полученный из плана 6.6  Столбец Строка 1 2 3 4 | 5 6 I 7 8 9 10 l A B С D E F G H I J 2 B I J A G C F D H E 3 E D B G I A H C I F  Анализ этого плана относится к анализу частично сбалансированных неполных блоков, как анализ сбалан- сированных квадратов Юдена к анализу сбалансирован- ных неполных блоков.  6.17. Выбор плана  Если способы, которые должны сравниваться в экспе- рименте, не имеют факторной структурыднапример, если все они являются различными дозами одного лекарства или различными сортами сельскохозяйственных культур, или различными рабочими, управляющими машиной, то практически их число редко строго фиксировано. Можно ввести дополнительные дозы (так чтобы фиксированный интервал разбить на более мелкие дозы), можно оцени- вать дополнительные сорта или опустить менее интерес- ные и т. д., если посредством этого достигается более удовлетворительный план. Даже если экспериментатор не преследует ни однои из этих целеи, то он может всегда выбрать один или несколько особенно интересных сортов (или других способов обработки) и включить их дважды; в структуре эксперимента каждый такой способ тогда рассматривается как два, и только в конце эти  „двойные результаты комбинируются (см. § 1.7).  Здесь необходимо согласование действий эксперимен- татора и статистика, так как сбалансированный или умеренно симметричный план выгоден им обоим. Напри- мер, предположим, что экспериментатор вынужден ис- пользовать блоки по три элемента и при этом желает 
153 гл. 6. нвполныв БЛОК-ПЛАНЫ  сравнить восемь способов. Для сбалансированного пла- на единственная возможность состоит в использовании сбалансированных неполных блок-схем с 56 блоками по три зълемента или 168 участков с 21 репликой, что несом- ненно слишком много для большинства целей. Сущест- вуют частично сбалансированные планы только с трой- ной репликой, но дисперсии при сравнении пар способов отличаются слишком сильно. Однако если можно опу- стить один способ, то становится возможным сбаланси- рованный план с тремя или кратным трем числом реп- лик. Если добавлен или удвоен один из способов, то пригодны решетчатые планы с любой кратностью репли- ки, и такие планы с 4,8, P+�� репликами будут сбаланси- рованными. При большом числе способов подбор удоб- ных квадратов и кубов позволяет использовать решетки. Прямоугольные решетки с t= n(n + 1) являются удоб- ным промежуточным шагом между квадратами, так что стремление получить 70 способов обработки может быть заменено увеличением до 72, а не выбором между 64 и 81. Тем не Менее ввиду большого числа различных стан- дартных ошибок желательно избегать прямоугольных решеток, если этого можно достичь без больших отступ- лений от первоначального замысла экспериментатора. Прямоугольные решетки с t= n(n + 2) используются редко, так как квадратная решетка с t= (n + 1)? тре- бует всего на одно наблюдение больше. Аналогично z‘= n(n + 3) может быть превращено в гораздо более удовлетворительное t = (n + 1) (п + 2) добавлением двух способов обработки или удвоением двух способов первоначального набора. Математическая элегантность построения и суще- ствующих примеров неполных блок-планов никогда не должна затмевать их многочисленных недостатков ни для статистика, ни для ученого-экспериментатора. Они редко имеют какие-либо преимущества перед рандоми- зованными (полными) блоками, за исключением пла- нов, использующих меньшие блоки. Иногда такой мень- ший размер блоков необходим, а часто желателен для того, чтобы перевесить дефекты неполных блоков, но альтернатива использования полных блоков почти все- гда заслуживает проверки перед началом эксперимента. 
6.17. ВЫБОР ПЛАНА 159 Полные рандомизованные блоки обеспечивают оценку каждого из способов обработки на фоне других, а лю- бой неполный блок-план вносит большую зависимость от предположения, что эффекты блоков и способов об- работки просто аддитивны. Дело не только в том, что статистический анализ полных блок-планов значительно менее трудоемок, чем анализ неполных блоков, но лю- бые неудачи такого рода, как потеря наблюдений для некоторых участков или очевидная разнородность дис- персии ошибки от одного способа к другому, имеют зна- чительно большие последствия при анализе неполных блоков. Только опыт в отдельной области эксперимен- тирования может указать грань, до которой нужно упро- щать план, чтобы быть застрахованным от тех или иных неудач, и этим практическим аспектом планирова- ния экспериментов не следует пренебрегать. Неполные блок-планы имеют большое значение во многих обла- стях исследований, но их неумелое использование не принесет ни удовлетворения экспериментатору, ни славы статистику. ' 
Глава 7  ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ СПОСОБОВ ОБРАБОТКИ  7.1. Время как экспериментальный фактор  Все до сих пор рассмотренные планы экспериментов применялись в ситуациях, когда каждый участок или экспериментальная единица либо используется только один раз в течение эксперимента, либо один и тот же способ обработки используется повторно. Это соответ- ствует, например, испытаниям лекарств, в которых ка- ждое подопытное животное получает дозу лекарства только один раз (не обязательно в одно и то же время для всех животных или для всех способов обработки), или таким опытам, в которых периодическое назначение одного и того же лекарства рассматривается как суще- ственная черта способа обработки. Когда изучается эф- фект изменения способа обработки, ситуация услож- няется. И хотя можно сравнивать другие последователь- ности способов обработки с помощью планов того же самого типа, число возможностей так велико, что дол- жен быть сделан очень тщательный выбор, если жела- тельно, чтобы эксперимент не был чрезвычайно боль- шим, с тем чтобы его можно было без труда интерпретировать. Например, если должны сравниваться четыре рациона для свиней при условии непрерывного использования одного рациона, то достаточно относи- тельно простого плана. Если же исследуется польза, по- лучающаяся от введения не менее одной перемены ра- пиона у животного (в наборе, состоящем из указанных четырех рационов) в течение опыта, то большое число комбинаций, которые могут быть испытаны, становится препятствием. Вводя упрощающие предположения о со- отношениях между эффектами различных способов об- работки, используемых последовательно, можно значи- тельно уменьшить число параметров, подлежащих 
7.1. время кАк экспвримвнтАльньт ФАКТОР 161  оценке; требуемый размер эксперимента сильно умень- шается, вероятно, в виде платы за повышение статисти- ческой ловкости и изворотливости, требуемых в экспе- рименте, анализе и интерпретации. Обычно нельзя определить, допустимы ли эти предположения без по- дробного обсуждения между экспериментатором и ста- тистиком. При других обстоятельствах последовательность из- менений способов обработки в одном или большем числе случаев по ходу эксперимента может не представлять существенного интереса, но тем не менее может потре- бовать рассмотрения, так как план, включающий изме- нения способа обработки, дает возможность увеличить точность или более эффективно использовать экспери- ментальный материал. Дисперсия ошибки, соответствую- щая различным сравниваемым лекарствам, может быть значительно больше в случае, когда к одному испь1туе- мому может применяться только один способ обработки, чем в случае, когда на одном и том же испытуемом можно измерять эффекты двух или более способов. От- клонения между испытуемыми часто больше, чем откло- нения для одного испытуемого. Если влияние лекарств может быть ограничено небольшой площадью вокруг точек инъекции и можно предположить отсутствие взаи- модействия между эффектами в различных местах, то возможно одновременное испытание различных спосо- бов обработки на одном и том же испытуемом. Напри- мер, на месте инъекции может образоваться рубец и его размер будет «урожаем». Эксперимент с вирусной при- вивкой для растений из § 3.2 логически будет экспери- ментом такого же типа. В обоих примерах участком яв- ляется скорее место обработки, чем все животное или растение. Если действие способов обработки не может быть локализовано таким образом, то лекарства долж- ны быть упорядочены по времени, и нужно учитывать возможность остаточного влияния каждого лекарства на наблюдаемые эффекты его преемника. В этой же главе будут рассмотрены различные типы экспериментов, в которых важно упорядочение по вре- мени и взаимоотношение последовательных способов об- работки.  11 Д. (Danna 
152 гл. 7. эксперименты, ВКЛЮЧАЮЩИЕ II3MEI-IEHHE ОБРАБОТКИ  7.2. Сельскохозяйственный севооборот  В Великобритании, как и во многих других странах, в обычной сельскохозяйственной практике не рекомен- дуется из года в год при простом ежегодном посеве по- вторять одну и ту же культуру на одном и том же участке. Вместо этого принята система севооборота, тра- диционно соответствующая установленным образцам, но в настоящее время на много более гибкой основе. Для этого есть несколько причин. Повторение одной куль- туры способствует накоплению вредителей и болезней, свойственных этой культуре, в особенности таких, кото- рые из года в год остаются в почве. Постоянный посев хлебных злаков может привести к усилению засорения почвы—тенденции, которую можно изменить при сево- обороте, включающем картофель и сахарную свеклу, так как обе эти культуры допускают и требуют культи- вации почвы в течение лета для контроля за сорняками. Различные культуры предъявляют различные требова- ния к питательным веществам, находящимся в почве. Агрохимия еще не добилась такого положения, когда применение удобрений в точности компенсировало бы элементы, Изъятые культурами, а севооборот гаранти- рует существующую устойчивость в почве. Хотя совре- менная тенденция сельского хозяйства в Великобрита- нии направлена на более гибкое использование после- довательности культур на полях, и фермер с помощью севооборота может привести свою программу действий в соответствие с изменениями цен, требованиями рынка, техникой производства, изучение достоинств различных возможностей должно быть ограничено севооборотами, включающими циклическое повторение последователь- ности культур. Севооборот может различаться по пе- риоду, или числу лет, требуемых для одного полного цикла, по типам культур, образующих цикл, и по по- рядку, в котором эти культуры встречаются. Если не- обходимо сравнить экспериментально два или более севооборотов, то неизбежно, что в различные годы выращивались различные культуры. Для удовлетвори- тельной оценки относительных достоинств севооборотов  требуется, чтобы были приняты меры для устранения 
7.2. сельскохозяйственный сввооворот 163  различий по годам, либо за счет ограничения оценки годами, когда культуры одинаковы, либо за счет какой- нибудь эквивалентной аналитической схемы. Хотя необходимость севооборота для практики со- ставляет очевидную первопричину сельскохозяйственных исследований, связанных с тем, как способ обработки земли в данныи год может влиять на урожай в после- дующие годы (здесь культура, посеянная в первый год, рассматривается как способ обработки), тем не менее эта причина Не является единственной. Много других практически важных проблем включают рассмотрение взаимодействий между эффектами способов, используе- мых в разные периоды. Например, различные методы  .культивации почвы могут давать различные эффекты не  только на произрастающую культуру, но и на те куль- туры, которые будут посажены позднее. Кроме того, для культур, посаженных через год или два с сельскохозяй- ственной и экономической точек зрения, может быть су- щественным оставшееся от предыдущих лет количество удобрений, и, вероятно, необходимо сравнивать различ- ные циклы способов с тем, чтобы можно было бы удов- летворительно изучить их эффекты. Наиболее сложными являются ситуации, в которых севообороты и циклы ис- пользования удобрений или другие способы обработки необходимо сравнивать в одном и том же эксперименте. Особые трудности могут возникнуть из-за того, что прак- тическая осуществимость полевых работ, имеющиеся знания о крайне нежелательных комбинациях культур и способов обработки или даже глубоко укоренившееся предубеждение накладывают ограничение на план, ко-  торый с математической точки зрения возникает совер-  шенно произвольно. _ Некоторые книги по планированию эксперимента (Федерер [93], Кенуй [5З]) упоминают о задачах планирования этого типа, но никакого исчерпывающего обзора еще не опубликовано. И э й тс [47] дал полезное краткое изложение основных классов планирования. К о х р э н [64] весьма детально рассматривал некоторые примеры. Здесь не будет дано широкого обсуждения этих задач, так как это потребовало бы больших позна- ний и заинтересованности в сельском хозяйстве, чем  Н‘ 
164 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  предполагается у читателя этой книги, а встречающиеся трудности связаны как с осуществитмостью и со стати- стическим анализом, так и с планированием. Если рассматривается только один севооборот, то возникающие задачи сравнительно просты, но даже в этом случае появляются трудности, которых нет в од-  нолетнем эксперименте. Предположим, что Р, Q, R, S--  четыре культуры и должен быть применен четырех/толь- Haul’ севооборот со следующей последовательностью  Р, Q, R, S, P, Q, R, S, Р, Q, $�� И т. д.  При изучении эффекта введения удобрения <<а>> не воз- никает никаких проблем, если интересоваться примене- нием удобрения только для одной культуры. Соответ- ствующее число реплик пар участков с добавлением и без добавления удобрения <<а>>, например, при каждом появлении культуры Q образует требуемый эксперимент. Однако можно задать вопрос: «K каким культурам сле- дует применить это удобрение для того, чтобы получить наибольшую долгосрочную выгоду?» Тогда набор из пяти участков может быть использован в соответствии со схемой, приведенной для плана 7.1. Первые три года должны рассматриваться как предварительный услов- ный период, после чего каждый год участки 1—4 содер- жат набор, который получал удобрения 3, 2, 1 год на-  План Z1  1Тоследовательности способов обработки для одного блока четырехпольного севооборота со внесением удобрений раз в четыре года  I‘011l|2|3‘4l5l6|7|8|9ll0  культура номер участка  |,|,|,1, „д, д, Q  O1-¥§C»Dl\D'—‘ Q Q 
7.2. свльскохозяистввнныи сввооворот 165  зад и в текущем году. Этот набор из пяти участков мо- жет образовать блок, повторяемый несколько раз. В этой схеме участок всегда получает свой способ удобрения, когда на нем растет определенная культура. Следовательно, различие в плодородии между участка- ми будет влиять на оценку разностей между прямыми и остаточными эффектами удобрения. Точность этого сравнения может возрастать при принятии такого пе- риода для внесения удобрения, который был бы взаимно прост с периодом севооборота для данной культуры, на- пример, можно принять трех- или пятилетний цикл. Схема в плане 7.2 имеет в общем 12-летний период, за который каждая связь культуры и фазы, касающейся использования удобрений, встречается один раз на ка- ждом участке. Здесь первые два года следует рассмат- ривать как предварительные перед собственно экспери- ментом. План Z2  1Тоследовательности способов обработки для одного блока четырехпольного севооборота со внесением удобрений раз в три года  Год 1|2(3|4|5‘67’8'9|1ol... культура Номер участка  Plczlzz slPQ’R]sPQ  а p!�� ���� а `=�� �%�� а `��� 0��� а  »J>.C»Dl\Dv-- Q D D  Хотя реплика, использующая одну из только что опи- санных схем как базис рандомизованного блок-плана, в некоторых отношениях увеличивает точность, она не может влиять на изменчивость урожаев для участков с одной и той же культурой (и с одинаковым способом обработки) в различные годы. Поэтому широко исполь- зуемый принцип в экспериментах с севооборотом состоит в том, чтобы все фазы севооборота были представлены в каждом году. Например, для только что рассмотренного 
166 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  четырехпольного севооборота можно было бы ис- пользовать четыре блока, но вместо того, чтобы начи- нать эксперимент для всех участков в одно и то же время, можно начинать его (с культуры Р) в каждом из четырех последующих календарных лет. Когда резуль- таты исследуются через несколько лет, оказывается, что точность важных сравнений в основном выше, чем если бы четыре реплики были начаты одновременно. Бо- лее того, так проводить эксперимент удобнее часто и с административной точки зрения. с Если цель эксперимента состоит в сравнении различ- ных севооборотов, то план должен принимать во внима- ние трудности прямого сравнения урожаев различных культур. В любой год на различных участках экспери- мента могут выращиваться картофель, сахарная свекла, трава, и может не существовать единой оценки урожаев одной культуры относительно другой. Грубое сравнение в терминах веса культур бессмысленно. Было бы воз- можно выразить урожаи в денежных единицах и сравни- вать урожаи на этой основе, но данный метод в качестве определенной оценки эксперимента еще далек от удач- ного. Другими основаниями для сравнения могут быть калорийность или содержание белка в культуре. Однако ни один из подобных способов сравнения не может пол- ностью представить урожай и качество культуры. Обыч- но принимаемое решение должно обеспечить периодиче- ское попадание всех участков эксперимента или всех участков блока под одну и ту же пробную культуру, и через долгий срок относительные эффекты рассматри- ваемых севооборотов должны быть объединены при сравнении относительно пробной культуры. В известном смысле годы, в которые не применяется пробная куль-  -тура, МОЖНО РЗССМЗТРИВЗТЬ K'c1K ГОДЫ, СОЗДЗЮЩИС P83-  ЛИЧИЯ способов обработки, применяемых в конечном сче- те к пробной культуре. Когда все севообороты имеют одну и ту же продолжительность, этого легко Достиг- нуть, особенно если все они имеют общую культуру, ко- торую можно рассматривать как пробную. Как K о х р э н [64], так и И э й т с [47] проиллюстри-  -ровали эту ситуацию с помощью эксперимента, в кото- сром должны были сравниваться четыре пятипольных ce- 
7.2. сельскохозяйственный сввооворот 157  вооборота (план 7.3). Здесь четвертая и пятая культуры (картофель и ячмень) являются пробными культурами, но в данном эксперименте мы интересуемся долгосроч- дчными влияниями на плодородие, связанными с повтор- ным использованием последовательности культур, нахо- дящихся B таблице под годами 1——3. Для того чтобы представить все фазы севооборота в каждый год, потре- бовалось бы 20 участков. В каждом календарном году одна серия из четырех участков находилась бы под ка- ждой из двух пробных культур (давая информацию о разницах по севооборотам на данное число), а три остальные серии участков согласно их индивидуальным севооборотам в течение указанных трех лет были бы заняты культурами, отличными от двух пробных. Фак- тически эксперимент состоял из 40 участков вместо 20, что дало возможность включить сравнение участков, на которых один и тот же цикл культур повторялся неогра- ниченное время, с участками, на которых сам цикл из- менялся каждые пять лет. Каждый из пяти блоков со- держал по восьми участков, причем все участки в блоке принадлежали одной серии (т. е. все участки, которые были засеяны картофелем в один год, на следующий год засевались ячменем). Эти пять блоков были начаты в различных фазах, так что на них был картофель соот- ветственно в 1940, 1941, 1942, 1943 и 1944 гг.; некоторая второстепенная регулировка посадок была сделана в не- которых блоках в течение первых двух лет. Во всех бло- ках четырем участкам были постоянно сопоставлены че- тыре цикла посадок, приведенных в плане 7.3(а). На оставшихся четырех участках блока цикл посадок из- менялся в конце каждого пятилетнего периода; измене- ние, конечно, всегда происходило после посадки ячменя. В трех из пяти блоков был принят один образец для под следовательности циклов, а в остальных двух——другой, как показано в плане 7.3(б). Существуют сельскохозяй- ственные причины, по которым предполагались одина- ковыми Циклы 1 и 2, а также циклы 3 и 4, и поэтому использовались только две перестановки, которые изме- няют члены этих двух пар (1324, 1423). «Непрерывные» участки позволяют’ оценить совокупный эффект циклов, а остальные участки будут сохранять остаточные 
168 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  План Z3  Эксперимент по севообороту (Уоберн Jhfih 1938) а) Сравнение четырех пятипольных севооборотов  Годы Номер ЦИКЛЗ 1 2 3 4 5 6 1 Трава Трава Трава Карто- Ячмень Трава фель 2 Jhouepna Jhouepna Jhouepfia Карто- Ячмень ]ЬоЦерна фель 3 Карто- 1Тцюница Сенокос Карто- Ячмень Картофель фель фель 4 Карто- ГЬненица Капуста Карто- Ячмень Картофель фель фель б)1Тоследовательность циклов культур на чепярех участках кахсдого блока Годы Блоки ъ—5 6-10 11-15 16-20 21-25 26-30 I 1 3 2 4 1 3 . 2 4 1 3 2 4 .. I» Ш» IV 3 1 4 2 з 1 . l 4 2 з 1 4 2 1 4 2 3 1 4 . 2 3 1 4 2 3 . "д з 2 4 1 з 2 . . 4 1 3 2 4 1 . ..  эффекты приблизительно одинаковыми для различных участков в течение длительного времени и, таким обра- зом, приводят к сравнению прямых эффектов возмож- ных трехлетних последовательностеи культур для двух следующих друг за другом урожаев. Этот эксперимент был описан более подробно как относительно простой эксперимент по сравнению сево- оборотов. Если рассматриваются севообороты разной  продолжительности, ТО придумать УДОЕЛЕТВОРИТЕЛЬНЫЙ  451% 
7.2. сельскохозяйственный сввооворот 159  план эксперимента подходящего размера значительно труднее. Если наименьшее общее кратное продолжитель- ностей севооборотов не слишком мало, то интервалы ме- жду годами, в которых одна и та же пробная культура растет на всех участках блока или серии, будут слиш- ком велики для того, чтобы оценка результатов зависе- ла только от этих лет. Одна из возможностей состоит в том, чтобы поместить все фазы в один блок. Например, трех- и четырехпольный севообороты, включающие две культуры из четырехпольного, могут сравниваться в бло- ках, составленных, как показано в плане 7.4. B каждом году каждый блок обеспечивает сравнение двух севообо- ротов по двум участкам, занятым под культурой Р, и другое сравнение для двух участков, занятых под куль- турой S. Очевидно, что такая схема может легко стать невообразимо большой.  План Z4  1Тоследовательность культур для одного блока при сравнении четырехпольного И трехпольного севооборотов  Годы Номер участка 1 2 3 4 5 6 7 1 Р Q R S .Р Q R . 2 Q R S P Q R S 3 R S P Q R S P . 4 S P Q R S P Q 5 P T S P T S P 6 T S P T S P T 7 S P T S P T F  Если эксперимент продолжается лишь короткое вре- мя, то трудно извинить пренебрежение исходным mm- нированием эксперимента и наилучшим возможным под- бором способов обработки (см. гл. 9). Это особенно существенно при однолетних сельскохозяйственных экс- периментах, так как если после начала эксперимента обнаружилась ошибка или неразумный выбор плана, то, по-видимому, нельзя сделать ничего, кроме как составить план нового эксперимента на следующий год. Иэйтс [47] отметил важность сохранения некоторой гибкости 
170 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  в экспериментах с продолжительным севооборотом с тем, чтобы можно было делать изменения по мере на- копления информации из проводимого и других экспе- риментов. Изменения следует делать только после очень тщательного обсуждения, так как частые или легкомь1с- ленные изменения в плане могут совершенно погубить эксперимент, но все же начальный эксперимент, плани- руемый так, чтобы сохранялась возможность модифика- ций, имеет свои преимущества. В § 5.13 упомянуты He- которые пути такого гибкого планирования. § 7.3 также имеет отношение к этому вопросу. Было сказано достаточно, чтобы представить неко- торые идеи принципов планирования экспериментов с сельскохозяйственным севооборотом. Полное понима- ние требует знания основ агротехники‚ поскольку легко разработать элегантные планы, не имеющие отношения к действительным сельскохозяйственным задачам. Как правило, статистический анализ результатов эксперимен- тов с севооборотом очень сложен, так как почти всегда планы бывают He полностью сбалансированными для некоторых контрастов, и должны делаться допущения относительно различия участков по плодородию для выявления долгосрочной тенденции в отношении уро- жаев и сложной структуры остаточных эффектов культур и способов обработки, использованных в предыдущие годы. Отсылаем читателя к статье П а те р со н а [74], где проведен анализ одного такого эксперимента. рНикакой статистик He возьмется планировать экспе- римент с севооборотом без предварительного очень тща- тельного обсуждения его целей, без уверенности в том, что он полностью понимает сельскохозяйственные аспек- ты, и без проверки того, что предложенный им план под- дается анализу, который даст полезную информацию по основным вопросам.  7.3. Плодовые культуры  Необходимость в модификации экспери.меНтов в ходе их проведения может возникнуть особенно настоятельно в связи с долгосрочными экспериментами с сортами пло- довых культур, в которых одни и те же участки дают 
7.3. ПЛОДОВЫЕ КУЛЬТУРЫ 171  урожаи в течение многих лет (иной раз, вероятно, до 50 лет). Много важных экспериментов связано с распо- ложением и уходом за деревьями в течение первых не- скольких лет, но цена посадки фруктового сада настоль- ко велика, что заставляет даже исследовательский институт сопротивляться выкапыванию этого сада через 5—-10 лет для того, чтобы начать новый эксперимент на том же участке. Далее, если эксперимент должен прово- диться над взрослыми деревьями, то должно пройти не- сколько лет «между посадкой и началом эксперимента. Заслуживает рассмотрения любая возможность экспе- риментального использования молодых деревьев в эти годы, если это может быть сделано не в ущерб основ- ному эксперименту. Очевидно, что возможность введения в эксперимент совершенно нового способа обработки должна быть предусмотрена заранее, и в исследовательских работах по садоводству рассматриваются планы, которые обла- дают подобной гибкостью (П и р с и Т е й л о р [77], Пирс [76], Хоблин, Пирс и Фримен [130], Фри- мен [122], [124]). Исходные способы могут непрерывно влиять на деревья, даже если они фактически использо- вались только несколько лет, и обычно необходимы ка- кие-нибудь новые способы обработки для того, чтобы  уравновесить ИХ ВЛИЯНИЕ. ОДНЗКО В ЭКСПСРИМСНТЗХ НОр-—  мального размера обычно бывает практически невоз-  МОЖНО ИЗУЧЗТЬ ВЗЗЗИМОДСЙСТВИЯ МЕЖДУ НОВЫМИ И C’I‘a-'  рЫМИ способами обработки, и выгодные процедуры, таким образом, ограничиваются главным образом слу- чаями, когда такие взаимодействия почти несомненно незначительны. Один из способов построения подходя- щих планов состоит в построении их из простых рандо- мизованных блоков с использованием свойств латин- ских квадратов, а другой — из факторных планов, пред- почтительнее с одинаковым числом уровней для всех факторов. Если t исходных способов обработки расположены в рандомизованных блоках и число блоков равно или  кратно Ё, ТО, ИСПОЛЬЗУЯ ЛЗТИНСКИС КВЗДРЗТЫ, МОЖНО ДО-,  бавить новый набор способов, ортогональных к старым. Достаточно взять квадраты размера г, для того чтобы 
172 гл. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  получить одну строку, соответствующую каждому блоку. Если первый, второй и т. д. столбцы всех квадратов со- ответствуют первому, второму и т. д. исходным спосо- бам обработки и буквы латинских квадратов соответ- ствуют t новым способам, то по квадратам устанавли- вается связь исходных и новых способов. План 7.5 иллюстрирует процедуру для плана с четырьмя способа- ми обработки в восьми рандомизованных блоках. Два латинских квадрата размера 4 >< 4 накладываются на блоки способов, записанных с правой стороны в неслу- чайном порядке. Новые способы сочетаются с соответ- ствующими старыми способами по распределению участ- ков, записанными слева. При любом последующем ана- лизе можно исследовать, сохраняются ли какие-нибудь остаточные эффекты исходных способов обработки. Если исходный план представлен как латинский квадрат, а не как совокупность рандомизованных блоков, то для опре- деления ортогонального расположения новых способов можно было бы использовать греко-латинский квадрат (если подходящий существует). Другое очевидное ис-  План 7.5*)  Построение изменения способов обработки в рандомизованном блок-плане, использующее два латинских квадрата  Расположение участка Нерандомизованное 1 Ва Cb Aa Dd V I Ad Ba Cb Dc Dc Ad Cb Bc II Ac Bd Ca Dc II Ac Ca Db Ad VI 111 Аа Bb Cc Dd Bd Db Ba Cc IV Ab Bc _Cd Da III Cc Dd [За Cd VII V Aa Bc Cb Dd Aa Bb Bb Ac VI Ad Ba Cc Db Ab Bc Ca Dc VIII VII Ac Bb Cd Da IV Cd На Ab Bd VIII Ab Bd Ca Dc  *) A, B, C, [Э-исходные способы, а, b, c, d—HOBbIe СПОСОбЫ. 
7.3. ПЛОДОВЫЕ культуры 173  пользование греко-латинских квадратов можно рассмат- ривать как путь к последующему изменению способов введением набора, ортогонального первым двум набо- рам способов. Другой подход предназначен для случая, когда в экс- перимент включено много факторов, каждый из которых может иметь небольшое число уровней, причем здесь особенно удобен пример 2". Если первоначальные блоки можно взять немного больше минимального размера, то в последующий период можно вставить один или не- сколько дополнительных факторов. П и р с [76] дал при- мер четырех блоков по восемь участков, которые перво- начально используются для испытания одного фактора только на двух уровнях, так что каждый блок имеет четыре участка со способом обработки «а» и четыре участка со способом обработки (1), расположенных в случайном порядке (хотя рандомизованные блоки с несколькими участками для каждого способа обработ- ки в блоке обычно не используются, в данном случае они не вызывают возражения). Следующий шаг состоит во введении новых факторов В, С, так что каждый блок становится репликой типа 23. Затем вводятся еще два фактора, для того чтобы сделать весь эксперимент еди- ничной репликой плана типа 25 со смешанными ABCD, ABE, CDE. Четвертый шаг, упомянутый Пирсом, состоит в прекращении использования фактора А, хотя, конечно, могут сохраняться остаточные эффекты от его прошлого использования. Процесс не должен на этом прекращаться, так как можно использовать дробную реплику, по- зволяющую вводить дальнейшие факторы. При этом сле- дует помнить, что А и другие последующие отброшенные факторы могут иметь устойчивые главные эффекты, но влияние их взаимодействий может быстро уменьшаться, и, таким образом, упрощается выбор подходящей струк- туры переименований (ср. § 7.6). Желания экспериментаторов изменить способ обра- ботки не всегда так легко выполнимы, особенно если число способов, которые они предлагают испытывать, плохо согласуется с уже существующим планом. Пирс и его коллеги использовали те же общие принципы при разработке планов, сбалансированных в меньшей 
174 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  степени, расширяя, таким образом, область возможных схем, но, конечно, многим комбинациям чисел не соот- ветствует никаких удовлетворительных схем. Один оче- видный совет заключается в использовании квадратов  План 7.6  Построение изменения способов обработки в рандомизованном блок-плане, использующее квадрат Юдена (план сохраняет ортогональность двух наборов способов)  Расноложение участков Нерандомизованное  1 Bc Ce Ac В? V I. Aa Bc Ce Dg  Dg Aa Cg Ba II. Ab Bf Cg Dc II Ab Cg Db Ae VI III. А? Ве Cb На Bf Dc Bd Cc IV. Ad Bg Cf De III Cb Па Dd Ca. VII V. Ac Ba Cd Щ Af Be Bb Ag VI. Ae Bd Cc Dd IV Ad Bg VII. Ag Bb Ca Dd В? De  *) A, B, C, 0—исходные способы, а, b, c, d, e, f, g—HoBbIe СПОСОбЫ.  Юдена вместо латинских. План 7.6 показывает, как можно использовать план для четырех способов обработкивсе- ми рандомизованных блоках для семи новых способов. Процедура точно такая же, как в плане 7.5, только квад- рат Юдена с k=r-=4, t=b=7 заменяет два латинских квадрата (читатель должен убедиться, что этот квадрат Юдена основан на не полностью сбалансированном блок-плане, приведенном в § 6.3). Можно поменять роль блоков и исходных способов для того, чтобы получить планы, в которых новые способы сбалансированы, но не ортогональны относительно исходных способов, а не блоков. План 7.7 иллюстрирует это обстоятельство для эксперимента, в котором сначала имелось семь способов обработки в четырех рандомизованных блоках, а затем 
7.3. ПЛОДОВЫЕ КУЛЬТУРЫ  План 7.7*)  175  Построение изменения способов обработки в рандомизованном блок-плане, использующее квадрат Юдена  (план сохраняет ортогональность блоков  с каждым набором способов)  Расположение участков  I Bb Dd Cf Gg Се Gd Ac Н Fe Ec Aa Bf Fd Ea Dg Ga Ae Bg Ag Gd Р!) Ef IV Ш Ее! Fc Cb Щ I Ca Bc De Нерандомизованное 1. Аа ВЬ Cf Dd Ec Fe Gg II. Ac Bf Ce Dg Ea Fd Gb III. Ae Bg Cb Di Ed Ре: Ga IV. Ag Bc Ca De Е} Fb Gd *) A, B, . . ., G — исходные способы, а, b, . . ., g— новые способы. П л а н 7.8 *)  План для измененения способов обработки  в рандомизованных блоках  *) A, B,..., F— исходные  новые способы.  Блок Нерандомизованньхе 1 Аа Bb Cc Dd Ea Fb II Ab Bc Cd Все Еа Fd III Ac Bd Ca Db Eb Fe IV Ad Ba Cb Dc Ec Fa V Aa Bb Cc Dd Ec Fd VI Ab Bc Cd На Ed Fb  способы, а, Ь. c, d—- 
176 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  было добавлено четыре новых способа обработки. При этом используется такой же квадрат Юдена‚ как в пла- не 7.6. Другой интересный план (П и р с и Тейло р [77]) показан в плане 7.8, где шесть исходных способов рас- положены в шести рандомизованных блоках. Четыре но- вых способа вводятся так, что каждый блок содержит каждый способ по одному разу и добавочные пары участков на каждый блок охватывают все возможные наборы по два из четырех, и одновременно имеется тот же самый тип баланса относительно исходных способов. Ф р и м е н [122] продемонстрировал, что планы, сбалан- сированные подобным образом, редки, но его `теория еще не вполне разработана. План 7.9 иллюстрирует воз- можность распространения планов этого типа на ситуа- ции, в которых исходным планом является латинский квадрат, а новые способы сбалансированы по методу Пирса—Тейлора относительно строк, столбцов и старых способов.  Г1латт Т9*) 1Тлан изменения способов обработки B ЛЗТННСКОМ квадрате Нерандомизованные Аа Bb Cc Dd Ed Ре Bd На Fd Ac Ca Ed Cb Ec Ad Fa Bc Db Dc Fd Ea Bb Ab Ca Eb Ac На Cd Ре Ва Fa Cd Bc Eb Db Ad *) А,.В,..„ 17—-старые способы‚сд Ь‚с‚41—-новые  способы.  Предлагались и легко могут быть построены анало- гичные планы, основанные на частично сбалансирован- ных неполных блоках, но, конечно, они обладают-обыч- ными неудобствами частичного балансирования, связан- ными с неодинаковой точностью различных сравнений. Ф р и м е н [122] доказал ряд теорем о необходимых ус- ловиях существования планов, в которых новые способы 
7.4. FIEPEKPECTI-IbIE ПЛАНЫ 177  частично сбалансированы относительно старых и отно- сительно блоков. Однако о достаточных условиях суще- ствования иичего не известно. Позднее [123] он систематически изучил и свел в каталог все эти и тесно связанные с ними планы, в ко- торых число способов обработки, реплик и блоков не превышает 30, а полное число участков не больше 150.  7.4. Перекрестные планы  В двух предыдущих параграфах приведены некоторые из задач, возникающих, когда время играет важную роль в экспериментах. Несколько отличная ситуация встре- чается, когда последовательность способов обработки несущественна, а целью эксперимента является просто возможно более точное сравнение способов, если допу- скаются последующие испытания других способов на том же участке и, следовательно, полное или частичное исключение дисперсии между участками. Например, в эксперименте с питательными веществами для живот- ных можно разделить всю продолжительность экспери- мента Ha периоды так, чтобы рацион каждого животного изменялся в конце периода. Информация об относитель- ных достоинствах способов обработки затем получается из сравнения измерений подходящих реакций животного в течение последующих периодов для отдельных живот- ных (например, привесов или производства молока) после исключения любой полной разницы между перио- дами. Простой пример такого эксперимента был уже при- веден в § 3.4 для того, чтобы проиллюстрировать стати- стический анализ латинского квадрата. Повторное его рассмотрение прольет свет на настоящую проблему. В описанном эксперименте мы интересуемся только раз- ницей в уровне сахара в крови при четырех способах об- работки. Такой эксперимент можно было бы провести на 16 кроликах, используя по четыре кролика на каждый способ, так что в эксперименте каждый кролик участвует только один раз. Конечно, в этом случае мы можем за- кончить эксперимент быстрее. Преимущество плана ла- тинского квадрата, не принятое во внимание, состоит  12 д. Фннни 
178 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  в -том, что сравнения способов подвержены дисперсии для каждого кролика, которая (как правило) много меньше дисперсии между кроликами, так что в действи- тельности понадобится около 56 кроликов, подвергнутых обработке только один раз, для того, чтобы получить ту же точность, как в действительном эксперименте. Хотя изменение дозы, действию которой подвергается кролик, само по себе не представляет интереса для экс- периментатора, рассмотрение плана 3.3 обнаруживает одну тревожную особенность: за исключением послед- них четырех доз, А всегда следовало за С и аналогично В всегда следовало за D, C за В и D за А. Может слу- читься, что отклик кролика на любое событие зависит от ранее полученной дозы. Например, высокая доза или сильная реакция может в любом случае предрасполо- жить кролика к относительно меньшей реакции в сле- дующем опыте (в сравнении с обычной реакцией). Если на используемую последовательность доз накладывают- ся некоторые ограничения, то баланс по периодам мо- жет быть усилен путем некоторого балансирования от- носительно предыдущего способа обработки, по крайней мере настолько, что остаточные эффекты способов об- работки будут аддитивными компонентами величины урожая в следующем периоде (так что равенство (3.6) просто переделывается добавлением к правой части сле- дующего члена, соответствующего остаточному эффекту, независимо от того, какой способ предшествовал спо- собу i). План 7.10 дает один из наиболее простых нетри- виальных сбалансированных перекрестных или перемен- ных планов, которые используются при сравнении силы лекарств (как в плане 3.3), в экспериментах по питанию животных и в различных других обстоятельствах. В этом плане сравниваются четыре способа обработки на 12 жи- вотных за четыре периода. В каждом периоде на способ приходится по три животных, а на каждое возможное изменение способа в конце каждого периода (А на В, А на С, ...‚ В на А, В на С, ...‚ D Ha C) приходится по одному животному. План можно считать полученным из полностью ортогонализованного квадрата 4><4 плана 3.5, если записывать последовательно три компоненты 
7.4. пврвкрвстньтв ПЛАНЫ 179  квадрата буквами, а не цифрами. Аналогичные планы можно образовать из некоторых полностью ортогонали- зованных квадратов размера z‘ >< I’, особенно же из квад- ратов, полученных в соответствии с правилом `из §= 3.6 для простых t. Например, 12 животных могли бы. быть приписаны наугад столбцами плана 7.10 и"рационы могли бы быть обозначены в случайном порядке как А, В, С, D. План с этим свойством балансирования мож- но построить для любого числа способов обработки, ис- пользуя t периодов и If! столбцов (животных), но план 7.10 особенно интересен тем, что балансирование достиг- нуто на 12 столбцах, а не на 24.  План 7.10  План для перекрестного эксперимента над 12 животными с четырьмя способами обработки, сбалансированными по остаточным эффектам  Номер животного Период I 1 I 2 .3 V 4 l 5 | 6 7 ' 8 I 9 l 10 l ll ' 12% 1 А в C D A B с D A B с D II B A D C C D A B D C B A III C D A B D C B A B A D C IV D C B A B A D C C D A B  Анализ результатов этого эксперимента дает возмож- ность сравнивать рационы в терминах оцененной раз- ницы в эффектах за период использования, а также дает возможность оценивать добавочные остаточные эффек- ты. Если эти остаточные эффекты представляют особый интерес, то есть смысл продолжить эксперимент в пятом периоде, в котором все животные имеют тот же способ обработки, что и в периоде IV, для того чтобы получить информацию о каждом способе, следующем за самим собой. Тогда оценка точности остаточных эффектов бу- дет выше ввиду более полного балансирования, хотя по отношению к полному числу сделанных наблюдений мы получим некоторый ущерб в прямых эффектах (П а т е р- сон и Лукас[75]).  12* 
180 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  В сравнении с планом 3.3 план 7.10 включает в три раза больше животных, так как только таким путем можно достичь полного баланса остаточных эффектов. Можно было бы ожидать, что увеличение общего числа «участников» с 16 до 48 приведет к пропорциональному повышению точности, не считая улучшений в оценке остаточных эффектов. Если ослабить требование, по ко- торому каждая возможная последовательность из двух способов обработки должна встречаться одинаково ча- сто в каждой паре последовательных периодов, до тре- бования, по которому каждая такая последовательность из двух способов обработки должна встречаться одина- ково часто во всем эксперименте, то возможны планы с меньшим числом реплик. В и л ь я м с [27] показал, как построить планы, в которых каждая последовательность из двух способов обработки встречается только один раз. Если бы вместо плана 3.3 использовался план 7.11, то  План 7.11  План для перекрестного эксперимента над четырьмя животными с четырьмя способами обработки, сбалансированными относительно остаточных эффектов  Номер животного Период 1 2 д 4 1 А В С D II B C D A III D A B C IV C D A B  B этом случае происходило бы балансирование остатков внутри эксперимента, при котором способы В, С, D сле- довали бы за А соответственно на животных 1, 4, 2 и аналогично для других способов. Общее построение та- ких планов упрощается при использовании набора це- лых чисел О, 1, 2, ..., (z‘— 1) для обозначения способов обработки. Если t четное, то эти числа можно располо- жить в столбцы таким образом, чтобы разности между следующими один за другим элементами, приведенные 
7.4. ПЕРЕКРЕСТНЫЕ ПЛАНЫ 181  по модулю l, принимали значения 1, 2, 3, ��d� (t——l). Для любого такого столбца можно получить последующие столбцы квадрата t><l, добавляя 1, 2, 3, ���� (t—1)  K этому первому столбцу и приводя результаты по мо- дулю L‘. Легко видеть, что такой квадрат будет обладать требуемыми свойствами. Таким образом, в плане 7.12  План 7.12  План для перекрестного эксперимента над шестью животными с шестью способами обработки, сбалансированными относительно остаточных эффектов  Номер животного Период ъгггвмлвм 1 О 1 2 З 4 5 11 2 3 4 5 О 1 111 1 2 3 4 5 О IV 4 5 О 1 2 3 V 5 О 1 2 3 4 VI 3 4 5 о 1 2  для t= 6 первый столбец дает последовательно разно- сти 2, 5, 3, 1, 4; остальные столбцы строятся очевидным циклическим способом, и легко проверить, что, напри- мер, способ три следует за способами О, 1, 2, 4, 5 соот- ветственно на животных 3, 5, 2, 6, 4. Первый столбец, элементами которого являются  0,1, (l‘—1),2,(t—2),3,...,t/2,  всегда будет обладать требуемым свойством, но, как по- казал Вильямс, существуют и другие решения. Если t нечетное, то легко видеть, что невозможно балансирова- ние в одном квадрате, но аналогичное решение можно дать для двух квадратов, когда каждая последователь- ность из двух способов обработки встречается дважды. Вильямс также рассматривал возможность баланси- рования относительно двух предшествующих способов обработки, либо отдельно, либо во всех комбинациях. Дальнейшее рассмотрение плана 7.10 показывает, что каждая возможная упорядоченная последовательность 
182 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  трех различных букв встречается по одному разу, при- чем каждое животное имеет одну последовательность способов для периодов 1, 11, 111 и другую последователь- ность для периодов 11, 111, IV. ВИЛЬЯМС показал, как можно использовать аналогичные разностные методы для образования таких планов и как можно получить дополнительные планы из теории полей Галуа. В сле- дующей статье [28] он указал, что существуют дополни- тельные решения, связанные не с разностями и не с по- лями, и дал пример для 1:5, который даже не состоит из пяти латинских квадратов. Очевидно, необходимы даль- нейшие исследования, прежде чем можно будет получить исчерпывающую классификацию этого семейства планов. Статистик не должен допускать, чтобы изящные ком- бинаторные свойства перекрестных планов затмевали для него практическую ограниченность этих планов. При их использовании существенно предположение, что влия- ние прошлых способов обработки животных (или других объектов) на последующие способы в течение любого периода может соответствующим образом суммировать- ся, если затем в модель вводится одна или большее число аддитивных компонент, подобно тому, как это де- лалось в равенствах (3.6). При некоторых обстоятель- ствах это предположение может соблюдаться почти точ- но, в других оно может служить хорошим первым приближением, но будет ли это предположение доста- точным, требует обсуждения в конкретной эксперимен- тальной ситуации. Иногда, конечно, более ранний способ обработки может непрерывно воздействовать на реак- ции субъекта на последовательность способов. Особенно важны задачи, в которых экспериментатор интересуется сравнением способов, используемых непрерывно в тече- ние длительного времени, и схема перемен после корот- ких периодов является исключительно схемой для точ- ной оценки сравнений внутри субъекта. Человек, изучающий питание животных, преждевсего будет инте- ресоваться тем, как сопоставить различные рационы при непрерывном их использовании. Если эксперимент, в ко- тором рацион животного меняется каждые шесть недель, дает результаты, которые неправильно подскажут эф- фект этих рационов после года непрерывного кормления, 
7.5. СБАЛАНСИРОВАННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 183  то он должен быть отброшен, несмотря на его кажу- щуюся точность. Эти оговорки относительно семейства планов, кото- рые могут иметь большое практическое значение, яв- ляются поэтому особенно кстати в связи с одной об- ластью исследований, в которой они должны быть очень популярны-сравнением режимов кормления молочно- го скота. Бл ексте р [9] накопил доказательства того, что наибольшая чувствительность коровы к изменениям рациона наблюдается во время лактации. Это уже ясно видно, хотя результаты еще подвергаются полной обра- ботке. Короткий период недоедания может He только уменьшить молочную продукцию за этот период и дать остаточный аддитивный (или скорее субтрактивный) эф- фект Ha последующие периоды, но он может привести к необратимому ухудшению продуктивных свойств ко- ровы, не восстанавливающихся полностью при дальней- шем обильном кормлении. В статистических терминах продукция за период может зависеть не только от пара- метра, характеризующего текущий рацион, и одного или более дополнительных параметров для предшествовав- ших рационов, которые могут считаться независимыми один от другого, но также от величины изменений пита- тельной ценности одного рациона по отношению к сле- дующему H OT BpeM€HH, которое прошло с момента из- менения. Характер зависимости может быть очень сложным и может удовлетворительно изучаться только при некотором учете физиологии лактации. Даже здесь анализ результатов перекрестного эксперимента, соот- ветствующего простой аддитивной модели, может быть полезным первым приближением; однако может возник- нуть серьезное непонимание, если статистик и экспери- ментатор попытаются трактовать эксперимент, пол- ностью игнорируя возможность более сложной структу- ры, недоступной этому поверхностному анализу.  7.5. Сбалансированные последовательности  Перекрестные планы полезны, когда число способов обработки должно оставаться малым, хотя каждый от- дельный субъект может получать несколько способов обработки в последовательные периоды. Существуют 
184 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮ1ЦИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  обстоятельства, в которых число субъектов должно быть очень небольшим, может быть всего один экземпляр, но его можно использовать в течение очень большого числа периодов. Здесь будет рассмотрена крайняя ситуация, в которой все опыты проводятся над одним субъектом. Однако могут быть построены планы, в которых соче- таются некоторые из особенностей, изучаемых в этом параграфе и в § 7.4. Финни и Аутвайт [111], [112], рассматривали последовательности способов обработки, сбалансированные относительно предшествующих спо- собов. Сами по себе такие способы обработки легко придумать, но возможность длительного проведения эксперимента делает желательным одновременную груп- пировку способов обработки в последовательность по- вторяющихся блоков. Практические ограничения на ис- пользование перекрестных планов, приведенные B конце § 7.4, также можно использовать для этих последова- тельностей. Можно определить два Tuna последовательно сба- лансированных последовательностей порядка z‘ c индек- сом k. Для типа 1: i) последовательность состоит из (kt? + 1) букв, при- чем один символ способа обработки встречается (kt+1) pas, a каждый Из оставшихся (t—-1) символов встре- чается kt pas; ii) после первой буквы каждый из kt последователь- ных наборов по If элементов содержит каждый символ способа обработки; 111) каждая из 12 возможных упорядоченных пар сим- волов последовательных способов обработки встречает- ся k pas. Для типа 2: i) последовательность состоит из (kt? —— kt + 1) букв, причем один символ способов обработки встречается (/г2‘——/г + 1) раз, а каждый из оставшихся (z‘—— 1) сим- волов встречается k(zf —— 1) раз; 11) после первой буквы каждый из k(t— 1) последо- вательных наборов из l‘ элементов содержит каждый символ способа обработки; 
7.5. СБАЛАНСИРОВАННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 185  111) каждая из t(t— 1) возможных упорядоченных пар последовательных различных символов способов об- работки встречается /e pa3. Наиболее употребительные планы этого класса — это планы индекса 1. Для планов типа 1 имеется тривиаль- ное решение для t=2, НО нет решения для t=3, 4, 5.  Примером многочисленных возможностей для t=6  СЛУЖИТ А; А, В, С, D, E, F; F, C, E, A, D, B; B, A, F, E, D, C; ` С, А, Е, В, F, D; D, F, A, C, B, E; E, C, F, B, D, A.  Из любого плана другой план может быть построен ци- клической перестановкой повторяющихся блоков и за- меной первой буквы на любую другую. Перемена по- рядка всей последовательности, кроме первой буквы, также дает новый план. Конечно, при теоретическом об- суждении, вероятно, удобнее представлять себе 22 букв, записанных по кругу. При этом последовательность об- разуется разбиением круга на любые интервалы между блоками, чтением в любом направлении и добавлением первой буквы, тождественной с последней. Последова- тельности типа 2 появляются много чаще, по крайней мере для малых значений г‘. Примером с t = 5 служит  А; В, D, E, C, A; Е, B, C, D, A; C, E, D, B, A; D, C, B, E, A;  И этот план обладает интересным свойством полной об- ратимости, поскольку  А; E, B, C, D, A; B, D, Е, C, A; D, C, B, E, A; C, E, D, B, A  удовлетворяет этим условиям. Если для наблюдений при- нята аддитивная модель (составленная из параметра блока, параметра способа обработки, параметра оста- точного влияния способа и экспериментальной ошибки) и мы игнорируем результат аномального первого участ- ка, то полностью обратимые планы имеют то преимуще- ство, что контрасты между остаточными эффектами и 
186 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  контрасты между прямыми эффектами ортогональны блокам. С э M п ф о рд [88] доказал различные теоремы, ка- сающиеся таких последовательностей. Он дал общие ме- тоды построения последовательностей типа 2 с индек- сом’ 1 и последовательностей типа 1 с индексом 2, применимые для всех значений 1.‘. Он основывает свой метод на перестановках столбцов латинского квадрата, за которым следует включение дополнительного столбца и последовательное чтение строк. Например, если столб- ць1 циклического квадрата 4 >< 4  А ВС D B CD A С D A B DA B C  переставлены в следующем порядке: 1, 2, 4, 3 и рассмат- риваются как квадрат, имеющий строки, которые чи- таются последовательно и циклически (ABDCB ADACBA), то нетрудно увидеть, что все возможные пары последовательных букв встречаются по одному разу, что AD, BA, СВ, DC встречаются по два раза и что такое повторение встречается между новыми столб- цами З и 4 и новыми столбцами 4 и 1. Следовательно, столбец, состоящий только из одной новой буквы, может  быть вставлен между столбцами одной из этих пар И  добавление начальной буквы, такой же, как последняя, дает последовательность типа 2. Итак, в результате двух шагов получаем последова- тельно  толь. обои шьш ЪФСЪ manna; D006. mumm- bbfvto  D A B D А С В D A C Е В Сэмпфорд предложил правила, тесно связанные с пра-  вилами Вильямса для его перекрестных планов (§ 7.4). Он указал, что как и для перекрестных планов, суще- 
7.6. ИСПОЛЬЗОВАНИЕ дровнои РЕПЛИКИ 187  ствует много планов, которые нельзя построить подоб- нь1м образом. Очевидно, остается сделать еще очень много, прежде чем будет полностью понята природа по- следовательностей. Сэмпфорд, кроме того, дал правила построения полностью обратимых планов для значений! вплоть до 22 (тип 1) и до 23 (тип 2). Он рассматривал проблему последовательностей типа 1 с индексом 1, не достигнув общих результатов, и описал в общих чертах методы статистического анализа экспериментов. Л а к ш- M И н а р а й а н [68] получил дополнительные теоремы, касающиеся построения этих планов. В и л ь я м с [29] придумал последовательности, ана- логичные последовательностям типа 2, но подчиняющие- ся менее строгим условиям. Его последовательности сбалансированы относительно соседних пар символов, независимо от их порядка. Например, последователь- ность с z‘ = 4,  А; D7 В? С, ���� С? В, А’ �_�� С’ D) В? А?  удовлетворяет условиям Вильямса, поскольку любая возможная пара из двух букв встречается вместе два- жды: АС, ВС и CD в любом порядке, но BA, AD И DB встречаются дважды в одном и том же порядке.  7.6. Последовательное использование дробной реплики  Важная особенность большинства промышленных эксперимен- тов состоит в том, что наблюдения делаются последовательно, либо по одному, либо небольшими группами одновременно, так что ре- зультат наблюдений одной группы становится известным до начала следующей. Более того, временной интервал между группами наблю- дений, как правило, короткий, часто это дело дней или даже часов... В сельском хозяйстве, если полевой эксперимент начат, то, как пра- _вило, невозможно изменить или модифицировать план, но в боль- шинстве промышленных экспериментов имеется большая степень гибкости, так как ситуацию можно пересмотреть после любого на- блюдения или полученного набора наблюдений. Нет необходимости строго придерживаться плана, составленного в начале эксперимента, но план может быть преобразован в результате информации, полу- ченной из более ранних наблюдений (Дейвис и Хей [38]).  Далее эти авторы утверждают, что в эксперименте с химическим процессом, если один из факторов имеет 
\  188 ГЛ. 7. ЭКСПЕРИМЕНТЫ, ВКЛЮЧАЮЩИЕ ИЗМЕНЕНИЕ ОБРАБОТКИ  большое влияние, то, по-видимому, его взаимодействия с другими факторами должны быть существенными, и, вероятно, дальнейший практический интерес представ- ляет только та часть эксперимента, в которой этот фак- тор находится на определенном уровне. Это может озна- чать, что половина вычислений большого эксперимента является излишней. Для обнаружения большого эффек- та достаточно дробной реплики, и решение о прекраще- нии испытания одного уровня фактора может быть тогда принято с меньшим количеством ненужных наблюдений. В любом факторном эксперименте, в котором полное число комбинаций способов превышает размер блока, образующего естественную часть целого, как правило, прибегают к смешиванию. В промышленных экспери- ментах чаще встречается временная последовательность опытов, нежели их расположение в пространстве, так что блоком может служить день или неделя работы. Ка- ждый блок в схеме смешивания можно рассматривать как дробную реплику всех комбинаций способов обра- ботки, и аргументация последнего параграфа наводит на мысль, что можно было бы использовать анализ од- ного или нескольких блоков для получения предвари- тельных сведений об эффектах факторов. Такой анализ может привести к одному из трех заключений: i) пока еще не получено никакого ясного ответа, и эксперимент должен быть продолжен до тех пор, пока не сможет быть проведен дальнейший анализ; 11) результаты уже настолько очевидны, что экспери- мент можно не продолжать; 111) результаты показывают, что исследование одного из факторов (или нескольких факторов) должно быть прекращено, последующие шаги этого эксперимента бу- дут проходить только на одном уровне этого фактора. Если получено третье заключение, то продолжаю- щийся эксперимент содержит на один фактор меньше, или можно ввести новый фактор. Такая процедура ана- логична процедуре, предложенной в экспериментах с плодовыми культурами в § 7.3, но не вполне совпадает с ней, так как в рассматриваемом контексте новые «участки» используются непрерывно. Целый экспери- мент может состоять из Последовательности дробных 
7.6. ИСПОЛЬЗОВАНИЕ дровнои реплики 189  реплик относительно многих факторов, причем исполь- зуемые факторы изменяются в ходе эксперимента. Читатель может сравнить это обсуждение с обсужде- нием формальных последовательных экспериментов в § 8.2, где рассматривается простейший тип экспери- мента только c ДВУМЯ способами обработки. Сомнитель- но, чтобы было уже сделано какое-нибудь исследование по точной теории, соответствующее случаю, когда окон- чание эксперимента над несколькими факторами сде- лано зависящим от уже полученных результатов. Однако в первом приближении можно игнорировать любое усложнение в оценивании эффектов способов и точности оценок, особенно для факторов, отличных от тех, кото- рые влияют на окончание эксперимента. Несомненно, возникает опасность смещения, хотя его природа не мо- жет быть объяснена без более полного рассмотрения последовательного экспериментирования, но многие экспериментаторы хотят, по-видимому, справедливо рас- сматривать риск как разумную цену за преимущества и достаточную экономию. 
Глава 8  ПОСЛ ЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  8.1. Последовательный выбор  Большую часть количественных научных исследова- ний можно описывать как последовательные, по край-  ‚ней мере в чистой и прикладной биологических науках иичв тех отраслях физических наук, в которых важным  является эмпирический элемент (например, в отраслях, связанных с производственными процессами). Резуль- таты такого исследования могут потребоваться для не- медленного практического применения, но они могут быть также, непосредственно или в будущем, основой для дальнейших исследований, в которых количествен- ные свойства будут определяться более точно, чем до этого. Этому процессу в действительности нет конца. Некоторые свойства допускают точное определение, а для других измерения показывают столь малые инди- видуальные колебания, что среднее по малому числу тщательно выполненных определений может оказаться достаточным для будущего практического использова- ния. Примерами этого являются соответственно число хромосом того или иного вида растений или животных и стандартные физические константы такие, как точки плавления, удельные веса или электропроводности. Од- нако очень многие свойства проявляют столь большие колебания от одного индивидуума к другому, или при повторных определениях на одном и том же индиви- дууме, что может возникнуть конфликт между необхо- димостью получения надежного значения и стоимостью (во времени или в деньгах) выполнения достаточного ко- личества испытаний и измерений. Типичными примерами этого являются доля дефектных изделий в промышлен- ной продукции, число насекомых некоторого вида на 
8.1. послвдовАтЕльньт вывор 191  Ч  единичной площадке земли, длительность существова- ния электрического термостата при стандартных усло- виях и доза инсулина, требуемая для того, чтобы пони- зить содержание сахара в крови животного до опреде- ленного уровня. Часто практические выводы и действия должны основываться на одной малой выборке, но тот; кто планирует эту выборку, поступит разумно, если при- мет во внимание всякие сведения о точности, ‘достигну- той в предшествующем выборе такого же типа. Если новые исследования предполагаются обширными, то ста- тистик может посоветовать взять сначала малую вспо- могательную выборку, которая даст информацию о по- рядке величин, подлежащих оцениванию, и их дисперсий. На основе этой информации главная выборка может быть спланирована более удовлетворительно. _ Из этих простых идей об использовании последова- тельно получаемой информации в последние годы вь1- росла более формализованная система последователь- ного выбора для изучения генеральных совокупностей. Основным принципом его является то, что вместо того, чтобы фиксировать объем выборки уже на первой ста-_ дии, его делают зависимым от результатов самой вы- борки. Конечно, это возможно лишь тогда, когда сбор данных или исследование полученной выборки представ- ляют собой процесс, который занимает длительный пе- риод времени и который можно остановить на промежу- точных ступенях. Например, при оценивании доли дефектных изделий, производимых на различных маши- нах, вместо того, чтобы брать одинаковое число изделий or каждой машины, выбор можно было бы продолжать до тех пор, пока не будет получено фиксированное число дефектных изделий от каждой машины. Такой обратный выбор в некоторых условиях выгоден. С другой стороны; эту долю можно непрерывно контролировать по мере того, как объем выборки растет. Если она все время или- очень мала или очень велика, то решение о принятии или браковке исследуемой партии изделий можно сде- лать по совсем малой выборке, в то время как при_доле среднего размера следует продолжать выбор далее, пре- жде чем можно сделать надежное заключение. Однако  имеет место извечная трудность, состоящая кв 
192 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  гарантировании того, что члены выборки действительно получены случайным выбором из генеральной соовокуп- ности. Образцовый труд по последовательному выбору напи- сан В а л Ь до M [26], основателем этого направления. Од- нако читатель, который ищет простого введения, прояс- няющего связь между глубокой теорией и практикой, по- видимому, получит большую пользу от статьи Б а р н а р- д а [5]. Имеется, конечно, множество более поздних статей.  8.2. Последовательные эксперименты  План эксперимента будет также улучшаться, если принимается во внимание информация от предшествую- щих экспериментов в этой же или смежных областях. Действительно, так же как идеальный план выбора реально зависит от знания того, какие величины на са- мом деле должна измерять выборка, так идеальный план эксперимента зависит от самих результатов экспе- римента: на практике должны быть сделаны разумные догадки или предположения об этих результатах, осно- ванные на некоторой информации, и тогда выбор или эксперимент планируются по отношению к этим пред- положениям в надежде, что истина не будет отличаться от догадки настолько, чтобы серьезно нарушать опти- ьмальные условия. Более подробно об этом будет ска- зано в гл. 9 в связи с общим планированием экспери- ментальных программ. Здесь будет рассматриваться более специальный аспект последовательностей экспери- ментов, а именно тот, в котором временная последова- тельность и окончание эксперимента, определяемые уже полученными результатами, являются существенными свойствами отдельного эксперимента. Целью является составление такого плана, при котором удовлетвори- тельные результаты достигнуты наиболее экономичным образом в отношении суммарного расхода эксперимен- тальных объектов («участков»). Одной из возможностей является приспособление идей последовательного выбора к экспериментальным процедурам. Их применимость ограничена, но по край-  ней мере в одном отношении условия более удовлетво- 
8.2. ПОСЛЕДОВАТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 193  рительньт, чем для выбора: так как объектами изучения являются скорее сравнения, чем абсолютные значения, то исчезают некоторые трудности в отношении случай- ности, отмеченные B § 8.1. Например, при клинических испытаниях новых способов лечения болезни обычные экономические сооб- рзжения, связанные с желанием получить ответ из экс- перимента без чрезмерных трат времени и материалов, усиливаются этикой и человеколюбием, требующими, чтобы ни один пациент не подвергался некоторой обра- ботке после того, как собранные сведения показали, что альтернативный способ обработки здесь будет лучшим. Для второстепенных недугов таких, как головная боль или обыкновенная простуда, это требование вряд ли нужно жестко навязывать, но в случае серьезных забо- леваний оно должно неуклонно выполняться. Предполо- ложим, что А——стандартный способ лечения для кон- кретной болезни, и высказываются доводы в пользу мнения, что следует отдать предпочтение альтерна- тиве В. Коль скоро В считается безопасным для людей, опыты будут производиться на них, и результаты будут сравниваться с соответствующими результатами для Первые пациенты, которые получат В, будут неизбежно «экспериментальными»: соображения морали требуют, чтобы результаты полученные от них, образовывали часть хорошо спланированного эксперимента и были бы по возможности эффективно использованы (Хилл [129]). Одна возможность состоит в распределении А и В слу- чайным образом среди всех исследуемых пациентов, а затем в сравнении долей вылечившихся по таблице со- пряженности признаков типа 2><2. Последовательным вариантом этого плана является разделение всех пациентов на пары (с отбрасыванием тех, кто не подходит для эксперимента), например, в со- ответствии с датой обработки, но если данных очень много, то можно образовать пары, например, по призна- кам пола, возраста, опасности заболевания или же фи- зическим характеристикам, а затем для способа лече- ния В выбрать по одному члену из каждой пары слу- чайным образом. Когда результаты для каждой пары  13 Д. Фпнни 
194 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ экспЕримЕнтпровАнИв  становятся известными, их можно отнести в одну из четырех групп:  i) HH ОДИН из членов пары He вылечился, 11) способ А привел к выздоровлению, а В не привел, 111) способ В привел к выздоровлению, а А не привел, iv) оба способа привели к выздоровлению.  у Ясно, что группы 1) и iv) He дают никакой информа- ции, которую можно было бы использовать для выясне- ния того, отличаются ли А и В по эффективности. При нулевой гипотезе о том, что оба метода лечения одина- ково хороши, группы 11) и 111) имеют одинаковые ве- роятности. Следовательно, если продолжать эксперимент до тех пор, пока не получится N пар в этих двух груп- пах, то для проверки нулевой гипотезы можно исполь- зовать биномиальное распределение вероятностей  (0,5 + 0,5)“.  Однако большой избыток группы 11) на ранних стадиях эксперимента следует считать доводом в пользу А, даже He дожидаясь какого-либо определенного суммарного числа N наблюдений, и аналогичным образом ранний избыток группы 111) должен вызвать решение в пользу В. Более экономичной была бы схема, в которой после того, как из всех классифицированных пар г попадают в 11) и 111), принимается одно из трех решений: а) если число в группе 11) превосходит Ат, некоторую функцию от г, то А считают более эффективным, чем В; б) если число в группе 111) превосходит В), другую функцию от г, то В считают более эффективным; в) если ни а) ни б) не имеют .места, то эксперимент продолжается, и эти правила применяют к (г + 1) паре, попавшим в 11) и 111). Ситуацию можно изобразить графически в виде дву- мерной диаграммы на клетчатой бумаге. Для этого ис- ходящую из начала координат точку-индикатор будем сдвигать на одну единицу вправо всякий раз, когда отмечается пара типа 11), на одну единицу вертикально вверх для каждой пары типа 111) и оставлять на месте для каждой пары типов 1) и iv). Положение точки по 
8.2. ПОСЛЕДОВАТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ 195  отношению к границам с координатами (АТ, г-—А,.), (г——В,., B,.) дает решение об окончании или продол- жении эксперимента после того, как в 11) и 111) попали г пар. Вероятности различных положений точки после г шагов не являются просто биномиальными, так как некоторые последовательности результатов, приводящие к данному положению точки, должны быть исключены, поскольку они пересекают одну или большее число гра- ниц, прежде чем его достигнут. Функции Ar, В, зависят от рисков неверных сужде- ний, которые экспериментатор готов принять, и от вели- чины разности в соотношениях, которую ему хотелось бы уметь обнаружить. Если PA, РВ-вероятности излече- ния соответственно способами А и В, то условная ве- роятность того, что пара пациентов окажется в группе 11) при условии, что она принадлежит одной из групп 11) и1Н),равна  РАО-РЕ) �A�  Р: РА(1—РВ)+РВ(]_РА)  и принимает значение 0,5 при нулевой гипотезе, что PA = PB. Если PA и PB примерно равны, то мог бы по- требоваться огромный объем экспериментирования, что- бы обнаружить, которая из этих вероятностей больше. Но в среднем это имеет малое отношение к тому, какой способ лечения был применен. На практике эксперимен- татор хочет остановиться, когда он удовлетворен тем, что разность достаточно мала, и утверждать, что «А и В примерно одинаково эффективны». Он может сформули- ровать свои требования, установив априори, как сильно должны отличаться PA И PB *), как велика вероятность заключения, что А лучше, тогда как в действительно- сти В по крайней мере не хуже того, которое он может допустить, и как велика вероятность заключения о том, что В лучше, когда А в действительности достаточно хо- рошо, чтобы устроить его: он будет желать малых ве- роятностей, но чем меньшими они будут, тем дольше будет продолжаться его эксперимент. Он может тогда  *) Точнее, важна именно величина, на которую отличается от единицы PA(1— P3)/P3(l — PA).  13* 
196 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  определить подходящие А, и Br, хотя бы с помощью трудоемких вычислений. Внедавней работе Бросс [24] говорит о том, что если объем выборки фиксирован заранее, то число про- веряемых пациентов в опыте этого типа будет равно в среднем только примерно половине числа, необходи- мого‚ чтобы получить одинаковую точность. Билле- в и ч [8] исследовал выгоды от образования пар субъек- тов. Он указал на то, что PA И PB могут меняться внутри исследуемой генеральной совокупности, и расслоение в соответствии с разными наблюдаемыми характеристи- ками может объединить индивидуумы с одинаковыми вероятностями реакции на способ обработки. Хотя обос- нованность эксперимента и не была бы нарушена, если бы пары образовывались случайным образом, можно ожидать, что ограничение парами, в которых оба члена взяты из одного и того же слоя генеральной совокупно- сти, привело бы к увеличению чувствительности экспе- римента и, следовательно, к уменьшению числа требуе- мых пар. Изучение одного или двух частных случаев привело Биллевича к заключению, что ожидаемый объем эксперимента в терминах общего числа пар был бы только примерно на 10% меньше даже при со- вершенно крайних условиях. Однако научные работники в области медицины часто находят образование пар удобным как в техническом отношении, так и ввиду того, что они могут видеть сравнения между случаями, аналогичными по характеристикам, что они считают важным. Ф и ш е р [118] использовал аналогичные последова- тельные методы в задачах генетики по различению двух возможностей. Он рассматривал результаты скрещива- ния двух мышей таких, что их потомство могло быть коричневым или черным. В результате скрещивания од- ного вида с вероятностью 1/2 получалась черная мышь, а для другого вида эта вероятность была равна 1/3. С помощью последовательных записей цвета потомства от любой конкретной пары и диаграммы, почти та- кой же, как описанная выше, каждое скрещивание мож- но приписать к его точному типу с определенными ве- роятностями ошибки. Б а р н а р д [5] развил другой тип 
8.3. ПОСЛЕДОВАТЕЛЬНОЕ ОЦЕНИВАНИЕ 197  последовательного критерия, который можно было бы применить к рассмотренной выше задаче из области ме- дицины. В соответствии с некоторыми правилами, осно- ванными на определенных вероятностях, он заранее определял числа пациентов, которые должны подвер- гаться лечению А и В, а затем продолжал испытания, пока эти числа не достигались, причем суммарные числа требуемых пациентов были случайными величинами в его критерии значимости. Можно рассмотреть много других применений последовательных методов в гене- тике. Важная модификация исходной задачи возникает, когда эффекты А и В птзмереньт в непрерывной шкале вместо дискретной. Предположим, что каждая пара субъектов дает оценку у количественной разницы ме- жду двумя способами обработки. Тогда на каждой сту- пени эксперимента можно изучать величину  (Ё y)2/ Е (у?)  и сравнивать ее с теоретическими пределами (А р м и- T е й д ж [З]).  8.3. Последовательное оценивание  Хотя в ранних работах по использованию статисти- ческих методов в экспериментах была склонность при- давать особое значение нулевой гипотезе и критериям значимости, в настоящее время общепризнано, что в этом смысле немногие эксперименты выполняют свою функцию полностью и что самое большее, что требует- ся — это оценить разность между средними или другими функциями от параметров. Здесь в данное время лежит слабость последовательного экспериментирования: тот факт, что окончание эксперимента становится зависи- мым от результатов, создает трудности в несмещенном оценивании средних. Хотя в первом приближении сме- Щение в «очевидной» оценке может быть пренебрежи- мым, необходимо дальнейшее продвижение в этой об- ласти (Анскомб[2]). Стейн [86] предложил изящный и вместе с тем очень простой метод, который можно применить к 
198 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  оцениванию разности Между двумя способами обработки на двух ступенях при условии, что длина доверитель- ного интервала заранее фиксирована. Например, может потребоваться оценка разности средних урожаев для способов обработки А и В при условии, что с вероят- ностью (1—-Р) интервал длины d no обе стороны от оценки будет содержать истинное значение. Нужно взять пары участков (пациентов, машин и т. д.) с подбором или без подбора по одинаковым характери- стикам, как описывалось в § 8.2, и выбрать наугад по одному члену из каждой пары для обработки спосо- бом А, а другой член подвергнуть обработке способом В. Для каждой пары составляется разность у между ве- личинами некоторой характеристики участков, подверг- нутых соответственно обработкам способами А и В. Ве- личина у будет предполагаться нормально распределен- ной по парам со средним ц и дисперсией 09, причем оба параметра считаются неизвестными. По методу Стейна сначала берется го повторений пар, причем го предполагается несколько меньшим, чем это окончательно нужно для удовлетворительной оцен- ки, но желательно, чтобы го было больше 10. Экспери- мент проводится по го парам, и для каждой пары изме- ряется значение у. Тогда  Z0(lJz'-17)? __z=1 s§———-———r0_] , (8.2) где Ч _ ш _z7=“‘ . (8.3) Го  представляет собой оценку дисперсии о? одного наблю- дения. Если z‘0— табличное значение Z для двусторонней вероятности Р с (го— 1) степенями свободы, то г, мож- но определить равенством  1.282 гд = + 1, (8.4) 
8.3. ПОСЛЕДОВАТЕЛЬНОЁ ОЦЕНИВАНИЕ 199  где символ [а] означает «наибольшее целое число, мень- шее или равное а». Простой вариант правила Стейна состоит тогда во взятии суммы г реплик, где  г = max (го, п), (8.5)  так что или эксперимент оканчивается уже на первой ступени из-за того, что у уже достаточно точное, или  берутся (г, — го) дополнительных реплик.  ЕСЛИ теперь В КЗЧССТВВ ОЦЕНКИ ПРИНИМЗЕТСЯ ВСЛИЧИНЗ  у” = ‘= ‚ (8-6)  го почти_очевидно, что интервал (y"‘—t0s0/1/r, y*+ -}-toso/1/r)c вероятностью (1—Р) содержит истинное среднее п. Кроме того, согласно равенству (8.4) этот ин- тервал меньше или равен интервалу (y*-——d, y* +d), так что требования выполняются с избытком. Несмотря на остроумие этого метода, в нем видна серьезная практическая брешь. Несомненно, определяе- мый интервал сходен с доверительным интервалом тем, что если экспериментатор собирается оценить 02 только из первых го реплик, то вероятность того, что интервал  длиной (Soto)/1/r по обе стороны от y* содержит Е(у), равна (1 — Р). Однако оценивание 02 является неэффек- тивным, так как, за исключением случая г, \<.r0, инфор- мация о о? используется неполностью. Экспериментатор несомненно соблазнился бы определением величины  2] (.1/z— .1/*)2 S2 = —————————‘=' (8.7)  r-— 1 B качестве оценки дисперсии, вычисленной по всем дан- ным, и пересчитал бы интервал, используя 5 вместо so И t, основанное на (r—— 1) степенях свободы. K сожале- нию, это не гарантировало бы того, что длина интервала не превосходит 2d, a также изменило бы связанную с интервалом вероятность, так как зависимость числа 
Q03 гл. 8. ПослвдовАтвльноЕ ЭКСНЕРНМЕНТИРОВАПНЕ  (r,—r0) до11олнительных реплик от 5% вызывала бы смещение в оценке 52 для 02. Если бы r0 было очень Малым (скажем, 2 или 3), то никто не мог бы лишь для получения догматического соответствия с правилами доверительного оценивания довольствоваться тем, что окончательное заключение об  интервале основывается на весьма неточной оценке So и на необходимо большом отклонении го, когда на руках имеется гораздо большая информация. Значит, пред- ставляет интерес исследование вопроса, сколь большим было бы нарушение строгой теории, если бы на прак- тике следовали тому, что изложено в последнем абзаце, но этот вопрос, кажется, еще никем не изучался. В ин- тересной статье, на которую мы уже ссылались, Анс- комб [2] рассмотрел, что случилось бы, если бы после каждого наблюдения среднее, стандартное отклонение и доверительные интервалы вычислялись бы по накоп- ленным до этого j значениям в точности так, как если бы данные относились к эксперименту, в котором решение взять j значений было объявлено заранее, при этом экс- перимент должен заканчиваться, как только станет оче- видно, что доверительные интервалы будут не более 2d. Ему удалось показать, что связанная с этим финальным глнтервалом истинная доверительная вероятность отлича- лась бы от (1 —Р) весьма незначительно, если только само финальное j He очень мало. Для метода Стейна не- возможность использования всей содержащейся в на- блюдениях информации препятствует тому, чтобы истин- ные доверительные границы были одновременно и фи- дуциальньлми границами. Для интуитивно разумного альтернативного метода, описанного Анскомбом, вероят- ности не являются в точности такими, как они опреде- ляются для любой системы границ, но расхождение вряд ли имеет практическое значение. Статья Стейна дает прежде всего интересный пример контраста между точками зрения теоретика-статистика и прикладного статистика. Хотя его метод по существу совпадает с описанным здесь, он изо всех сил старается выработать правила, которые дают доверительный ин- тервал в точности длины 2d. OH заменяет y* Ha взвешен- 
8.4. оцвнивлнгтв оптимАльных условии 201  ное среднее средних значений у C неравными весами для двух ступеней эксперимента. Эта намеренная неэффек- тивность оценивания дает возможность отбросить избы- точную информацию, которая возникает из того, что  1333/d2 аппроксимируется ближайшим целым числом. Его предложение остроумно с точки зрения математики, и мы отнюдь не хотим здесь умалять его теоретический интерес, но прикладной статистик едва ли испытывает потребность в видоизменении метода из-за того, что он приводит к доверительным интервалам, несколько более узким, чем интервалы, которые ему требовались!  8.4. Оценивание оптимальных условий  Общая проблема экспериментирования на множестве п факторов, каждый из которых может быть измерен в непрерывной шкале, может быть рассмотрена в терми- нах регрессии. Если xi, x2, ���� х„—значепия, прини- маемые факторами, а у-«урожагт», получаемый в от- дельном опыте при фиксированной комбинации xi, то  y=Y+& (вы где Y = E (y) = H (xi, x2, ..., x,i), (8.9)  a е-случайная ошибка, которая включает те эффекты каких-либо неконтролируемых факторов, которые некор- релированы с xi. Здесь Н(...)——однозначная функция от xi, которая в практических ситуациях обычно является непрерывной и имеет производные хиалых порядков, не- прерывные в области п-мерного пространства величин xi, ..., xii, которая интересует исследователя. Эта функ- ция, очевидно, является функцией регрессии у по xi. Для большинства целей, по-видимому, можно предпола-  гать Е (82) = 02 (постоянная), (8.10)  хотя, конечно, это может не всегда быть адекватным приближением. В чисто научном исследовании, по-вндиътому, пред- ставляет интерес форма уравнения регрессии в целом, по меньшей мере в области п-мерного пространства, 
202 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  которая может быть не очень точно определенной. Мо- жет оказаться возможным в качестве приближения к этой области использовать прямоугольную область, оп- ределяемую неравенствами  U,-<x,-<V,- для всех i. (8.11)  Для такого исследования, по-видимому, наиболее удо- влетворительным является условный тип факторного плана, рассмотренного в гл. 4 и 5. Множества значений (х1, х2, @��� xn) берутся на пересечениях прямоугольной сетки в пространстве х, для того чтобы иметь совер- шенно одинаковый разброс в точках плана. Разумеется, если функция регрессии очень сложна и не может быть хорошо аппроксимирована полиномом невысокой степе- ни, то требуемое число точек (комбинаций уровней фак- торов) может оказаться недопустимо большим. Даже если исследуется квадратичная регрессия, то необходима Зп-факторная схема (см. § 9.4). При большом п. адек- ватное исследование вида функции регрессии в широкой области редко осуществимо, если только нельзя сделать законных упрощающих предположений таких, как отсут- ствие взаимодействия (§ 4.4 И далее). Во многих отраслях прикладных научных исследова- ний целью чаЩе всего является оценивание оптимальной комбинации уровней факторов, так что требуется знание только малой области пространства х. Трудность возни- кает из-за того, что вначале мы можем иметь лишь сла- бое представление о том, где лежит эта область, и даже вовсе не представлять себе этого. Например, в сельско- хозяйственных исследованиях может представлять фун- даментальный интерес связь урожая с количеством раз- личных типов удобрений, датами посева, расположением рядов и т. д., но чаЩе целью будет нахождение <<наи- лучшей» комбинации для использования в определенных обстоятельствах. Однако урожаи в сельском хозяйстве подвержены не только колебаниям, обусловленным не- контролируемыми (а часто и неуправляемыми) причи- нами. Изменения в видах растений и методах культива- ции могут так видоизменить оптимальные комбинации других факторов, что обычно гораздо важнее изучить функцию регрессии на широких интервалах значений 
8.4. ОЦЕНИВАНИЕ ОПТИМАЛЬНЫХ УСЛОВИЙ 203  различных xi. Концентрация усилий на малой окрест- ности пространства х могла бы привести к более эф- фективному изучению этой окрестности Ценой получения лишь небольшой (а может быть и никакой) информа- ции о других значениях величин xi, которые между тем могут оказаться важными для практики. Кроме того, длительное время (обычно год), которое должно прохо- дить между удобными моментами для опробования но- вых комбинаций xi, НЕСКОЛЬКО ограничивает полезность описываемого ниже последовательного процесса и со- здает преимущества для более экстенсивных экспери- ментов, проводимых за один год. Когда прикладное исследование ведется при более устойчивых условиях и когда экспериментирование за- нимает небольшой отрезок времени, может оказаться более выигрышным последовательное отыскивание оп- тимальных уровней факторов. Здесь слово <<оптималь- ный» может относиться к максимизации Y для неко- торого желательного свойства, минимизации Y для некоторого нежелательного свойства, или, более общо, максимизации функции регрессии, выбранной для пред- ставления чистого экономического выигрыша, т. е. стоимости урожая за вычетом стоимости принятия кон- кретного множества уровней величин xi. Например, вхи- мической промышленности можно пожелать максимизи- ровать чистый выигрыш от процесса, связанного с коли- чествами вводимого сырья, Id различными физическими факторами (температурой, давлением, продолжительно- стью реакции и т. д.), причем он равен стоимости конеч- ного продукта за вычетом стоимости материалов и под- держания физических условий на выбранных уровнях. Тогда, может быть, лучше локализовать поиск оптималь- ных значений xi с помощью процесса последовательных приближений. Уравнение (8.9) задает поверхность в (n+ l)-Mep- HOM пространстве, и целью эксперимента является лока- лизация координат х «вершины» на этои поверхности. Разумная последовательная процедура может состоять в том, что к вершине двигаются по маршруту, исходя- щему из любой точки, и продолжают подниматься до тех пор, пока в любом направлении никакое дальнейшее 
204 гл; 8. ПОСЛЕДОВАТЕЛЬНОЕ экспвримвнтировмтгтв  повышение неперестанет быть возможным; значит, по- лученная точка должна быть максимумом. Однако же- лаемым результатом является отыскание абсолютного максимума величины Y B ряду осуществимых значений величин xi. Если имеется несколько локальных макси- мумов, то достигнутая вершина может оказаться в этом ряду не наивысшей. Еще нет методов для действий в та- кой ситуации, и эти ситуации рассматриваются обычно как не имеющие места на практике. [Иетод крутого восхождения можно коротко описать с помощью следующих шагов: i) Берется исходная точка P0, координаты (x1, x2, . . . , xn) которой лежат недалеко от максимума. Если экспериментатор слишком мало знает о форме функции Н(. . .), для того чтобы сделать хотя бы грубую догадку,  - OH может начать с малого условного факторного экспе-  римента (например, он может взять малую часть плана типа 2"), НО такое крайнее неведение является все же редким. ii) Делаются наблюдения над у в каждой из неболь- шого числа комбинаций (по крайней мере п + 1) значе- ний величин xi B окрестности точки P0. iii) Эти значения у используются для вычисления линейнего приближения или же полиномиального при- ближения более высокого порядка к функции Н(...) в окрестности точки P0. iv) Затем вычисляют оценки производных дН "07;  B точке P0 И используют эти значения для оценки на- правления (определяемого отношениями xl IX2 : . . . :xn), B котором функция Н(. . .) растет быстрее всего. V) Берется точка P1, координатами которой является новое множество значений величин хд, расположенная на небольшом расстоянии от Po B направлении, определенд ном на предыдущем шаге iv). vi) Повторяют шаги ii)—v) для перехода от точки P1 к Р2 и продолжают аналогичный процесс. На практике на шаге V можно было бы брать две точки на различных расстояниях от P0, пронаблюдать у 
8.4. ОЦЕНИВАНИЕ ОПТИМАЛЬНЫХ УСЛОВИЙ 205  для каждой из этих точек, а затем взять в качестве Р1 ту из НИХ, в которой значение у больше, или некоторую ин- терполированную или экстраполированную точку, для которой можно угадать, что она лучше каждой из тех двух рассмотренных. Пока о мало по сравнению с производными, подъему не будут серьезно мешать ошибки в оценивании направ- ления, в котором Н(...) увеличивается круче всего. По- этому обычно достаточно использовать только (п + 1) точку на каждом шаге— минимум для оценивания пло- скости B (n + 1)-мерном пространстве (у, х) —и при- нять эту плоскость за приближение к форме поверх- ности. Однако по мере увеличения подъема это стано- вится недостаточным. Если достигается вершина или плоский участок, то производные первого порядка стано- вятся почти равными нулю. Если встретится такой слу- чай, то вокруг каждой полученной точки придется брать большое число комбинаций уровней, так что функция сможет быть локально приближена только с помощью квадратного уравнения, а не линейного. Бокс и Уилсон [19] дали мастерский подход к экспериментам такого типа. С тех пор появились другие ценные статьи, среди которых особо выделим статьи Бокса [16] и Бокса и Хантера [20] (см. также книгу Чью [134]). Как Дейвис [36], так и Кохрэн и Кокс [66] дали превосходные элементарные рас- четы. Для фазы, в которой требуется рассмотрение только эффектов первого порядка, по-видимому, может быть эффективной дробная реплика плана типа 2”, но альтернативы, использующие вершины правильных фи- гур в п-мерном пространстве, также имеют особые до- стоинства. Например, для п = 3 выбранные значения (x1, x2, x3) МОГЛИ бы соответствовать вершинам правиль- ного тетраэдра с центром в точке P0. Это приводит к адекватной информации для оценивания трех коэффи- циентов регрессии, а также к ценному свойству рота- табельности, причем дисперсия оценки для Н(...), основанная на найденном уравнении регрессии, будет постоянной для всех (х1,х2‚х3)‚ расположенных на фикси- рованном расстоянии от точки Po. Такие ротатабельные 
206 ГЛ. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  планы, из которых можно образовывать планы гораздо более сложного вида, комбииттруя два или большее чис- ло простых планов, часто выгодны из-за требования сим- метрии, налагаемого на точность оценок, так как в ис- ходном положении неизвестно, какое направление из точки Ро может представлять наибольший интерес. Это, в частности, верно, если все xi измеряются в одних и тех же единицах, поскольку тогда «расстояние» обладает некоторыми свойствами инвариантности при преобразо- ваниях масштаба. Если х1—температура, х2—электри- ческий потенциал, хз-объем и т. д.‚ то расстояния в пространстве х переводятся друг в друга изменениями в нескольких единицах измерения, и ротатабельность имеет меньшее значение. Иногда делаются дополнитель- ные наблюдения в самой точке P0 для того, чтобы, во- первых, иметь меру экспериментальной ошибки из раз- ностей между повторными значениями, и, во-вторых, увеличить точность в окрестности Po. Если достигнута почти стационарная область, то выбор комбинаций уровней для дальнейших проверок должен стать более целенаправленным для того, чтобы можно было оценить квадратичную функцию регрессии и производные второго порядка. Бокс и Х антер [20] рассмотрели общую теорию, которая слишком сложна для того, чтобы привести ее здесь. Тип плана, который оказывается подходящим, иллюстрируется с помощью случая n = 2. Факторный план типа 22, центром кото- рого является начало координат, состоит из четырех зна- чений величин (х1, x2), именно (1, 1), (1, —1), (-1, 1), (—1, —1), а хороший план второго порядка получается добавлением к нему четырех дополнительных точек (ta, О), (О, ia), так же как наблюдений в точке (О,О). Ротатабельность обеспечивается тем, что берут а? = 2, и точность внутри круга единичного радиуса будет почти постоянной, если точка (О, О) повторяется пять раз. Бокс и Хантер рассмотрели также задачу разбиения та- ких множеств способов обработки на блоки (для обыч- ной цели) таким образом, что внутриблоковые контрасты не являются важными. Эти планы можно в весьма об- щем смысле рассматривать как части полных реплик. и 
8.5. ЭВОЛЮЦИОННАЯ ОПЕРАЦНЯ В ПРОМЫШЛЕННОСТИ 207  полное представление о их свойствах зависит от лиатриц переименования, которые определяют способ, дающий возможность оценить коэффициенты уравнения поверх- ности отклика. Для ознакомления с простыми применениями этого метода следует ознакомиться с книгами Кохрэна и  К о к с [66] и Д е й в и с а [36]. Другой стимулирующей ра-  ботой является статья Бокса и Юл а [22], в которой из результатов статистического анализа данных экспери- мента такого типа извлекается информацияо физико-хи- мических законах, контролируемых системой. Описанные вкратце в этом пункте идеи являются, по-видимому, наиболее интересными разработками в теории экспери- ментальных планов со времен важных фишеровских вкладов, но они еще слишком новы, чтобы их рассмат- ривать здесь.  8.5. Эволюционная операция в промышленности  Развитые Боксом методы, коротко изложенные в § 8.4, не являются с необходимостью целиком последо- вательными при их применении. Они включены в насто- ящую главу, потому что исторически они берут начало из проектов последовательных исследований, и их основ- ное употребление, по-видимому, состоит в последова- тельном приближении к оптимальным условиям. Однако нет никаких причин, по которым придуманные Боксом планы, в частности ротатабельные планы второго по- рядка, не могли бы использоваться при исследовании конкретной области поверхности отклика (8.9), даже если нет намерения продолжать эксперимент за пределы этого одного этапа. Бокс [17] предложил гораздо более упрощенный вариант своего метода, имеющий целью дать воза/юж- ность предприятию эволюционировать в направлении оптимальных условий работы без чрезмерного наруше- ния нормального производства. Этот метод может ока- заться подходящим для применения на иротхтышленнотхт предприятии большого масштаба. Предположим, что He- обходимо рассмотреть пару факторов, скажем, концепт- 
208 гл. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТНРОВАНПЕ  рацию реагента в химическом процессе и температуру, при которой происходит реакция. Пусть (х1, х2) - уровни этих факторов в текущий момент. Тогда можно составить блок из пяти пар уровней (х1, x2) и (х1 : u, x2 : v), где и и о —две малые величины. Предприятие может работать по очереди при каждом из этих условий  .(в случайном порядке) на протяжении минимального  времени, при котором сохраняется удобство производст- венной операции и получается достаточное количество окончательного продукта для оценки характеристик про- изводимой продукции. Этот процесс повторяется, чтобы получить несколько повторяющихся блоков по пять эле- ментов. Если поверхность отклика, задаваемая уравне- нием (8.9)‚ линейна относительно двух факторов в окре- стности (х1, x2), то среднее значение наблюдений по у в этой точке будет отличаться от среднего для всех дру- гих четырех точек только за счет ошибки эксперимента. Следовательно, стоимость исследования будет равна стоимости выполнения весьма обычных изменений кон- центрации и температуры. Если поверхность выпуклая, как это имеет место в случае, когда (хд, X2) близка к максимуму, то среднее значение у по всем наблюдениям будет несколько меньше, чем только по наблюдениям в точке (хд, x2), так что происходит некоторая потеря продукции и возрастает стоимость исследования. Если по- верхность вогнута, при этом (хд, м) близка к минимуму, то среднее значение у по всем наблюдениям будет боль- ше, чем среднее значение только по наблюдениям в точ- ке (xi, x2), что дает увеличение продукции в противовес стоимости выполнения обычных изменений концентрации и температуры. Если только процесс уже не находится вблизи от своей оптимальной точки, то хотя среднее у для всех (х, :L- u, x2 :L- v) может быть меньше, чем для (хд, x2), возможно, что одна или две из этих пар значе- ний покажут улучшение при (x1, x2). Это будет указы- вать на выгодность перевода стандартной концентрации и температуры к новым значениям. Поскольку любой выигрыш от такого перевода будет продолжать сущест- вовать лишь до тех пор, пока используется этот процесс, он должен быть только очень кратким, чтобы нашюго 
8.5. ЭВОЛЮЦИОННАЯ ОПЕРАЦИЯ В ПРОМЫШЛЕННОСТИ 209  превысить преходящие стоимости исследования. Даль- нейшие блоки по пять пар концентраций и температур можно построить при новых стандартных условиях. С другой стороны, если перспективы дальнейшего замет- ного улучшения от этой пары факторов кажутся ма- лыми, то можно использовать другую пару.  Бокс приводит пример, в котором такая схема дейст-  вовала на протяжении девяти последовательных фаз. При весьма умеренных денежных ценах можно было бы рассматривать стоимости схемы как имеющие порядок 0,1 пенса на фунт стерлингов продукции за год, в то время как достигаемое улучшение было эквивалентно 6 пенсам на фунт годовой продукции. Эта громадная разница была такой же большой к концу, как и в на- чале, что оправдывает продолжение применения схемы. Бокс заявляет, что «данный пример ни в коей мере не является исключением, что оправдывает мою настойчи- вость в требовании, чтобы эволюционный метод был принят за постоянный способ действий. Психологически неправильно говорить о производстве по такой схеме, как об «экспериментальном производстве», так как экс- перитхтент есть нечто, что выполняется за ограниченный период и не является частью нормального положения ве- щей». Приведенные здесь краткие сведения вряд ли от- дают должное более практическим аспектам метода Бокса. Этот же принцип может быть применен к случаю бо- лее двух факторов. Например, в случае трех факторов в качестве естественной структуры вместо квадрата бе- рется куб с наблюдениями в его центре. Бокс указывал на возможность использования двух центральных на- блюдений в каждом цикле, так что весь блок из 10 мно- жеств уровней можно было бы раздробить на два под- блока по 5 множеств. В очевидных обозначениях это будут: (хм X2» X3): (X1-us 752"“: x3“w).  (x,——u, x2+v, x3+w), (x,+u, x2—v, x3+w), (x1+u, x2+v, x3——w)  14 Д. Фннни 
210 ГЛ. 8. ПОСЛЕДОВАТЕЛЬНОЕ ЭКСПЕРИМЕНТИРОВАНИЕ  и (м, х2, x3), (x1+u, x2——v, x3——w), (x1—u, x2+v, x3——w), (x,—u, x2—v, x3+w), (x1+u, x2+v, x3+w).  Отношение к полуреплике плана типа 23 должно быть очевидным. Бокс и Хантер [21] проиллюстрировали это далее. Хотя несомненно возможны обобщения на большее число факторов, они тем не менее могут изжить себя, став неприменимыми для использования на произ- водстве Из-за их сложности. 
Глава 9  ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  9.1. Анализ, план и планирование  Еще тридцать пять лет назад считали, что роль ста- тистика в исследовании состоит лишь в анализе экспери- ментальных данных, предшествующем их интерпретации. Понятие плана было практически неизвестно. Начиная примерно с 1923 г. и далее появился ряд замечательных статей Р. А. Фишера, которые произвели коренную лом- ку этой точки зрения. Богатство подробных сведений о конкретных планах, полученное из работ Фишера, про- демонстрировано в предыдущих главах. Эти сведения интересны с точки зрения теории и важны для проведе- ния экспериментов. Но, по-видимому, даже более важным для эффективного использования эксперимен- тальных ресурсов является признание двух общих прин- ципов, которые возникают из теории и практики плани- рования:  i) План эксперимента в большой степени определяет форму статистического анализа результатов. Действи- тельно, тип анализа зависит, с одной стороны, от алге- браической модели, подходящей к эффектам различных способов обработки, и от известного или предполагае- мого распределения вероятностей для ошибок измерения на различных участках, а с другой стороны, от логиче- ских связей между способами обработки и правилами, по которым способы обработки приписываются к уча- сткам. Они в свою очередь определяют не только то, ка- кие ответы дает эксперимент на конкретные вопросы, но  ТЭКЖС И ТО, на КЗКИЕ‘ вопросы МОЖЕТ ОТВЕТИТЬ ЭКСПЕРИ‘.  мент. ii) Успешное получение ответов на вопросы, интере- сующие экспериментатора, без чрезмерной траты време- ни и ресурсов зависит в значительнои степени от пра- вгссльного выбора плана эксперимента.  14* 
212 гл. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  Предшествующие главы касались главным образом тех аспектов плана, которые относятся к распределению способов обработки по участкам,——тзоттросов, которые можно выразить в терминах формальной математиктт. Однако делались и попытки иллюстрировать тот факт, что план есть нечто большее, чем математическое упраж- нение, H показать как эффект плана при анализе, так и некоторые соображения, управляющие выбором плана. В этой главе и гл. 10 рассматриваются более общие во- просы планирования экспериментов такие, как объем экспериментов, число и природа способов обработки, ко- личество реплик и число экспериментов сходного типа, которые надлежит выполнить. Эти вопросы не могут быть формализованы, так же как и вопросы, касаю- щиеся чистой структуры планов, и полные ответы здесь должны опираться на детальное знание конкретной об- ласти приложений (Ф инни [106]). Они часто решаются исключительно самим экспериментатором, который не- редко просит статистика предложить планы только при довольно жестко определенных способах обработки и объеме эксперимента. Однако, если только эксперимен- татор не является одновременно и статистиком, он, по- видимому, не сможет полностью понять значения своих решений для окончательной интерпретации исследова- ния. Было бы также неверным, если бы статистик высту- пал B роли единственного арбитра. Необходимо тесное сотрудничество между этими двумя лицами. Часто экс- периментатор не привык к сложному количественному рассуждению, и, как бы прекрасны ни были его намере- ния, он может не чувствовать, что его программу можно существенно улучшить небольшой статистической изо- бретательностью без заметного эффекта в отношении требуемого времени и труда. Столь же часто статистик при попытке выразить требования задачи в математиче- ских терминах, с тем чтобы можно было получить опти-  ДИЗЛЬНОЁ решение, склонен СМОТРЕТЬ СКВОЗЬ ПЗЛЬЦЫ на  некоторые трудности, что может привести к полностью неосуществимым предложениям. В этой книге естествен- но концентрировать внимание на точке зрения стати- стика, но читатель должен понимать, что часто необхо- димьт значительные компромиссы. Рассмотренные здесь 
9.2. ВКЛЮЧЕНИЕ КОНТРОЛЕЙ 213  конкретные ситуации выбраны скорее для иллюстрации хода рассуждений, нежели для исчерпывающего рас- смотрения всех возможностей. Статистик может и должен сделать такой же полез- ный вклад в различные аспекты общего планирования эксперимента или группы экспериментов, какой был сде- лан им` при помощи более сложных математических вы- кладок в отношении деталей плана, относящихся к раз- мещению способов обработки по участкам. При этом ему придется проявить большое чувство такта, ибо если только экспериментатор предварительно не извлекал вь1- году из консультаций статистика на всех фазах своего исследования, он естественно склонен He доверять ста- тистику и даже обижаться на критику своего выбора способов обработки, числа уровней фактора, объема или числа экспериментов со стороны тех, кто не яв- ляется специалистом в той же области науки.  9.2. Включение контролей  Иногда экспериментатор утверждает, что он знает некоторый тип обработки, выгодный для его эксперимен- тального материала, и что его интересует лишь сравне- ние двух (или большего числа) альтернативных форм. Тем He менее, если только он He может доказать, что вы- годность имеет место при всех обстоятельствах, он дол- жен включить контре/ш, т. е. участки, не подвергнутые этому способу обработки (Финни [1О4]). Например, многие корнеплоды обычно хорошо реагируют на фос- фатные удобрения, и экспериментатор, который хочет сравнить два различных источника фосфора А и В, мог бы утверждать, что ему He нужно включать участки без удобрения, ибо единственной целью такого включения была бы проверка хорошо известного факта. Он мог бы провести эксперимент только с двумя способами обра- ботки А и В, уравняв количество фосфора, содержаще- гося H применяемых удобрениях. Если бы появилась ощутимая разница урожаев, то это, конечно, указь1ва- ло бы на превосходство одного или другого типа удоб- рения. Однако, если два способа обработки дали при- близительно одинаковые средние урожаи, он He может, 
214 гл. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  строго говоря, заключить, что этп способы обработки примерно одинаково выгодны. Если же при этом был бы включен третий (контрольный) способ обработки, кото- рый дал бы примерно тот же средний урожай, то это служило бы указанием на то, что в этом конкретном месте корнеплоды He могут эффективно использовать больше фосфора, чем его имеется в самой почве, и сле- довательно‚ ни А, ни В He являются выгодными. Однако ситуация эта He исключает возможности, что один спо- соб обработки может быть существенно лучше другого па почвах, где имеет место эффект удобрения. Без вклю- чения контролей нет защиты от этой двусмысленности. Такая ситуация может иметь место, в частности, в экспериментах из области клинической медицины, в осо- бенности при обстоятельствах, когда вера в лекарство сама может влиять на лечение (например, головная боль или морская болезнь). Если не вводятся контроли или фиктивные способы обработки, то реальный эффект ле- карства нельзя отличить от эффекта «внушения», возни- кающего, когда применяется какой-нибудь способ обра- ботки. Хорошей иллюстрацией этого служит сравнение трех лекарств от головной боли (Джеллинек [40], Финни [1О5]). Все они проверялись (по различным причинам в перекрестном плане) на 199 субъектах, при этом в качестве фиктивного лекарства применялось инертное вещество такого же внешнего вида. Отом, что головная боль излечена, можно было судить только по утверждению субъекта. Разумеется, ни один из субъек- тов не знал, какой из четырех способов обработки он по- лучал в каком-либо случае, и все таблетки выглядели одинаково. Некритическая оценка результатов показы- вала почти одинаковый процент излеченных среди при- нимавших лекарства (8О—85 процентов) и 50 процентов среди контрольной группы. Однако дальнейшее исследо- вание показало, что только 120 субъектов всегда утверж- дали, что головная боль была излечена после принятия дозы для контроля. Среди них все четыре способа обра- ботки показали примерно 85-процентную норму излече- ния, и значит их головная боль была, по-видимому, в большой степени психогенной. Оставшиеся субъекты, которые не излечивались контрольным веществом, пока- 
9.3. число спосоьов ОБРАБОТКИ 215  зали существенные различия в эффективности трех ле- карств по закономерностям, которые могут быть связаны с их известным составом. Как установил исследователь, «различение между лекарствами от боли может быть сделано только субъектами, которые испытывают боль». Трудность убедить экспериментатора включить адекват- ные контроли часто связана с сопротивлением любому изменению предвзятых мнений относительно способов обработки в опыте. Это забавно проиллюстрировано в отчете по работе над темой, аналогичной теме Джелли- нека, в котором авторы (Баттерман и Гроссман [7]) утверждали, что случай облегчения боли у субъек- тов, получающих фиктивные способы обработки по <<дву- сторонней слепой» схеме, показал, что включение таких фиктивных способов обработки было плохой политикой. Двусторонний слепой эксперимент таков, что ни пациент, ни лечащий врач не знают тождественности групп про- веряемых лекарств. Значит, один не может изменить свои реакции знанием, какой из способов обработки в действительности является пассивным контролем, а дру- гой не может подсознательно дать своему пациенту ка- кой-либо ключ к результатам, которых он ожидает на основе своих собственных убеждений по поводу относи- тельных достоинств альтернативных лекарств Обстоя- тельства, в которых может быть применена двусторонняя слепая схема, несколько ограничены практическими и am- ческими соображениями, причем,конечно‚ особенно труд- но держать в неведении врача относительно лекарства, даваемого пациенту, но для неопасных болезней это мо- жет быть допустимым. Однако, отвлекаясь от этих ограни- чений, Баттерман и Гроссман, по-видимому, возражают против двусторонних слепых экспериментов, ибо только давая возможность врачу опознать таблетки, можно по- лучить результаты, согласующиеся с тем, что ожидается!  9.3. Число способов обработки  В предшествующих главах изредка делались замеча- ния по поводу числа способов обработки и числа фак- торов, подлежащих включению в эксперимент. Если эксперимент, предлагаемый для сравнения некоторых 
215 гл. 9. эффективность экспвримвтттттровАния  I  способов обработки может иметь больше факторов или способов обработки, присоединение которых не приведет к серьезному увеличению объема эксперижтеита, серьез- ному понижению порядка реплики или какому-либо дру- гому ущербу для первоначальных способов обработки,то  "НЕЗНЗЧИТЕЛЬНЫМИ ЗЗТрЗТЗМИ МОЖНО ПОЛУЧИТЬ ДОПОЛНИ-  тельную информацию. Многие эксперименты планиру- ются с недостаточным пониманием того, чего можно до- стигнуть факторным планом, смешиванием и дробной репликой, и здесь имеется простор для тщательного об- суждения вопроса экспериментатором и статистиком. Часто в первоначальных предложениях будут сделаны небольшие изменения. Иногда на протяжении обсужде- ния характер этих предложений может быть полностью изменен не из-за настопчивости статистика, а. из-за того, что экспериментатор начинает ясно представлять себе возможности факторного плана для увеличения масшта- бов его исследования. Как крайний случай простое пред- ложение об эксперименте на 12 или 16 участках мож- но было бы видоизменить в предложении относительно эксперимента на 81 участке, при этом даже не при- нимая во внимание возрастания объема, так как это изменение может дать в 1О—2О раз большую инфор- мацию. Статистик должен делать замечания двух типов. Во- первых, он должен указывать на невозможность некото- рых допущении: никакое мастерство с его стороны He поможет создать треке-латинский квадрат 6><6, план типа 25 в блоках по 4 элемента, который He смешивает главных эффектов или двухфакторных взаимодействий, или сбалансированный неполный блок-план для шести способов обработки в блоках по четыре элемента менее чем с 10 репликами. Во-вторьтх, он должен указывать на статистическую невыгодность других допущенпй. Его наиболее общие возражения к предлагаемым экспери- ментам состоят в том, что эти эксперименты, возможно, трудно интерпретировать удовлетворительно (например, отсутствие контролей), что они дают неточные сравнения (например, 3 >< 5 >< 7-факторный план не может быть смешан удовлетворительным образом и потому может иметь большую дисперсию) или что они неэкономичны в 
9.3. ЧПСЛО СПОСОБОВ ОБРАБОТКИ 217  отношении использования ресурсов. Реже план может вызвать возражение из-за того, что он потребует более трудоемкого статистического анализа, чем альтернатив- ный план. Обычно затраты на проведение статистиче- ского анализа эксперимента относительно малы по срав- нению с полными расходами на эксперимент, так что такой довод имеет малую силу, но иногда выполнение эксперимента и сбор результатов являются настолько несложнои задачеи, что статистический анализ состав- ляет ощутимую часть всей стоимости. Рассмотрение экспериментов с факторами при двух уровнях дает довод в пользу того, что дополнительные факторы должны быть сильно выражены. Эксперимент с одим фактором редко рассматривается как адекватно повторенный, если только он не имеет около восьми уча- стков на каждом уровне. Если бы хотели рассмотреть два таких эксперимента с одинаковым содержанием, но C разными факторами, то нужно было бы включить 32 участка, и при комбинировании их в один экспери- мент типа 22 должна была бы получаться информация о взаимодействии факторов. Вместо блоков по два эле- мента можно было бы использовать рандомизованньте блоки по четыре элемента, но любая потеря в точности при больших блоках возмещалась бы с помощью боль- шего числа реплик (теперь 16-кратиых) по каждому фактору. В этом эксперименте 21 из 31 степени свободы используется при оценивании дисперсии ошибки и толь- ко три степени свободы предназначены для сравнений способов обработки-несколько экстравагантное поло- жение для ошибки, так как выгода от дополнительных степеней свободы, идущих на ошибку, заметно умень- шается после первых 10 степеней свободы. Только ли- шенный всякого воображения экспериментатор не смог бы придумать дополнительных факторов, подхо- дящих к его исследованию. Введение третьего фактора и расположение типа 23 B четыре блока по восемь эле- ментов влечет некоторую потерю точности от ббльших блоков, но теперь семь степеней свободы служат для сравнений способов обработки, а 21 степень свободы- для оценивания ошибки: все еще только четверть уси- лия экспериментатора тратится непосредственно на 
213 гл. 9. ЭФФЕКТИВНОСТЬ экспвримвгттировмтгтя  сравнение способов обработки, а три четверти на опре- деление Меры точности сравнений. Можно ввести еще один или два фактора без изменения размера блока с помощью смешивания (только трехфакторных взаимо- действий либо взаимодействий более высокого порядка) и использования оставшихся взаимодействий высокого порядка для оценивания ошибки (§§ 4.4, 5.6). Это при- водит или к 10 степеням свободы для способов обра- ботки (главные эффекты и двухфакторные взаимодейст- вия B плане типа 24) и 18 степеням свободы для ошиб- ки, или к 15 степеням свободы для способов обработки (план типа 25) и 13 степеням свободы для ошибки. Та- ким образом, насыщение эксперимента факторами, де- лающее его единичной репликой, все еще оставляет почти половину затрачиваемого усилия на оценивание ошибки. Дробная реплика дает метод сверхнасыщения. Это имеет небольшое значение в столь малом экспери- менте, но если можно пожертвовать одним двухфактор- ным взаимодействием, то возможна полуреплика плана типа 26 с одинаковыми блоками по восемь участков, и теперь будет использоваться 20 степеней свободы для главных эффектов обработки и двухфакторных взаимо- действий, а восемь степеней свободы-для ошибки. Фишер [117] показал, как внести поправку в неиз- бежную неточность выборочной оценки дисперсии при  получении полезной информации из эксперимента. Если 1  эксперимент имеет среднеквадратичную ошибку 32 с f степенями свободы, то точность контраста, оцениваемая как разность между средними двух множеств из г уча- стков, равна -2-53‘-’°i‘l—. (9.1) 8 (f+3) Показатель информации для эксперимента в целом, когда главные эффекты и двухфакторные взаимодейст- вия считаются равноценными, можно было бы опреде- лить как эту величину, умноженную на число тех эф- фектов способов обработки, которые могут быть оценены (Финни [1О6]). В табл. 9.1 приведены значения этого показателя для рассмотренных выше шести экспери- ментов. Даже если принять во внимание, что первый 
9.3. число спосовов ОБРАБОТКИ 219  эксперимент требует только половину того числа уча- стков, которое требуют другие, и что первые два экспе- римента имеют меньшие блоки, выгода от планов типов 25 и 26 кажется существенной. Конечно, этот индекс не следует употреблять некритически, поскольку он не дает никакого различия по величине Между главными эффектами и взаимодействиями, а также не учитывает случающуюся время от времени необходимость в оце- ниванин трехфакторных взаимодействий и взаимодейст- вий более высокого порядка. Таблица 9.1 Информация о главных эффектах и двухфакторных взаимодействиях, получаемая из экспериментов типа 2" на 32 или меньшем числе участков  3:31: Число размер Повторе- c:e!:1CéJ:;)e1"1 aI<‘1)JI<12)1<]=,31i<{1l'): Показатель ров УЁЁЁЁ“ блока “Ё” ЁГЁЁЁЁ?’ ’§f§?§”;‘3.’§‘f§§'4%‘3' информации п f действия 1 16 2 8 7 1 3,2/$2 2 32 4 16 21 3 22,0/з2 3 32 8 16 21 6 44,0/$2 4 32 8 16 18 *) 10 72,4/$2 5 32 8 16 13 *) 15 105,0/s2 6 32 8 16 8 *) 20 130,9/S2 *) Здесь ошибка, целиком или частично, оценивается из взаимодействий.  Предшествующие абзацы не надо под-тимать. как бес- компромиссную пропаганду многофакторных единичных или дробных реплик для любой цели. Статистик должен знать возможности факторного плана и должен ясно сформулировать перед экспериментатором ожидаемые выигрыши от вариантов исходных предложений. Пос- леднее слово остается за экспериментатором. Иногда ограниченный опыт и возможности служебного персо- нала, ответственного за выполнение и регистрацию экспериментов, а также сосредоточение интереса на од- ном или двух вполне определенных вопросах, 
220 гл. 9. эффективность ЭКСПЕРИМЕНТНРОВАЪШЯ  заставляют отдать предпочтение весьма простым планам по сравнению с теми, которые на бумаге кажутся более информативными. Несмотря на достоинства успешных многофакторных дробных реплик, предпочтение следует отдать скорее более простому плану, который дает на- дежные результаты на более узком фронте, чем схеме, слишком претенциозной для условий эксперимента. Часто включение в эксперимент пяти факторов вместо двух первоначально предполагаемых влечет лишь не- значительное увеличение труда по выполнению экспе- римента и по анализу результатов. Если эксперимент должен вестись при большом напряжении или с помо- щью служебного персонала, не привыкшего к чему-либо другому, кроме простейших экспериментов, то успех це- лого может быть подвергнут опасности ввиду риска до- пустить ошибки, и выбор плана типа 22 может ока- заться более разумным, чем выбор плана типа 25. Хотя статистик может постоянно искать благоприятные слу- чаи для введения в эксперимент возможно большего чис- ла факторов, он не должен руководствоваться аргумен- тами, которые делают табл. 9.1 его единственным путе- водителем, а должен умерять свой пыл и оставаться в рамках благоразумия. Другой тип трудностей, связанных с числом спосо- бов обработки, включаемых в факторные эксперименты, иллюстрируется в крайней форме на принтере проекта, в обсуждении которого я недавно принимал участие. Смеси семян для создания пастбищ нередко содержат несколько различных видов, и хотя в последнее время наблюдается тенденция к упрощению, часто сеются смеси, содержащие четыре или даже большее число ви- дов трав и два вида клевера. Кроме того, каждый вид имеет еще несколько сортов с различиями, состоящими не только в продуктивности, но и в таких свойствах, как раннее начало весеннего роста и живучесть на протяже- нии нескольких лет, цена и общая продуктивность. Даже в торговой практике несколько сортов одного вида можно было бы включить в смесь. 7Келательно иметь информацию об оптимальных количествах каж- дой из Множества различных компонент, подлежащих 
9.3. число спосовов ОБРАБОТКИ 221  включению, и в связи с Этим было бы весьма разумным опробование четырех или пяти уровней (включая ну- левой) какого-либо одного из сортов. Предложение, ко- торое послужило причиной написания этого абзаца, со- стояло В том, чтобы первоначально использовать 107 >< 46 >< 34 >< 22-факторную схему, однако даже уве- личение симметрии путем преобразования ее в схему типа 419 (19 видов и сортов с четырьмя уровнями для каждого) мало чем помогло бы делу. Экспериментатор мог иметь самое большее 300 участков, и, очевидно, это- го недостаточно, чтобы часть плана типа 419 могла дать полезную информацию в ситуации, где даже трех- и че- тырехфакторные взаимодействия могли бы оказаться важными. Кроме того, была желательной интерпрета- ция B терминах регрессии урожая по переменным, изо- бражающим количества семян для 19 компонент так, чтобы стоимость данной смеси можно было сравнить со стоимостями альтернативных семенных смесей для за- сева. Для изучения оптимальных условий линейная регрессия не подходит, а общая квадратичная регрессия является простейшей из позволяющих учитывать воз- можность того, что чистгая прибыль будет убывать, если включено слишком мало или слишком много компо- нент. Действительно, можно было бы взять 300 совер- шенно произвольных комбинаций уровней факторов (даже случайные уровни, хотя они едва ли имеют ка- кое-либо преимущество) и приписать их случайным об- разом к 300 участкам, выравняв далее урожаи квадра- тичной регрессией и приняв остаток за меру ошибки. Практическая необходимость придерживаться плана с высокой степенью ортогональности и симметрии оче- видна, если ясно представлять себе, что включе- ние всех квадратичных членов (т. е. регрессий по xi хЁ, ���� х1х2, ...), так же как и линейных, потребо- вало бы 209 коэффициентов регрессии. Если использо- валось случайное множество комбинаций уровней фак- торов, то необходимо было бы обратить матрицу по- рядка 209 >< 209. Здесь мы имеем пример гого, что труд по статистическому анализу не является пренебрежи- мым по отношению к общим затратам! 
222 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТПРОВАНПЯ  9.4. Уровни факторов  Высказывалось мнение, что факторные эксперимен- ты нужно использовать разумно для того, чтобы можно было извлечь из эксперимента информацию по многим точкам, и что, где это практически возможно, все (baa- торы нужно поддерживать на одинаковом числе уров- ней. Сколько уровней должен иметь фактор, и какими они должны быть? Это весьма общий вопрос. Для фактора, в котором уровни качественно отличны (различные фосфатные удобрения, различные газы для наполнения электриче- ских ламп, различные обезболивающие вещества), вы- бор B большой степени диктуется интересами экспери- ментатора, который, однако, может решиться включить или исключить один или два косвенных момента для того, чтобы сделать экспериментальный план более послушным. Если уровни градуированы по количествен- ной шкале х, то статистические задачи относятся к вы- бору уровней. Решение будет зависеть от типа инфор- мации, ожидаемой из эксперимента, и от имеющихся знаний о связи между урожаем и уровнем. Если известно, что связь линейна в определенной об- ласти значений х, то ничего не может быть лучше, чем два уровня, взятых возможно ближе к концам этой об- ласти. Они оценивают прямую столь точно, как это только возможно, в том смысле, что для фиксирован- ного общего числа наблюдений в оцененном уравнении регрессии Y = у + b (x -2)  V(g) не зависит от конкретных значений х, а V(b) МИ- нимизируется выбором, при котором предлагается де- лать на каждом уровне половину наблюдений. (Здесь предполагается, что дисперсия единичного наблюдения над у одинакова для всех х.) Если известно, что урав- нение регрессии квадратичное в определенном интер- вале х, то лучшую схему, применимую для большинства Целей, хотя и необязательно для всех, дают, по-види- мому, три уровня, расположенные последовательно на одинаковом расстоянии (два на краях интервала, а тре- 
9.4. уровни ФАКТОРОВ 223  тий-в середине), причем в каждой из точек поме- щается одна треть наблюдений. Этот подход едва ли реалистичен. Ситуации, в кото- рых известно, что регрессия измерения урожаев на уро- Вень линейна или же имеет какую-либо специальную математическую форму, редки. Если о природе регрес- сии известно очень мало, то предпочтительным будет большое число уровней, широко разбросанных на ин- тервале изменения х, который интересует исследователя, а не одинаковое суммарное число наблюдений, скон- центрированных на нескольких уровнях По-видимому, больший интерес и большее практическое значение имеют промежуточные ситуации, в которых кое-что из- вестно о связи, но информации нельзя полностью LOBB- рЯТЬ. Можно различать по крайней мере три широких категории случаев, разбив их на следующие типы:  1) Опыт некоторой экспериментальной практики по- казал, что на представляющем интерес интервале зна- чений х регрессия почти всегда линейна, но иногда по являются отклонения. Их нужно уметь обнаружить, ибо за их появлением должно следовать изменение ме- тодов анализа или даже отказ от всего эксперимента. 11) Хотя истинная связь почти наверняка имеет бо- лее сложный вид‚ следует использовать линейную рег- рессию в качестве приближения на рассматриваемом интервале, и уровни должны быть выбраны таким об- разом, чтобы сделать приближение возможно лучшим. 111) Предполагается, что математическая форма связи адекватно определена. Целью является оценива- ние некоторой конкретной характеристики в условиях, которые делают оптимальный выбор уровней завися- щим от оцениваемой величины.  В качестве примера 1) мы можем напомнить методы биологического оценивания эффективности лекарств. Многие из них основаны на связи измерения эффекта, который лекарство оказывает на животного, и лога- рифма дозы; эта связь выражается с помощью линейной регрессии. Тогда базой для оценивания эффектив- ности одного лекарства по отношению к другому яв- ляется горизонтальное расстояние между параллельными 
224 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТЫРОВАЪ-{НЯ  линиями регрессии, выравненнымтт по отметкам для доз различных лекарств. Легко видеть, что это расстоя- ние оценивает логарифм отношения одинаково эффек- тивных доз. Здесь линейность является существенной частью процедуры оценивания. Любое отклонение от нее может означать, что следует применить измененную схему вычисления или даже что анализ должен быть отброшен, как не могущий дать оценки эффективности. Если нет сомнений относительно линейности, то опти- мальной процедурой будет использование двух доз для каждого лекарства, причем берутся по возможности от- даленные пары. Если имеются основания для опасений, что иногда может иметь место нелинейность, то следует использовать по крайней мере три дозы каждого лекар- ства так, чтобы можно было бы построить критерий значимости отклонений от линейности. Этот вопрос го- раздо полнее рассмотрен в работе Финни [1О3]‚ в ко- торой приведены некоторые представляющие интерес специальные планы. Бокс и Дрейпер [18] внесли важный вклад в разработку задач класса ii). Приведем простой пример. Предположим, что на фиксированном интервале значе- ний х у имеет квадратичную регрессию по х такую, что  п=Е(у)=оъ+[3х+ух2 (9.2) Е Ну - T02] = 02, (9-3)  причем математические ожидания здесь берутся при фиксированном х. Без потери общности будем предпо- лагать, что масштаб х выбран таким образом, что -—1 \<x<1. Если при каждом из N уровней х, (1? = 1, 2, �<�� N) делается единственное наблюдение над у, то исследователь мог бы предложить аппрокси- мировать т] обычным линей/чьим уравнением регрессии у‚; по xi, скажем,  Y = a + bx. (9.4)  B силу предположения о симметрии значений ‚и отно- сительно нуля мы имеем  2 хд = о, (9.5) 
9.4. уровни ФАКТОРОВ 225  а тогда Буг Zyzxz b=—————2—, Ext где символ Z означает суммирование по всем i. Бокс и Дрейпер предложили считать критерием для наилучшей аппроксимации функции т] линейной регрес- сией обращение в минимум математического ожидания квадрата отклонения У от т], осредненного по х. Полу- чение этого среднего здесь не приводится, так как оно ничего не содержит, кроме обычных интегрирований. Результат может быть записан в виде суммы двух сла- гаемых, одно из которых зависит от дисперсии у отно- сительно истинной регрессии, а другое-—от смещения, получаемого в результате пренебрежения квадратичной составляющей в уравнении (9.2), r. e. 1  2 g—f15(Y—~n)2dx=£fV—(1+ -1  (9.6)  1 т” 2 1 т2 где  Ex? = ��@� (9.8)  m2: М» m3  Очевидно, одним из условий минимизации, которое мо- жет быть найдено подходящим выбором уровней, яв- ляется условие m3=0, (9.9)  НО оптимальное 1722 зависит от относительных величин о2/А/ и у? Если у2 гораздо меньше, то следует поставить целью максимизировать 1722, и это потребует концентра- ции наблюдений на концах интервала. С другой сто- роны, если 02/N пренебрежимо мало, то среднее обра-  тится в минимум при  т2 =—;—. (9.10)  Если нельзя пренебречь ни дисперсией, ни слагаемым, обусловленным смещением, то оптимум будет лежать  [Б Д. Финни 
а ' I dx .I I  225 гл. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  где-то между двумя значениями. При возрастании N оп- тимальные условия будут сдвигаться в сторону равен- ства (9.1О). Бокс И Дрейпер доказали, что оптималь- ное условие лежит близко от него, если только вклад в уравнение (9.7) от дисперсии не является гораздо большим, чем вклад от смещения, обусловленного тем, что действуют, как если бы в уравнении (9.2) было у = О. Вывод состоит в том, что выбор 1722, функции от используемых в эксперименте N значений x,-, должен диктоваться в гораздо большей степени рассмотрением смещения, чем усилиями, направленными на миними- зацию дисперсии. Если экспериментатор хотел использовать только два уровня (даже если N было больше двух), то усло- вия на т2 и тз привели бы к выбору значений x2= =———x1= 1/1/3 или возможно какого-либо несколько боль- шего значения в виде уступки слагаемому, зависящему от дисперсии. Если допустимо большее число уровней, то любой выбор, при котором2хд=0‚ m3=O, m2=1/3 или некоторому подходящему слегка большему значению, будет минимизировать среднеквадратичное отклонение, задаваемое уравнением (9.7), и, таким обра3ом,имеется свобода для удовлетворения других условий. Например, можно предположить, что истинная регрессия является полиномом степени выше второй, а не задается уравне- нием (9.2). Общая теорема, доказанная Боксом и Дрей- пером, утверждает, что если истинная функция регрес- сии является полиномом степени d, И в некотором ин- тервале 1 используется приближение степени d2 <d,, то среднее значение квадрата смещения, т. е. выражение  f{E<Y>—nVdx 1  (9.11)  ‚(где п-истинная функция регрессии, а У-чоценка  приближения), будет обращаться в минимум при выборе 
9.4. уровни ФАКТОРОВ 227  уровней, ДЛЯ КОТОРЫХ ВЫПОЛНЯЮТСЯ p8B€HCTBEl  . [Мах  1 “т ‚ _ 1 Wzdxi _ ум (9-12) I при г= 1, 2, ...‚ (с1‚+с12). Это значит, что N значе-  ний xi должны быть выбраны так, чтобы они имели все Моменты вплоть до порядка (d1 + d2), совпадающие с моментами распределения, равномерного на интер- вале 1. Теорема остается справедливой и для функции  регрессии, содержащей /2 независимых случайных пере-  менных, при условии, что равенства (9.12) обобщаются и на моменты до порядка (d1+d2) совместных распре- делений двух или большего числа случайных перемен- ных. Область 1, в которой приближение используется, обычно выбирается прямоугольной, так чтобы включить все значения каждой из независимых переменных меж- ду выделенными верхней и нижней границами. Однако это несущественно, и теорема остается справедливой, какова бы ни была форма области 1 в й-мерном про- странстве независимых переменных. Эта замечательная сравнительно простая теорема и связанная с ней работа Бокса открывают большие перс- пективы для улучшения планирования экспериментов по оцениванию функций регрессии в условиях класса 11). Но это не есть последнее слово. Например, еще остается открытым вопрос о том, какие действия будут наилуч- шими в условиях, когда форма истинной функции рег- рессии, возможно, не является полиномиальной и пол- ностью неизвестна. Задачи класса 111) можно проиллюстрировать зада- чей оценивания «экономически оптимальной» среди квад- ратичных кривых отклика. Предположим, что регрессию урожая сельскохозяиственнои культуры, выраженного в денежных единицах, на количество некоторого вида удобрения можно считать квадратичной: если т1——сред- ний урожай с акра, когда дано х единиц удобрения, то  ~'r1=0v+l3x+vx2~ p��� v.(9-13)  15* 
228 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  вплоть до значения х, превосходящего любое из тех, ко- торые будут здесь рассматриваться. На практике у бу- дет отрицательным, так что если, х достаточно велико, то dn/dx будет отрицательным. Однако равенство (9.13) не может претендовать на то, что оно изображает от- клики на удобрение в широком интервале значений х. Оно в лучшем случае является лишь приближением (см. ниже равенство (9.20)), хотя часто соответствует пред- ставляющему практический интерес интервалу. Каково оптимальное обогащение удобрением, если цена едини- цы удобрения равна R? Ответ Е, получается максимиза- цией чистого выигрыша (п —— Rx) И равен _ R-15 §— 2y Здесь предполагается, что R известно из внешних источ- ников, а В и у должны быть оценены из эксперимента. Предположим теперь, что нужно использовать N участ- ков B эксперименте с (n + 1) равноудаленными уровня- ми от О до d, предполагающими, таким образом, г по- вторений каждого из уровней  О, d/n, 2d/n, 3d/n, ..., (n—1)d/n, d.  B настоящий момент будем предполагать дисперсию о? независимой от п, хотя на практике она, по-види- мому, коррелирована с п из-за возможности использова- ния меньших блоков, когда п мало. Оценим с помощью значений урожаев квадратичную функцию наилучшего выравнивания  Y=a+bx+cx2 (9.15)  И, воспользовавшись коэффициентами b И с, вычислим оценку Х для величины E: * X: R—b 2c  Тогда асимптотическую дисперсию Х (после значитель- ных алгебраических преобразований) можно записать в виде Зпо’  2 2 V<X>=wT,r:a3‘5?zr11+7;.T*§%n‘5;(“3§')]- <9-17> Теперь нетрудно показать, что V(X) --MOHOTOHI-IO воз-  (9.14)  (9.16) 
9.4. уровни ФАКТОРОВ 229  растающая по n функция, и, следовательно, если не хо- тят вводить дополнительных уровней для проверки зна- чимости отклонений от модельного равенства (9.13), то следует выбрать наименьшее допустимое значение п. Кроме того, это дает возможность использовать блоки с малым числом повторений, так что допущение о по- стоянстве 02 оказывается сохранившимся. При п = 2  2 9 V(X)=%—[1+12( �p�� (9.18) Выбор d еще остается за экспериментатором. Идеалом мог бы казаться выбор очень большого d, НО эта мате- матическая истина непригодна для практики из-за того, что равенство (9.13) не описывает адекватным образом связи при большом х. В действительности V(X) имеет локальный минимум при  d = 2,2363, (9.19)  И значение, получаемое из равенства (9.18), снова не будет меньше значения из равенства (9.19), пока d не превзойдет 4,6%. Аналогичные результаты можно найти для другого п. Отношение d/E для минимума вь1раже- ния (9.17) оказывается удивительно нечувствительным  „К ИЗМЕНЕНИЯМ I1.  Поэтому, если бы перед началом эксперимента можно было угадать Е, скажем, равное Хо, то использование значений О, 1,1X0, 2,2Хо в качестве уровней эксперимента было бы близким к оптимальному. Поскольку на V(X) более неблагоприятно сказывается взятие слишком ма- лого d, чем слишком большого, полезной предосторож- ностью против малого X0 было бы принятие значений О, 1,25Хо, 2,5Х0 в качестве уровней. Если имеются при- чины в пользу выбора четырех уровней, то ими могли бы быть 0, 0,8 Хо, 1,6X0, 2,4/Y0, причем высший уровень со- храняется примерно одинаковым. Конечно, это лишь решение некоторой идеализиро- ванной задачи по отношению к конкретной практиче- ской проблеме. Если квадратичной функции недоста- точно для аппроксимации истинной зависимости вплоть до 2,5Х, то ответ не будет верным, и во всяком случае ero НУЖНО ПРИНЯТЬ скорее за opnenmp ДЛЯ pa3yMHoro 
9,5. ДРУГОЙ подход к выбору уровней  230 гл. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  выбора уровней, чем за жесткое правило. Разумеется’, нет никаких общих соображений против использования более трех уровней. При предварительном исследовании формы уравнения регрессии наличие многих уровней может оказаться существенным. Когда этот вопрос ре- шен и внимание сосредоточивается на некотором специ- альном свойстве регрессии, становится желательным использовать меньшее число уровней, зато- более тща- тельно выбранных. Но даже тогда следует сохранить достаточное количество уровней, чтобы дать какие-либо необходимые контрольные операции для проверки за- конности допущений. ’ В действительности истинная регрессия урожая сель- скохозяйственной культуры на удобрение будет почти наверняка как раз не полиномиальной. Для более тес- ного приближения к истине в этом случае часто исполь- зуется функция n = 0. —— Вед“. (9.20)  Очевидно, т] в точке х = О равно (ос —— |3)‚ а когда х ста- новится большим, значения т] приближаются к горизон- тальной асимптоте Ha уровне ос. Если ос, [3, y все должны оцениваться из опыта, то исследование наилучшего вы: бора уровней х для оценки их экономически оптималь- ных значений приводит к сложным алгебраическим вы- кладкам. Приближение с помощью квадратичной функ-- ции не настолько абсурдно, как это может показаться на первый взгляд, ибо из опыта известно, что в интер- вале х, представляющем практический интерес, эти две кривые могут лежать весьма близко друг от друга. Бо- лее подробное исследование задачи потребовало бы рас- смотрения смещения при использовании-зависимости (9.13) вместо некоторой зависимости, аналогичной (9.20), что, по-видимому, можно осуществить так же, как и выше в этом параграфе.  ‚и  A Обсуждение в § 9.4 связано с выбором уровней при оценивании регрессии, когда приходится принимать во внимание существенную неопределенность в природе функции регрессии. Описанные правила, „сформулиро- 
9.5. другои подход к вывору уровнви 231  ванные более общо в исходной статье, умеренно устой- чивы (robust; термин введен Боксом) в том смысле, что недостаток наблюдений для точного соответствия с про- стой математической моделью не будет серьезно пор- тить их оптимальные своиства. Эл фв и н г [138] предложил несколько отличный под- ход к близкой задаче B условиях, когда известно, что модель является точной. Хотя это часто и нереали- стично, но как его метод, так и его результаты представ- ляют интерес и будут здесь вкратце изложены. Он пред- полагает, что наблюдение у может быть выражено-в виде H=B1x1+[32x2+3> (9-21)  где x1, X2-—-TOLIHO известные «независимые» перемен- ные, е-случайная ошибка такая, что  Е (е) = О, Е (82) = 02, (9.22)  a [31, [32, o2——HeH3BecTHb1e фиксированные параметры. Никакого предположения о нормальности не делается, но предполагается, что различным наблюдениям над у соответствуют значения е, являющиеся независимыми случайными величинами. Экспериментатору нужно оце-  ‘НИТЬ’ линейную функцию от [3,- вида‘  9 = 411131 + 0252, (9-23)  используя для этого суммарное число N наблюдений при условии, что допустимы только пары значений (хд, х ), являющиеся элементами множества (хдд, x2,-), j= 5:1, 2, ., г. Он может выбрать свои N наблюдений из этого множества с такими повторениями и пропуска- ми, какие он пожелает, Каким образом он должен вы- брать наблюдения, чтобы минимизировать дисперсию t, несмещенной оценки 6 для конкретных (ад, а2)? Не- трудно догадаться, что если для какого-либо j .. xii _ x21‘ ` ° ax _ C12 ТО только это значение j И следует использовать, и тогда t будет соответствующим кратным среднего значения у; при других обстоятельствах ответ менее ясен.  , (9.24) 
232 гл. 9. эффвктивность ЭКСПЕРИМЕНТИРОВАНИЯ  В общем для г > 2 число несмещенньтх оценок, кото- рые можно образовать с помощью комбинаций наблю- дений, He ограничено. Если N велико по сравнению с г, то число наблюдений над (x1,-,x2j) МОЖНО принять рав- ным А/рд, где рд—непрерь1вная величина (О<рд<1)‚ удовлетворяющая условию  2д=ъ mm  Дисперсия величины y,-, среднего значения этих наблю-  дений, равна 0-2  v (и) = „д. (9.26)  Предположим теперь, что й—произвольная несмещен- ная линейная оценка 6:  t= 2. с,д„ (9.27) I И, значит, ё C,-xii '= ад. p `� Дисперсия t равна 0'2 ‘*1 C2] vm—V)E. em)  Требуется минимизировать V(t) при условиях выполне- ния (9.25), (9.28) И для конкретного xi]-. Первая мини- мизация относительно рд для фиксированного сд немед- ленно приводит к значению  где в силу (9.25) 1  _ 21011 ° i CJI€]_IOB3T€JIbHO, ДЛЯ МИНИМ Ma ИМЕЕМ у 2 ‘1 2 V (z)=—9N—(2|c,|) . (9.32) ЭТО последнее ВЫРЗЖСНИС следует далее МИНИМИЗИ-  ровать относительно сд., Как показывает дифференциро- вание, B общем случае для обращения в минимум тре-  k (9.31) 
9.5. другой подход к вывору уровнви 233  буется, чтобы все c,-, кроме двух, были равны нулю, од- нако единственным удобным путем для установления того, какие же два из них должны быть ненулевыми, по- видимому, является геометрическое рассуждение. Соот- ношение (928) можно записать в виде  1 т $Ь(:1)р,х„=а,‚ (9.33) 1  где знак совпадает со знаком сд. Пусть Хд-вектор из начала координат в точку (хдд, x2_,-). Рассмотрим 2г век- торов, равных :!:Хд. Их концы однозначно определяют минимальный выпуклый многоугольник, который охва- тывает их и, таким образом, имеет самое большее 22’ сторон, но несколько меньшее четное число, если один или большее число векторов столь коротки, что включе- ние их концов нарушило бы выпуклость. Очевидно, ко- нец вектора с координатами ` E(i1)Pjxz1  I  находится внутри многоугольника или на его контуре, и согласно (9.33) его направление совпадает с направ- лением вектора А, определяемого посредством (а1,а2). Следовательно, k принимает максимальное значение при таком выборе рд, при котором суммы  Z Н‘ 1) pjxij 1 являются координатами пересечения А с многоугольни- ком, чего, очевидно, можно достигнуть использованием только Хд, соответствующих концам по каждую сторону от этого пересечения. Согласно (9.31) и (932) максими- зация la соответствует минимизации дисперсии оценки, и, следовательно, искомой процедурой будет использование только двух из пар допустимых значений для независи- мых переменных, распределяющих наблюдения в пра- вильной пропорции между двумя заданными парами с помощью приведенного выше правила. (Тривиальная мо- дификация, возникающая, когда три или большее число векторов Х, имеют коллинеарные концы, не нуждается в специальном рассмотрении.) 
234 гл. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  Таким образом, задача решается, если получаемые по этому правилу величины А/рд являются целыми чис- ламицвообще говоря, они могут и не быть целыми чис- лами, и тогда нужно взять ‘приближение к оптималь- ному решению, использовав ближайшие целые числа. В частном случае задачи линейной регрессии по Одной переменной решение получается принятием хдд =1 для всех j. Перенесение общей задачи на случай s независи- мых переменных с соответствующим видоизменением равенств (9.21), (9.23) He представляет труда. Такое же по существу доказательство, только в з-мерном про- странстве, приводит к результату, что оптимальным бу- дет использование в точности s множеств значений вели- чин xi,-, за исключением случая, когда решение некото- рым очевидным образом вырождается. Элфвинг пошел дальше, показав, что если требуются оценки взятых по отдельности величин [31, [52, a не толь- ко линейной функции типа соотношения (9.23), то в об- щем случае потребуется большее количество пар (х1д, x2,-). Для того чтобы оптимальные условия были определимы, нужно ввести некоторое требование об от- носительных точностях двух оценок. Если оно дается в форме обращения в минимум линейной функции от дис- персий, то, как доказал Элфвинг, следует использовать три значения L Эта теория получила дальнейшее обобщение, в осо- бенности в работах Ч ер но в а [132].  9.6. Повторные реплики  Иногда наилучшую помощь статистик может ока- зать экспериментатору, сказав ему: «Если только вы не увеличите объем этого эксперимента, т. е. не осущест- вите большего числа реплик, вы не сможете надеяться  ‘ПОКЗЗЗТЬ СТЗТИСТИЧЕСКУЮ ЗНЗЧИМОСТЬ интересующих ВЗС  небольших разностей или достаточно точно оценить эти разности для какого-либо последующего применения». Если увеличение числа реплик невозможно, то экспе- риментатор поступит разумно, если не будет расточать своих средств на мероприятия, в отношении которых Нет уверенности, что они дадут адекватную прибыль, а 
9.6. повторные реплики 235  вместо этого обратит внимание на другие вещи. Менее часто (и это скорее из-за_извечного оптимизма экспери- ментаторов, чем из-за чрезмерных требований статисти- ков) экспериментатору приходится говорить, что пред- лагаемый эксперимент содержит больше реплик, чем это необходимо. Правильное число требуемых реплик может быть установлено только на основе рассмотрения стандарт- ных ошибок, связанных с величинами эффектов, кото- рые представляют интерес. Точная теория сложна, она включает нецентральные t- И Р-распределения и никоим образом не является полностью удовлетворительной,так как она по необходимости зависит в какой-то степени от угаданных или произвольных численных значений. Имеются простые приближения, пригодные для многих практических целей. Дальнейшее основывается на эле- ментарном рассмотрении Кохрэна и Кокс [66]. Пусть экспериментатор желает уметь обнаруживать в качестве значимой при вероятности Р, любую раз- ность в среднем урожае для двух способов обработки, которая превосходит d. Если дисперсия на участок рав- на 02, и каждый способ обработки проверяется на г участках, то условие имеет тогда вид  а! 1/2 >tl'  где 2‘; —— двустороннее нормальное отклонение для веро-  ятности P1. Следовательно, требуемое число реплик за- дается неравенством 2021? d2 '  Это относится к наблюдаемой разности (1. Если для ге- неральной совокупности разность равна б, то одинаково возможно, что наблюдаемое в эксперименте значение будет меньше или больше, чем б, и, следовательно, под- становка б вместо d B неравенство (9.34) дает вероят- ность 0,5 того, что истинная разность б будет недо- статочно велика,. чтобы ее обнаружили. Если вероят- ностьднеобнаружения такой разности для генеральной  (9.34) 
236 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  совокупности должна быть понижена до P2, то появ- ляется необходимость в репли-ке более высокой кратно- сти. Пусть z‘2—06H0cT0p0HHee нормальное отклонение для вероятности P2. C вероятностью P2 наблюдаемая разность будет меньше, чем  д—г2(  и требуемой границей для г будет  г> 122 (t, + t2)?. (9.35)  202 1/2 ) .  Г  Этот довод был бы точным, если бы 02 была известна еще до эксперимента. Однако на практике о? можно лишь угадать из предшествующего опыта, и показания неравенств (9.34) И (9.35) будут удовлетворительными, если эксперимент будет иметь достаточное число степе- ней свободы, чтобы средний квадрат ошибки был хоро- шей оценкой для 02. Если подстановка угаданного значения 02 в неравен- ство (9.35) дает столь малое г, что эксперимент не имеет достаточно много степеней свободы для среднего квад- рата ошибки, то это можно было бы откорректировать с помощью использования соответствующих чисел сте- пеней свободы для 11 и 12. Таким образом, если через 59 обозначить угаданное значение 02, то берется г, удовле- творяющее неравенству  232 r 62 < (t.+t2>2 '  где t1 И 2‘2—!-отклонения при тех же уровнях вероят- ности, что и рассмотренные выше, но с зависящими от г числами степеней свободы. Если бы эксперимент прово- дился в рандомизованных блоках по 2 участка, то было бы (г— 1) степеней свободы; если бы он был пол- ностью рандомизованным только с двумя способами об- работки, то было бы 2(г — 1) степеней свободы; если бы специальному рассмотрению подверглись два способа обработки из множества значений 2‘, то в рандомизо- ванном блок-плане было бы (г -— 1) (г — 1) степеней сво- боды. Кохрэн и Кокс основывают свои рекомендации на  (9.З6) 
9.6. повторные реплики 237  этом методе. Они, а также Кену й [53] предложили таб- лицы минимального числа реплик для различных специ- фикаций конкретных случаев, основанных на неравен- стве (9.36). Табл. 9.2 представляет собой другую таб- лицу такого рода, показывающую минимальное число реплик, требуемое для каждой из пяти пар вероятно- стей, как для случая (г—1) степеней свободы для ошибки, так и для другого крайнего случая, когда 02  Таблица 9.2  Число реплик каждого из двух способов обработки, требуемое для того, чтобы вероятность не обнаружить существование истинной разности б с помощью критерия значимости с уровнем вероятности Р, не превосходила P2 (более подробное объяснение дано в тексте)  Р. 0,05 0,05 1 0,05 1 0,01 i 0,01 P, 0,50 0,20 I 0,05 I 0,50 0,05 s/6 1 0) | (н) (з) 1 (п) | ‹:› | an | <0 | (п) а) | ш) 0.1 3 1 3 1 3 1 3 1 3 1 0,2 3 1 3 1 4 2 4 1 5 2 0,3 4 1 4 2 5 3 5 2 7 4 0,4 4 2 5 3 7 5 6 3 9 6 0,5 5 2 7 4 9 7 7 4 13 9 0,6 6 3 8 6 12 10 9 5 16 13 0,7 7 4 10 8 15 13 11 7 21 18 0,8 8 5 13 11 19 17 13 9 26 23 0,9 9 7 15 13 24 22 15 11 32 29 1,0 11 8 18 16 29 26 18 14 39 36 1,2 1 4 12 25 23 40 38 23 20 55 52 1,4 18 16 33 31 54 51 30 27 73 70 1 ,6 23 20 43 41 69 67 38 34 95 92 1,8 28 25 53 51 87 85 47 43 . . . . 2,0 34 31 65 63 . . . . . 57 54 2,2 40 38 78 76 69 65 2,4 47 45 93 91 81 77 2,6 55 52 94 90 2,8 63 61 . . . . 3,0 72 70 i) Если используются г реплик, то эксперимент имеет (г- 1) степеней свободы для ошибки. ii) Для любого числа реплик 02 известна точно. 
238 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНПЯ  известно, а число степеней свободы не ограничено. На- пример, если $=0‚5б  и вероятности равны Р1=О‚05, Р2=О,20, то для г должно удовлетворяться неравенство  0,50 ——’--—. <:: (tn 4‘ t2)2 Если г = 6 и ошибка имеет пять степеней свободы, то 23, = 2,571 и t2 = 0,920, и, следовательно,  Г ——-——%‘=О,492. (ti 4“ t2)z Поэтому шести повторных реплик не совсем доста- точно, но г= 7 полностью удовлетворяет условию. С другой стороны, если число степеней свободы для ошибки бесконечно, то t1 = 1,96, t2 = 0,842, и  4 М+Ы, —-0,509, так что достаточны четыре реплики. Разность между требуемым числом реплик для двух крайних ситуаций удивительно мала: нетрудно оценить промежуточные условия, такие как 2(г— 1) или 5(г— 1) степеней сво- боды, а если требуется знать их более точно, то вычис- ления проводятся таким же образом. Гаррис, Горв и Ц и Муд [30] пытались придумать более точную теорию, которая была бы пригодной, если бы вместо просто угаданного значения для о? имелась оценка 52 с f степенями свободы. Их результат для экс- перимента, проводимого в рандомизованных блоках по два участка, состоит в рекомендации принять в Katie- стве г наименьшее целое число, удовлетворяющее нера- венству L Ц 252 г  —— -————‘ 9.37 6* t%F2<r—1,f>’ ( ) где 2‘, имеет (г— 1) степень свободы и, как и выше, со- ответствует вероятности Р1‚ а Р2(г—- 1, f) —-дисперси- уонное отнощение для уровня вероятности Р2 (обычно та- булируемое, одностороннее) с (г— 1), f степенями сво- 
9.6. повторные РЕПЛИКИ 239  боды. Для численного примера, использованного в‘ пре- дыдущем абзаце, при 52, имеющем пять степеней сво- боды, правило, диктуемое неравенством (9.37), также привело бы к семи репликам, так как  7 (2‚447)2 >< 2,22  = 0,527,  И соответствующая функция для г=6 меньше, чем 0,5. С другой стороны, если бы такое же значение $2 было при 20 степенях свободы, то достаточно шести реплик, так как 6 _ (2,571)? >< 1,62 ‘D560’  и значение г = 5 сделало бы функцию меньшей, чем 0,5. Этот пример выявляет одну слабость в применении теории, наводя на мысль, что рассматриваемая ситуа- ция до некоторой степени нереалистична. Если экспери- ментатор имеет оценку для 02 с пятью степенями сво- боды, то, по-видимому, для него He слишком неразумно проводить эксперимент с семью репликами и сравнивать средние для способов обработки, использовав новую оценку дисперсии с шестью степенями свободы. Если первоначально он имел оценку с 20 степенями свободы. то едва ли можно поверить, что он проведет экспери- мент с шестью репликами и использует новую оценку дисперсии только с пятью степенями свободы при срав- нении способов обработки! Почему бы не использовать значение з? с 20 степенями свободы или не скомбиниро- вать каким-нибудь образом две оценки? На практике редко можно констатировать существование заслужи- вающей доверия оценки дисперсии участка, соответст- вующей эксперименту еще до его проведения. Аналогич- ные эксперименты в прошлом могут вполне дать полезные указания, но не оценки, согласующиеся со стандарт- ным распределением 52 около о? с f степенями сво- боды. Если это так, то полученная теория (как будет ясно читателю, хотя никакого доказательства и не будет дано) при допущении, что отношение средней квадра- тичной ошибки в эксперименте кисходной оценке $2 сле- дует Р-распределению, имеет ограниченное применение, 
240 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  и сомнительно, имеет ли она на практике превосход- ство перед приближением Кохрэна и Кокс. Кроме того, в заметке, которая возможно неизвестна многим, кто ссылался на основную статью, Муд [71] указал, что тео- рия, предложенная 1`аррисом, Горвицем и им, содер- жала брешь и была, следовательно, неточной. Этот ме- тод имеет некоторую аналогию с методом Стейна (§ 8.3), НО различие достаточно для того, чтобы считать теорию Стейна точной, хотя, как говорилось ранее, она также имеет ограниченное практическое применение.  9.7. Сбалансированность и ковариация  Во всех рассмотренных планах экспериментов были важны ограничения того или иного вида на блоки, и од- ной из главных обязанностей статистика в связи с экспериментированием является нахождение лучшей си- стемы разбиения на блоки. Многое зависит от опыта в области применений и вытекающего из него знания о наиболее возможных источниках изменчивости Однако справедливости ради отметим, что любая логическая классификация объектов эксперимента, которая воз- можна до начала эксперимента и которая, быть может, менее всего связана с окончательными урожаями, за- служивает рассмотрения в качестве основы для разбие- ния на блоки. Часто количество выборов больше, чем может быть осуществлено в эксперименте, даже если прибегнуть к латинскому квадрату и другим планам, в которых одновременно используются две или большее число систем блоков. Статистик учится относиться с по- дозрением к утверждениям экспериментаторов, что раз- ности между днями экспериментирования или между альтернативными запасами предполагаемого стандарт- ным материала пренебрежимы, и проверяет их, когда это возможно, по записям предшествующих эксперимтен- тов. Нередко он приходит к заключению, что эффектив- ность сравнений между способами обработки сущест- венно улучшилась бы, если бы эксперименты были сба- лансированы по способам обработки. Если приходится делать выбор между альтернатив- ными классификациями, то при прочих равных условиях 
9.7. свАлАнспровАнность и КОВАРИАЦРЖЯ 241  некоторое предпочтение следует отдать качественным свойствам как основе для объединения в блоки, тогда как вопросы о количественных свойствах можно часто рассматривать с помощью ковариационного анализа. Если при выполнении опыта есть уверенность, что на него не влияет то, какое из четырех разных лиц отве- чает за некоторую операцию (или какой из четырех различных запасов номинально стандартного лекарства используется), так что нет смысла балансировать пла- ны по этим четырем лицам, и, следовательно, появ- ляются очевидные различия, то все же их можно ком- пенсировать следующим путем. Одно лицо, скажем P1, может быть принято за стандартное. Можно определить три фиктивных переменных таким образом, что первая принимает значение единица для всех результатов Р2 и нуль для P1, P3 И P4, вторая—значение единица только для P3, а для остальных — нуль и третья равна единице только для Р4. Тогда ковариационный анализ одновре- менно по всем фиктивным переменным согласовывает все сравнения средних значений способов обработки к оцениваемой эквивалентности в отношении P1, P2, P3, P4. Сумма квадратов, исключенная из ошибки с помо- щью регрессии по трем переменным, сводится к обычной сумме квадратов между лицами, если план в деистви- тельности был идеально сбалансирован по этим четы- рем лицам. Этот процесс не только труден, но оценива- ние ковариационных поправок неизбежно влечет неко- торую потерю информации, которая не происходила бы, если бы балансирование было идеальным. Следователь- но, выгодно использовать такую классификацию в каче- стве основы для блоков, если бы она была возможна. Количественное свойство, например, первоначальный вес животного или урожай с участка в какой-нибудь доэкспериментальный период, может быть таким, что связь окончательного урожая с ним (с точностью до способов обработки и эффектов блоков) выражается регрессией довольно простого вида, скажем, линейной или квадратичной. Тогда ковариационный анализ, ис- пользующий эту одну сопутствующую переменную (и ее квадрат, если регрессия квадратичная), гарантирует. что сравнения откорректированных средних значений  16 Д. Финни 
242 гл. 9. эффвктивность ЭКСПЕРИМЕНТИРОВАНИЯ  способов обработки производится в терминах эквива- лентности для сопутствующих переменных. Однако, как подчеркивал Кемпторн [52], строгая законность про- цедуры зависит от точного соответствия модели регрес- сии, допущения, которого избегают, если группы участ- ков, точно или приближенно равные по количествен- ному свойству, задают состояние блоковых ограничений. Аутвайт и Рез е р ф о р д [4] проделали поучительный пересмотр данных,сначала описанных и проанализиро- ванных Федерером и Шлотфельдтом [94]. Экс- перимент по выращиванию растений был разложен в рандомизованнь1е блоки, причем каждый блок представ- лял собой одну линию участков, а последовательные блоки-параллельные линии. Контроль урожаев вы- явил тренд вдоль линии участков. Аутвайт и Резерфорд устранили этот тренд с помощью множественного кова- риационного анализа, используя в качестве одной сопут- ствующейпеременной положение участка в блоке, а в качестве других сопутствующих переменных-последо- вательные целые степени этого значения. С помощью продолжения до полинома седьмой степени им удалось исключить все разности, соответствующие средним по- ложениям восьми способов обработки внутри блоков --— процедура, аналогичная использованию фиктивных пе- ременных, упомянутых в предыдущем абзаце. Тем не менее они нашли, что ошибки оценивания, свойственные ковариационным поправкам, составляют примерно 15% потери информации по сравнению с планом, в котором использовались ограничения латинского квадрата для балансирования способов обработки по положениям внутри блоков. Вот пример, в котором количественное (характеризующее положение) свойство было бы лучше использовать в качестве основы для разбиения на бло- ки, чем в’ ковариационном анализе. Несомненно, следует предпочитать разбиение на блоки, если оно осущест- вимо, а ковариацию нужно рассматривать как средство для использования в ситуациях, где эксперимент не мо- жет выдержать достаточного" количества блоковых огра- ничений, когда непредвиденный источник изменения оказывается связанным с некоторым свойством на про- тяжении всего эксперимента или к концу его (причем 
9.7. СБАЛАНСПРОВАННОСТЬ И КОВАРИАЦИЯ 243  само свойство определено до применения способа обра- ботки или не зависит от него по другим причинам), или для корректировки ошибок в плане *). Одним из способов использования количественной характеристики в качестве основы для разбиения на блоки является расслоение участков в соответствии со значением характеристики. Например, рандомизован- ные блоки для t способов обработки могли бы состоять из t участков с наибольшими значениями, из t участ- ков с наибольшими из оставшихся значений и т. д. План 3.2 относится к эксперименту, в котором эта идея была обобщена на латинский квадрат, причем размер листа был упомянутой характеристикой. Это разумно и строго и потому может быть рекомендовано. Такой конт- роль B модифицированной форме может быть исполь- зован даже при отсутствии первичной классификации разбиения на блоки (<<растения>> в плане 3.2). Сопутст- вующая переменная может быть внесена в список по порядку величины для всех участков, после чего эта по- следовательность делится на последовательные «блоки» по z‘ участков, и способы обработки распределяются по участкам внутри каждого блока в соответствии со слу- чайно выбранным латинским квадратом или квадратом Юдена. Например, если бы на 25 участках испытыва- лись пять способов обработки, то последовательные строки латинского квадрата размера 5><5, такого как план 3.2, могли бы определять способы обработки_по  ‚УЧЗСТКЗМ КЗК упорядоченные ОТ наибольшего ДО НЗИ-  меньшего ПО величине ЗНЗЧЭНИЯ ХЗрЗКТСОИСТИКИЁ А: Е; D7 Ca B7 Ca В» Аз В» Еэ Вэ ---7 C7 Е) A-  Анализ происходит в точности как для латинского квад- рата. Энтузиаст по мере исключения эффекта независи- мой переменной может сделать также ковариационные  поправки, если захочет! Статьи Кокса [61] и‘  Фельдта [95] посвящены в основном этому вопросу.  *) Этого, конечно, быть не должно, но нужны методы для дей- ствий в такой ситуации. Пример, тесно связанный с Настоящей дис- куссией, рассматривался Ф И н н и и К о у п о M [113]. _  16* 
244 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  Иногда используется видоизмененная форма балан- сирования, в особенности при опытах с животными, где за количественное свойство можно принять, например, первоначальный вес. Вместо случайного распределения по способам обработки здесь группы животных, припи- сываемых к различным способам обработки, выби- раются таким образом, чтобы средние значения перво- начальных весов для всех способов обработки стали по возможности примерно равными. Не говоря уже о субъ- ективных моментах, которые появляются, как только отвергается истинная рандомизация, эта процедура рез- ко увеличивает изменение внутри способов обработки за счет изменения между ними. Критерии значимости и оценки стандартных ошибок могут быть существенно смещенными, если только статистический анализ не ис- пользует ковариационный анализ, чего план, по-види- мому, должен избегать! Теория рассматривалась в дру- гой работе (Финни [1О7]). Такой план, по-видимому, не имеет никаких достоинств.  9.8. Выбор плана  Вопросы о числе способов обработки, факторов, уровней и реплик являются предварительными при вы- боре плана, и, может быть, придется слегка видоизме- нить ответы, чтобы приспособиться к соответствующим планам. В частности, поскольку требования относитель- ного числа реплик и точности редко являются абсолютно жесткими, почти всегда допустимы небольшие измене- ния B числе реплик, предписываемых ими. Общий ха- рактер плана в большой степени определяется ответами. Если включено много факторов, то смешивание почти неизбежно, и все, что остается‚—это найти систему смешивания (И возможно дробную реплику), которая сохраняет блоки достаточно малыми, чтобы выполнить абсолютные ограничения или чтобы не превзойти под- сказанного опытом максимума для разумной однород- ности внутри блоков. Если эксперимент однофакторный лишь с несколькими уровнями, то естественно выбирать рандомизованные блоки и латинские квадраты или сба- лансированные неполные блоки, если размер блока нуж- 
9.8. вывор ПЛАНА 245  по сохранять небольшим. Если эксперимент одиофак- торный со многими уровнями, то можно использовать многие различные типы решетчатых планов. Кенуй ([53], табл. 1,9Ь и 8.8а) кратко подытожил некоторые особенности, управляющие выбором конкретного плана, но суждение может зависеть также и от опыта. В любой конкретной области исследования важным является накопление информации по внутренней измен- чивости участков или других экспериментальных объек- тов. Рассмотрение дисперсионных анализов дает воз- можность изучать средний квадрат ошибки для различ- ных размеров участка. Алгебраические модели также могут быть использованы при оценивании компонент дисперсий от разных источников, которые в свою оче- редь дают возможность предсказать последствия исполь- зования различных типов расположения блоков. Здесь нельзя приводить деталей, но основной идеей является аддитивная модель для урожаев с участка, из которой получают математические ожидания средних квадратов в дисперсионном анализе и возможность синтезирова- ния оценок дисперсии ошибки, соответствующей разным другим планам. Изучение прошлых экспериментов дает возможность улучшить будущие эксперименты.’ Иэйтс использовал понятие фактора эффективностиЕ для неполных блок-планов. Понятие является ценным, хотя терминология может вводить в заблуждение. Фак- тор эффективности измеряет невь1годность плана отно- сительно плана рандомизованных блоков в предполо- жении, что нет никакого компенсирующего преимуще- ства от малых дисперсий. Рассмотрим, например, план § 6.3 при значениях t = b = 7, la = r = 4. Требуется 28 участков, чтобы его можно было альтернативно ис- пользовать как четыре рандомизованных блока по семь участков каждый, содержащих одну реплику способа обработки. Можно проверить, изучив алгебраические выкладки дисперсионного анализа, что если бы внутри- блоковая дисперсия была одинаковой для обоих этих планов, то дисперсия разности между средними значе- ниями двух способов обработки в рандомизованном блок-плане составляла бы 87,5 процента от дисперсии для сбалансированных неполных блоков. О факторе 
246 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТНРОВАНИЯ  эффективности неполного блок-плана, следовательно, го- ворят, что он равен Е = 0,875. Более общо,  Ыгщш 1—1“"_ /er‘  E = (9.38)  Ha практике обычно основной аргумент в пользу при- менения сбалансированного неполного блок-плана со- стоит в том, что ожидается существенное уменьшение внутриблоковой ошибки. «Участками» могли бы быть 28 крыс в группах по четыре крысы из семи различных приплодов, или колеса от семи четырехколесных средств перевозки, на каждом из которых должна быть прове- дена Некоторая проверка износа. Произвольная группи- ровка в блоки по семь элементов была бы возможна и допустима, но в большинстве случаев дисперсия была бы гораздо большей, чем дисперсия внутри приплодов или внутри средств перевозки, и эта потеря намного пре-  восходила бы выигрыш в 12,5 процента в значении Е._  Следующий пример дает эксперимент, рассмотрен- ный в § 6.6. Здесь  ——— = 0,800.  Невозможно оценить по данным табл. 6.1, какую дис- персию имел бы эксперимент, проводимый как 15 ран- домизованных блоков по шесть участков, папример,е'сли считать, что каждая пара лиц образует блок. Если эта дисперсия была известна, то умножение ее отношения к внутриблоковой дисперсии из табл. 6.3 (s§=O,474l) на  Е показало бы величину полного выигрыша в точности от неполного блок-плана. Можно было бы произвести сравнение с планом из трех рандомизованньтх блоков по 30 участков, в котором каждая доза встречается пять раз в каждом блоке. В табл. 9.3 приведено вычисле- ние суммы квадратов для блоков подлинного плана, откорректированного по различиям для способов обра- ботки. Процедура состоит из вычисления грубой суммы квадратов для способов обработки по суммам Тд, по- 
9.8. вывор ПЛАНА 247  Таблица 9.3  Вычисление сумм квадратов для блоков, откорректированных по способам обработки, для данных табл. 6.1 (ср. табл. 6.3)  Поправка для среднего 401‚1111 Средний квадрат * число сте- сумма Повторения 2 6‚288Э  Блоки, откорректиро- ванные по способам  обработки ' 27 43,1037 1,5964 Способы обработки (неоткорректированные) 5 37,4222 Ошибка т 55 26,0741 0,474] Сумма - 89 1128889  мешенным в нижней строке табл. 6.1:  432+382+ ���� +l82—— 15 >< 401,1111 15  = 37,4222.  Теперь из табл. 6.3 мы получаем полную сумму квадра- тов для блоков и способов обработки (5 + 27 степеней свободы), равную  46,6000 + 33,9259 = 80,5259,  Разность между этими величинами есть сумма квадра- тов для блоков, уравненная в отношении способов обра- ботки. Если бы эксперимент был полностью рандомизо- ван в пределах трех повторений, причем каждое содер- жалобы пять участков с каждым способом обработки, то’ дисперсия ошибки включала бы все изменение, свя- ванное с этими 22 степенями свободы для блоков. Ее можно оценить объединением этой суммы квадратов с внутриблоковой ошибкой величины S22 ДЛЯ всех внутри- блоковых степеней свободы (т. е. способов обработки и 
248 гл. 9. эффективность экспвримвнтировАния  ошибки), в результате чего получаем  2 _ (5+ 55) >< 0,4741 + 43,1037 S “ 5+55+27  = 0,8224.  Диспе сия с едних значений способов об аботки для P о . внутриблоковых сравнении—выражение (b.22),—— оче- видно, оценивается с помощью величины sg/rE, a дис-  персия для эксперимента с рандомизованным блоком—— c помощью 32/r. Следовательно, точность неполного блок- плана по отношению к рандомизованным блокам равна 215 5, = 1,388.  52  Уменьшение ошибки среднего квадрата более чем урав- новешивает фактор эффективности, равный 0,800, и оставляет чистый выигрыш в 39 процентов. Будет ли вы- игрыш аналогичным по отношению к рандомизованному блок-плану с блоками по шесть элементов, с уверен- ностью сказать нельзя, но разумное предположение, что выигрыш увеличивается от взятия всех сравнений внутри лиц, говорит в пользу того, что это будет так. Это отно- сится только к внутриблоковому анализу для неполного блок-плана, и выигрыш в точности при полном анализе § 6.6 со смешиванием внутриблокового и межблокового оценивания несколько больше, а именно, он равен 49 процентам.  9.9. Отбор  В качестве другого примера широкого планирования эксперимента рассмотрим вкратце статистическую тео- рию отбора. Предположим, что имеется большая попу- ляция существ, с каждым из которых связано истинное значение или «ожидаемый урожай». Исследователь хо- чет отобрать часть из них с Целью получения существ, способных дать высокие урожаи. Для того чтобы это сделать, он проводит эксперимент на некоторых или на всех членах популяции и получает для каждого прове- ряемого существа оценку его ожидаемого урожая. Его ресурсы ограничены, так что чем большее число cy- ществ он будет проверять, тем менее интенсивной будет 
99 OTBOP 249  его проверка каждого из них и тем большими будут вы- борочные ошибки его оценок. Как должен он действо- вать? Очевидно, громадное количество важных для прак- тики задач пкпкет быть охвачено этой обцпн1‹рормули- ровкой. Однако ситуация нуждается в более точном определении, прежде чем она окажется поддающейся статистическому анализу. Рассмотренная здесь конкрет- ная форма основана на нуждах науки о выведении сор- тов растений, хотя принятая математическая модель является, по-видимому, лишь грубым приближением к действительности. Многочисленные практические сторо- ны этого подхода и характеризация его пригодности рас- сматривались в другом месте (¢>ur1H11[1O8L|]O9D. ГЦ» средством скрещивания созданных разновидностей се- лекционеры, занятые улучшением конкретных видов сельскохозяйственных культур, могут произвести боль- шое число новых сеянцев. Громадное большинство из них оказывается бесполезным или во всяком случае худшего качества, чем существующие разновидности, но часть из них может быть достойной сохранения в ка- честве основы для новых разновидностей. Ниже дается упрощенный расчет обычно принятого типа проверки. Ситуацию следует, очевидно, отличать от большинства задач отбора, связанных с людьми, например, отбора для некоторого типа обучения, где истинной целью яв- ляется различение между двумя или более категориями способностей. Справедливость или политика государ- ства могут требовать, чтобы все, кто хочет посещать определенный тип цпкыд были бы проверены на пригод- ность, но те, кого проверка квалифицирует как непри- годного, должны тем He менее обучаться каким-либо другим путем, чтобы они могли играть подходящую для них роль в обществе. Селекционер же должен забо- титься лишь об оптимизации качества тех объектов, которые он выбирает, и не испытывать какого-либо беспокойства о судьбе тех, кого он отбросил как непригодных. Он свободен от рассмотрения этических и эмоциональных факторов. В результате его задачи го- раздо менее сложны, хотя и они все же достаточно трудны. 
250 гл.` 9. эффвктивълость ЭКСПЕРИМЕНТИРОВАННЯ  д Предположим, что каждый год группа из N ВОЗМОЖ- нь1х новых разновидностей культур готова начать свою программу проверки на урожайность, проверки, которая продолжается на протяжении k последовательных лет, и что к концу этого времени доля п: разновидностей должна быть выделена как «успехи». Число остающихся для контроля разновидностей в группе будет умень- шаться год от года, так что в году г вырастут в полевом опыте все уцелевшие от года (r—— 1), и доля Р, из них, показавших лучшие урожаи (без какой-либо ссылки на критерии значимости), останется для следующего года. Нужно подсчитать вероятность того, что N может быть „столь большим, что проверка всех в первом году станет нецелесообразной, а вместо этого можно было бы слу- чайно отобрать из группы РОМ разновидностей, при этом оставшаяся часть (1——P0)N должна быть отброшена без проверки. Очевидно, Р, подчинены условию  Р0Р1Р2 ... Pk_1Pk=TE. ���  р В какой-нибудь один год уцелевшие из /e различных групп будут под контролем, каждый на разной стадии проверки. При стабильных условиях экспериментатор будет-иметь для полевых опытов в каждом календар- ном году суммарную площадь А, причем ее местополо- жение может меняться из года в год, хотя площадь co: храняется постоянной. Эту площадь экспериментатор должен разделить таким образом, чтобы выделить mo; щадь А, для РоР1 ���� P,N, уцелевших из группы, в Haw стоящий момент находящихся на г-м году проверки ..(г= 1, 2, ..., la), где  A A1+A2+ �$�� +Ak_1+'.Ak=A. �}��  Задачей оптимального планирования является опреде- ление значений Ро, Р, и Ат, удовлетворяющих условиям (9.39) и (9.40), так чтобы максимизировать ожидаемые урожаи- для лА/ окончательно отобранных разновид- ностей. — М-разновидностей могут рассматриваться как вы- борка из бесконечной генеральной совокупности, в ко- торой распределение ожидаемыхурожаев имеет опре- деленный вид. Здесь будет рассматриваться только нор- 
9.9. отвор 251  ‘мальное распределение. Кернов ([54], [55])‚получил некоторые результаты, относящиеся к другим распреде- лениям. Полевой опыт на стадии r будет оценивать ожи- даемые урожаи с ошибкой, которую разумно предпола- гать нормальной. Кроме того, эта ошибка будет убывать с уменьшением числа разновидностей на шаге г или с возрастанием А, за счет изменений размера участка и повторения, которые возможно сделать. Будем предпо- лагать, что приближение е? дисперсии ошибки можно представить в виде 2 уРОР, 0�{� P,__,/102 8 L: 7 Ат  (9.41)  где у-постоянная, а суд-дисперсия распределения ожидаемых урожаев. ' Тогда математический анализ этой модели для одно- ступенчатого отбора совершенно прост. Можно пока- 3ать,`что средний урожай отобранных n.N разновидно- стей имеет математическое ожидание, которое превы- шает общее среднее на величину  1 (1 +YPo) где 2‚—ордината нормированной функции плотности нормального распределения (со средним О и диспер- сией 1), соответствующей односторонней вероятности P1. При условии (9.39) это выражение обращается в мак- симум, если принять за Р, решение уравнения-  2 (219 + aw) = 2TP (P + эту), (9.43)  где" Т-—абсцисса (единичное нормальное отклонение), а_2—- ордината, соответствующие Р. Следовательно, Р, есть функция только пу, и P0 = It/P1. Уравнение (9.43) может привести к значению P1, меньшему чем л. Это служит указанием на то, что величина G, выигрыш в среднем урожае, была бы больше, если бы N было больше, но что лучшей процедурой сейчас является при- нять Plén, Po=l. Чаще Р, будет больше, чемщп, и первоначальное случайное отбрасывание А/(1—-.Р0) разновидностей будет выгодным. При этом выигрыш мо- жет в быть значительным; Например," .если- у = 5 и 
252 ГЛ. 9. ЭФФЕКТИВНОСТЬ ЭКСПЕРИМЕНТИРОВАНИЯ  л=0,01—разумные для практики значения, то опти- мальным значением Р, является 0,063 и первоначальное уменьшение числа N разновидностей до 0,16 N увеличит величину G Ha 35 процентов по сравнению с использо- ванием Р, = :п: по всем исходным разновидностям. Если л было равно 0,1, то выигрыш от использования опти- мальной процедуры случайного отбрасывания для уменьшения N до 0,56 N, осуществляемого с помощью Р, = 0,18, был бы равен только 5 процентам от значе- ния G для Р = 0,1. Как только приходится рассматривать более чем одну ступень, математические выкладки существенно усложняются, и даже для двухступенчатого отбора мало чего можно достигнуть помимо численного исследова- ния одного или двух частных случаев. Однако они весь- ма показательны. Как и можно было бы ожидать, пер- воначальное отбрасывание является гораздо менее важ- ным, так как его функция уменьшения общего числа разновидностей до числа, которое можно с достаточной точностью проверить на имеющейся земле, отчасти вь1- полнена с помощью первой ступени отбораЕслипочень мало, то может оказаться выгодным значение P0, отлич- ное от единицы, но выигрыш в 10 процентов или больше по отношению к наилучшему достижимому при Ро= является исключительным. Поэтому подробно был изу- чен только случай Po = 1. Тогда для любых конкретных значений у и л: программа отбора полностью опреде- ляется выбором Р, и 14„ так как P2=:r1/P1, A2/A = =1—A1/A. Если в качестве системы отсчета для Р, (лучше для 1ogP1) и А,/А принять две прямоугольные оси, то можно вычислить величину G для многих раз- личных пар точек на диаграмме. Эта величина снова определяется как излишек ожидаемого среднего урожая от лА/ отобранных разновидностей над общим средним по всем разновидностям, но его символическое выраже- ние является гораздо более громоздким, чем равенство (9.42), и трудоемким для вычисления. На диаграмму можно нанести контуры равных значений G, и они бу- дут окружать единственный макситиум, Достигаемый при оптимальной комбинации Р, и А,. Полное исследо- вание случая у - 1, п а 0.01, сопровождающееся мень- 
9.9. отвор 253  шим количеством вычислений для у = 10, л = 0,01 и вы- водами из обзора результатов, наводит на мысль о про- стом обобщении: для широкого ряда значений у и п, примерно соответствующих практическим условиям, максимизация G достигается приближенно при  Р1= P2 = „т, А, = ‚42 = ё- А. (9.44)  Эти значения, конечно, не дают истинного максимума, но поверхность связывающая G с Р, и /11, является очень плоской вблизи максимума, и потерями от при- ближения можно пренебречь. Когда п превышает 0,1, этот двухступенчатый отбор едва ли лучше, чем одно- ступенчатый. С уменьшением п: выгода от дополнитель- ной ступени становится большей, хотя кажется, что вы- игрыш по отношению к оптимальной одноступенчатой процедуре всегда будет гораздо меньшим, чем выигрыш для оптимальной одноступенчатой процедуры по отно- шению к одноступенчатой процедуре с Ро = 1. Кернов [56] выполнил некоторые вычисления по трехступенча- тому отбору, подтвердившие мнение о том, что условия  Р0:1‚ P1"="P2'="P3'—_'3T:l/3, A1:A2:A3=Al3 @�m�  бЛИЗКИ к оптимальным, а также показавшие, что даль- нейший выигрыш по отношению к двухступенчатому от- бору мал. Обобщение этого простого правила на k сту- пеней очевидно. Хотя отклонение приближения значе- ний Р, и А, от истинных максимизирующих значений может увеличиваться с ростом k, разность между сред- ними ожидаемыми урожаями для тех разновидностей, которые отобраны в соответствии с правилом, и для тех разновидностей, которые отобраны в соответствии с истинной оптимальной процедурой, будет почти навер- ное всегда малой. Этот параграф содержит лишь краткий очерк отрас- ли науки, работа в которой еще только разворачивается. Полученные до сих пор результаты нельзя рассматри- вать как какую-либо точную рекомендацию для практи- ческого проведения отбора разновидностей, потому что математическая формулировка является лишь грубым отображением действительности. Например, не было 
254 гл. 9. эффективность ЭКСПЕРИМЕНТНРОВАНИЯ  сделано никакого упоминания о возможности того, что  ДОСТОИНСТВЗАрЗЗНОВИДНОСТИ МОГУТ МЕНЯТЬСЯ ОТ места К  месту и от сезона к сезону вследствие дифференциро- ванных откликов на факторы почвы и климата; ничего не было также сказано о потребности одновременного отбора по нескольким измеряемым характеристикам культуры (химическая структура И факторы качества, сопротивляемость болезням и вредителям и т. д.‚ а также вес брутто). Кроме того, необходима теория, от- носящаяся к генетической характеристике конкретных видов культур и к методам производства семян, исполь- зуемым селекционером и в когтмерческог’: практике. Во- прос «что такое разновидность?» уместен, но его гораз- до легче поставить, чем ответить на него. Работа обсуж- дается здесь из-за того, что она иллюстрирует, каким образом статистик может пытаться помочь в планирова- нии сложных экспериментальных программ. По-види- мому, интересно отметить, что независимо от излагае- мой работы, хотя и одновременно с ней Робертсон [82] использовал по существу такой же подход к одно- ступенчатому отбору при выведении пород животных, где нужно было отобрать производителей на основе про-  ДУКТИВНОСТИ ИХ ПОТОМСТВЗ.  9.10. Отбор лекарств  Задача, аналогичная задаче отбора новых разновид- ностей сельскохозяйственных культур, возникает при «отсеивании» химических соединении в связи с их воз- можной терапевтической активностью. Фирма в фарма- цевтической промышленности может иметь в своем рас- поряжении большое число соединений, любое из кото- рых может оказаться ценным при лечении конкретной болезни, хотя доля активных соединений будет почти наверняка чрезвычайно мала. Некоторые соединения были изготовлены потому, что теория или предшествую- щий опыт навели на мысль о их возможной полезности при лечении данной болезни, но многие из них не имеют никаких предварительных рекомендаций и берутся про-  сто случайным образом из запаса синтезированных ве- ‘ществ. Может быть, средство от рака имеется среди 
910 отвор ЛЕКАРСТВ 255  соединений, первоначально синтезированных для дру- гих совершенно отличных - промышленных или научно- исследовательских целей, отложенных в сторону как не представляющих непосредственного интереса и еще не испытанных в области, где они могут оказаться чрезвы- чайно ценными. Здесь снова имеется потребность в предварительных проверках с малым числом реплик, на основе которых можно было бы отвергать соединения, терапевтическая активность которых оченьслаба. Вто- рой ступенью таких проверок было бы использование реплик высокой кратности. Снова можно рассматривать возможность последовательности из нескольких ступе- ней. Однако в этой ситуации дискретное распределение ожидаемых урожаев с чрезвычайно малой долей актив- ных соединений (предполагаемых равнозначными) и добавочной большой долей соединений с нулевой актив- ностью может дать лучшее приближение к действитель- ности, чем непрерывное распределение. Дейвис [37] положил начало развитию статистиче- ской теории, пригодной к этой ситуации. Ему пришлось ограничиться предположением, что проверяемые соеди- нения можно рассматривать как случайно выбранные из большой генеральной совокупности. Хотя.нестатистиче- ские соображения должны быть, разумеется, приняты во внимание, план отсеивания, полученныи из основанной на случайности теории, является, по-видимому, полез- ным в качестве первого приближения к оптимальной процедуре. Дейвис заметил: «Если найдено активное  соединение, то обычно следует взять целый ряд соеди-  нений аналогичного типа в надежде улучшить amus- HOCTb. Это то, что мы называем «следованием примеру». Когда следуют примеру, проверка больше не будет слу- чайной, и соображения, на которых основан план про- верки, становятся тогда иными». [Щля втногих целей в качестве исходного распре- деления активности может быть взято распределение, принимающее только два значения 1 или 0 с вероятно- стями б и (1-6), где б-обычно малое число (возможно, порядка 0,01, 0,001, или даже меньше). Любая отсеивающая процедура будет включать провер- ку соединений, например с помощью испытания каждого 
256 гл. 9. эффвктттвность ЭКСПЕРИМЕНТИРОВАНИЯ  из них на одном или более животных и измерения ак- тивности, и отбора тех, для которых так измеренная средняя активность превзойдет определенное значение. Измерения будут подвержены ошибками эксперимента и, таким образом, не будут ограничены значениями 1 и О. Некоторые из этих отобранных соединений неизбежно будут псевдоположительньълш, т. е. соединениями с ис- тинным значением нуль, которые выдержали испытание из-за экспериментальной ошибки, и также неизбежно некоторые истинно положительные соединения не будут отобраны. Дейвис предложил в качестве подходящего критерия для оптимальной схемы руководствоваться тем, что когда общее число соединений уменьшается при отборе до фиксированной доли п, доля истинно актив- ных соединений должна быть максимизирована (или доля псевдоположительных соединений минимизиро- вана) относительно всех расходуемых усилий. Для этого начального биномиального распределения истинной активности критерий совпадает с критерием максимиза- ции истинной средней активности. Для более общего распределения критерий, основанный на доле соедине- ний, которые превышают некоторый уровень истинной активности, оказывается предпочтительным по сравне- нию с критерием, основанным на среднем. Предположим, что принятые правила отбора таковы, что соединения с истинными активностями О и 1 имеют соответственно вероятности 6 и Э’ быть отобранными. Для того чтобы приспособиться к требованию, что ин- тенсивность отбора будет равна п, они должны удовле- творять равенству  л: = 6 (1 — б) + 6’б. (9.46)  Тогда доля активных среди всех отобранных соединений  равна ч: = ~‘j-5’-, (9.47)  величина ф есть также средняя активность отобранных соединений. Проверка будет включать назначение доз соединений экспериментальным объектам, которые воз- можно являются представителями одного из обычных видов лабораторных животных. Если процедура имеет 
9.10. отвор ЛЕКАРСТВ 257  более чем одну ступень, то число используемых живот- ных может меняться от соединения к соединению и, в частности, может отличаться в среднем для активных и неактивных соединений. Если математические ожидания числа животных, используемых для соединений актив- ности О и 1, равны соответственно т и т’, то величина  т =т(1—б)+т’б (9.48)  есть среднее число животных на соединение. Расходы по проверке одного соединения можно, по-видимому, удовлетворительно представить в виде  А = ат + с, (9.49)  где а-стоимость одного используемого животного, а с-стоимость самого соединения. Целью, следова- тельно, будет максимизация ф при условии, что :п: и А фиксированы, а б-неизвестное число, предполагаемое очень малым. Эти выражения легко обобщаются в виде интегралов в случае, когда исходное распределение ак- тивности непрерывно. Одной возможностью было бы принятие /г—ступенча- той программы проверки, аналогичной программе, рас- смотренной в предыдущем параграфе. Если la = 2, то вычисления могут быть быстро выполнены с помощью существующих таблиц нормального распределения. Предположим, что на первой ступени приписывают г, животных к каждому соединению. Наблюдаемый эф- фект от любого соединения имеет среднее х, дисперсия которого равна 02/r1, где о2—дисперсия для отдельного животного. Отвергаются все соединения, для которых х < Х, и это соответствует отбору доли Р1, т. е. умень- шению первоначального числа. N соединений до Р,/\/. На второй ступени к каждому из оставшихся соединений приписывают г2 животных, и средний эффект у имеет дисперсию 02/r2. Отвергаются все соединения, для кото- рых среднее по обоим ступеням меньше чем У, т. е. г1х + г2у<(г, + r2) Y или И <[(r1+ T2) Y " 7175]/V2» (9-50) и это соответствует отбору на второй ступени доли Р2,  Где Р1Р2=л. ����  17 Д. Фннни 
258 гл. 9. ЭФФЕКТИВНОСТЬ эксппртнх-твнттнэовАътия  Здесь Х и У——величины, подчиненные условию (9.51), которые еще подлежат определению. Если можно предположить нормальность распреде- ления х и у, то вероятность того, что соединение отби- рается на первой ступени, равна *)  e,,e;=—‘: J e-Wat, (9.52) [<X—u>VrT]/a  где р принимает значения О и 1 для двух значений истинной активности. Вероятность того, что соединение, которое проходит первую ступень, отбирается на второй ступени, равна вероятности того, что у должно пре- взойти [(г, +г2)У—г‚х]/г2, если дано, что х превосхо- дит Х. Как можно показать, она равна  02’ 6;=Н[(Х—д;)1/:, (У`д):/п+г2‚.'/ТЕ_;]‚ (953)  где H(§, 1],p) означает нормированный двумерный нор- мальный интеграл:  _ 2__ 2 mg’ т“ ")=‘2‘nT1l$*TJJ eX1"[’ и 2<%p:vp:r>v ]"”d”' En '  (9.54) И снова нужно подставить и = О и 1. Тогда в обозначе- ниях предыдущей части этого параграфа  е = 9,92, е’ = age; (9.55) к  и т = г, + 915, т’ = г, + 9fr2. (9.56)  Исследование оптимальных условий существенно упрощается, если учесть тот факт, что б очень мало, так что, как видно из формулы (9.46), 6 будет почти рав- но п. Конкретные условия можно исследовать, выбрав значения для 6, и г, (целые числа). Если о известна с достаточной точностью из предшествующего опыта, то  *) B (9.52) и (9.54) символ л используется в соответствии со стандартной математической практикой Едва ли имеется какой-либо риск путаницы от использования этого же сгтмвола для обозначения полной интенсивности отбора, как в (951) и других местах. 
940 отвор ЛЕКАРСТВ 259  МОЖНО НСПОЛЬЗОВНТЬ ТЭбЛИЦЫ НОрМЗЛЬНОГО nH'rerpa.na,  чтобы получить Х из (9.52), и также получить 9;, ис- пользованием другого значения р. Следовательно, при- ближенно 92 равно Л 62:’ ��^� о Значение Y, соответствующее любому опытному значе- нию величины r2, можно определить из (9.53), исполь- зуя таблицы двумерного нормального интеграла. Из  (953) получится также значение 65. Из (9.55) полу-  чается 6’. Поскольку б мало, среднее число животных на соединение будет едва ли отличаться от т, или (г, + 61г2). Наконец, оценивается величина 9’ 9’ 7 Al C1(I'1+91/'2)+C ’ которая в силу (9.46), (9.47) пропорциональна частоте истинно положительных соединений на единицу стои- мости среди отобранных соединений. Повторение цикла вычислений для других значений п, r2, О, дает возмож- ность провести поиск максимума выражения (957). Сказанного достаточно, чтобы показать подход Дей- виса к этой задаче, хотя данное изложение представляет собой лишь упрощенный вариант его подхода. Дейвис привел численную иллюстрацию вычислительной схемы, связанной с отбором соединений, которые могли бы уве- личивать длительность жизни мышей, зараженных ту- беркулезом. Он сравнил как теорию, так и конкретное практическое применение двухступенчатой проверки с полной последовательной процедурой и нашел, что по- следняя значительно более эффективна в отношении ча- стоты положительно отобранных соединений на едини- цу стоимости. Однако последовательный метод иногда неудобен на практике, и Дейвис предположил, что схе- ма трехступенчатого отбора могла бы быть удовлетво- рительным компромиссом Насколько известно, ника- кого исследования по этому вопросу не сделано. Недав- но Да ннет ([34], [35]) рассмотрел эту группу задач. Он получил очень много результатов в задаче с отбором и  (9.57)  ИСПЫТЗНИЕМ ЛСКЗРСТВ, ВЗЖНЫХ как В теоретическом ОТ-п  НОШЕНИИ, так И ПрИ практическом ИСПОЛЬЗОВЭНИИ.  17"‘ 
Глава 10  ЭКОНОМИКА ЭКСПЕРИМЕНТИРОВАНИЯ  10.1. Внутренняя и внешняя экономика  Аспекты планирования экспериментов, рассмотрен- ные в гл. 9, связаны с тем, что можно было бы назвать внутренней экономикой исследовательских проектов. Всюду целью была максимизация дохода от каждого измерения или наблюдения, и если рассматривать экс- перимент как целое, то либо должна быть как можно большей точность для ряда сделанных наблюдений или для некоторой другой фиксированной меры полной стои- мости, либо стоимости должны быть как можно меньше при условии достижения определенного уровня точности. Соображения такого рода уместны в любом виде иссле- дования. Будь то бескорыстное исследование явлений природы или задача непосредственной практической важности для некоторой протиьппленнойт или биологиче- ской отрасли, желательность того, чтобы любые расхоч дуемые ресурсы использовались как можно Эффектив- нее, не вызывает сомиенигп. Трудность возникает, когда цели исследования пе поддаются выражению в форме оценивания одной или двух ясно определенных величин, а целеустремленность, по-видътмому, более характерна для прикладной науки, нежели для чистой. «Оценить оптимальное количество азотных удобрений на акр ози- мой пшеницы B восточной Англии» можетбыть нелегким делом, но эффективность альтернативных эксперимен- тальных планов для исследования может быть рассмот- рена детально, что совершенно невозможно, когда целью является «установить связь характеристик извлечения азота из почвы обыкновенной пшеницей с условиями физической среды». Если акцент делается скорее на про- грессе знаний, чем на приобретении конкретной единицы информации, то исследователь редко может утверждать заранее, какие аспекты его эксперимента представляют 
10.1. внутренняя и внешняя ЭКОНОМИКА 251  ОСНОВНОЙ ИНТЕрЕС‚ И СТЗТИСТИК ПОЭТОМУ МОЖЕТ ОКЗЗЭТЬСЯ НЕ В СОСТОЯНИИ рЗССМЗТрИВЭТЬ ВЫбОр ПЛЗНЗ В ЗЗВИСИМО- СТИ ПРОСТО ОТ МИНИМИЗЗЦИИ НЕКОТОРЫХ ДИСПЕрСИИ ИЛА МЗКСИМИЗЗЦИИ НЕКОТОрЫХ Mep ВЫИГрЫШЗ. Различие между научным исследованием для приоб- ретения знаний об экспериментальном материале и тех- НОЛОГИЧЕСКИМ ИССЛЕДОВЗНИЕМ УВЕЛИЧИВЗЕТСЯ, когда рас- смотрение эффективности переносится на вопросы о том, какой должна быть полная стоимость эксперимента или какой объем экспериментирования можно было бы оправдать ценностью получающихся результатов. Фи- шер ([119], гл. 4) отметил по существу это же разли- чие в дискуссии о роли критериев значимости и индук- тивного умозаключения с одной стороны, и процедур решения и принятия, с другой. Он подчеркнул, что ис- пользование критериев значимости и фидуциальных рас- пределений в связи с научными экспериментами имеет целью подвести итог доступной в данный момент досто- ВЕРНОСТИ И ПОМОЩЬ ПрОГрЕССу НЭУКИ ПУТЕМ НЗКОПЛЕНИЯ знания. Эта процедура в корне отлична от процедуры, соответствующей принятию бесповоротного решения, ко- ТОРОЕ КЗСЗЕТСЯ НЕКОТОрЫХ ВОПРОСОВ ПОЛИТИКИ ИЛИ рЕКО‘ МЕНДЗЦИИ НЕСКОЛЬКИХ альтернативных НЗПрЗВЛЕНИЙ ДЕЙ- ствия. Он писал: «Существенная разница состоит в том, что Решения являются окончательными, тогда как формулировка мнения, получаемого на основе критерия значимости, является условной и допускает не только подтверждение, но и пересмотр. Процедура принятия при- думана для Целого ряда случаев. Нет никакого рецепта, который давался бы в каждом возникающем случае, как нет и накопления опыта в процессе обучения. С другой стороны, критерий значимости подразумевает помощь процессу обучения посредством наблюдае- мого опыта... Существенно, что научный работник *) He вводит ни- каких функций стоимости для неверного решения, в то время как это разумно и часто необходимо сделать для Процедур Принятия. Если ввести такие функции, то это означало бы, что цели, на кото- рые должно быть Направлено новое исследование, известны и под- даются оцениванию. Если, однако, научные открытия пропаганди- руются для просвещения других свободных умов, то они могут быть рано или поздно поставлены на службу ряду Целей, о которых мы можем ничего не знать».  *) Из контекста ясно, что подразумевается научный работник в области чистой науки, а не ученый, занятый технологическим усо- вершенствованием и проверкой, . 
263 гл. 10. ЭКОНОМИКА экспврхпивптировАнпя  Тем не менее многие эксперименты И ПрОГрЗММЫ на- уЧНЫХ исследований ВЫПОЛНЯЮТСЯ ДЛЯ специальных це-  лей, которые допускают предварительную оценку ре-'  зультатов. Это, в частности, верно в технических и прикладных науках, но даже в чистой науке имеются примеры, где вопросы выбора аппарата должны быть исследованы в качестве предварительных к основному проекту. Например, могут сравниваться альтернативные методы выбора популяции насекомых или подсчета эле- ментов некоторого типа с целью принятия одного из них в качестве стандартного для будущей работы, на основании его точности, отнесенной к его стоимостяти, хотя стоимости могут измеряться скорее во времени, чем в денежных единицах. В этой последней главе мы будем касаться в большей мере задач техники, научных иссле- дований и способов, какими могут и должны влиять на планирование экспериментов экономические соображе- ния, и которые являются более общими, чем просто наи- более эффективное использование предопределенных ре- сурсов. Если целью эксперимента или группы экспериментов является оценивание величины, размеры которой важны для некоторого сектора экономики, то при прочих рав- ных условиях любое увеличение объема или числа экс- периментов будет улучшать точность оценки. До тех пор пока имеется возможность уточнять формулировку спо- соба действий, основанного на этой величине, улучшение точности может описываться в денежных единицах, чему можно противопоставить стоимость дополнительного экспериментирования. Изучение оптимальных условий, определяемых как максимизиру1ощие чистый выигрыш, относится к внеилней экономике системы. Она тесно свя- зана с теорией решающих функций, хотя ее подход осно- ван на несколько отличной точке зрения.  10.2. Оценивание оптимальной нормы  Приведем в качестве иллюстрации к предмету на- стоящей главы один пример, рассмотренный Иэйтсом [48]. Предположим снова, что должна быть оценена эко- номически оптимальная нормаприменения удобрения 
10.2. оцвнивмххтв ОПТИМАЛЬНОЙ нормы 253  для конкретной сельскохозяйственной культуры (см. § 9.4). Однако теперь целью является не просто оценить эту норму из одного эксперимента, но при размещении экспериментов на случаино распределенных местах вь1- брать область, в которой выращивается эта культура. Если все эксперименты выполняются по одной простой стандартной схеме, то стоимость A(n) выполнения и анализа п экспериментов может быть приближенно вы- ражена в виде  A(n)=c+an, (10.1)  где c означает фиксированные накладные расходы для всей программы, а а означает дополнительные расходы на эксперимент. Как и в § 9.4, обозначим через E ту норму применения удобрения на акр, которая обращала бы в максимум чистый выигрыш. Однако здесь не де- лается никакого предположения относительно конкрет- ной формы кривой отклика, и выигрыш предполагается максимизируемым при условии, что все фермеры в обла- сти принимают одинаковую норму удобрения. Урожай при п экспериментах можно осреднить таким образом, чтобы оценить кривую отклика, по которой может быть получена оценка Х для Е, Причем метод получения Х зависит от формы кривой, хотя в принципе будет анало- гичен описанному в § 9.4. Если бы регрессия урожая на уровень применения удобрения была квадратичной, то уменьшение в ожидаемом чистом доходе (цена куль- туры минус стоимость удобрения) На единицу площади, когда вместо E используется Х, было бы пропорциональ- но (?;-—Х)2‚ как можно видеть из (9.13), (9.14). Если число экспериментов достаточно велико для того, чтобы можно было гарантировать близость Х к Е, то для лю- бого другого регрессионного соотношения уменьшение в урожае будет еще такого же вида с точностью до пер- вого порядка. Хотя (§——X)2 неизвестна, ее математиче- ское ожидание V(X) можно оценить по результатам эксперимента, и оно будет обратно пропорциональным п, т. е. V (X)=£, (10.2)  П. 
264 гл. 10. экономим BKCIIEPIIMEIITIIPOBAHI/I51  где 0——дисперсия оценки Х на эксперимент. Тогда по- теря в доходе на единичную площадь от будущего ис- пользования Х вместо ё имеет математическое ох<идание Av/n. Если оценка Х используется в качестве нормы рас- хода удобрения на всей площади в Т акров, то суммар- ное уменьшение в денежных доходах от несовершенного оценивания величины 5; имеет математическое ожидание  L(n) = "ff . (10.3)  CyMMa экспериментальных стоимостей и ожидаемой по- тери от несовершенного оценивания A(n)+ L(n) обра- щается в втинимум при я: 7» Т 1/2 п =( ” ) . (10.4)  а  Если вместо n* экспериментов выполняется fn* (где f или меньше или больше единицы), то ожидаемые чистые прибыли от применения результатов исследования све- дутся к величине (f — 1)? an’ f 9 которая мала, когда f близко к единице. Следовательно, если экспериментальные ресурсы должны быть распре- делены между несколькими различными исследователь- скими программами, то каждая программа может быть сделана несколько меньшей, чем ее собственный опти- мум, при этом без существенной потери в общей эконо- мике. Численный пример может придать этому рассужде- нию большую наглядность. Предположим, что использование удобрения по ис- тинной оптимальной норме для области по сравнению со случаем отсутствия удобрения привело бы к увели- чению продукции, стоимость которой неизвестна для го- сударства, но в действительности равна 500 000 фунтов стерлингов. Предположим также, что стоимость предва- рительного исследования и накладные расходы для не- которого множества экспериментов (с в формуле (10.1)) равны 50 ООО фунтов стерлингов. Если а равно 250 фун-  (10.5) 
10.2. ОЦЕНИВАНИЕ ОПТИМАЛЬНОИ НОРМЫ 265  там стерлингов, М) равно 5 фунтам стерлингов на акр культуры и Т равно 500 000 фунтов стерлингов, то по формуле (1О.4) получим  n* = (5 >< 500 ооо/250)*/2 = 100.  Очевидно, cm* н L(/7*) всегда равны между собой и при- нимают значение 25000 фунтов стерлингов. В табл. 10.1 приведены значения чистых доходов от выполнения 100 экспериментов или некоторого альтернативного чис- ла их. Очевидно, без каких-либо потерь для практики  можно уменьшить объем экспериментирования на 20 про--  центов (и передать ресурсы на другие исследования), и даже 50-процентное уменьшение объема экспериментиро- вания не имеет слишком серьезных последствий, но лю- бая меньшая интенсивность экспериментирования может резко уменьшить прибыли, получаемые от применения результатов исследования. Конечно, нет никакого смы- сла в понижении объема экспериментирования ниже оп- тимального f= 1, если только это не есть единственный путь сохранения денежных средств для других совер- шенно отличных, но важных проектов.  Ч`абл1н11а IOJ  Значения чистых доходов при различных объемах экспериментирования (в тысячах фунтов стерлингов)  Число экспе- Стоимость нссле- Цена возросшей __ U риментов дования продукции q“‘3”"” fn*) (50 +o,25 m (500—2500/n) ДОХОД 160 90 484 394 140 85 482 397 120 80 479 399 100 75 475 400 80 70 469 399 60 65 458 393 40 60 438 378 20 55 375 320 10 52 250 198  Более разумным предполоэкеттнем могло бы быть предположение о том, что площадь Т должна получать 
255 гл. 10. ЭКОНОМИКА ЭКСПЕРИМЕНТИРОВАНИЯ  оцененное количество Х удобрения ежегодно на протя- жении неограниченного периода на основании экспери- ментов, выполненных B одном году. Соответствующая теория не имеет существенного отличия, но следует при- нять во внимание потерю интереса ккапиталу, расходуе- мому на исследование в настоящий момент с целью бу- дущего выигрыша. Здесь Т должно быть заменено на  Т  -———__  q 3  где 100q процентов представляют собой приемлемую норму на капитал, или на  -f;[1—<1+ q)~'"1,  если результаты следует использовать только на про- тяжении т лет. Например, если интерес появляется при 4 процентах и т велико, то оптимальное число экспери- ментов увеличивается B пять раз по отношению к пре- дыдущим результатам. Задача еще до некоторой степени искусственна, поскольку изменение экономических и кли- матических условий и.ли другие колебания привели бы к изменению а, A и о. Действительно Х, оцененное по одному году экспериментирования, едва ли было бы удо- влетворительным для сельского хозяйства. Лучшей exe- мой мог бы быть выбор подходящего значения п выпол- ненных за год экспериментов, а затем принятие среднего значения (возможно взвешенного) величин Х для la не- посредственно предшествующих лет в качестве общего уровня применения в любой другой год. Однако рассмот- ренная выше задача является первым приближением. Ее можно применить с очень небольшим изменением к не- которым аспектам промышленных исследований, где условия гораздо более стабильны, и даже в сельском хо- зяйстве она достаточна. чтобы показать полную несо- стоятсыпьность многих текущих исследований при опре- делении возможных прибылей. Выгода от увеличения п недооценивалась с одной точ- ки зрения. Знание кривых откл_ика для очень многих местоположений внутри области могло бы дать возмож- 
10.3. ОПТИМАЛЬНЫЙ ВЫБОР МЕЖДУ АЛЬТЕРНАТИВАМП 267  ность подразделить область на участки, в каждом из которых потенциал отклика культуры был бы более од- нородным. Если бы за этим следовали отдельные реко- мендации по норме применения удобрения для несколь- ких участков, то суммарный урожай этой культуры был бы больше, чем если бы всюду было рекомендовано одно среднее значение.  10.3. Оптимальный выбор между двумя альтернативами  Хотя рассмотренная в § 10.2 задача содержала важ- ную свежую мысль, когда она была предложена впервые, решение ее весьма просто. Большие логические и мате- матические трудности появляются, когда вместо оцени- вания оптимальной нормы в непрерывной шкале Целью становится осуществление наилучшего возможного вы- бора между альтернативными процедурами. Одна за- дача такого типа, относящаяся к ситуациям, которые встречаются в ряде отраслей техники, была изучена Гранди, Хили и Рисом ([33], [31]). Предположим, что изучается желательность несения изменений в некоторый исследуемый стандартный тех- нологический процесс (например, использования новой синтетической пластмассы для некоторого типа электри- ческого изоляционного материала или добавления не- которого гормона в рацион поросят). Был проведен еди- ничный эксперимент, на основе которого подсчитали, что увеличение количества или улучшение качества продук- 1ши при новом процессе по сравнению со старым состав- ляет х и имеет дисперсию 02. Разумеется, х может быть положительным или отрицательным. Будем предпола- гать, что дисперсия величины х основана на достаточно большом числе степеней свободы, так что ее можно при- нять за дисперсию генеральной совокупности. Тогда х есть оценка параметра 6 генеральной совокупности, изо- бражающего ожидаемое улучшение продукции, обуслов- ленное новым процессом. Решение о том, следует ли принять новый процесс, обычно определяется тем, бу- дет ли W/0, денежная стоимость улучшения, превосхо- дить ос-(известную) основную стоимость производства 
268 гл. 1о. ЭКОНОМИКА ЭКСПЕРИМЕНТИРОВАНИЯ  изменения. W есть стоимость единичного улучшения во всей области применения процесса, и если продукция производится на протяжении некоторого периода вре- мени, то W будет приемлемой суммой капитала, осно-  "ванной на представляющей интерес текущей норме. Пе-  ред ИССЛЕДОВЗТСЛСМ ОТКРЫТЫ ДВЕ ЗЛЬТСРНЗТИВЫЗ  i) вычислить W/x— ос и рекомендовать принятие или отклонение нового процесса в соответствии с тем, будет ли эта величина полонштельной или отрицательной. ii) Признать, что нет достаточных оснований для принятия решения, и продолжить опыт, чтобы с по- мощью дальнейших п объектов экспериментирования получить вторую оценку у величины 6 с дисперсией 0'2/n. Затем вычислить  W(x+ny) __  l+n a  И рекомендовать принятие или отклонение в соответствии с тем, будет ли эта величина положительной или отри- Цательной.  Если стоимость дополнительных экспериментов про- порциональна их числу, например, равна ст, то ожидае- мый выигрыш от правила ii) будет функцией от 6, х и п вида Q(6, х, п) = (WG-00 P— an, (10.6)  где Р—вероятность принятия нового процесса. Разу- меется, Q может быть И отрицательным, например, если п принято чрезмерно большим. Предположим теперь, что х и у независимы и нормально распределены около их среднего 6. Условие о том, что правило ii) приводит к принятию нового процесса, может быть записано в виде  у>——‚Ё—+Ё‘-ЁЁ%Ё.  Вероятность этого равна Р = Ф {[п\170 + W/x — 0.(I1 + 1)]/0 Шиш}, (1О.7)  где (р (2) = (2л)“/2е‘22’2 (10.8) 
10.3. ОПТИМАЛЬНЫЙ ВЫБОР МЕЖДУ АЛЬТЕРНАТИВАМИ 269  Ф (2) = f (p (t) dz‘. (10.9)  Кроме того, формулу (1О.7) можно также рассматривать как применимую в условиях правила i), ибо когда п—+О‚ Р—›1 или О в соответствии с тем, будет ли (W/x——oL) положительным или отрицательным. Исследователь должен решить, какое значение rz(> О) он хочет использовать. Если его решение должно быть в некотором смысле оптимальным с экономической точки зрения, то, по-видимому, оно должно основы- ваться только на поведении функции в формуле (1О.6). Теперь в Q(O, x, n) x известно из первого эксперимента, но O неизвестно, так что очевидного направления макси- мизации Q нет. Значение п должно быть выбрано только в виде функции от х и от параметров стоимостей и из- менчивости. Одним из принципов, который считают по- лезным в задачах такого типа, является принцип Murm- макса. Этот принцип предполагает такой выбор п, как функции от х, при котором минимизируется максималь- ная потеря, обусловленная значением В, неблагоприят- ным для окончательно принимаемого действия. Эта по- теря измеряется по отошению к значению непосредствен- ного верного решения (W/0——oL) или О в соответствии с тем, будет ли (W/O——oc) положительным или отрица- тельным. Потеря равна разности между этой величиной и ОШ, х, п), И минимаксное значение п есть то значе- ние, которое минимизирует максимум функции потерь относительно O. Известно, что минимаксное оцениванпе имеет некоторые оптимальные свойства, но Гранди и его коллеги заметили, что они «не чувствуют какой-либо необходимости для предпочтения минимаксного реше- ния при всех альтернативах B практических задачах». В рассматриваемой задаче минимаксный метод является математически труднообрабатываемым. Они предлагают вместо него такой выбор п, при котором максимизирует-  ся значение Q, осредненное по 9. Они используют для.  этой цели фидуциальное распределение 9, основанное на первом эксперименте, т. е. нормальное распределение со 
270 гл. 10. экономикА ЭКСПЕРШИЕНТИРОВАНИЯ  средним х и дисперсией 02. Следовательно, среднее зна- чение равно  C—2(x, n)= fQ(6, x, n)cp(B—;x)0“ d6=  = J01’/20+ W/x—o1)>< (W/x—a)(n+ 1) OW/nl/2  >< (D[zn"2+ ]cp(2)dz—an, (10.10)  и получается подстановкой из (1О.6) и (1О.7) и преобра- зованием 6 = 20 + x. Некоторое преобразование стан- дартных интегралов приводит тогда к выражению  бос, Iz)=(Wx—o1)(I)(u)+0W(n:‘l)1/2cp(u)—an, (10.11) ГДЕ  ll-‘=  Wx-a> (n+1 V. 110.12)  OW n  Заметим, что при п—+0 б стремится к (W/x——o1) или 0 в соответствии с тем, будет ли (W/x——oL) положитель- ным или отрицательным, и, таким образом, дает точно  Q(x, О). Удобно рассматривать п как измеряемое в непрерыв- ной шкале, что превращает его в отношение объема экспериментирования, рекомендуемого для второго шага, к объему, уже выбранному при определении х. Диффе- ренцирование функции дисс, п) по п показывает, что ко- гда п возрастает от нуля, C сначала убывает и может далее продолжать убывать или достигнуть сначала мн- нимума, затем макситхаума, а потом монотонно убывать. Практически важным является значение абсолютного максимума Pj�� для n_>_ О. Рекомендация будет состоять в том, чтобы принять немедленное решение (n=0), если '(§(x, n) не превосходит значения §(x, О) для какого-либо п > О, но использовать значение п, соответствующее мак- симуму д, если он существует и превосходит @(x, О). Гранди, Рис и Хили изучили условия для абсолютного максимума б и построили номограмму для определения оптимального п. 
10.3. ОПТИМАЛЬНЫЙ ВЫБОР МЕЖДУ АЛЬТЕРНАТИВАМИ 27]  Сказанного достаточно для иллюстрации характера этой теории. Авторы весьма детально развили математи- ческий аппарат, привели таблицы, показывающие, как рекомендации действуют при конкретных значениях х и различных параметрах, и сравнили действие своего ме- тода с действием метода нескольких альтернатив. Как п можно было ожидать, функция б(х,п) плоская в окре- стности своего максимума, так что особого ущерба не будет, если взять rz на некотором расстоянии от ее мак- снмизирующего значения. Кроме того (за исключением случая W/x—oc = О), поведение б в окрестности n=0 обеспечивает рекомендацию или n=0 или же весьма большого дополнительного объема экспериментирования. Очевидно, от небольшого объема мало пользы, так как он не может эффективно ни подтвердить, ни отвергнуть отличия от нуля величины (W(x)——oc) И должен по- этому быть почти наверняка экономически невыгодным. Поучительно сравнение этой теории с несколько бо- лее ранней статьей Бросса [23]. Бросс рассматривал аналогичную задачу, но без какой-либо информации из предшествующего эксперимента, вроде той, что выше давалась с помощью х. Он рассмотрел минимаксиый выбор п, а также выбор, который максимизировал бы ожидаемый выигрыш, если бы само 6 можно было бы рассматривать как случайную величину, выбранную в начале задачи из нормально распределенной совокуп- ности с известными средним и дисперсией. Соответствую- щая теория несколько менее сложна, и результаты, по-видимому, имеют меньшую непосредственную полез- ность, но Бросс выяснил ряд важных для практики раз- личий между альтернативными точками зрения на внеш- нюю экономику простого выбора. Читатель, который привык придавать особое значение критериям значимости, или в данном случае фидуциаль- ным или доверительным границам, с которыми можно познакомиться по многим элементарным книгам по ста- тистической теории и практике, должен заметить, сколь неуместны они в ситуациях, подобных рассмотренным здесь и в §§ 10.2 И 10.4. Этим отнюдь не отрицается важ- ность критериев значимости и интервального оценива- Hm, ибо они могут быть совершенно необходимыми для 
272 гл 10. ЭКОНОМИКА эксперимент:тровАшжя  исследования гипотез в чистой науке. Однако вопрос о том, будет ли статистически значимой разность между двумя процессами, оцененная из сравнительного экспе- римента, имеет малое отношение к тому, будет ли ба- ланс вероятностей показывать экономическую выгоду при общей замене одного из этих процессов другим. Бо- лее глубокое рассмотрение этой идеи едва ли уместно для книги, в первую очередь касающейся планов экспе- римента, но оно приведено потому, что рассмотренные здесь столь подробно задачи подчеркивают ее актуаль- ность.  10.4. Внешняя экономика отбора  В § 9.9 рассматривалась теория отбора на конкрег- ном примере оптимальных процедур для выведения улуч- шенных разновидностей сельскохозяйственных культур. Были получены оптимальные условия для эксперимен- тальной ситуации, в которой общее число новых разно- видностегт, образующих сезонную группу, и полные ре- сурсы исследователя, измеряемые наличными экспери- ментальными площадями, определялись с помощью фак- торов, находящихся за пределами контроля. Если задача ставится в широких рамках экономики государства, то для максимизации выигрыша с точки зрения полной экономики допускается, что как объем группы, так и экспериментальная площадь могут варьироваться. Да- дим краткий набросок теории и результатов для одно- ступенчатого отбора (Фи н ни [11О]). Как и в §§ 10.2 и 10.3, рассуждение ведется в денежных единицах. Стои- мости отбора противопоставляются цене улучшений уро- жая, и максимпзируется чистый выигрыш. Это отнюдь не означает, что важны только деньги, просто они sm- ляются удобным средством, с помощью которого можно измерять и выигрыш от отбора и вкладываемые в него усилия. Было бы ошибкой считать, что результаты та- кого анализа дают точное определение оптгпчальной про- педуры, но они могут по краинеи мере навести на мысль о порядке величины исследовательского усилия, кото- рое является желательным. На практике обычно рас- сматривают другие факторы, которые не так легко выра- 
10.4. ВНЕШНЯЯ ЭКОНОМИКА ОТБОРА 273  зить количественно, и делают соответствующие модифи- кации. В рамках экономики чистой прибылью, проистекаю- щей от отбора, будет разность между ценой дополни- тельного урожая культуры со всей земли, где TEN ВЫ- бранньтх разновидностей следует выращивать в обычной коммерческой практике, и стоимостью программы иссле- дованпй для отбора экспериментов и получения N раз- новидностей для опыта. Задача внешней экономики со- стоит в стремлтении максимизировать эту чистую при- быль с помощью подходящего выбора P0, А и N, причем 02 и :mV остаются постоянными (так что, как бы велико ни было N, выбирается одно и то же число разновидно- стей). В пределах величин, представляющих практиче- ский интерес, кажется разумным принять в качестве при- ближения к действительности, что стоимость изменений усилий, резервируемых на полевой эксперимент, пропор- циональна изменению площади эксперимента. Измене- ния N вызывают изменения исследовательских усилий на более ранней ступени, именно на ступени выведения сортов для производства новых разновидностей, и снова разумным приближением кажется допущение, что стои- мость какого-то изменения в общем числе разновидно- стей, представленных для отбора, пропорциональна ве- личине изменения. Введем следующие обозначения: О'—стоимость увеличения А на одну единицу пло- ЩЗДИ; У-стоимость введения одной дополнительной раз- новидности в опыт; Ц7—стоимость единичного увеличения урожая на единицу площади по всей площади, на которой отобранные разновидности должны расти в ком- мерческих целях. Если система выведения сортов, отбора и распреде- ления новых разновидностей стабильна из года в год, то площадь, на которой отобранные разновидности будут расти, следует относить только к одному году. Если от- бор представляет собой единичное событие; то нужно было бы содействовать непрерывному использованию одного тиножества отобранных разновидностей на протяжении многих лет с поправкой, принимающей в  ��t� Д. Финпи 
274 гл. 10. экономикА ЭКСПЕРИМЕНТНРОВАНПЯ  расчет меньшую текущую цену вложений в далекое бу-  дущее. Чистый выигрыш Н от отбора можно записать в виде  H=WG—-UA—VN, (10.13)  где G то же, что в (9.42). Интуитивно ясно, что одним из условий максимизации Н является условие Р0= 1. Это следует из того, что производство такого обилия разновидностей, когда становится желательным отбра- сывание некоторых из них без проверки, очевидно, мо- жет быть лишь экономически невыгодно. Дифференци- рование по А и N легко приводит к условиям  С/Ап __ Zy 1170 2(1+y)"3’ VNn 2(Z—T:rt)+y(Z—2Tn)  W0 = ` 2(1+Y)';/2 (10.15)  (10.14)  (B обозначениях § 9.9). Хотя эти уравнения нельзя ре— шить точно, графические или итеративные решения их для конкретных значений U, V, W, о, Мл могут быть получены совсем просто с помощью таблиц функций, связанных с нормальным распределением. Здесь у уже больше не является постоянной, но может быть запи-  сана в виде v=cN/A, (10.16)  где с-константа, сопоставляющая е? величине 02 для некоторого стандартного объема эксперимента, так что формула (9.41) принимает вид  е? = сА/о2/А. (10.17)  Так получаются оптимальные значения N, Л, у, /1. C по- мощью подстановки соответствующих величин из (10.14), (10.15) B (10.13) максимум можно выразить в виде  нм = W/GT/(1 + м)”. (10.18)  Математический вывод этих условий несложен, но даже математику может доставить некоторое удоволь- ствие сводка числовых результатов, к которым они при- водят. Британский опыт по выращиванию пшеницы при- 
10.4. ВНЕШНЯЯ ЭКОНОМИКА ОТБОРА 275  вел к выводу, что в этом случае можно приближенно считать с= 1,0 (если площади измерялись в акрах), причем этот вывод основан на допущении, что разумно полагать о = 0,5 в Центнерах на акр. Примем альтерна- тивы 500 и 250 фунтов стерлингов для Н-—стоимостн каждого дополнительного акра, используемого в полевом опыте, и альтернативы 200 и 40 для 1/—— стоимости каж- дой дополнительной разновидности, произведенной для проверки. Эти числа возможно завышены, но даже при тенденции ошибаться в этом направлении оптимальный объем экспериментирования очень велик. Цена одного центнера зерна порядка 1 фунта стерлингов, так что ис- пользуемые для “Учисла будут примерно соответствовать площади в акрах, на которой отбираемые разновид- ности должны будут впоследствии расти. В качестве типичных будут приняты значения 50000, 250000 н 1250000 фунтов стерлингов. Табл. 10.2 показывает  Таблица Ю2  11римеры результатов для оптимального одноступенчатого отбора при 02 =0,25, c=1, :n;V= 1  CyuMMap- т ост в нтах “Ы” Ожи‘ С Оигтецэйиттёьв °“;é‘313.“;‘:S”‘e сдавливать ожидае` даеМыЁ ША + v~> “$‘i.i§$§; ;;f1.°§}§’L,m (B Tb‘°“‘ урожая (в H (B ТЫ- Чах фун’ центнерах сячах ТОВ стер‘ на акр) фунтов W U V п = Р А N '””‘”°B) стерлин- (акры) FOB) 50 000 500 200 0,100 14 10 9,0 0,67 24,5 500 40 0,076 16 13 8,5 0,70 26,2 250 200 0,076 25 13 8,8 0,76 29,3 250 40 0,052 31 19 8,5 0,80 31,5 250000 500 --200 0,034 67 29 39 0,92 192 500 40 (L028 74 36 38 (L94 197 250 200 0,0240 120 42 38 1,02 216 250 40 (L0178 140 56 37 1,04 223 1250(XX) 500 200 (L0100 330 100 185 L17 L280 1 500 40 (L0037 350 110 179 L18 L290 250 200 (L0069 600 140 178 L25 L390 250 40 (L0054 660 190 173 1,27 L410  18* 
275 гл. 10. ЭКОНОМИКА ЭКСПЕРИМЕНТИРОВАННЯ  оптимальные условия, когда число подлежащих отбору разновидностей равно TEN = 1. Числа являются прибли- женными, так как использовалось графическое представ- ление уравнений (1014), (10.15). Рассмотрение табл. 10.2 показывает, что понижение стоимости на акр или на разновидность отражается в увеличении оптимальных значений как А, так и N, хотя естественно на первое прежде всего воздействует экспе- риментальная площадь в акрах, а на второе—число разновидностей. Кроме того, как А так и N весьма за- метно увеличиваются при любом увеличении W, что есте- ственно, причем первая величина растет почти пропор- ционально W, а вторая гораздо менее интенсивно. По- видимому, наиболее удивительной чертой является почти постоянство полной стоимости исследования при фикси- рованном уровне W И меняющихся U И N, несмотря на существенные изменения в оптимальных А и N. Вообще: если W= 50000 фунтов стерлингов, то оптимальные издержки равны 9000; если W = 250 000 фунтов стерлин- гов, то оптимальные издержки равны 38000; если W= 1250000 фунтов стерлингов, то оптимальные из- держки равны 180 000. Это остается справедливым даже в более широкой области условий, чем использованная здесь. Еще более приближенно, расход в 1 фунт стерлингов на исследова- ние для каждых 7 фунтов стерлингов B W будет давать примерно оптимальный чистый выигрыш, если этот рас- ход произведен с наибольшей выгодой посредством соот- ветствующего выбора А и N. Эти результаты являются в лучшем случае прибли- женными и, возможно, не более чем очень грубыми до- гадками, но они указывают на то, что оптимальное вло- жение капитала в отбор разновидностей может быть гораздо большим, чем текущий уровень, даже если допу- стить, что математическая модель содержит столь боль- шие упрощения, что выглядит нелепой в глазах селек- пионеров! В других публикациях (Финни [108], [109], [110]) большее внимание уделено практическим аспек- там задачи и характеризации использованного здесь на- ивного подхода. Кое-что было также сказано по поводу отбора на двух или более ступенях (ср. § 9.9). Кажется, 
1о.5. «мАлвнькии черный ящик» 277  что дополнительные выигрыши от этого будут очень малыми, в особенности после второй ступени, но вычис- ления еще не закончены (Кернов [54]). Здесь целью было лишь дать эскиз еще одной задачи экономического планирования экспериментов.  10.5. «Маленький черный ящик»  Чтобы закончить эту книгу в более легком стиле, мы дадим краткую сводку о забавном, но поучительном ис- следовании, проведенном одной компанией (Esso Re- search and Engineering Company) (Макартур и Хейгл [69]). «Маленький черный ящик» содержит элек- трические сети сопротивлений. Имеется пять значений сопротивлений, контролируемых с помощью шкал, кото- рые проградуированы делениями от О до 85. Конструк- ция такова, что выход, читаемый на вольтметре, может быть сделанным функционально зависящим от значений, устанавливаемых на пяти шкалах, при этом допускается широкий выбор типов функций, которые могут иметь простые аддитивные эффекты по пяти «факторам» или могут иметь сложную систему взаимодействий. Цифер- блаты контролируются с помощью субъекта——экспери- ментатора или группы экспериментаторов. Вольтметр виден только оператору, который прибавляет к каждому показанию нормальное отклонение с определенной дис- персией H сообщает результат субъекту. Типичная «игра» с черным ящиком состояла в под- боре такого напряжения, которое помогло бы приспосо- биться к конкретной неизвестной функции от пяти пере- менных. Первоначально все циферблаты должны были быть установленными на деление 50 и это давало извест- ный (свободный от ошибки) урожай в 24 единицы. Субъекту было сказано, что черный ящик нужно рассмат- ривать как моделирующий промышленное предприятие, в котором максимальныи возможныи урожаи лежит ме- жду 24 и 50. Ему разрешалось делать столько испь1та- ний, сколько он пожелает, причем каждое испытание, будучи набранным на шкалах, приводило к наблюдению урожая, равного показанию вольтметра, читаемому с на- 
278 гл. ю. экономпкА ЭКСПЕРИМЕНТИРОВАННЯ  ложениой ошибкой, и его целью было отыскать удовлет- ворительное приближение к оптимальным условиям для пяти величии. Любое увеличение достигнутого ожидае- мого урожая должно было оцениваться в 500 ООО дол- ларов на единицу, но каждая сделанная проверка пред- ставляла расходы в 120000 долларов, противопоставляе- мые окончательной прибыли. Эти суммы, в особенности последняя, кажутся чрезмерно большими, но, конечно, речь идет о моделировании экспериментирования круп- ных масштабов и было бы желательным, чтобы субъект был несколько наказан за продолжение эксперимента за пределы ступени, на которой выигрыш должен быть, по- видитхтому, меньше стоимости дальнейшей проверки. K задачам с играми такого типа могут быть сведены действия многих различных субъектов, работающих по отдельности или же коллективами независимо друг ог друга. Сюда входят научные работники, администра- торы, матетиатики и ряд других лиц, часть из которых имеет опыт в области планирования экспериментов, а часть не имеет. Применялись многие различные страте- гии. Как правило, выбиралось изменение одного фак- тора за раз. Конечно, ситуация несколько отлична от ситуаций, предусмотренных для большинства рассмот- ренных в настоящей книге экспериментов, эксперимен- татор имеет урожай от каждого испытания (или уча- стка) перед тем, как он делает заключение о комбина- ции способов обработки, подлежащей проверке далее, так что даже такая простая многофакторная последова- тельная процедура, как изменение каждый раз одного фактора, может иметь достоинства. Популярными были также дробные факторные эксперименты, в особенности 1/4-реплика плана типа 25. Испытывались методы, при- надлежащие Боксу (§ 8.4), хотя большого знания дела при этом, по-видиъиому, не было проявлено. Согласно другой стратегии каждая комбинация уровней факторов рассматривалась как точка в пятимерном пространстве. Считалось, что каждая неудовлетворительная проверка из числа выполненных влечет за собой исключение части этого пространства из дальнейшего изучения, а точка для новой проверки выбиралась случайным образом из 
10.5. «МАЛЕНЬКИЙ ЧЕРНЫЙ ЯЩИК» 279  оставшейся части пространства. Это продолжалось до тех пор, пока не была найдена удовлетворительная точ- ка или комбинация уровней. Пробовались некоторые другие варианты этих стратегий, как, например, меняю- щиеся одновременно пары факторов. В одной такой игре максимальный возможный уро- жай был равен 40,5 (с точностью до колебаний погреш- ности). Структура взаимодействия переменных была сложной, но и стандартное отклонение ошибки было равно только 2,5 на одну проверку. Наилучшие чистые выигрыши получались C помощью двух субъектов, кото- рые оба основывали свои стратегии на дробных репли- ках (1/4-реплика плана типа 25 и 1/9-реплика плана типа 35), дополненных несколькими дальнейшими про- верками. Они выиграли соответственно 15,9 и 16,3 еди- ницы от максимума в 16,5 при 20 и 31 проверках, при этом чистые прибыли составили 5550000 (15,9>< ><500 000—20 >< 120 000) долларов и 4 430 000 долларов. Один представитель при методах Бокса увеличил уро- жай только на 9,0 единиц и, потребовав 34 проверки, дал прибыль только в 420 000 долларов‚— гораздо мень- шую, чем при наилучшем из направлений «один фактор каждый раз». Как другая крайность, многие субъекты достигли нулевого или очень малого (меньшего трех) увеличения урожая при значительных расходах на про- верки, и, таким образом, обнаружились значительные чистые потери. Даже сведения о том, что наилучшие ре- зультаты получались бы при дробных факторных пла- нах, сводятся на нет тем фактом, что два других иссле- дователя, пользовавшихся 1/4-репликами плана типа 25, или плохо выбирали их уровни, или оказывались не в состоянии достаточно хорошо интерпретировать свои данные для дальнейших проверок, добившись лишь не- значительного увеличения урожая и понеся чистые по- тери в размере 1 800000 и 2 690000 долларов. Возможно, многому можно было бы научиться в от- ношении исследования стратегий при экспериментах с «черным ящиком», используя большое множество раз- личных функций, но делать серьезные выводы из одного или двух опробованных случаев было бы неразумно. 
280 ГЛ. 10. ЭКОНОМИКА ЭКСПЕРИМЕНТИРОВАНИЯ  Авторы указывают (несомненно с более полным основа- нием, чем приведенное в их краткой статье) шесть основ- ных типов ошибок: i) робость: не исследуется вся область переменных посредством крупных шагов перед тем, как концентри- ровать внимание на одной области; 11) вхождение в колею: слишком быстро принимаются два или три хороших результата как указание на хоро- ший уровень одного фактора или существенный тренд; 111) вера в линейность: пренебрегают возможностью того, что эффекты могут He быть даже приближенно ли- нейными в важной области; iv) пренебрежение ошибкой: предполагают, что хо- рошие наблюдения должны соответствовать хорошим ожиданиям, даже если бы могли иметь место случайные сочетания отклонений положительной ошибки; V) отказ исключить не относящееся к делу: в одном эксперименте многие субъекты не в состоянии раскрыть, что одна величина не дает эффекта; vi) отсутствие склонности к остановке: некоторые субъекты He обращали должного внимания на стоимость проверки, когда никакого улучшения урожая уже не происходило, и продолжали проверки за пределами сту- пени оптимальнои выгоды. Очевидно, наилучшая стратегия зависит от функции, выбираемой для «черного ящика», и от дисперсии ошиб- ки. То, насколько испытание конкретных функций может помочь указать оптимальные типы используемых стра- тегий, когда функция полностью неизвестна, должно в свою очередь зависеть от степени, в которой испытывае- мые функции могут быть сделаны представителями встречающихся в реальной жизни функций. Следова- тельно, могут иметь место жесткие ограничения на ис- пользование «черного ящика>> как в качестве метода исследования оптимальной стратегии плана, так и в ка- честве метода обучения. Тем не менее он несомненно имеет значение как иллюстрация принципов, и занима- тельная статья Макартура и Хейгла может доставить удо- вольствие тем, кто считает Многое в Этой книге скучным. 
ЛИТЕРАТУРА  .Биллевич  . Бозе, Шрикхэнд  .Бокс (Вох, G. E. P.),  . Анскомб (Anscombe, F. J.), The validity of comparative ex-  periments, J. Roy. Stat. Soc., 111 (1948), 181—211. Анско M 6, Fixed-sample-size analysis of sequential observa- tions, Biometrics 10 (1954), 89-100.  .Армитейдж (Armitage, P.), Some sequential tests of Stu-  dent’s hypothesis, J. Roy. Stat. Soc., Suppl. 9 (1947), 250- 263.  . A у т в а й т, Р е 3 е р ф о р д (Outhwaite, A. D., Rutherford, A. A.),  Covariance analysis as an alternative to stratification in the control of gradients, Biometrics ll (1955), 431-440.  . Барнард (Barnard, G. A.), Sequential tests in industrial sta-  tistics, J. Roy. Stat, Soc., Suppl. 8 (1946), 1-26.  . Бартлетт (Bartlett, M. S.), The use of transformations, Bio-  metrics 3 (1947), 39-52.  . Б а тт е р м а н, Г р о c c M a Н (Batterman, R. C., Grossman, A. J.),  Effectiveness of salicylamide as an analgesic and antirheumatic agent, J. Amer. Med. Assoc. 159 (1955), 1619—1622. (Billewicz, W. Z.), Matched pairs in sequential trials for significance of a difference between populations, Bio- metrics 12 (1956), 283-300.  ‚Блекстер (Blaxter, K. L.), Starch equivalents, ration stan-  dards and milk production, Proc. Brit. Soc. of Animal Production, 1956, 1-31.  . Бозе (Bose, R. C.), On the application of Galois fields to the  problem of the construction of hyper-Graeco Latin squares, San- khya 3 (1939), 323-338.  .Бо3е, А note on Fisher's inequality for balanced incomplete  block designs, Ann. Math. Stat. 20 (1949), 619-620.  . Бозе, Буш (Bush, K. A.), Orthogonal arrays of strength two  and three, Ann. Math. Stat. 23 (1952), 508-524.  . Бозе, Коннор (Соппог, W. S.), Analysis of fractionally re-  plicated 2"’-3” designs, Bull. de l’lnst. Intern. de Stat. 37(3) (l960),14l——l60.  . Боз е, Н а ир (Nair, K. R.). Partially balanced incomplete block  designs, Sankliyéi 4 (1939), 337-372. (Shrikhande, S. S.), On the falsity of Euler’s conjecture about the non-existence of two orthogonal Latin squares of order 41+ 2, Proc. Nat. Acad. Sci. (U.S. A.) 45 (1959), 734-737. The exploration and exploitation of response surfaces: some general considerations and examples, Biometrics 10 (1954), 16-60. 
282  17  18.  19. 20.  21. 22.  ЛИТЕРАТУРА  Бокс, Evolutionary operation: a method for increasing indus- trial productivity, Appl. Stat. 6 (1957), 81-101. Бокс, Дрейпер (Draper, N. R.), А basis for the selection of a response surface design, J. Amer. Stat. Assoc. 54 (1959), 622- 654. Boxc, Унлсон (Wilson, K. B.), On the experimental attain- ment of optimum conditions, J. Roy. Stat. Soc. B13 (1951), 1-45. Бокс, Хантер (Hunter, J. S.), Multifactor experimental de- signs for exploring response surfaces, Ann. Math. Stat. 28 (1957), 195-241. Бокс, Хантер, Condensed calculations for evolutionary ope- ration programs, Technometrics 1 (1959), 77-95.  Boxc, Юл (Youle P. У) The exploration and exploitation  _ of response surfaces: an example of the link between the fitted  23. 24. J 25. 26.  27.  28. Н 29. 30.  31.  J 32. 33. 34. 35. 36. 37.  surface and the basic mechanism of the system Biometrics 11 (1955), 287-323. Бросс (Bross, 1.), 45 (1950), 530-540. Bpocc, Sequential medical plans, Biometrics 8 (1952), 188- 207. Буш (Bush, K. A.), Orthogonal arrays of index unity, Ann. Math. Stat. 23 (1952), 426-434. B альд (Wald, A.), Sequential Analysis, New York, John Wiley, 1947 (русский перевод: А. Вальд, Последовательный анализ, Фнзматгиз, 1960). B ИЛЬЯ мс (Williams, E. J.), Experimental designs balanced for the estimation of residual effects of treatments, Austral. J. Sci. Res. A2 (1949), 149-168. B ИЛЬЯ MC, Experimental designs balanced for pairs of residual effects, Austral. J. Sci. Res., A 3 (1950), 351-363. ВИЛЬЯ м c, Experimental designs for serially correlated obser- vations, Biometrika 39 (1952), 151-167. Гаррис‚ Горви Ц, Муд (Harris, M., Horvitz, D. G., Mo- od, A. M.), On the determination of sample sizes in designing experiments, J. Amer. Stat. Assoc. 43 (194-8), 391-402. Гранди, Рис, Хили (Grundy, P. M., Rees, D. Н., Не- а1у, M. J. R.), Decision between two alternatives—how many ex- periments?, Biometrics 10 (1954), 317-323. Гранди, Хили, Restricted randomization squares, J. Roy. Stat. Soc. B 12 (1950), 286-291. Гранд и, Хил и, Рис, Economic choice of the amount of ex- perimentation, J. Roy. Stat. Soc. B 18 (195-6), 32-55. Д а н нет (Dunnett, C. W.), On selecting the largest of la normal population means, J. Roy. Stat. Soc B22 (1960), 1-40. Д а ннет, The Statistical Theory of Drug Screening, D. Sc. the- sis, Univ. of Aberdeen, 1960. Дейвис (Davies, O. L., ed.), The Design and Analysis of In- dustrial Experiments, London, Oliver and Boyd, 1954. Дейви c, The design of screening tests in the pharmaceutical industry, Bull. de 1‘lnst. Intern. de Stat. 36 (3) (1958), 226- 241.  Two-choice selection, J. Amer. Stat. Assoc.  and quasi—Latin 
38.  39.  40. 41.  42. 4-3. 44. 45. 46.  47. 48. 49.  50.  51.  52. 53. 54." 55.  56. 57.  58.  ЛИТЕРАТУРА 233  Дейви c, Хей (Hay, W. A.), The construction and uses of fractional factorial designs in industrial research, Biometrics 6 (1950). 233—249. Де Л ур и (De Lury, D. B.), The analysis of Latin squares when some observations are missing, J. Amer. Stat. Assoc. 41 (1946), 370-389. Джеллинек (Jellinek, E. M.), Clinical tests on comparative effectiveness of analgesic drugs, Biometrics 2 (1946), 87—91. Иэйтс (Yates, F.), The formation of Latin squares for use in field experiments, Empire J. Experimental Agriculture 1 (1933), 235-244. Иэйтс, Complex experiments, J. (1935), l81—247. Иэйтс, Incomplete Latin squares, J. Agricult. Sci. 26 (1936), 301-315. Иэйтс, А new method of arranging variety trials involving a large number of varieties, J. Agricult. Sci. 26 (1936), 424-455. Иэйтс, The design and analysis of factorial experimens, Impe- rial Bureau of Soil Science Technical Communication 35 (1937). Иэйтс, The recovery of inter-block information in variety trials arranged in three-dimensional lattices, Ann. Eugen, 9 (1939), 136-156. Иэйтс, The design of rotation experiments, Commonwealth Bureau of Soil Science Technical Communication 46 (1949). Иэйтс, Principles governing the amount of experimentation in developmental work, Nature 170 (1952), 138. Иэйтс, Хейл (На1е, R. W.), The analysis of Latin" squares when two or more rows, columns, or treatments are missing, J. Roy. Stat. Soc., Suppl. 6 (1939), 67—79. Калмус (Kalmus, Н.). A factorial experiment on the mine- ral requirements of a Drosophila culture, Amer. Naturalist 127 (1943), 376-380. Кем пторп (Kempthorne, 0.), A simple approach to con- founding and fractional replication in factorial experiments, Bio- metrika 34 (1947), 255-272. Кемпторн, The Design and Analysis of Experiments, New York, John Wiley, 1952. Ken уй (Quenouille, M. H.), The Design and Analysis of Experi- ment, London, Charles Griffin, 1953. Кернов (Curnow, R. N.), The Statistical Theory of Selection, Ph. D. thesis. Univ. Aberdeen, 1959. Kep HOB, The consequences of errors of measurement for selec- tion from certain non—normal distributions, Bull. de 1’lnst. Intern. de Stat. 37 (3), (1960), 291-308. К е p H o B, Статья в печати. Китага ва, М итом е (Kitagawa, T., Mitome, M.), Tables for the Design of Factorial Experiments, Tokyo, Baifukan, 1953 (текст на японском, таблицы на анг.т1.). Кишен (Kishen, К), Оп fractional replication of the general symmetrical factorial design, J. Indian Soc. Agricult. Stat. 1 (1948), 91-106.  Roy. Stat. Soc., Suppl. 2 
284  59. 60.  61.  62. 63.  64. 65.  66. 67.  68.  69. 70. 71.  72. 73. 74.  75. 76.  77. 78.  ЛИТЕРАТУРА  Кишен, Recent developments in experimental design. Proc. of 45-th Indian Science Congress, 1958, 1-32. Кишен, Рао (Rao, C. R.), An examination of various inequa- lity relations among parameters of the balanced incomplete block design, J. Ind. Soc. Agricult. Stat. 4 (1952), 137-144. Кокс Д. (Сох, D. R.), The use of a concomitant variable in selecting an experimental design. Biometrika 44 (1957), 150- 158. Кокс Д., Planning of Experiments, New York, John Wiley and Sons, 1958. Кокс Г., Кохрэн (Сох, G. M., Cochran, W. G.), Designs of greenhouse experiments for statistical analysis, Soil. Sci. 62 (1946), 87-98. Кохрэн, Long-term agricultural experiments, J. Roy. Stat. Soc., Suppl. 6 (1939), 104—148. Кохрэн, Some consequences when the assumptions for the analysis of variance are not satisfied, Biometrics 3 (1947), 22-38. Кохрэн, Кокс Г., Experimental Designs, 2-nd ed., New York, John Wiley and Sons, 1957. Кэльвин (Calvin, L. D.), Doubly balanced incomplete block designs for experiments in which the treatment effects are corre- lated, Biometrics 10 (1954), 61-88. Л а к ш м и н а р а й а н (Lakshminarayan), The Construction and Combinatorial Properties of Latin Squares and Balanced Sequen- ces, Ph. D. thesis, Univ. Aberdeen, 1958. Maxapryp, Хейгл (McArthur, D. S., Hefgl, .1. J.), Strategy in research. Trans. Amer. Soc. Quality Control, 1957, 1——18. Моррисон (Morrison, M.), Fractional replication for mixed series, Biometrics 12 (1956), 1—19. Муд (Mood, A. M.), Erratum: on the determination of sample sizes in designing experiments, J. Amer. Stat. Assoc. 46 (1951), 515. Нортон (Norton, Н. W.), The 7>< 7 squares, Ann. Eugen. 9 (1939), 269-307. Паркер (Parker, E. T.), Orthogonal Latin squares, Proc. Nat. Acad. Sci. (U. S. А.) 45 (1959), 859-862. Патерсон (Patterson, H. D.), The analysis of the results of a rotation experiment on the use of straw and fertilizers, J. Agri- cult. Sci. 43 (1953), 77-88. Патерсон, Лукас (Lucas, H. L.), Extra-period change-over designs. Biometrics 15 (1959), 116-132. Пирс (Pearce, S. С), Field Experimentation with Fruit Trees and Other Perennial Plants, Farnham Royal, Commonwealth Agri- cultural Bureaux, 1953. Пирс, Тейлор (Taylor, J.), The changing of treatments in a long-term trial, J. Agricult. Sci. 38 (1948), 402-410. Питмен (Pitman, E. J. G.), Significance tests which may be applied to samples from any population. 111, The analysis of va- riance test, Biometrika 29 (1937), 322-335. 
79. 80. 81.  82. 83.  84. 85. 86.  87. 88.  89.  90.  91.  93. 94.  95.  96.  98. 99.  .Финни,  ЛИТЕРАТУРА 235  Плэкетт (Plackett, R. L.), Some generalizations in the multi- factorial design, Biometrika 33 (1946), 328-332. Плэкетт, Бермен (Burman, J. P.), The design of optimum multifactorial experiments, Biometrika 33 (1946),. 305-325. Pao (Rao, C. R.), Factorial experiments derivable from combi- natorial arrangements of arrays, J. Roy. Stat. Soc., Suppl. 9 (1947), 128-139. Робертсон (Robertson, А.), Optimal group size in progeny testing and family selection, Biometrics I3 (1957), 442-450. CaKceHa (Saxena, P. N.), А simplified method of enumera- ting Latin squares by MacMahon’s differential operators. II, J. Indian Soc. Agricult. Stat. 3 (1950), 24—79. Сейд (Sade, А.), Enumeration des carrés latins: application au 7° ordre, Marseille, Imprimerie de Pharo, 1948. C M ит, Х а р тли (Smith, C. A. B., Hartley, H. O.), The construc- tion of Youden Squares, J. Roy. Stat. Soc. B 10 (1948), 262-263. Стейн (Stein, C.), А two-sample test for a linear hypothesis whose power is independent of the variance, Ann. Math. Stat. 16 (1945), 243-258. C т и в ен c (Stevens, W. L.), The completely orthogonalized Latin square, Ann. of Eugenics 9 (1939), 82-93. Сэмпфорд (Sampford, M. R.), Methods of construction and analysis of serially balanced sequences, J. Roy. Stat. Soc., B19 (1957), 286-304. Тишер (Tischer, R. G.), Кемпторн, Influence of variations in technique and environment on the determination of consistency of canned sweet corn, Food Technology 5 (1951), 200-203. Тхавани (Thavani, V. D.), А simple method of construction of symmetrical confounded factorial designs, J. Indian Soc. Agri- cult. Stat. 4 (1952), 124-136. Тэ р р и (Таггу, G.), Le probleme des 36 officiers, Compte Rendu de l’Association francaisc pour l’Avancement des Sciences 29 (2) (1900), 170-203.  .Уэлч (Welch, B. L.), On the 2-test in randomized blocks and  Latin squares, Biometrika 29 (1937), 21-52. Федерер (Federer, W. T.), Experimental Design, New York, MacMillan Co, 1955. Федерер, Шлотфельдт (Schlottfeldt, C, S.), The use of covariance to control gradients in experiments, Biometrics 10 (1954), 282-290. Фельдт (Feldt, L. S.), А comparison of the precision of three experimental designs employing a concomitant variable, Psycho- metrika 23 (1958), 335-353. Ф нн н и (Finney, D. .l.), Some orthogonal properties of the 4><4 and 6 >< 6 Latin squares, Ann. Eugen. 12 (1944), 213-219. The fractional replication of factorial arrangements, Ann. Eugen. 12 (1945), 291-301. Финн и, Orthogonal partitions of the 5 >< 5 Latin squares, Ann. Eugen. 13 (1946), 1-3. Фин н и, Orthogonal partitions of the 6 >< 6 Latin squares, Ann Eugen. 13 (1946), 184-196. 
286  100. 101.  102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113.  114.  I15. 116.  ЛИТЕРАТУРА  Ф и н н и, Recent developments in the design of field experiments. I, Split-plot confounding, J. Agricult. Sci. 36 (1946), 56-62, Ф ын н и, Recent developments in the design of field experiments, ll, Unbalanced split-plot confounding, J. Agricult. Sci. 36 (1946), 63-68. Финны, The fractional replication of factorial arrangements- a correction, Ann. Eugen. I5 (1950), 276. Финны, Statistical Method in Biological Assay, London, Char- les Griffin, 1952. Ф ин н ы, Response curves and the planning of experiments, Ind. J Agricult. Sci. 23 (1953), 167-186. Ф nu Н и, Experimental Design and Its Statistical Basis, Chicago, University of Chicago Press, 1955. Ф ы пни, The statistician and the planning of field experiments, J. Roy. Stat. Soc. А119 (1956), 1-27. Финн и, Stratification, balance and covariance, Biometrics 13 (1957), 373-386. Финны, Plant selection for yield improvement, (1958), 83~——l06. Фи ини, Statistical problems of plant selection, Bull. de l’lnst. Intern, de Stat. 36 (3) (1958), 242-268. Финн и, А simple example of the external economy of varietal selection, Bull. de l’Inst. Intern. de Stat. 37 (3) (1960), 91-—106. Ф11 нни, Аутвайт (Outhwaite, A. D.), Serially balanced se- quences, Nature 176 (1955), 748. Ф и н н и, Аутв а fir, Serially balanced sequences in bioassay, Proc. Roy. Soc. B 145 (1956), 493-—5О7. Финны, Коуп (Соре, F. W.), The statistical analysis of a complex experiment involving unintentional constraints, Biomet- rics I2 (1956), 345-368. Ф и ш е р (Fisher, R. A.), An examination of the different possible solutions of a problem in incomplete blocks, Ann. Eugen. 10 (1940), 52—75. Фишер, The theory of confounding in factorial experiments in relation to the theory of groups, Ann. Eugen. 11 (1942), 341-353, Фишер, А system of confounding for factors with more than two alternatives, giving completely orthogonal cubes and higher powers, Ann. Eugen. 12 (1945), 283—290.  Euphytica 7  ‚Фишер, The Design of Experiments 6th ed., London, Oliver  and Boyd, 1951.  . Фишер, Sequential experimentation, Biometrics 8 (1952), 183—  188.  . Фишер, Statistical Methods and Scientific Inference, London,  Oliver and Boyd, 1956.  . Ф 11 ш е р, И э й т c (Yates, F.), The 6 >< 6 Latin squares, Proc.  Cambr. Phil. Soc. зо (1934), 492-507.  . Ф и ш е р, И э й т c, Statistical Tables for Biological, Agricultural  and Medical Research, London, Oliver and Boyd, 1957.  . Фримен (Freeman, G. H.), Some exper'ment.al designs of use  in changing from one set of treatments to another, J. Roy. Stat. Soc. B 19 (1957), 154-165. 
123. 124. 125.  126. 127. 128.  129.  130.  131. 132. 133.  134. 135. 136.  137.  138. 139.  140.  ЛИТЕРАТУРА. 287  Фрпмен, Families of designs for two successive experiments, Ann. Math. Stat. 29 (1958), 1063—1078. Фримен, The use of the same experimental material for more than one set of treatments, Applied Stat. 8 (1959), 13-20. Хартли, Шрикхэн д, Тейлор (Hartley, H. 0., Shrikhan- de, S. S., Taylor, W. B.), A note on incomplete block designs with row balance, Ann. Math. Stat. 24 (1953), 123-126. Харшбарг ер (Harshbarger, B.), Rectangular Lattices, Vir- ginia Agricultural Experiment Station. Memoir 1, 1947. Х а p ш б а р ге р, Triple rectangular lattices, Biometrics 5 (1949), 1—13. Хервик, Уэлч, Патнем, Гамбоа (Herwick, R. W., Welch, H., Putnam, L. E., Gamboa, A. M.), Correlation of the purity of penicillin sodium with intramuscular irritation in man, J. Amer. Med. Assoc. 127 (1945), 74--76. X ИЛЛ (Hill, A. B.), The clinical trial, Brit. Med. Bull. 7 (1951), 278-282. Х о б л и н (НоЫуп, T. N.), П И р с, Ф р и м е н, Some considera- tion in the design of successive experiments in fruit plantations, Biometrics 10 (1954), 503-515. Хьюарт (Hewart), Per Lord Hewart, C. J., B «Rex v. Succex Justices». Ex parte McCarthy, 1 K. B. (1924), 256, 259. Чернов (Chernoff, Н), Locally optimal designs for estimating parameters, Ann. Math. Stat. 24 (1953), 586—602. Чинлой, Иннес, Финни (Chinloy, T., Innes, R, F.), An example of fractional replication in an experiment on sugar cane manuring, J. Agricult. Sc.i.__43 (1953), 1—11. Чью (Chew, V.), ed., Experimental Designs in Industry, New York, John Wiley, 1958. Шр и кхэнд, The impossibility oi certain symmetrical balanced incomplete block designs, Ann. Math. Stat. 21 (1950), l06—1l1. Ш ютцен берже (Schijtzenberger, M. P.), A non—existence theorem for an infinite family of symmetrical block designs, Ann. Eugen. 14 (1949), 286-—287. Эйлер (Euler, L.), Recherches sur une nouvelle espéce de quar- rés inagiques, Verhandelingen uitgegeven door het Zeeuwsch Ge- nootschap der Weterschappen te Vlissingen 9 (1782), 85—239. Элфвинг (Elfving, G.), Optimum allocation in linear regres- sion theory, Ann. Math. Stat. 23 (1952). 255-262. Юден (Youden, W. J.), Use of incomplete“ block replications in estimating tobacco mosaic virus, Contributions of the Boyce Thompson Institute 9 (1937), 41-48. Юден, Experimental designs to increase accuracy of greenhouse studies, Contributions of the Boyce Thompson Institute 11 (1940), 219-228. 
Д. Финны  Введение в теорию планирования экспериментов  М.. 1970 г.‚ 288 стр.  Редакторы С. М. Ермаков, М. М. Горячая Техн. редактор К. Ф. Брудно Корректор Е. Я. Гороховская  Сдано в набор 11/\/111 1969 г. Подписано к печати 7/V 1970 г. Бумага 84><108‘/зд. Физ. печ. л. 9 Условн. печ. л. 15.12. Уч.-изд. л. l5.l0. Тираж 22600 экз. Цена книги 1 р. 27 к. Заказ N9 266.  Издательство «Наука» Главная редакция физико-математической литературы  Москва, В-71, Ленинский проспект, 15.  Ордена ТРУдового Красного Знамени Ленинградская типография N9 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете [Чинистров СССР. Измайловский проспект, 29. 
517.8 Ф 59 УДК 51924/27  AN INTRODUCTION TO  THE THEORY OF EXPERIMENTAL DESIGN  D. J. FINNEY  Reader in statistics and director of A. R. C. unit of statistics University of Aberdeen  THE UNIVERSITY OF CHICAGO PRESS  Введение в теорию планирования экспериментов. Д. Финни, перев. с англ., Главная редакция физико-ма- тематической литературы изд-ва «Наука», 1970.  Книга представляет собой введение в I-1oBbn”1, быстро развиваю- щийся отдел статнстикн-планирование экспериментов. Дан широ- кий обзор математических методов, применяемьтх в планировании. Обзор содержит и такие совсем новые методы, как методы после- довательного планирования эксперимента. Библ. — 140 назв.  2-2-3  36-70