Текст
                    Дж. КЛИР
СИСТЕМОЛОГИЯ
Автоматизация
решения
системных
задач
ARCHITECTURE
OF SYSTEMS
PROBLEM SOLVING

ARCHITECTURE OF SYSTEMS PROBLEM SOLVING GEORGE J. KLIR State University of New York at Binghamton Binghamton, New York PLENUM PRESS • NEW YORK AND LONDON
Аж. КЛИР СИСТЕМОЛОГИЯ Автоматизация эешения системных задач Перевод с английского М. А. Зуева Под редакцией А. И. Горлииа Москва «Радйои связь» 1990
УДК 007:681.518.2 Клир Дж. Системология. Автоматизация решения системных задач: Пер. с англ.—М.: Радио и связь, 1990.—544 с.: ил.—ISBN 5-256-00649-5. В книге известного американского ученого дана иерархическая классифика- ция систем и системных задач, предложены методы решения некоторых классов задач. Все понятия вводятся в контексте универсального решателя системных за- дач (УРСЗ) — предлагаемой автором оригинальной архитектуры экспертной си- стемы, решающей системные задачи. Язык УРСЗ позволяет свести описание всего многообразия системных задач к относительно небольшому числу формулировок. Методы их решения ориентированы на использование ЭВМ. Приведено много примеров, облегчающих использование описанных теоретических идей при реше- нии задач. Для научных работников в области теории систем, информатики, разработ- чиков экспертных систем и архитектуры вычислительных комплексов. Табл. 53. Ил. 137. Библиогр. 362 назв. Редакция переводной литературы „ 1402050000—090 К 046(01)—90 22-90 ISBN 5-256-00649-5 (рус.) ISBN 0-306-41867-3 (англ.) © 1985 Plenum Press New York © Перевод на русский язык. Зуев М. А., 1990. © Предисловие к русскому изданию, примечания. Горлин А. И., 1990
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Трудно в последнее время встретить научную или техническую статью, а тем более книгу, в которой бы много раз, иногда на каж- дой странице, не встречалось бы слово «система». И это отнюдь не случайность и тем более не дань моде. Сейчас большинство облас- тей науки находится на этапе осмысления полученных результатов, приведения их в систему. При этом по большей части понятие «си- стема» используется на интуитивном уровне н служит обозначе- нием таких общих понятий, как целое, составленное из частей, мно- жество элементов, образующих некое единство, или даже порядок, объединяющий множество элементов. Однако с конца 30-х годов системы являются предметом иссле- дования математиков, рассматривающих изучение «систем вообще» как логико-математическую дисциплину, занимающуюся изомор- физмом системных понятий, законов и моделей в разных предмет- ных областях. Эта дисциплина называется по-разному: системоло- гия, теория общих систем, общая теория систем, системотехника и т. п. Системология переживает период бурного развития, посколь- ку она занимается чрезвычайно актуальными проблемами поиска математических методов решения междисциплинарных задач. Очень приблизительно в системологии можно выделить два ос- новных подхода. При первом подходе системология рассматрива- ется как расширение и обобщение теории управления. С этим под- ходом связаны работы М. Месаровича и его школы, А. М. Летова, К. Боулдинга и многих других известных ученых. Второй подход, можно было бы назвать кибернетическим или структуралистским. При этом подходе особое внимание уделяется структурным харак- теристикам системы, а не характеристикам описывающих ее функций, таким, например, как линейность, стационарность или гладкость. С этим направлением в системологии связаны работы П. фон Берталанфи, У. Росс Эшби, Н. Винера и др. К данному направлению принадлежат и работы автора данной монографии Дж. Клира. Немного об авторе. Дж. Клир один из самых известных специа- листов по системологии, профессор и декан факультета системоло- гии Университета шт. Нью-Йорк, автор более чем 100 статей и 14 книг, редактор журнала International Journal of General Systems, консультант фирм IBM и Bell и т. д. и т. п. Но самое главное для 5
читателя данной книги — это то, что Дж. Клиру принадлежит ори- гинальный, целостный и конструктивный подход к системологии, который в нескольких словах можно охарактеризовать следующим образом. Предлагается формализация семантики и логики обще- системных понятий, позволяющая определить иерархическую клас- сификацию систем. На основе этой классификации систем и парал- лельно с ней строится соответствующая классификация системных задач и методов их решения. При этом основное внимание уделяет- ся дискретным методам, ориентированным на использование ком- пьютеров на всех стадиях системных исследований. На наш взгляд, центральными понятиями предлагаемого Дж. Клиром подхода являются понятия порождающей и структу- рированной систем, на основе которых он и строит свой достаточно простой и гибкий формализм. Особую ценность этому формализму придают два обстоятельства. Во-первых, это достаточно гибкий аппарат, позволяющий описывать очень широкий спектр систем и системных задач. Во-вторых, весь спектр этих задач поддается ре- шению с помощью относительно небольшого числа методов, кото- рые также образуют некую иерархию. Данная книга представляет очень стройное и последовательное изложение системологии по Клиру. К основным особенностям дан- ной книги следует отнести ее многоплановость. Эту книгу можно читать как монографию по системологии, в которой наряду с резуль- татами Дж. Клира и его школы дается очень хороший и ясный об- зор других результатов, полученных в этой области и в смежных областях. При этом необходимо отметить широту научного круго- зора автора, использующего работы из самых разных отраслей ма- тематики, таких как теория вероятностей и теория категорий, тео- рия графов и теория нечетких множеств, математический анализ и искусственный интеллект и многих других.. С другой стороны, эту книгу можно рассматривать и как практи- ческое руководство по решению системных задач, поскольку в кни- ге приводится множество примеров использования предлагаемых методов для решения вполне конкретных задач из самых иногда неожиданных областей. На наш взгляд, конкретные примеры, на долю которых приходится около трети объема книги, представляют большую ценность, поскольку дают очень четкое представление о том, как по существу немедленно использовать предложенные автором подходы. В этом смысле книга Дж. Клира выгодно отли- чается от многих книг по теории систем, в которых теоретический материал часто вообще никак не интерпретируется. Еще одним чрезвычайно интересным аспектом этой книги явля- ются философские эссе о системологии и вообще о естественных науках, которыми открывается каждая глава. В этих эссе наряду с мыслями автора приводится множество выдержек из работ со- временных ученых, касающихся таких важных общетеоретических 6
вопросов, как непрерывность и дискретность, часть и целое, слож- ность, подобие, инвариантность, изменчивость и др. В совокупности эти отрывки составляют небольшой трактат по философии науки. Далеко не все его положения представляются бесспорными, одна- ко в коротком предисловии не место комментировать такие слож- ные понятия. Читатель сам, в соответствии со своим опытом и склонностями, сможет составить мнение о философских положени- ях этой книги. У этой книги имеется еще одна особенность — она построена как описание очень интересного программного проекта: экспертной системы для решения системных задач — Универсального Решате- ля Системных Задач (УРСЗ). Все системные понятия формализу- ются в книге на языке этой гипотетической экспертной системы. В книге последовательно разрабатывается база знаний этой систе- мы н обсуждаются различные аспекты ее интерфейса с пользовате- лем. УРСЗ — не работающая система, а очень большой проект, однако некоторые его компоненты уже реализованы сотрудниками Дж. Клира. В этом смысле УРСЗ заслуживает внимания специа- листов, поскольку, как нам кажется, этот проект открывает новые перспективы перед разработчиками экспертных систем. И, наконец, главное назначение этой книги—учебник по систе- мологии. После вышесказанного может создаться впечатление, что это очень сложная книга, предназначенная только для узких спе- циалистов. Это не совсем так. Чтение этой книги требует, разумеет- ся, определенной математической культуры, однако в целом она написана вполне доступно и, что важно, хорошо структурирована, так что позволяет читателю выбрать подходящий для него уровень изложения. В частности, относительно сложные математические рассуждения выделены, и при чтении их можно пропускать без ущерба для основного материала. Кроме того, доказательства ос- новных теорем вынесены в приложения. Из вышесказанного, надеюсь, видно, что лежащая перед чита- телем книга — это весьма нетривиальное издание, представляю- щее интерес и для студентов, так или иначе занимающихся изуче- нием системологии, и для специалистов по теории систем и искус- ственному интеллекту, и особенно для стремительно расширяюще- гося круга ученых, занимающихся междисциплинарными исследо- ваниями. А. Горлин
Памяти У. Росс Эшби Труднее всего увидеть то, что прямо перед тобой Гете ПРЕДИСЛОВИЕ Одним из критериев того, к какой категории относится та или иная книга, является ее назначение: используется она для одной или служит многим целям. Данное издание относится к категории книг многоцелевого назначения, но прежде всего это учебник, не- обходимый аспирантам и студентам старших курсов и полезный также для всех курсов при изучении фундаментальных понятий си- стемологии, основных категорий системных задач и некоторых до- статочно общих методов их решения. Уникальная особенность данной книги состоит в том, что эти понятия, задачи и методы вводятся в процессе формализации архи- тектуры некоторой экспертной системы, называемой универсаль- ным решателем системных задач (УРСЗ). Назначение УРСЗ — предоставить различным пользователям компьютеризованные зна- ния и методы системологии. Разрабатываемая в этой книге архи- тектура УРСЗ поясняется схемой изложения, облегчающей прак- тическое введение в теорию систем — понятия, задачи и методы. Основы науки о системах излагаются теперь не только в курсах системологии, информатики и программирования, но входят и в учебные программы по многим другим предметам. И хотя уровень преподавания науки о системах у студентов, специализирующихся по системологии или системотехнике, отличается, разумеется, от уровня преподавания этой науки для студентов других специаль- ностей, данная книга построена так, чтобы удовлетворить и тех, и Других. В курс системологии и системотехники текст книги должен входить целиком, включая приложения. Материал этой книги даст студентам обширную базу для дальнейших исследований, имея ко- торую студент при изучении более сложных п специализированных вопросов сможет сохранить общую перспективу исследований. Он сможет определить место любого вопроса в общей архитектуре УРСЗ, разглядеть в более широкой перспективе взаимосвязь раз- личных вопросов и воспользоваться своими знаниями для разра- ботки содержательной программы самостоятельных исследований. При использовании книги в курсе, предназначенном для сту- дентов, изучающих различные традиционные дисциплины, некото- рые части текста могут быть опущены. Начало и конец фрагментов, которые при чтении могут быть пропущены без ущерба для пони- 8
мания последующих частей книги, помечены соответственно знака- ми Д и ▼. Эти фрагменты содержат математическую интерпрета- цию материала, для общего понимания которого достаточно его изложения на концептуальном уровне и иллюстрации на примерах. Выделены также фрагменты, содержащие конкретные методологи- ческие альтернативы, несущественные для общего понимания основ системологии. В зависимости от целей курса (или задач чи- тателя) выделенные фрагменты можно или совершенно исключить из рассмотрения, или пропустить при первом чтении. Кроме своего основного назначения как учебника, данная книга адресуется также ученым и специалистам, работающим в самых разных областях. Растет интерес к новейшим достижениям систе- мологии, которые можно использовать в индивидуальных работах. Эта книга будет особенно полезна для специалистов, принимаю- щих участие в междисциплинарных исследованиях. Полагаю, что данная книга окажется удобным справочником для всех, кто занимается системными исследованиями и использу- ет их результаты в своей работе, а также для специалистов по экс- пертным системам. Теоретики системологии найдут в книге бога- тый источник нерешенных задач, а практики — общие методы, имеющие широкое применение. В то время как большинство описанных в литературе эксперт- ных систем создано для предоставления пользователю экспертных консультаций по традиционным дисциплинам (таким, как опреде- ленные разделы медицины, геологии, химии или права), УРСЗ предназначен для оказания помощи системных задач. Он осуще- ствляет экспертизу в области си- стемных знаний и методологии и, следовательно, работает как бы поверх барьеров, разделяю- щих традиционные области зна- ния. В этом смысле книга будет полезным справочником для раз- работчиков экспертных систем и даже для проектировщиков архи- тектуры вычислительных систем, поскольку именно компьютера должна определяющую ее решения системных наоборот. Последовательность чтения от- дельных глав и разделов книги четко определена н в виде схемы приводится на рис. П.1. Так как архитектура отражать архитектуру задач, а не пользователю при решении Рис. П.1. Возможные последователь- ности чтения глав и разделов книги 9
на этой схеме есть разветвления, то имеется несколько альтерна- тивных путей изучения материала. Прежде всего следует прочитать гл. 1, содержащую введение. Главы 2—5 составляют стержень кни- ги и, как показано на схеме, связаны одна с другой. В этих главах вводятся все основные типы систем и ключевые категории систем- ных задач. Один из способов изучения материала состоит в том, чтобы сначала изучить основные главы, а затем — остальные. Дру- гой способ — после изучения очередной основной главы читать соответствующие разделы гл. 7 (целенаправленные системы) и гл. 8 (подобие систем). Главу 6, посвященную сложности систем, можно прочитать практически в любое время. Последняя, гл. 9, в которой УРСЗ рассматривается целиком, должна быть прочита- на в последнюю очередь. Необходимые для чтения математические знания ограничива- ются материалом, обычно входящим в односеместровый курс по ко- нечной математике. Полезно, но не обязательно иметь некоторое представление о методах вычислений. Специальные математиче- ские понятия, такие, как энтропия Шеннона, нечеткая мера или метрическое расстояние, вводятся в книге до их использования. Для быстрого наведения справок в приложениях А и Б приводятся: список используемых математических символов и толковый сло- варь математических терминов соответственно. Чтобы свести к минимуму отступления от основного текста, большая часть библиографических, исторических, терминологиче- ских и других заметок включена в примечания, сопровождающие отдельные главы. Они помещены в конце каждой главы, пронуме- рованы, и на них при необходимости даны ссылки в основном тексте. Следует упомянуть еще об одной особенности этой книги. Каж- дая глава и каждый раздел предваряются цитатой, описывающей суть содержащегося в главе или разделе материала. Назначение этих тщательно подобранных эпиграфов, апеллирующих к правой полусфере мозга читателя, — передача ключевых идей книги. Я думаю, что в одних случаях эпиграфы помогут читателю понять следующий за ними материал, в других же — изучаемый материал поможет правильно понять и оценить эпиграф. Во всяком случае я уверен, что эпиграфы будут способствовать процессу изучения и сделают его чуть более приятным. Джордж Клир Бингемтон, Нью-Иорк.
БЛАГОДАРНОСТИ Появление этой книги стало возможным прежде всего благодаря щедрой поддержке Нидерландского института перспективных исследований в Вассеиааре, где я работал в качестве приглашенного исследователя в 1975—1976 и 1982— 1983 академических годах. Ключевые идеи этой книги созрели во время первого моего пребывания в институте, а, собственно, писал я ее уже во время второго. Когда я второй раз работал в институте в августе 1982 г., почти весь мате- риал для книги был подготовлен, разобран и апробирован в аудитории. Большая часть исследовательской работы, связанной с УРСЗ, была сделана иа факультете системных исследований Школы передовой технологии Университета шт. Нью- Йорк, Бингемтон. Некоторые из этих работ, в частности относящиеся к гл. 4, были финансированы Национальным научным фондом по контрактам ENG-78-18954 и ECS-80-06590. Многие аспиранты, специализирующиеся в системологии в Университете шт. Ныо-Иорк в Бингемтоне, приняли непосредственное участие в этих исследо- ваниях. Прежде всего, это Р. Кавалло, А. Чанг, Д. Эллайас, Р. Джерарди, А. Хай, М. Хигаши, М. Мариано, Б. Парвиц, М. Питарелли, А. Рамер, С. Сан- кетта и X. Уиттенхсв. Другие студенты внесли свой вклад в виде курсовых ра- бот или групповых проектов. Развитие ключевых идей данной книги в большой степени обязано влиянию А. Свободы, моего научного наставника и близкого друга, а также личным кон- тактам с многими коллегами во всем мире, особенно с У. Россом Эшби, Г. Брок- строй, Б. Гейизом, И. Кейа, Л. Лофгреном, У. Лоуэиом, Р. Орчардом, Ф. Пихле- ром, Р. Розеном, Л. Заде и Б. Пойглером. Я очень признателен двум людям, которые очень помогли мне в работе над рукописью, — Майклу Питарелли и Марине Форман. Майкл внимательно прочел всю рукопись, проверил все математические формулы и примеры и решил все упражнения. Результатом его тщательной работы над первым вариантом руко- писи было внесение в нее многочисленных изменений, от которых рукопись су- щественно выиграла. Марина перепечатала практически всю рукопись в течение моего пребывания в Нидерландском институте перспективных исследований в 1982—1983 гг. Она не только великолепно печатала, но ежедневно ободряла меня. В книге множество превосходных цитат, и я приношу благодарность изда- тельствам за разрешение использовать нх материалы. Это Academic Press, Addi- 11
sion-Wesley, American Scientist, Cornell University Press, Entropy Limited, Estate of Buckminster Fuller, Cordon and Breach, Institute of Electrical and Elec- tronic Engeneers, International Institute for Applied Systems Analysis, John Wiley, Alfred A. Knopf, Longmans, Green and Co.. Nature, North-Holland, Ohio Univer- sity Press, Pattern Recognition Pepperdine University Press, Philosophy of Science Association, Physica-Verlag, Reidel, Society for General Systems. Research, South- west, Journal of Philosophy, University of Massachusetts Press. И наконец, последнее, по порядку, но не по значению. Я благодарю за под- держку мою жену Милену и моих детей Джона и Джейи.
ГЛАВА 1. ВВЕДЕНИЕ Если начинают с неправильного, то мало надежды на правильное завершение Конфуций 1.1. НАУКА О СИСТЕМАХ Нужно перестать поступать так, словно природа делится на дисциплины, как в университетах Рассел А. Аккофф Одной из важнейших особенностей развития науки является возникновение очень сложной иерархии специализированных дис- циплин. На место древнего ученого-философа, такого как Аристо- тель, который мог охватить практически всю совокупность доступ- ных в его время знаний, пришли поколения ученых, обладающих все большей глубиной знаний и все большей узостью интересов и компетенции. Вероятно, основной причиной, породившей тенденцию к раз- дроблению науки на узкие специальности, является ограниченность возможностей человеческого разума. Поскольку объем знаний стал больше того, который человек в состоянии воспринять, всякое уве- личение знания необходимо приводит к тому, что человек может охватить все меньшую его часть. Чем глубже это знание, тем более специализированным оно должно быть. Углубление специализации по дисциплинам присуще не только естественным наукам. В других областях человеческой деятельно- сти, например в технике, медицине, гуманитарных науках, искусст- ве, наблюдается та же тенденция. Так, техника из одной дисципли- ны превратилась в спектр инженерных отраслей, таких, как меха- ника, электротехника, химическое машиностроение или атомная техника, и каждая из них, в свою очередь, подразделяется на мно- жество узких специальностей. Одной из главных особенностей науки второй половины нашего столетия является появление ряда родственных научных направле- ний, таких, как кибернетика, общесистемные исследования, теория информации, теория управления, математическая теория систем, 13
теория принятия решений, исследование операций и искусственный интеллект. Все эти области, появление и развитие которых тесно связано с возникновением и прогрессом компьютерной технологии, обладают одним общим свойством—они имеют дело с такими системными задачами, в которых главенствующими являются ин- формационные, реляционные и структурные аспекты, в то время как тип сущностей, образующих систему, имеет значительно мень- шее значение. Становится все более очевидным, что полезно было бы посмотреть на эти взаимосвязанные интеллектуальные разра- ботки как на части более общего поля исследований, обычно назы- ваемого наукой о системах или системологией. Если наука о системах является наукой в обычном смысле, то в ней следует различать три основных компонента: 1) область исследования; 2) совокупность знаний об этой области; 3) методологию (совокупность согласованных методов) на- копления новых знаний об этой области и использования этих знаний для решения относящихся к ней задач. Назначение данного вводного раздела — охарактеризовать эти три компонента — область, знания и методологию науки о систе- мах. Кроме того, приводятся доводы за то, что науку о системах нельзя непосредственно сравнивать с другими науками, а правиль- нее было бы рассматривать ее как новое измерение в науке. Точнее было бы сказать, что предметом любой научной дисцип- лины является определенный класс систем. В самом деле, термин система безусловно является одним из самых распространенных терминов, используемых при описании работ в самых разных науч- ных дисциплинах, особенно в последнее время. Этот термин, к со- жалению, оказался чрезмерно перегружен и имеет различный смысл при различных обстоятельствах и для различных людей. Посмотрев в толковый словарь, вы, вероятно, найдете примерно такое толкование слова «система — множество элементов, находя- щихся в отношениях или связях друг с другом, образующих цело- стность или органическое единство», хотя в других словарях могут иметься стилистические варианты этой формулировки. Если следовать общепринятому определению, то термин «систе- ма» означает, в общем, множество элементов и отношений между ними. Термин отношение используется здесь в самом широком смысле, включающем весь набор родственных понятий, таких, как ограничение, структура, информация, организация, сцепление, связь, соединение, взаимосвязь, зависимость, корреляция, образец и т. д. Скажем, система S представляет, таким образом, упорядо- ченную пару 5=(Л, 7?), где А есть множество соответствующих элементов, a R — множество отношений между элементами мно- жества А. Подобная концепция системы слишком обща и, следо- вательно, практическое значение ее невелико. Чтобы сделать это 14
определение практически полезным, его нужно уточнить, ввести определенные классы упорядоченных пар (Л, R), относящихся к выделенным задачам. Эти классы можно ввести с помощью одно- го из двух фундаментальных критериев различия: а) выделение систем, базирующихся на определенных типах элементов; б) выделение систем, базирующихся на определенных типах отношений. Классификационные критерии а) и б) можно рассматривать как ортогональные. Примером критерия а) служит традиционное подразделение науки и техники на дисциплины и специальности, причем каждая из них занимается определенным типом элементов (физических, химических, биологических, политических, экономи- ческих и т. д.). При этом никакой определенный тип отношений не фиксируется. Поскольку элементы разных типов требуют разных экспериментальных (инструментальных) средств для сбора дан- ных, эта классификация по существу имеет экспериментальную основу. Критерий б) дает совершенно другую классификацию систем: класс задается определенным типом отношений, а тип элементов, на которых определены эти отношения, не фиксируется. Такая клас- сификация непосредственно связана с обработкой данных, а не сих сбором, и основа ее преимущественно теоретическая. Как будет подробно рассмотрено ниже, самыми большими классами систем по критерию б) являются классы, описывающие различные эпистемологические уровни, т. е. уровни знания относи- тельно рассматриваемых феноменов. Далее они уточняются с по- мощью разных методологических отличий. Каждый класс систем, заданный определенным эпистемологическим уровнем и конкрет- ными методологическими отличиями, подразделяется далее на еще меньшие классы. Каждый из этих классов состоит из систем, экви- валентных с точки зрения конкретных, практически существенных сторон определенных в них отношений. Такая эквивалентность обычно называется изоморфизмом, а определенные по ней классы эквивалентности — изоморфными классами. В зависимости от характеристик отношений, относительно кото- рых требуется изоморфность систем, одни изоморфные классы яв- ляются подмножествами других. Ясно, что наименьшими изоморф- ными классами являются такие классы, в которых входящие в них системы изоморфны относительно всех характеристик определен- ных на них отношений. Поскольку системы в каждом конкретном изоморфном классе эквивалентны только с точки зрения некоторых характеристик их отношений, они могут базироваться на совершенно разных типах элементов. Если рассматривать только характеристики отношений в системах, то достаточно каждый класс изоморфных систем заме- 15
Рис. 1.1. Два способа классификации систем нить одной системой, представляющей этот класс. Так как выбор этих представителей в принципе произволен, то важно, чтобы для всех изоморфных классов использовался один и тот же критерий выбора. Для наших целей будем выбирать в качестве представите- лей системы, в которых множествами элементов являются абстрак- тные (неинтерпретированные) множества одной природы, а отно- шения описаны в подходящей стандартной форме. Представителей изоморфных классов, удовлетворяющих этим требованиям, при определенной интерпретации термина «стандарт- ный» будем называть общими системами. Таким образом, общая система — это стандартная и неинтерпретированная система, вы- бранная в качестве представителя класса систем, эквивалентных (изоморфных) относительно некоторых практически существенных характеристик отношений. В этом определении термин «стандарт- ная» используется для ссылки на описание, удовлетворяющее определенным соглашениям, которые определяются в первую оче- редь применением данной системы. Например, соответствующая форма представления системы в вычислительной машине может быть принята в качестве ее стандартного описания. Ортогональность классификационных критериев а) и б) пока- зана на рис. 1.1. Классы систем, содержащие различные типы эле- 16
ментов (множество Л), изображаются горизонтальными полосами; классы систем, содержащие различные отношения (множество R), — вертикальными. Хотя классификация по критерию б) чужда традиционной науке, ее важность признается все больше. Все исследования свойств систем и связанные с этим задачи, проистекающие из данной клас- сификации получили сейчас общее название «науки о системах». В этом смысле наукой о системах называется научная деятельность в основном теоретического плана, которая таким образом допол- няет экспериментальные исследования традиционной науки. В область науки о системах входят все типы свойств отноше- ний, существенные для отдельных классов систем или в очень ред- ких случаях существенные для всех систем. Выбранная классифика- ция систем по отношениям определяет способ разбиения области исследований науки о системах на подобласти точно так же, как традиционная наука подразделяется на подобласти — различные дисциплины и специальности. Знания в науке о системах, т. е. знания, относящиеся к различ- ным классам свойств отношений в системах, можно получать либо с помощью математики, либо с помощью экспериментов с моделя- ми систем, на компьютерах. Примерами знаний в науке о системах, полученных математическим путем, являются закон необходимого разнообразия Эшби [17, 18], принципы максимума энтропии и минимума кросс-энтропии [76, 166] или различные законы об ин- формации, управляющей системами [84]. Если говорить о знаниях, полученных экспериментальным путем, то лабораторией для науки о системах является компьютер. Он позволяет экспериментировать ученому-системщику точно так же, как это делают другие ученые в своих лабораториях, хотя экспериментальные понятия, которыми он оперирует, представляют собой абстрактные структурные (мо- делируемые на компьютере), а не конкретные свойства реального мира. В этой книге описываются некоторые примеры системных знаний, полученные с помощью экспериментов на компьютере. Третий компонент науки о системах — системная методология— это стройная совокупность методов изучения свойств различных классов систем и решения системных задач, т. е. задач, касающихся отношений в системах. Хорошая классификация систем с точки зрения отношений — ядро системной методологии. Соответствую- щим образом разработанная классификация является основой для исчерпывающего описания и таксономии системных задач. Главная задача системной методологии — предоставление в распоряжение потенциальных пользователей, представляющих разные дисципли- ны и предметные области, методов решения всех определенных типов системных задач. Если проанализировать разделение традиционной науки на дисциплины, то станет очевидно, что наука о системах носит меж- 2—6923 17
дисциплинарный характер. Этот факт имеет, по крайней мере, два следствия. Во-первых, системные знания и методология в принци- пе могут быть использованы практически во всех разделах тради- ционной науки. Во-вторых, наука о системах обладает гибкостью, позволяющей изучать свойства отношений в таких системах и, сле- довательно, в задачах, где фигурируют характеристики, исследуе- мые обычно в самых разных областях традиционной науки. Это позволяет изучать подобные системы и решать такие задачи в це- лом, а не рассматривать их как собрание несвязанных предметных подсистем и подзадач. Как уже говорилось выше, наука о системах, как и другие на- уки, имеет определенную область исследования, обладает совокуп- ностью знаний и методологией. И тем не менее это не наука в обычном смысле: традиционная наука ориентируется на исследо- вание разных категорий явлений, а наука о системах изучает раз- личные классы отношений. По существу, ее нужно рассматривать как новое измерение науки, а не как новую науку, сопоставимую с другими. Два измерения в науке, которые отражает двумерная класси- фикация систем, показанная на рис. 1.1, являются взаимодопол- няющими. Их сочетание в научных исследованиях оказывается более мощным средством, чем использование каждого из направ- лений в отдельности. Традиционное измерение науки определяет смысл и место любого исследования. С другой стороны, системное измерение позволяет содержательно работать с любой наперед вы- бранной системой, независимо от того, ограничена ли она рамками одной традиционной научной дисциплины или нет. Представляется, что с точки зрения свойств науки в истории человечества можно естественным образом выделить три основных периода. 1. Донаучный период (приблизительно до XVI в.). Характерны- ми чертами периода являются здравый смысл, теоретизирование, метод проб и ошибок, ремесленные навыки, дедуктивные рассуж- дения и опора на традицию. 2. Одномерная наука (начало XVII — середина XX вв.). Харак- терные черты: объединение теорий, дедуктивные рассуждения, осо- бое внимание к эксперименту, которое привело к возникновению базирующихся на эксперименте дисциплин и специальностей в на- уке. Кстати, они появились прежде всего из-за различий в экспери- ментальных (инструментальных) средствах, а не из-за различий в свойствах отношений исследуемых систем. 3. Двумерная наука (развивается примерно с середины XX в.). Характерные черты: возникновение науки о системах, занимаю- щейся свойствами отношений, а не экспериментальными свойства- ми исследуемых систем, и ее интеграция с основанными на экспе- рименте традиционными научными дисциплинами. 18
Таким образом, можно сказать, что главное в развитии науки во второй половине нашего века — это переход от одномерной науки, в основном опирающейся на экспериментирование, к науке двумерной, в которую наука о системах, базирующаяся прежде всего на отношениях, постепенно входит в качестве второго изме- рения. Важность этой совершенно новой парадигмы науки, двумер- пость науки, еще не вполне осознана, но ее последствия для буду- щего представляются чрезвычайно глубокими. 1.2. РЕШЕНИЕ СИСТЕМНЫХ ЗАДАЧ Только при полном понимании за- дач можно найти соответствующие способы их решения. Для результа- тов важнее поставить правильные вопросы, чем правильно ответить на ошибочные. К- Норберг-Шульц С понятием решения системных задач главной темой этой книги связано три вопроса о его смысле и существенности: 1. Можно ли выделить системные задачи в особый и хорошо определенный класс задач? 2. Может ли класс системных задач быть описан операционно, чтобы стало возможным создание доступной методологии решения задач этого класса? 3. Имеет ли класс системных задач достаточное практическое значение, чтобы оправдать работы по развитию методологии реше- ния системных задач? По-моему, на все эти вопросы можно ответить положительно. Хотя обоснование этого мнения может быть вполне понятно только по прочтении данной книги, позвольте мне привести следующие краткие предварительные соображения. Как уже говорилось в разд. 1.1, понятие общих систем как стандартных представителей практически важных классов эквива- лентности систем естественным образом возникает из двумерной классификации систем, изображенной на рис. 1.1. Хотя и совер- шенно ясно, что общие системы бесконечно разнообразны, это раз- нообразие может быть адекватно охвачено конечным числом типов общих систем, каждый из которых характеризуется определенным эпистемологическим уровнем и конечным набором соответствующих и существенных методологических отличий. Поскольку существенные типы общих систем определены, по- стольку они образуют пространство, на котором можно определить типы системных задач. Это пространство обычно называется про- странством задач. Любой тип задач определяется в терминах упо- рядоченных связей между двумя типами систем — начальным и
конечным, а также набором типов требований, совместимых с типа- ми этих систем. Для конкретных задач эти требования могут быть целями или ограничениями. Хотя разнообразие реальных требований, предъяв- ляемых к непустому пространству задач, бесконечно, они могут быть адекватно представлены конечным числом типов, как уже указы- валось в предыдущем разделе. Таким образом, любой тип задач характеризуется типами двух рассматриваемых систем и конечным набором определенных типов требований. Задача определенного типа станет конкретной, если заданы кон- кретные требования для всех типов и в зависимости от типов тре- бований заданы конкретная исходная система определенного типа или системы обоих определенных типов. В первом случае началь- ная система представляет собой начальное состояние задачи. Реше- ние задачи (целевое состояние задачи) представляет собой одну (или более) конкретную конечную систему требуемого типа. Во втором случае начальное состояние задачи представляется двумя конкретными системами, а решением является некоторое отноше- ние между ними. Из такой характеристики системных задач следует, что они и в самом деле образуют особый и хорошо определенный класс общих задач. Тот факт, что бесконечное разнообразие этих задач сводимо к конечному числу хорошо определенных типов задач, делает без- условно возможным создание методологии решения данного класса задач. Таким образом, на первые два наших вопроса можно, оче- видно, ответить положительно. Третий вопрос требует дополнитель- ного обсуждения. Решение системных задач, как утверждается в этой книге, сво- дится к решению задач, состояния которых представлены общими системами хорошо определенного типа. Тем самым, рассматрива- ются только те аспекты задач, которые свободно интерпретируются и не зависят от контекста. Таким образом, применение методологии решения системных задач основано на допущении, что из конкрет- ных задач могут быть выделены свободно интерпретируемые и контекстно независимые задачи. Имеет ли смысл и нужно ли делить задачи таким образом? Го- тов поспорить, что это так. В самом деле, используем же мы это деление при решении простых повседневных задач, применяя, на- пример, арифметику. Б. Зиглер очень хорошо формулирует это в предисловии к своей книге [357]: Ни у кого не вызывает сомнения роль арифметики в науке, технике и управ- лении. Арифметика проникла повсюду, но при этом опа является математической дисциплиной с собственными аксиомами и логической структурой. Ее содержание не принадлежит никакой другой дисциплине, но ее ко всем можно применить. Так, студентов-биологов и студентов-инженеров учат сложению одинаково, раз- личие состоит в том, что, когда и за^см складывать. 20
На практике моделирование и имитация также проникли во все области. Однако они имеют собственные подходы к описанию модели, ее упрощению, обо- снованию, имитации, изучению, и эти подходы принадлежат только данной кон- кретной дисциплине. С этими утверждениями согласятся все. Никто, одиако, не будет утверждать, что названные подходы можно выделить и абстрагировать в общепринятом виде. Хотя Зиглер говорит о моделировании и имитации, его наблю- дения равным образом применимы и к другим классам задач, таким, как проектирование систем, их анализ, идентификация, реконструкция, управление, оценка производительности, тестиро- вание и т. д. Для многих подзадач этих задач могут быть созданы тонкие методы решения в терминах соответствующих общих сис- тем, т. е. не связанные определенной интерпретацией или контек- стом. Подобные методы значительно повышают эффек- тивность и унифицируют процесс решения сложных задач точно так же, как арифметика облегчает решение очень простых задач. Назовем концептуальную схему, в которой типы системных задач определены совместно с методами решения задач этих ти- пов, универсальным решателем системных задач (УРСЗ). При решении задач в различных контекстах, связанных с раз- ными традиционными областями науки, техники, медицины и т. д., а также в междисциплинарных исследованиях УРСЗ должен рас- сматриваться в первую очередь как методологическое средство, предположительно использующее вычислительную технику. Рас- полагая этим средством, можно обращаться к его услугам всякий раз, когда в процессе решения какой-то проблемы возникает не- обходимость решения системных задач. На рис. 1.2 показана роль УРСЗ как средства научного ис- следования в различных областях науки. В работе УРСЗ можно выделить два уровня операций. 1. (Представлен внутренними прямоугольниками). Исследо- ватель достаточно знаком с базовым языком УРСЗ, чтобы сфор- мулировать интерпретацию своей задачи в виде системной зада- чи. В этом случае исследователь или пользователь сам определяет интерпретированную задачу в терминах УРСЗ (как будет описано ниже), а УРСЗ решает задачу и отображает решение в термины интепретированной системы. Подобная ситуация также возникает, если необходимо разработать процедуры, имеющие вид простых вопросов, задаваемых пользователю. Отвечая на эти вопросы пользователь определяет системную задачу, подходящую к дан- ной ситуации. 2. (Внешние прямоугольники). Многие системные исследова- ния достаточно сложны, так что исследователь может содержа- тельно использовать больший объем информации, чем это требу- ется для решения определенной системной задачи. В этом случае также можно разработать процедуры, производящие преобразо- 21
Рис. 1.2. Роль УРСЗ как методологического средства вания из интерпретированной системы в общую. Основываясь на информации, сопровождающей это преобразование, УРСЗ может перевести новую информацию относительно общей системы в тер- мины интерпретированной системы. Таким образом, исследователь может получить о ней новые сведения. Использование УРСЗ или аналогичных разработок науки о системах требует, следовательно, введения интерфейса между вовлеченными в исследования дисциплинами. Такой интерфейс состоит из двух альтернативных процессов — абстрагирования и интерпретации. В научных исследованиях использование этих процессов носит, вообще говоря, непрерывный и постоянный ха- рактер. Это важнейшее свойство науки хорошо выражено Дж. Сп. Брауном [57]: Наука—это непрерывный живой процесс, ее содержание — это деятельность, а ие данные. Наука отличается от просто данных, как преподаватель отличается от библиотеки... Научное знание, словно отрицательная энтропия, постоянно стремится к уменьшению. Мешает же ей превратиться в короткий эпизод только стремление бесконечно повторять эксперименты и проверять результаты... Наука это игра в значения: один игрок старается свести значительное к незначительно- му, задавая все новые вопросы, а другой стремится противопоставить этому на- 22
тиску все новые эксперименты. Ученый, словно шахматист-эитузиаст, часто сам играет за обоих противников... Повторения научных результатов преследуют две цели: во-первых, они препятствуют возникновению новых вопросов, стремя- щихся приуменьшить значимость результатов, во-вторых, каждое успешное по- вторение увеличивает значимость, которую такой вопрос мог сократить. Таким образом, происходит состязание между вопросами и результатами. Схема на рис.-1.2 подходит не только для науки. Она с успе- хом может быть применена в технике, медицине или управлении. Хотя задачи в этих областях (т. е. проектирование систем, их тестирование, диагностика, принятие решений и т. д.) отличаются от задач, возникающих при научном исследовании, роль УРСЗ в оказании помощи пользователю при решении системных подза- дач по существу остается той же. Решение системных задач, как оно представляется в УРСЗ, возможно только в сочетании с традиционными методами науки или других областей, где общие задачи возникают в специфиче- ских контекстах. УРСЗ, для того чтобы оказаться практически полезным, должен охватывать как можно более широкий класс системных задач, в особенности системные задачи, являющиеся общими для многих дисциплин. Следовательно, концептуальная схема УРСЗ должна быть получена абстрагированием и органи- зацией системных понятий и задач из как можно большего числа дисциплин и приложением этой схемы, когда это нужно, к новым понятиям и задачам с целью образования единого целого. Струк- тура УРСЗ, как она описана в этой книге, и в самом деле созда- валась именно таким образом в течение почти 20 лет. Настоящую версию УРСЗ, так же как и любую из его буду- щих версий, не следует рассматривать как окончательную. Если принята определенная структура, то всегда имеется вероятность, что в процессе использования УРСЗ мы рано или поздно обнару- жим новые системные понятия и задачи, неукладывающиеся в эту структуру. И хотя некоторые из них окажутся слишком специа- лизированными, другие могут иметь настолько широкое примене- ние, что будет оправданным их включение в эту структуру и раз- работка соответствующих методов. Таким образом, УРСЗ разви- вается во взаимодействии с пользователями, а сфера его приме- нения в процессе развития непрерывно расширяется. С этой точки зрения УРСЗ можно рассматривать и как действующую програм- му исследований. Итак, можно заключить, что системные задачи — это содержа- тельные подзадачи общих задач, возникающих в традиционных дисциплинах науки и других областях человеческой деятельности, что эти подзадачи могут быть описаны операционально, и что методология их решения представляет большие возможности как для задач традиционных дисциплин, так и для междисциплинар- ных задач. 23
1.3. ИЕРАРХИЯ ЭПИСТЕМОЛОГИЧЕСКИХ УРОВНЕЙ СИСТЕМ Эпистемология или теория познания, раздел философии, в котором изучаются природа и сфера распространения знания, его предпосылки и основы, а также критерии истинности знания. Философская энциклопедия Иерархия эпистемологических уровней систем образует каркас таксономии систем в УРСЗ. Представляется, что в той или иной форме подобная иерархия совершенно необходима при создании любого пакета методов решения системных задач. Хотя отдельные эпистемологические уровни систем подробно описаны в гл. 2—5, в этом разделе дается упрощенное предварительное описание свойств этой иерархии в целом. Данная иерархия опирается на несколько элементарных поня- тий: исследователь (наблюдатель) и его среда, исследуемый (на- блюдаемый) объект и его среда и взаимодействие между иссле- дователем и объектом. Самый нижний уровень в этой иерархии, обозначаемый как уровень 0, это система, различаемая исследователем как система. То есть, исследователь выбирает способ, каким он хочет взаимо- действовать с исследуемым объектом. В большинстве случаев этот выбор не вполне произволен. По крайней мере частично он определяется целью исследования, условиями исследования (до- ступностью измерительных инструментов, финансовыми возмож- ностями, временными рамками, юридическими ограничениями и т. д.), а также имеющимися знаниями, относящимися к данному исследованию. В приведенной ниже выдержке из последней статьи В. Гейнса обсуждается такое очень общее понимание тер- мина «система» [116]: Определение. Система — это то, что различается как система. На первый взгляд это никакое не утверждение. Системой является все, что мы хотим рас- сматривать как систему. Можно ли что-иибудь сказать по этому поводу? Имеет- ся ли здесь какое-то основание для науки о системах? Я отвечу на оба эти во- проса утвердительно и покажу, что это определение полно смысла и имеет бо- гатую интерпретацию. Позвольте мне прежде всего ответить на одно очевидное возражение и обер- нуть его в свою пользу. Можно спросить: «Что специфически системного в этом определении?» «Нельзя ли точно так же применить его ко всем другим объектам, которые я захочу определить», т. е. кролик — это то, что различается как кролик. «Но, — отвечу я, — мое определение адекватно определяет систему, в то время как Ваше определяет кролика неадекватно». В этом суть теории систем: опреде- ление того, что некая сущность является системой, является необходимым и до- статочным критерием того, что она является системой, и это верно только для 24
систем. В то же время различение, что некая сущность является чем-то еще, не- обходимо для того, чтобы эта сущность была этим чем-то, но иедостаточио. Выражаясь образно, можно сказать, что понятие системы стоит на самом верху иерархии понятий. Это место выглядит очень важным. Может быть, так оно и есть. Но когда мы понимаем, что это высокое место достигнуто за счет довольно негативного достоинства отсутствия отличительных свойств, то такая характеристика оказывается не такой уж впечатляющей. Я полагаю, что это определение системы как уникального понятия сделано для того, чтобы объяс- нить многие достоинства и недостатки теории систем. Сила этого понятия в его абсолютной общности, и мы явно указываем на это полное отсутствие качест- венных характеристик в термине «общая теория систем» вместо того, чтобы за- темнять суть, привести какой-нибудь почтенный прикрывающий термин вроде математической теории систем. Слабость и в то же время главное достоинство этого понятия в том, что его никак нельзя дополнительно охарактеризовать. Слабость потому, что мы не можем оценить значимость дополнительных характе- ристик изучаемого предмета. Достоинство же в том, что эти дополнительные характеристики сами по себе для обсуждения не нужны и только затемняют суть дела, так как принимают во внимание крайности суждений специалистов. Способ взаимодействия с самим объектом можно описать не- сколькими альтернативными способами. В структуре УРСЗ систе- ма эпистемологического уровня 0 определена через множество переменных, множество потенциальных состояний (значений), выделяемых для каждой переменной, и некий операционный спо- соб описания смысла этих состояний в терминах проявлений соот- ветствующих атрибутов данного объекта. Для определенных на этом уровне систем используется термин исходная система, ука- зывающий на то, что подобная система является, по крайней мере потенциально, источником эмпирических данных. В литературе для этих систем используются также названия «примитивная сис- тема» н «система без данных», предполагающие, что система это- го уровня представляет простейшую стадию процесса исследова- ния систем, не использующую данные о доступных переменных. Множество переменных обычно подразделяется па два под- множества, называемые основными переменными и параметрами. Совокупность состояний всех параметрических переменных обра- зует параметрическое множество, при котором наблюдается из- менение в состояниях отдельных основных переменных. Чаще все- го в качестве параметров выступают время, пространство и раз- личные совокупности объектов одного типа (социальные группы, группы стран, продукция одного типа и т. д.). Исходные системы полезно классифицировать по различным критериям, по которым имеются методически существенные отли- чия в конкретных свойствах множеств переменных или множеств состояний. Согласно одному из таких критериев основные пере- менные могут быть разделены на входные и выходные перемен- ные. При таком разделении состояния входных переменных рас- 25
сматриваются как условия, влияющие на выходные переменные. Входные переменные не являются предметом исследования; счи- тается, что они определяются неким фактором, не входящим в рассматриваемую систему. Этот фактор называют средой сис- темы, в которую часто включают и исследователя. Важно, что понятие входных переменных не противоречит понятию независи- мых переменных. Системы, в которых переменные разделены на входные и вы- ходные, называются направленными-, системы, в которых такое разделение не задано, называются нейтральными. Выделяют так- же ряд дополнительных отличий множеств состояний, связанных с введенными переменными (основными и параметрическими), что позволяет проводить более глубокую методологическую клас- сификацию исходных систем. Это, например, отличия между чет- кими и нечеткими переменными, между дискретными и непрерыв- ными переменными, между переменными с разными шкалами значений. На других более высоких эпистемологических уровнях системы отличаются друг от друга уровнем знаний относительно перемен- ных соответствующей исходной системы. В системах более высо- кого уровня используются все знания соответствующих систем более низких уровней и, кроме того, содержатся дополнительные знания, недоступные низшим уровням. Таким образом, исходная система содержится во всех системах более высоких уровней. После того как исходная система дополнена данными, т. е. действительными состояниями основных переменных при опреде- ленном наборе параметров, мы рассматриваем новую систему (ис- ходную систему с данными) как определенную на эпистемологи- ческом уровне 1. Системы этого уровня называются системами данных. В зависимости от задачи данные могут быть получены из наблюдений или с помощью измерений (как в задаче моделиро- вания систем) или определены как желательные состояния (в за- даче проектирования систем). Более высокие эпистемологические уровни содержат знания о некоторых инвариантных параметрам характеристиках отноше- ний рассматриваемых переменных, посредством которых можно генерировать данные при соответствующих начальных или гра- ничных условиях. Генерируемые данные могут быть точными (детерминированными) или приблизительными в каком-то опре- деленном смысле (стохастическими, нечеткими). На уровне 2 инвариантность параметров представлена одной обобщенной характеристикой, задающей ограничение на множе- стве основных переменных при данном множестве параметров. В множество основных переменных входят переменные, опреде- ляемые соответствующей исходной системой и, возможно, некото- рые дополнительные. Каждая дополнительная переменная опре- 26
Уровни 4,5 ... МЕТАСИСТЕМЫ Отношения между определенными ниже отношениями______________________ Уровень 3 СТРУКТУРИРОВАННЫЕ СИСТЕМЫ отношения между определенными ниже моделями Уровень 2 ПОРОЖДАЮЩИЕ СИСТЕМЫ •Модели, порождающие определенные , ниже данные______ ,Уродень 1 СИСТЕМЫ ДАННЫХ Наблюдения, описанные на определенном ______ниже языке_____________ Уровень О Ц ИСХОДНЫЕ СИСТЕМЫ \\ Язык описания данных СОБЫТИЯ ПРЕДСКАЗАНИЕ ДЕЙСТВИЯ ВЗАИМОДЕЙСТВИЕ 0 ВНЕШНИМ МИРОМ ПРОИСХОДИТ ЧЕРЕЗ ИСХОДНУЮ СИСТЕМУ ДЛЯ ПОЛУЧЕНИЯ СИСТЕМЫ ДАННЫХ, КОТО- РАЯ МОДЕЛИРУЕТСЯ СИСТЕМАМИ БОЛЕЕ ВЫСОКИХ УРОВНЕЙ Рис. 1.3. Иерархия эпистемологических уровней систем (упрощенное представ- ление) деляется конкретным пра- вилом преобразования на множестве параметров, при- менимом или к основной пе- ременной исходной системы, или к гипотетической (нена- блюдаемой) переменной, введенной пользователем (составителем модели, про- ектировщиком). Эта пере- менная обычно называется внутренней. Правило преоб- разования обычно представ- ляет собой взаимно одно- значную функцию, присваи- вающую каждому элементу множества параметров дру- гой (единственный) элемент того же множества. Поскольку задачей пара- метрически инвариантного ограничения является описа- ние процесса, при котором состояния основных пере- менных могут порождаться по множеству параметров при любых начальных или граничных условиях, системы уровня 2 называются порождающими системами (generative system). На эпистемологическом уровне 3 системы, определенные как порождающие системы (или иногда системы более низкого уров- ня), называются подсистемами общей системы. Эти подсистемы могут соединяться в том смысле, что они могут иметь некоторые общие переменные или взаимодействовать как-то иначе. Системы этого уровня называются структурированными системами (struc- ture system). На эпистемологическом уровне 4 системы состоят из набора систем, определенных на более низком уровне, и некоторой инва- риантной параметрам метахарактеристики (правила, отношения, процедуры), описывающей изменения в системах более низкого уровня. Требуется, чтобы системы более низкого уровня имели одну и ту же исходную систему и были определены на уровне 1, 2 или 3. Определенные таким образом системы называются мета- системами. На уровне 5 допускается, что метахарактеристика мо- жет изменять множество параметров согласно инвариантной па- раметрам характеристике более высокого уровня или мета-метаха- рактеристике. Такие системы называются мета-метасистемами 27
или метасистемами второго порядка. Аналогично определяются метасистемы более высоких порядков. Для справок на рис. 1.3 представлено упрощенное представ- ление иерархии эпистемологических уровней систем. 1.4. РОЛЬ МАТЕМАТИКИ Не путайте метод решения с определе- нием задачи, особенно если это ваш собственный метод Д. Гаусс и Дж. Уейнберг Как уже говорилось в разд. 1.2, понятие решения системных задач естественным образом возникло из двумерной классифика- ции систем, изображенной на рис. 1.1. Они предназначены для работы со свойствами отношений систем, не зависящими от ин- терпретаций и контекста. Однако тем же занимается и матема- тика. Какая же тогда между ними разница? Очень приближенно математику можно разделить на чистую и прикладную. Чистая математика занимается в основном разра- боткой разных аксиоматических теорий независимо от того, име- ют они практическое значение или нет. Чистая математика осо- бенно интересуется доказательством теорем, следующих из посту- лированных предположений (аксиом), и не ее цель определять, существует ли некая интерпретация теории, для которой эти пред- положения истинны. Эта позиция «искусства для искусства», очень влиятельная в математике еще с XIX в., даже подчеркива- ется некоторыми математиками, считающими ее принципиальной позицией для этой науки. Однако несмотря на такой подход мно- гие математические теории в разной степени, но все же имеют отношение к реальности. Иногда обнаружение подобной связи является счастливой случайностью. Чаще, однако, оно представ- ляется результатом бессознательного процесса в сознании мате- матика (интуиции, озарения) или его осознанной попытки (часто скрытой или, по крайней мере, недекларируемой) абстрагировать и формализовать некоторые аспекты реальности. Здесь необходимо упомянуть о том, что аксиоматическая фор- мализация по своей природе имеет некоторые ограничения. В 1931 г. К. Гёдель показал, что аксиоматические теории (напри- мер, аксиоматическая теория обычной арифметики) таковы, что нельзя доказать их внутреннюю непротиворечивость (т. е. то, что из аксиом нельзя вывести взаимоисключающие теоремы). Точнее, непротиворечивость аксиоматической теории не может быть до- казана с помощью ее собственных правил вывода. Доказательст- во непротиворечивости, опирающееся на более мощные правила вывода, может существовать, но тогда следует доказать непро- 28
тиворечивость положений, используемых в новых правилах выво- да. Для этого могут потребоваться еще более мощные правила. Повторение этого рассуждения показывает, что на вопрос о пол- ноте каких-то математических теорий окончательно ответить нель- зя. Что еще важнее, Гёдель также показал, что если некие акси- оматические теории, непротиворечивость которых недоказуема, являются непротиворечивыми, то они будут неполны (т. е. некие истинные утверждения этих теорий нельзя вывести из их аксиом). Следовательно, существуют математические теории, которые или противоречивы, или неполны, и невозможно определить, к какой из двух категорий каждая из них принадлежит. Назначение прикладной математики — поиск практических ин- терпретаций математических теорий и после нахождения таких интерпретаций создание на основе теорий методических средств работы с интерпретированными системами и связанными с ними задачами. В этом смысле прикладная математика ориентирована на разработку методов, базирующихся на определенных матема- тических теориях, и использование их в как можно большем чис- ле конкретных приложений. Эти методы, разумеется, подчиня- ются фундаментальным ограничениям математических теорий, на которые указал Гёдель. Более того, любая математическая тео- рия выводится из некоторых определенных предположений (акси- ом) и, следовательно, любая методика, опирающаяся на эту тео- рию, применима только к тем задачам, которые отвечают этим предположениям. Если задача им не отвечает, а математик-при- кладник, владеющий данной методикой, все-таки хочет ее приме- нить, ему нужно переформулировать свою задачу так, чтобы она удовлетворяла этим ограничениям. Однако это означает, что теперь будет решена другая задача. Очень часто изменение задачи явно не констатируется, в результате чего создается впе- чатление, что была решена исходная задача, хотя на самом деле это не так. Таким образом, математики-прикладники предоставляют поль- зователям (ученым, инженерам и т. д.) набор методических средств, каждое из которых получено из какой-либо математиче- ской теории, которая, в свою очередь, опирается на определенный набор предположений. Чаще всего математические теории разра- батываются в предположениях, представляющих интерес или под- ходящих с точки зрения математического аппарата. Как следст- вие порожденные ими методы покрывают лишь отдельные неболь- шие фрагменты всего спектра системных задач. Идея решения системных задач является в некотором смысле реакцией на это неудовлетворительное положение. В противоположность прикладной математике решение систем- ных задач предназначено для исследования области системных задач как единого целого. Оно, в частности, пытается определить 29
практически ценные подзадачи, возникающие в как можно более широком классе реальных системных задач. Эта направленность решения системных задач на полноту и практическую значи- мость проводимых исследований отличает ее от математики, ори- ентированной на исследование методик, базирующихся на подхо- дящих (и часто произвольных) математических свойствах. Таким образом, приоритет задач в решении системных задач резко контрастирует с приоритетом методов в прикладной мате- матике. Наиболее важным назначением науки о решении систем- ных задач является разработка методов решения системных задач в их естественной формулировке, либо не использующих при ре- шении упрощающих предположений, либо, если это невозможно, с упрощениями, позволяющими решить задачу, но в то же время как можно меньше искажающими ее. Методологические методы решения задач имеют подчиненное значение и выбираются так, чтобы как можно лучше соответствовать задачам, а не наоборот. Более того, эти методы по природе своей не обязаны быть чисто математическими, а могут представлять собой сочетание матема- тических, вычислительных, эвристических, экспериментальных и других методов. При управлении сложностью процесса решения редко удается обойтись без упрощающих предположений. Однако для любой за- дачи такие упрощающие предположения могут быть введены са- мыми разными способами. Всякий такой набор предположений определенным образом сокращает диапазон возможных решений и в то же время снижает сложность процесса решения. Для конкретной системной задачи множество предположений относительно ее решений называется методологической парадиг- мой. Если задача решается при определенной методологической парадигме, то найденное решение не содержит особенностей, не- совместимых с этой парадигмой. Целесообразно рассматривать парадигму, являющуюся под- множеством предположений другой парадигмы, как обобщение последней. При заданном множестве всех предположений, рас- сматриваемых для данного типа задач, отношение «парадигма А является более общей, чем парадигма В» (т. е. А содержит под- множество предположений, содержащихся в В) задает частичное упорядочение для всех содержательных парадигм, относящихся к данному типу задач. Термин «содержательная парадигма» мо- жет пониматься строго как характеристика множества предполо- жений, гарантирующего возможность решения всех конкретных задач данного типа. В то же время стороны его можно понимать и как более слабое требование, чтобы только некоторые частные задачи данного типа решались при данной парадигме. Самая общая парадигма для задачи любого типа единствен- на—это парадигма без предположений. Однако обычно сущест- во
вует несколько менее общих, но плодотворных для решения задач данного типа парадигм. Сейчас наблюдается тенденция к обобщению парадигм, сти- мулируемая достижениями в развитии вычислительной техники. Любое обобщение парадигмы расширяет множество возможных решений задачи и во многих случаях позволяет получить лучшее решение. Однако одновременно это требует усложнения процеду- ры решения. Изучение связей между возможными методологиче- скими парадигмами и классами системных задач является пред- метом метаметодологии систем. Это важная новая область иссле- дований, в которой пока еще мало сделано. Центральным вопросом метаметодологии систем является разработка таких парадигм, которые для различных классов задач и нынешнего состояния вычислительной техники обеспечивали бы наилучший компромисс для двух противоречивых критериев — качества ре- шения и сложности процедуры решения. Основная трудность по- добного исследования состоит в том, что для данной задачи при одной и той же методологической парадигме может быть разрабо- тано множество альтернативных процедур решения. Другой задачей метаметодологии систем является определение н описание кластеров системных парадигм, хорошо дополняющих друг друга, так что их можно эффективно использовать парал- лельно при решении одной и той же задачи. Вместе они могут дать исследователю значительно больше, чем каждая из них в отдельности. Всякая математическая теория, имеющая смысл с точки зре- ния схемы решения системных задач (такой, как УРСЗ), является по существу методологической парадигмой. Она связана с типом задачи и представляет собой локальную систему, в которой могут разрабатываться методы решения конкретных задач данного ти- на. Одна из задач методологии систем — это компиляция (состав- ление) математических теорий и определение их места в полном пространстве задач. Другая задача — предложение новых содер- жательных парадигм, при этом конечной целью является описание и упорядочение всех возможных парадигм для каждого типа задач. Поскольку выявление новой парадигмы служит толчком для создания новой математической теории, всесторонние иссле- дования в метаметодологии систем послужат, вне всякого сомне- ния, мощным стимулом для фундаментальных математических ис- следований, имеющих большое практическое значение. Таким образом, математика вносит свой вклад в решение системных задач и способствует ее развитию. 31
1.5. РОЛЬ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ Симбиоз сыграл важную роль в эволю- ции; ... он может сыграть решающую роль... и для человека нынешнего поколения, получившего важного сим- бионта. Новым партнером человека яв- ляется высокоскоростной компьютер. Дж. Кемени Наука о системах сильно зависит от компьютера, представляю- щего собой одновременно и ее лабораторию, и важнейшее мето- дологическое средство. Поэтому не удивительно, что современный системный подход начал формироваться почти сразу после появ- ления в конце 40-х — начале 50-х гг. полностью автоматизирован- ных цифровых вычислительных машин. Все это время наука о системах и компьютерная технология развивались бок о бок и влияли друг на друга. Прогресс компьютерной технологии совместно с достижения- ми в области искусственного интеллекта дали новые методоло- гические возможности, помогли прояснить илн уточнить формули- ровку некоторых фундаментальных философских проблем, сде- лать более конструктивными некоторые умозрительные идеи, а также сделали возможным реализацию некоторых простейших функций человеческого мозга на компьютере. Однако цель реше- ния системных задач — пе заменить мозг человека машиной, а симбиотически дополнить его компьютером, снабженным паке- том соответствующих методических средств. Такой подход осно- ван на том, что при столкновении с очень сложными системами мозг проявляет способности, намного превосходящие самые слож- ные методы, реализованные на самых современных компьютерах. Современное понимание этих способностей достаточно примитив- но и, безусловно, неудовлетворительно. Несмотря на успехи ис- кусственного интеллекта, а также нейрофизиологии, психологии и других наук есть основания считать, что некоторые способности человеческого мозга никогда не будут поняты до конца. Возможно, самыми ценными свойствами человеческого мозга являются интуиция, озарение, способность к глобальному охвату, особенно если они хорошо развиты. Сложные системы, однако, часто обладают свойствами, не поддающимися интуитивному по- ниманию и глобальной оценке. Эти свойства являются ловушками для ума в том смысле, что подталкивают его к неправильным представлениям. Для обнаружения этих ловушек нужно, как пра- вило, проделать утомительную работу по детальному анализу изучаемой системы. В этом отношении мозг не очень силен и ограничен в возможностях, а детальный анализ — это как раз та 32
область, где компьютер его превосходит. Это свойство компьютера позволяет ему играть важную роль гаранта и усилителя интуиции. Симбиоз человека (ученого, лица, принимающего решение, конструктора и т. п.) н методологически вооруженного компьюте- ра, такого, как УРСЗ, позволяет ввести и применить новые под- ходы к решению различных интеллектуальных задач, существенно более мощные, чем используемые человеком или машиной в от- дельности. Сила человека в его знании предмета исследования, понимания и использовании контекста, в котором производится исследование, в интуиции, способности к глобальному охвату, в чувстве правильного решения, аудиовизуальных возможностях, творчестве и тому подобное. Сила компьютера — это его вычисли- тельная мощность, легкость, с которой он производит огромное число операций, значительно превосходящая в этом отношении возможности человека. Правильно использованная вычислитель- ная мощность компьютера существенно увеличивает интеллек- туальную силу человека, осуществляя для него необходимый де- тальный анализ и, как уже отмечалось, помогая избежать многих интуитивно не обнаруживаемых ловушек, связанных со сложно- стью систем. Одной из таких ловушек является обычно принимаемое без доказательств предположение, что свойства систем в целом могут быть восстановлены по знаниям о соответствующих свойствах, связанных с их подсистемами. Например, в междисциплинарных социологических проектах обычно предполагается, что мы пони- маем систему в целом, если мы понимаем ее экономическую, пра- вовую, политическую, экологическую и другие рассматриваемые подсистемы. Подобное предположение, к сожалению, подтвержда- ется очень редко, и, даже если подтверждается, его обоснован- ность зависит от выбранных подсистем. Нет оснований считать, что «естественные» подсистемы (экономические, политические и т. д.) являются адекватными в том смысле, что они содержат достаточно информации, чтобы можно было достаточно точно реконструировать (понять) систему в целом. Если же предполо- жение о возможности реконструкции всей системы по определен- ным ее подсистемам не подтвердилось, то всевозможные выводы относительно всей системы, полученные из подсистем, могут ока- заться некорректными и вводящими в заблуждение. Хотя инфор- мация о возможностях реконструкции неявно содержится в дан- ных о системе в целом, явное ее определение требует детального анализа этих данных. Методы проведения такого анализа, назы- ваемого анализом реконструируемости, разрабатывались в послед- ние годы, они описываются в гл. 4. Человек, если не считать весь- ма небольших систем, с анализом реконструируемости не справ- ляется, в то время как у компьютера есть огромные возможности по проведению такого анализа для систем, имеющих практическое значение. 3—6923 33
Анализ реконструируемости — это просто один из примеров важной методологической области, практическая значимость ко- торой определяется применением сложной компьютерной техно- логии. При решении системных задач такие примеры отнюдь не редки, а скорее типичны. Использование компьютера как гаранта и усилителя интуиции при решении системных задач — это одно из двух важнейших его применений в науке о системах. Другим является его использова- ние в качестве лаборатории науки о системах. В этом случае он используется для проведения экспериментов со смоделированны- ми на нем системами. Можно выделить по крайней мере три цели проведения таких экспериментов. 1. Традиционное использование моделирования. Система, вос- производящая соответствующие свойства объекта исследования, моделируется на компьютере для порождения сценариев при раз- личных предположениях относительно среды системы, а также при различных параметрах самой системы. Некоторые наиболее известные примеры подобного рода из области промышленного и мирового развития даны Дж. Форрестером [ПО, 111]. 2. Открытие или проверка законов надки о системах. Экспери- менты такого рода проводятся на компьютере с большим числом разных систем одного и того же класса. Цель таких эксперимен- тов— открытие полезных свойств, описывающих класс исследуе- мых систем, или, наоборот, проверка выдвинутых относительно этого класса предположений. Один из наиболее характерных экспериментов такого рода был проведен Гарднером и Эшби [118]. Целью эксперимента было определение влияния размера системы (числа переменных) и ее связанности (числа зависимостей между переменными) на веро- ятность устойчивости в определенном классе систем. Гарднер и Эшби ограничили свое исследование весьма конкретным классом систем (линейными динамическими системами, описываемыми сис- темой линейных дифференциальных уравнений первого порядка с постоянными коэффициентами). Среди других результатов их исследование привело к открытию критической связности и дало следующий статистически достоверный закон для изучаемого класса систем: если линейная динамическая система (как она описана выше) достаточно велика (состоит из 10 или более пере- менных) и ее связанность (процент ненулевых недиагональных элементов в матрице, описывающей эту систему) меньше 13% (критическая связанность), тогда данная система почти наверня- ка устойчива. Если ее связанность больше 13%, она почти навер- няка неустойчива; 2 %-го отклонения от критической связанности оказывается достаточно для того, чтобы ответ на вопрос об устой- чивости из «почти наверняка устойчива» превратился в «почти наверняка неустойчива» (рис. 1.4). Подобного рода эксперимен- 34
тальные исследования для более широкого класса динамических си- стем, описываемых нелинейными ме- няющимися во времени дифферен- циальными уравнениями, прове- дены Макридакисом и Фошо [221]. Некоторые свои результаты для разных случаев они представили в виде математических формул. Так, например, вероятность устой- чивости произвольно выбранной системы описанного выше класса с п переменными задается функцией p{rt)=eI“I-In, что очень хорощо соответствует экс- периментальным данным. Конечно, Рис. 1.4. Зависимость устойчиво- сти системы от связности (экспе- риментальные результаты получе- ны Гарднером и Эшби) есть все основания рассматривать эту функцию как некий закон науки о системах. Аналогичные модельные исследования для биологических сис- тем, описываемых взаимосвязанными логическими элементами, проведены Кауфманом [171]. Уолкер, Эшби и Гельфанд [121, 325, 326] экспериментировали с системами, состоящими из функционально одинаковых элемен- тов, представляющих собой конечные автоматы с двумя входами и двумя внутренними состояниями. Задачей этих исследований было определение зависимости длины цикла и других характерис- тик от размера системы для различных типов автоматов. В качестве примера совершенно иного рода экспериментально- го исследования определенных свойств систем приведем эмпири- ческую формулу c=K1(K2)«gMte+ft) для вычисления средней цены С двухуровневой переключающей схемы, реализующей одну булеву функцию с п независимыми переменными, g узлами «один» и h узлами «нуль». Эта формула получена Келлерманом [172] на основе большого числа вычис- лительных экспериментов, и К2— это константы, зависящие в общем случае от используемой технологии, типов компонентов и определения цены. Келлерман определил также значения этих констант для практически важных случаев. Данная формула мо- жет помочь конструктору сравнить несколько различных конст- рукций, а также проливает некоторый свет на главный вопрос: при использовании одной технологии, объективных критериев и ограничений является ли переключающая схема с а входами и Ъ выходами дешевле или дороже (в среднем) переключающей схе-
мы с с входами и d выходами, где или а<с и b<d, или а>с и 6<d? 3. Экспериментальные характеристики методов. Постановка задачи, решение которой известно, моделируется на компьютере. Для решения этой задачи используется исследуемый метод (обыч- но это метод решения задач, имеющих недедуктивную природу). Полученный результат сравнивается с известным решением. Эта процедура повторяется достаточное число раз для различных по- становок задач исследуемого класса, что позволяет определить Полученные характеристики введенного метода. Такие характерис- тики очень важны для пользователей, применяющих разные ме- тоды, так как дают возможность правильно интерпретировать полученные результаты и принять соответствующие решения. Подобные эксперименты для одной из задач анализа рекоцструи- руемости описаны в гл. 4. Таким образом, связи между решением системных задач и вычислительной техникой весьма важны. Можно с уверенностью сказать, что решение системных задач, как оно понимается и описывается в данной книге, не имело бы в действительности никакой практической ценности, если бы не использование мощ- ной вычислительной техники. 1.6. АРХИТЕКТУРА РЕШЕНИЯ СИСТЕМНЫХ ЗАДАЧ Хорошая архитектура должна быть от- ражением самой жизни, что означает глубокое понимание биологических, со- циальных, технических и художествен- ных вопросов. В. Гропиус Хотя и совершенно ясно, что решение системных задач беско- нечно разнообразно, становится все понятнее, что это бесконечное разнообразие может быть достаточно полно представлено конеч- ным набором системных задач. Этот набор взаимосвязанных си- стемных задач получается в результате применения нескольких фундаментальных принципов, согласно которым классифицируют- ся и организуются системы. Решение системных задач может изучаться и развиваться на разных уровнях обобщения и детализации. На самом высоком уровне общности основное внимание уделяется разработке прак- тически важных принципов организации систем и выработке об- щего взгляда на процессы решения системных задач. Такие общие аспекты решения системных задач будем называть архитектурой решения системных задач. 36
Архитектура — это одна из самых древних профессий. В самом деле, уже в Древней Греции 2000 лет назад она была прекрасно развита и считалась самостоятельной профессией. Одним из луч- ших описаний архитектуры остается знаменитая книга «Об архи- тектуре» древнеримского архитектора и инженера I в. до нашей эры Марка Витрувия Поллиона [324]. Следующий отрывок из этой книги хорошо выражает его взгляды: Архитектор должен обладать знанием многих областей науки и разного рода ученостью, так как его суждением проверяются все создания других искусств. Это знание — дитя практики и теории. В своей долгой и увлекательной истории архитектура ассоци- ировалась почти исключительно с проектированием зданий. Толь- ко совсем недавно было показано, что некоторые общие принципы архитектуры относятся не только к проектированию зданий, но равным образом существенны и в других областях проектирова- ния. Необходимость использования приемов архитектуры при про- ектировании вычислительных машин была осознана в начале 60-х гг. Сам термин «компьютерная архитектура» был, кажется, введен Ф. Бруксом в связи с разработкой компьютера STRETCH фирмы IBM. В статье «Архитектурная философия» [54] он вводит следующее определение: Компьютерная архитектура, как и всякая другая архитектура, это искусство определения требований пользователя к структуре, а затем проектирование таким образом, чтобы опа как можно полнее соответствовала этим требованиям при заданных экономических и технологических ограничениях. Этот подход к компьютерной архитектуре, возникший из опыта проектирования ЭВМ STRETCH был последовательно выдержан при создании IBM System/360 — семейства одинаково спроектиро- ванных взаимно совместимых ЭВМ, отражавших как требования пользователей, так и экономические и технологические возможно- сти. Результат этого нового подхода к проектированию компью- теров излагается в статье «Архитектура IBM System/360», напи- санной архитекторами этой серии машин Амдалем, Блаау и Брук- сом [10]. Вскоре после этого компьютерная архитектура стала считаться важной частью компьютерного проекта. Теперь она изучается практически в любом семинаре по информатике и вычислительной технике и хорошо описана в литературе. Признание компьютерной, архитектуры было первым шагом в расширении понятия архитектуры за традиционные рамки ее понимания как архитектуры зданий. В данной книге делается еще один шаг, распространяющий понятие архитектуры на все систе- 37
мы. Подобное обобщение предлагается не впервые. Так, например, еще в 1962 г. Г. Саймон рассматривал подобную идею, называя ее «архитектурой сложности» [286]. Г. Земанек постоянно доказы- вал важность обобщения понятия архитектуры на все системы и ввел такие названия, как обобщенная архитектура [361] и аб- страктная архитектура [362]. Подобного же мнения придержива- ется Дж. Таунер в своей книге «Архитектура знания» [311]. Од- нако ни одно из этих предложений не относится к решению системных задач. В этом смысле данная книга является единст- венной в своем роде. Настоящая тенденция к расширению сферы архитектуры за рамки ее традиционной области — строительства зданий (и, воз- можно, других родственных сооружений вроде мостов и кораб- лей) не противоречит общепринятому и приведенному в словарях определению архитектуры. Например, в Оксфордском словаре ан- глийского языка архитектура определяется как «искусство или наука построения или конструирования любых сооружений для нужд людей», как «действие или процесс построения» или как «здание или сооружение». Таким образом, можно видеть, что, во- первых, термин «архитектура» имеет три разных толкования: оп- ределенная дисциплина, определенный тип человеческой деятель- ности и определенный результат этой деятельности, и, во-вторых, во всех трех толкованиях архитектура понимается не только как архитектура зданий. Из определения, приведенного в толковом словаре, можно лег- ко выделить две ключевые характеристики архитектуры: 1) архи- тектура связана с проектированием, конструированием, построени- ем и т. п., т. е. с процессами создания искусственных объектов; 2) она имеет дело с использованием созданных объектов челове- ком. Рассмотрим характеристики подробнее. Хотя архитектура и ориентирована на проектирование, конст- руирование и построение, полностью все эти виды деятельности она не охватывает. Таким образом, архитектор является проекти- ровщиком, работа которого завершается другими людьми. Его роль состоит в наблюдении за проектом на глобальном уровне; он занимается аспектами проекта, включающими любые интерфейсы с пользователем. В хорошем архитектурном проекте другие вопро- сы, не интересные с точки зрения пользователя, должны оставать- ся открытыми. Однако архитектор обязан учитывать возможности технологии и экономические ограничения, чтобы быть уверенным, что его архитектурный проект может быть реализован без значи- тельных затруднений. Архитектурное проектирование предназначено для подготовки общих спецификаций, определяемых нуждами и пожеланиями пользователя и используемых на этапах проектирования и конст- руирования. Таким образом, первая задача архитектора при соз- 38
дании проекта — это определение реальных потребностей и поже- ланий пользователя. Эта задача прекрасно сформулирована фран- цузским архитектором Ж- Годе: «Архитектор прежде всего должен определять содержание, из которого он может затем из- влечь форму». В хорошем архитектурном проекте многие детали будущей кон- струкции остаются непроработанными, оставляя достаточно сво- боды для дальнейшего проектирования и конструирования, но в нем имеются все спецификации существенных для пользователя характеристик. В этом смысле он представляет собой общее опи- сание будущей конструкции, сделанное с определенного расстоя- ния. Хорошего архитектора более чем что-либо другое отличает именно эта способность выбирать нужное отдаление, с которого хорошо различимы все существенные для пользователя свойства, но в то же время не видны остальные. Более поэтически эту точку зрения выражает следующий отрывок из книги «Дао Дэ Цзин» знаменитого китайского философа Лао Цзы (VI в. до н. э.) '. Находящееся в бесконечном движении не достигает предела. Не достигая предела оно возвращается к своему истоку. Итог нашим замечаниям можно подвести с помощью следую- щей цитаты из Г. Земанека [361]: Архитектурное проектирование — это проектирование сверху вниз, опреде- ляющее каждую деталь как функцию целого. С этой точки зрения архитектурное проектирование дополняет формальное определение: определить детали по общей структуре можно только в том случае, если метод описания позволяет совершен- но свободно опускать детали и говорить о желаемых свойствах системы в целом до начала любой работы по объединению частей сооружения. По Г. Блаау [44], одному из архитекторов IBM System/360, в проекте любой системы можно выделить три характерных уров- ня: архитектура, исполнение и реализация. Архитектура систе- мы— это функциональное проявление системы с точки зрения пользователя; под исполнением понимается логическое описание внутренней структуры, делающей возможным осуществление этих функций; реализация — это физическое воплощение исполнения. В хорошей архитектуре выдерживаются некоторые общеприня- тые принципы. Они четко изложены в статье Блаау [44]. Приве- дем перечень этих принципов из данной статьи: 1. Согласованность. Хорошая архитектура согласована, т. е. ча- стично знание системы позволяет предсказать остальное. 1 Дао Дэ Цзии. Древнекитайская философия: Пер. с кит. — М,- Мысль, 1972 т- 1.—373 с. —Прим. ред. 39
2. Ортогональность. Этот принцип требует, чтобы функции бы- ли независимы друг от друга и специфицированы по отдельности. 3. Соответственность. Согласно этому принципу следует вклю- чать в архитектуру только те функции, которые соответствуют су- щественным требованиям к системе, другими словами, в хорошей архитектуре нет ненужных функций. 4. Экономность. Никакая функция в описании архитектуры не должна в том или ином виде дублировать другую. 5. Прозрачность. Функции, найденные в процессе исполнения, должны быть известны пользователю. 6. Общность. Если функция должна быть введена, ее следует вводить в таком виде, чтобы она отвечала как можно большему числу назначений. 7 Открытость. Пользователю должно быть позволено исполь- зовать функцию иначе, чем это предполагалось при проектирова- нии. 8. Полнота. Введенные функции должны с учетом экономиче- ских и технологических ограничений как можно полнее соответст- вовать требованиям и пожеланиям пользователя. Архитектура решения системных задач, которой главным об- разом и посвящена эта книга, должна соответствовать основным целям и принципам любой архитектуры, как это описано в данном разделе. Прежде всего, эта архитектура должна быть ориентиро- вана на пользователя, т. е. должна охватывать все типы системных задач, с которыми будет работать предполагаемый пользователь. Хотя представление об этом пользователе должно быть как можно более широким, в первую очередь она ориентирована на ученых, инженеров и других специалистов. Различные типы системных за- дач определены, исходя преимущественно из тех системных задач, которые возникают в разных областях науки и техники, а также в таких областях, как медицина, управление или право. На архитектурном уровне решение системных задач должно рассматриваться и описываться с определенной дистанции, позво- ляющей, не отвлекаясь на детали, распознать общую структуру. Реальный архитектурный проект для решения системных задач, вроде упомянутого в разд. 1.2 УРСЗ, должен разрабатываться сверху вниз и отражать различные принципы хорошей архитекту- ры. Этот подход показан в гл. 9 после того, как в гл. 2—8 опреде- лены и описаны соответствующие решения системных задач. Что касается исполнения УРСЗ, то в этой книге рассматриваются только те его аспекты, которые непосредственно связаны с эписте- мологическими существенными задачами, базирующимися на очень общих методологических отличиях. Реализации УРСЗ в дан- ной книге не описываются, однако приводятся ссылки на две уже существующие реализации. 40
ПРИМЕЧАНИЯ 1.1. Термины «общая система» и «общая теория систем» предложены, по- видимому, Л. фон Берталанфи. Он употреблял их устно еще в 1930-х гг., однако первые публикации появились только после второй мировой войны [41—43]. С его точки зрения «общая теория систем — это логико-математическая область, задачей которой является формулирование и вывод таких общих принципов, ко» торые применимы ко всем «системам»». Фон Берталанфи не только автор идеи общей теории систем, но и один из главных организаторов исследований в этой области, прежде всего Общества общесистемных исследований. Общество было организовано в 1954 г. со следующими целями: 1. Изучение изоморфности концепций, законов и моделей в различных обла- стях и оказание помощи в перенесении их из общей области в другую. 2. Поощрение разработки адекватных теоретических моделей в областях, их не имеющих. 3. Минимизация дублирования теоретических усилий в разных областях. 4. Содействие единству науки за счет совершенствования общения между специалистами. Среди первых сторонников исследований по теории систем наиболее замет- ными фигурами были, вероятно, А. Раппопорт и К- Боулдннг. Боулдинг рассмат- ривал общую теорию систем как «некий уровень теоретического построения мо- делей, лежащий где-то между высоко обобщенными конструкциями чистой мате- матики и конкретными теориями специальных дисциплин» [48]. Вполне аналогичные концепции, но связанные не с общесистемными исследо- ваниями, а рассматривающие информационные процессы в системах, таких, как связь и управление, были сформулированы в конце 40-х — начале 50-х гг. н по- лучили название «кибернетика». Наибольшее влияние в этом направлении оказа- ли классические книги Б. Винера [339] и У. Росс Эшби [17]. Кибернетика, кото- рую Винер определил как исследование «связи и управления в животном и ма- шине», основывается на понимании того, что связанные с информацией проблемы можно вполне содержательно и успешно изучать, по крайней мере до некоторого предела, независимо от определенного контекста. Этот подход был существенно поддержан работами К. Шеннона по математическому исследованию понятия информации [283, 284]. В результате этого исследования появилась математиче- ская теория информации [103, 137, 175, 330]. Позднее, в 1960-х гг., было сделано несколько попыток сформулировать и развить математические теории систем высокого уровня общности. Одна из этих теорий, начало которой положил главным образом М. Месарович, основывается на предположении, что любую систему можно представить в виде отношения, определенного на семействе множеств [225]. Затем для изучения некоторых кон- кретных свойств были разными способами введены дополнительные математиче- ские структуры. Хороший обзор этой теории можно найти в книге [341], а так- же в более поздней книге Месаровича и Такахары [227]. Другие математиче- ские теории систем явились результатом попыток объединить теории систем, опи- сываемых дифференциальными уравнениями и конечными автоматами в единую 41
математическую теорию. Наиболее плодотворными из этих теорий оказались тео- рии, разработанные А. Уаймором [342] и М. Арбнбом [13]. Среди других мате- матических теорий систем теория, возникшая из теории электрических цепей, а затем обобщенной теории схем [349], а также теории, возникшие из других предметных областей [32, 147, 253, 354]. Три области иауки — общесистемные исследования, кибернетика и матема- тические теории систем, а также вычислительная техника — это важнейшие ком- поненты науки о системах. Более подробно история развития и значимость этих иаук и смежных областей (таких, как исследование операций, теория принятия решений, искусственный интеллект и т. д.) описаны в работах [63, 108, 115, 145, 152, 179, 183, 184, 275]. 1. 2. Интересно, что предложенные в разд. 1.1 три периода развития науки характеризуют три обычно выделяемых уровня обществ — донндустриальное, индустриальное и постиндустриальное [35, 125]. Донндустриальное общество по существу является обществом донаучным, для индустриального общества харак- терна одномерная наука, с постиндустриальным обществом, которое, по-видимо- му, лучше называть «информационным» [233], связана двумерная наука. 1. 3. Разрабатываемая в этой книге идея решения системных задач появилась у меня в начале 60-х гг., когда я заинтересовался методологическими резуль- татами общесистемных исследований. Впервые она упоминается в моей статье [177]. Позднее я изложил эту еще ие вполне сформировавшуюся идею в книге [178]. Первый набросок архитектуры УРСЗ опубликован в 1978 г. в статье, на- писанной мной в соавторстве с Р. Кавалло [63]. В том году X. Юттенхов закон- чил диссертацию на факультете системологии в университете шт. Нью-Йорк в Бингемтоне. Она была посвящена исполнению и реализации некоторых фраг- ментов УРСЗ [316]. Эти работы, начатые в 1978 г., продолжаются и сейчас. Пакет программ, реализующий подмножество УРСЗ, является теперь коммерче- ски доступным продуктом [317]. 1. 4. Гёдель опубликовал доказательство того, что аксиоматический метод имеет определенные внутренние ограничения, в 1931 г. в Германии в Monatshef- te fur Mathematik und Physik, Vol. 38, P. 173—198. Доступное изложение этого доказательства см. в книге Е. Nagel, J. R. Newman. Godel's Proof. (Routledge & Kegan Paul, London, 1959) ’. 1. 5. Рисунок 1.3 выполнен Б. Гейнсом и М. Шоу для описания предложенной мной иерархии эпистемологических уровней систем, он используется в этой книге с нх разрешения. 1П_ 1 ”ЛГ-?ЛЬ Э-, Ньюмеи Дж. Теорема Гёделя: Сокращ. пер. с англ.—М.: Мир.— 1970.—127 с. — Прим. ред. 42
ГЛАВА 2. ИСХОДНЫЕ СИСТЕМЫ И СИСТЕМЫ ДАННЫХ Человек сказал Вселенной: «Я существую»! «Увы, — ответила Вселенная, — Это ни к нему меня Не обязывает».1 С. Крейн 2.1. ОБЪЕКТЫ И СИСТЕМЫ ОБЪЕКТОВ Вот этот тонкий стебелек Рос в трещине в стене. Всего лишь крохотный цветок, Но, если бы я только смог Его понять вполне, Тогда б я понял, что есть Бог И все, что есть во мне.1 А. Теннисон Мы люди, способны отличать самих себя от окружающей среды. Непосредственные знания об окружающей среде есть результат наших ощущений. Мы также можем запоминать, обрабатывать и использовать информацию, полученную из окружающей среды, и таким образом усиливать свою способность к восприятию. Эти способности необходимы для нашего существования и благополу- чия. Они позволяют принимать решения и действовать соответ- ствующим образом. В повседневной жизни мы взаимодействуем с различными объ- ектами из нашего окружения, причем это взаимодействие для лю- бого объекта обычно ограничивается несколькими представитель- ными свойствами. Хотя подобное взаимодействие может стано- виться все разнообразнее по мере того, как мы все лучше узнаем объект, оно всегда существенно ограничивается пределами вос- приятия человека, его способностью к действию и другими воз- можностями. В таких случаях, как научное исследование, инже- нерное проектирование, медицинская диагностика, расследование преступления или художественное творчество, взаимодействие с объектами бывает более заметно выражено и часто выходит за пределы обычных человеческих возможностей. Людей, активно работающих в любой из традиционных отрас- лей науки, техники или в других областях (медицине, праве и т. д.), интересует в их профессиональной деятельности достаточ- 1 Перевод с английского А. Горлина. — Прим. ред. 43
но определенные типы объектов. Так, например, экологи занима- ются такими объектами, как озера, реки и леса; музыковеды — музыкальными сочинениями и композиторами; психологи изучают отдельных людей и малые социальные группы; инженеры занима- ются всевозможными объектами, созданными человеком, например электростанциями, автомобилями, самолетами, компьютерами и тому подобным; врачи имеют дело с пациентами, а ветеринары — с больными животными; криминалисты расследуют преступления, а биологи изучают различные явления в живой природе. В дальнейшие будем называть объектом часть мира, выделяе- мую как единое целое в течение ощутимого отрезка времени. Со- гласно этому определению объекты могут быть как материальны- ми, так и абстрактными. Затем можно материальные объекты раз- делить на естественные (такие, как кусок скалы, клетка организ- ма, солнце или группа животных) и созданные человеком (такие, как аэропорт, вычислительный центр, город Нью-Йорк или боль- ница). Абстрактные объекты (такие, как музыкальное сочинение, стихотворение или конституция США) обычно создаются челове- ком, однако некоторые из них можно рассматривать и как естест- венные, по крайней мере до некоторой степени (например, англий- ский или любой другой естественный язык). В большинстве случаев объекты обладают практически беско- нечным числом свойств, любое из которых можно вполне осмыс- ленно изучать и, как следствие, почти любой объект невозможно изучить полностью. Это означает, что необходимо отобрать огра- ниченное (и обычно довольно малое) число характеристик, наи- лучшим образом описывающих данный объект как явление. После того как такой отбор сделан, необходимо определить процедуру измерения (наблюдения) каждого свойства, которое, в свою оче- редь, задает абстрактную переменную, представляющую наш об- раз (наше отображение) соответствующего свойства. Мы говорим, что на интересующем нас объекте система зада- ется набором соответствующих свойств объекта и назначением каждому из них определенной переменной (с помощью процедуры измерения). Таким образом, система всегда рассматривается не как реальная вещь, а как абстрагирование или отображение не- которых свойств объекта. Это важное различие между понятием объекта и понятием системы хорошо описано У. Росса Эшби в его книге [17J. Теперь нужно пояснить то, как следует определить систему Первое, что при- ходит в голову, это указать иа маятник и сказать, что «система — это такая-то вещь, находящаяся там-то». Однако этот метод имеет существенный недостаток: всякий материальный объект включает бесконечное число переменных и, следо- вательно, бесконечное число возможных систем. Реальный маятник, например, характеризуется не только длиной и положением, но и массой, температурой, электропроводностью, кристаллической структурой, химическими примесями, ра- 44
диоактивностью, скоростью, коэффициентом отражения, пределом прочности иа растяжение, бактериальной зараженностью, поглощением снета, упругостью, фор- мой, удельным весом и т. д. и т. п. Нереально было бы исследовать все эти параметры, да такие попытки никогда и ие делаются. Нужно выделить и изучить параметры, относящиеся к некой главной проблеме, которая уже определена... Таким образом, система — это не предмет, а список переменных. Как мы уже говорили, термин «переменная» используется в этой книге для обозначения абстрактного образа свойства. По- этому, чтобы можно было определить его точно, нужно сначала разобраться, что же такое свойство. Заметим, что с каждым свойством связано множество его по- явлений (проявлений). Так, например, если свойством является относительная влажность в определенном месте Земли, то множе- ство проявлений — это всевозможные значения относительной влажности (определяемые некоторым определенным способом) в диапазоне 0—100%; если свойством является количество гор- мона эстрогена в 1 см3 женской крови, то определенное количе- ство этого гормона является проявлением этого свойства; если свойство — это цвет светофора на перекрестке, регулирующего движение транспорта в определенном направлении, то проявлени- ями этого свойства обычно бывают красный, желтый и зеленый цвета. При единичном наблюдении свойство имеет одно конкретное проявление. Для определения возможных изменений его проявле- ний требуется множество наблюдений этого свойства. Для этого, однако, необходимо, чтобы отдельные наблюдения свойства, осу- ществляемые с помощью одной и той же процедуры наблюдения, каким-то образом отличались одно от другого. Любое существен- ное свойство, на самом деле используемое для определения раз- личий в наблюдениях одного и того же свойства, будем называть базой (backdrop). Выбор этого довольно своеобразного термина объясняется тем, что всякая различающая особенность, какой бы они ни была, является своего рода базой, с которой наблюдается свойство. Типичной базой, пригодной практически для любого свойства, является время. В этом случае разные наблюдения одного свой- ства отличаются друг от друга тем, что они сделаны в разные мо- менты времени. Например, относительную влажность в определен- ном месте можно измерять в разные моменты времени, скажем каждый час. Аналогично множество замеров объема эстрогена в 1 см3 крови одного пациента можно получить, делая анализ в разное время, например в 8°° и 20°° ежедневно в течение всего периода исследования. В некоторых случаях разные наблюдения одного и того же признака по времени неразличимы (т. е. либо сделаны одновре- менно, либо время вообще не имеет значения), зато отличаются 45
положения в пространстве, в которых сделаны наблюдения. На- пример, различные свойства, характеризующие качество акустики, можно наблюдать в один и тот же момент времени в разных точ- ках концертного зала. В некоторых дисциплинах пространство как база играет особенно важную роль, например в кристаллогра- фии, строительстве, оптике, изобразительном искусстве и анато- мии. Понятие пространства не ограничивается одно-, двух- или трехмерным евклидовым пространством. Например, пространство, образуемое точками сферы с римановой геометрией на ней, может оказаться подходящей базой для некоторых свойств (скажем, для геологических, климатических и географических характеристик Земли). Последовательность слов в некотором тексте также мо- жет рассматриваться как одномерное (абстрактное) пространст- во; такие свойства, как позиция и функция слова в любом предло- жении, число букв в отдельном слове и т. д. могут наблюдаться в каждой точке (в любом слове) этого текста. Время и пространство не единственно возможные базы. Мно- жественные наблюдения одного и того же свойства могут разли- чаться друг от друга по индивидам некой группы (population), на которой определено данное свойство. Это может быть социаль- ная группа, набор производимых товаров определенного типа, мно- жество слов в каком-то стихотворении или рассказе, множество стран, популяция лабораторных мышей и т. д. Например, при лю- бой переписи населения такие признаки, как возраст, пол, доход, занятость, научные знания и т. д., наблюдаются одновременно у всех людей, составляющих население страны. Базы трех основных типов — время, пространство, группа — можно комбинировать. Хотя в принципе возможны любые комби- нации, особенно важны и распространены комбинации время — пространство и время — группа. Позвольте мне привести некото- рые примеры. Время — пространство. Лучшим примером данной комбинации является кинофильм, особенно если он используется в исследова- ниях (изучение микробиологических процессов, роста растений или дорожных ситуаций на загруженных перекрестках и т. п.); большая часть признаков в метеорологии (относительная влаж- ность, температура, скорость и направление ветра, типы облаков и т. д.) наблюдаются во многих местах Земли и в разное время; другим примером такой комбинации баз является последователь- ность позиций на шахматной доске. Время — группа. Свойства, характеризующие положение в эко- номике, политике и обществе разных стран, наблюдаются различ- ными организациями, например ООН; ежедневно проводятся на- блюдения за популяцией лабораторных мышей, за их физиологи- ческим состоянием и поведением, а также за признаками, находя- щимися под контролем исследователя (стимуляция, медикаментоз- 46
ное и хирургическое лечение); за такими характеристиками, как число опубликованных книг и журналов определенной категории, средняя цена книги и среднее число подписчиков журнала, сум- марный доход и за множеством других ежегодно следит группа издателей. Помимо особого использования времени, пространства и групп в качестве баз, они могут выступать и как свойства. Например, при ежедневном наблюдении времени восхода и захода Солнца в разных местах Земли, свойством является время, а его базами — вре1МЯ и пространство; рекордные значения времени в каком-либо спорте, скажем в плавании на 400 м вольным стилем, являются наблюдениями свойства, различающегося во времени (например, датами установления рекордов); время является базой для на- блюдения за таким свойством, как местоположение судна; можно наблюдать за значениями времени, необходимого для решения за- дачи пакетом программ, работающих на одном и том же компью- тере. Приведенные примеры показывают, что выбор подходящих баз достаточно гибок, однако не совершенно произволен. Ограничения при этом выборе достаточно точно выражены в описанных ниже требованиях, которым должны удовлетворять правильно выбран- ные базы; эти ограничения могут служить руководящими принци- пами в процессе определения системы на интересующем иас объ- екте. Первое, базы должны быть применимы ко всем свойствам си- стемы, для которой они определены. Например, ни время, ни про- странство не могут быть использованы для отличия испытаний продукции определенного типа (не имеет значения, когда и где были проведены эти испытания); ни пространство, ни группа не применимы в качестве баз для свойств, характеризующих музы- кальное сочинение; ни время, ни группу нельзя использовать при описании мозаики. Второе, базы системы должны отвечать назначению, для кото- рого определяется данная система. Так, например, при наблюде- нии за выздоровлением пациента после хирургической операции наблюдают за соответствующими признаками. Ясно, что единст- венной подходящей для этого базой является время. Но если це- лью является создание медицинской базы данных, то те же самые характеристики будут различаться не только по времени, но и по фамилиям и другим характеристикам пациентов, находящихся на одной стадии выздоровления, данные о которых и будут заносить- ся в базу данных. Таким образом, в данном случае применимыми в качестве баз оказываются и время и группа. Третье, наблюдения всех свойств системы должны однозначно определяться базами системы, т. е. каждый элемент базового мно- жества (значение определенного момента времени, точка прост- 47
раиства, элемент группы или соответствующая комбинация эле- ментов) определяет одно и только одно проявление любого из свойств. Например, при исследовании признаков слов текста (по- зиция и функция слова в предложении, число букв в слове и т. д.) вполне разумной базой является группа слов, входящих в этот текст. Очевидно, что такая база применима к этим свойствам и соответствует цели исследования. Однако она не удовлетворяет требованию однозначного различения наблюдений. В самом деле, одно и то же слово может находиться в одной и той же позиции и иметь ту же функцию в нескольких предложениях в данном тек- сте, но, разумеется, в нем будет одно и то же число букв. Для того чтобы отличить любое наблюдение, нам нужно обратиться в данном случае к одномерному абстрактному пространству, точ- кой которого является положение слова в тексте. Если смысл свойств и баз и их взаимоотношения поняты пра- вильно, то ясно, как формально определить систему, заданную на объекте, иначе систему объекта. Она представляет собой мно- жество свойств, с каждым из которых связано множество его про- явлений, и множество баз, с каждой из которых связано множество ее элементов. Формально система объекта — это 0=({(а,, A()|teWn}, {bh (2.1) где Nn= {1, 2, ..., п}, a Nm={\, 2, ..., т} (буквой N с положи- тельным целым индексом в той книге всегда обозначается множе- ство значений целых положительных чисел от 1 до значения этого индекса); через а,- и At обозначены соответственно свойство и мно- жество его проявлений; bj и Bj— база и множество ее элементов, а О — система объекта. Для некоторых признаков и баз множества Д- и В, из уравне- ния (2.1) определяются достаточно хорошо. Например, если в ка- честве базы используется группа (социальная группа или группа животных, продукция определенного типа или группа стран), мно- жество В/ обычно четко определено. Аналогично хорошо опреде- лено множество проявлений А{ для таких признаков а,, как еже- месячный доход человека, цвета светофора, число букв в слове или пассажиров в полете. В науке, однако, во многих случаях эти множества неизвестны и могут быть определены только с помощью философских построений. Тем не менее независимо от обстоятельств их можно связать с хорошо определенными множествами с помо- щью конкретных процедур наблюдения или измерения. Эти хоро- шо определенные множества представляют собой образы множеств А{ и В/, и терминах этих множеств и формулируются знания о свойствах. ▲ Само существование свойств, баз и, соответственно, множеств At, Bj как атрибутов естественных объектов является предметом 48
философской контроверзы. На этот счет имеются разные точки зрения — от наивного реализма, безоговорочно принимающего их существование, до крайних форм операционализма (или инстру- ментализма), отрицающего их существование и утверждающего, что содержание любого научного понятия целиком и полностью определяется спецификацией процедуры измерения. Данная философская проблема не имеет отношения к нашим задачам. Однако мы должны понимать, что независимо от отно- шения к проблеме существования множества А, и В/ часто быва- ют неизвестны. В подобных случаях система объекта смысла не имеет и может приобрести содержание только благодаря заданию конкретных процедур наблюдения или измерения, с помощью ко- торых создаются образы свойств. Таким образом, система объекта должна рассматриваться как компонент большей системы; рас- сматривать систему объекта саму по себе практически бесполезно. 2.2. ПЕРЕМЕННЫЕ И ПАРАМЕТРЫ Природа не выражает себя свобод- но, но говорит, только будучи спро- шенной. Ф. Бэкон Переменной называется в этой книге операционное представ- ление свойства, т. е. образ свойства, определяемый конкретной процедурой наблюдения или измерения. Каждая переменная име- ет определенное имя (метку), отличающее ее от других рассма- триваемых переменных, и связывается с определенным множест- вом величин, через которые она себя проявляет. Эти величины обычно называют состояниями (или значениями) переменной, а все множество — множеством состояний. Аналогично параметром называется операционное представле- ние базы. Каждый параметр имеет уникальное имя, и с ним свя- зывается некое множество; будем называть его параметрическим множеством, а его элементы — значениями параметра. По аналогии со свойствами и базами предполагается, что раз- ные наблюдения одной и той же переменной различаются по зна- чениям параметров. Если используются два и более параметра, то их общим параметрическим множеством является декартово про- изведение отдельных параметрических множеств. Необходимо, чтобы каждое конкретное значение параметра (из общего пара- метрического множества) идентифицировало одно и только одно наблюдение соответствующих переменных. На отдельных множествах состояний или параметрических мно- жествах могут быть определены некоторые математические отно- шения, скажем, отношение порядка или расстояние. Они отражают 4—6923 4g
существует и изоморфна относительно математических свойств Tt. Аналогично обобщенный параметр Wj конкретизируется парамет- ром Wj тогда и только тогда, когда функция е/1 Wp+W, (2.5) существует и изоморфна относительно Wp Каждый конкретный изоморфизм е, (или е/) задает конкретизацию иг- с помощью vi (или соответственно w, с помощью Wj). Функции, обратные е, и е/, т. е. ег1: ^Vi, (2.6) ег1 : (2.7) задают абстрагирование соответственно и{ и w,. Л Пример 2.1. Для иллюстрации введенных понятий положим, что а, — это установленный ежегодный доход налогоплательщика США за последний год, как сообщается в его налоговой деклара- ции за этот год. Тогда А,— это всевозможные суммы денег (в дол- ларах США) от нуля до максимально представимой суммы, ска- жем до 100 000.00 дол. Это множество конечно, так как минималь- ная имеющая хождение денежная единица — 1 цент. Мы понимаем также, что это множество полностью (линейно) упорядочено. Для вычисления подоходного налога достаточно рассматривать только диапазоны облагаемого налогом дохода, где каждому диапазону соответствует определенный процент дохода, который следует вы- платить в качестве подоходного налога. Для упрощения будем этими диапазонами считать диапазоны 0—4,999.99, 5,000.00 — 9,999.99, ..., 90,000.00 —94,999.99, 95,000.00— 100,000.00 и пусть множеством состояний V,- конкретной переменной v{, представля- ющей свойство а,, будет множество минимальных значений этих диапазонов. Содержательное представление а,- с помощью i)i мож- но ввести с помощью функции Oj, которая для каждого диапазона любому значению из диапазона присваивает минимальное значе- ние в этом диапазоне, например о, (52357) =50 000 или оД796)=0. Очевидно, что функция о,- гомоморфна относительно полного упорядочения А;, так как для любой пары а, реА,, если а^р, оДа)^оДр). Из методических соображений обобщенная перемен- ная Vi может быть для конкретной переменной v( определена с по- мощью абстрагирующей функции e~l: Vt—*~Vi. Эта функция долж- на быть изоморфной относительно упорядочения на izt-. Предполо- жим, что нужно, чтобы множество V, представляло собой набор значений целых чисел. Тогда ег1 можно, вероятно, наиболее есте- ственным образом, задать следующим уравнением: er'(5000k)=k (fe=0, 1, .... 19). 52
Базой в этом примере является множество американских нало- гоплательщиков определенной категории, скажем множество жи- телей шт. Нью-Йорк. Данное множество не обладает никакими математическими свойствами. Таким образом, он: может быть любой взаимно однозначной функцией, которая каждому на- логоплательщику ставит в соответствие уникальный идентифика- тор, например номер его страховки. Методологически удобно аб- страгирование е/-!: представить в виде взаимно однознач- ной функции, ставящей в соответствие целым числам из множест- ва Nn, где п — число налогоплательщиков в этой группе, значения номеров карточек социального страхования. Д Остановимся более подробно на понятии канала наблюде- ния. До сих пор мы его определяли через функции о< и о/, опре- деленные соответственно в уравнениях (2.2) и (2.3). Эти функции индуцируют разбиения множеств А, и В/, скажем разбиения Atld и BjltDj. Элементы любого блока в этом разбиении эквивалентны в том смысле, что они не различаются с точки зрения введенной процедуры наблюдения. В таком разбиении каждый блок целиком представляет одно состояние переменной и,- или одно значение параметра W/. Когда наблюдение свойства щ проводится при не- котором значении параметра, то наблюдаемое свойство получает определенное проявление (значение) из множества Аг. Это про- явление является элементом одного и только одного блока раз- биения Ai/Oi. Функция о, присваивает его определенному состоянию переменной in. Таким образом, предполагается, что любое наблю- дение позволяет нам определить, к какому блоку из At/Oi принад- лежит данное проявление, даже если отдельное проявление и нельзя идентифицировать. Предположение о том, что различие блоков Ai/oi может быть обнаружено по результатам наблюдений, оправдывается только в том случае, когда ошибки наблюдения исключены. Подобные случаи, как показано в примере 2.1, встречаются, но относительно нечасто. Тем не менее это предположение можно считать практи- чески оправданным и в других случаях, когда блоки Аг/Oi сущест- венно больше ожидаемых значений ошибок наблюдения. При этом блок Ai/Ог правильно определяется во всех случаях, кроме тех, когда фактическое проявление оказывается близко от границы между блоками, т. е. в пределах ожидаемой ошибки наблюдения. Поскольку свойства (по крайней мере некоторые из них) не кон- тролируются исследователем, невозможно предотвратить прояв- ления свойств в нежелательной близости от границ между блока- ми в Ai/oi и, следовательно, можно только сократить возможность определения неправильных блоков по наблюдениям благодаря правильному выбору канала наблюдения о,. Исключить такую воз- можность полностью нельзя. 53
В результате появления возможности ошибок измерения с про- явлениями возле границ между блоками в Ai/Oi связана опреде- ленная недостоверность наблюдения. Имеется два варианта интер- претации этой недостоверности. 1. Блоки разбиения, определенные на множестве At, рассма- триваются как множества без четких границ. В терминологии тео- рии нечетких множеств эти блоки представляют собой нечеткие подмножества множества Лг. Предполагается, что множество Аг является четким. Каждый элемент множества At принадлежит лю- бому его нечеткому подмножеству с определенной степенью при- надлежности. Согласно такому подходу подмножества определя- ются только степенями принадлежности, а не функцией о,. 2. Разбиение множества Лг задается функцией о,-. Это то же самое разбиение Л,/ог-, что рассматривалось выше. Ясно, что его блоки являются четкими подмножествами А{. Достоверно неиз- вестно, к какому блоку Лг/ог- принадлежит заданный элемент Лг. Эта недостоверность может быть задана функцией, сопоставляю- щей любой паре (элемент Лг, блок Лг/Ог) число (обычно между О и 1). Определенное таким образом число в заданном контексте выражает степень достоверности того, что данный элемент при- надлежит данному блоку. В дальнейшем мы будем придерживаться второго варианта. При этом варианте требуется, чтобы сначала была задана функ- ция о,, как в уравнении (2.2). Будучи заданной, она определяет на множестве Л,- разбиение Ai/Oi. Затем определяется функция di-.AiXAJOf^lO, 1], (2.8) где Oi[x, у) задает степень достоверности того, что х принадлежит у. Однако, поскольку каждый блок Adoi однозначно представля- ется (помечается) состоянием из множества Vi (в соответствии с функцией Oi), функцию 6$ можно задать в более удобном виде ~ог:ЛгХ^-<0, 1], (2.9) где б; (х, у) задает степень достоверности того, что х принадлежит блоку из разбиения Лг/ог, представляемому состоянием у пере- менной Vi. Определенная в уравнении (2.9) функция б,- характеризует на- блюдения свойства йг в смысле их недостоверности. Ее также можно рассматривать как функцию степени принадлежности, оп- ределяющей нечеткое отношение на декартовом произведении ЛгХК-. В этом смысле бг можно назвать нечетким каналом на- блюдения. Во избежание недоразумений Ог будем называть чет- ким каналом наблюдения. 54
ot (х, у) = Ясно, что для определения нечеткого канала наблюдения необ- ходимо сначала задать четкий канал наблюдения о,. Четкий ка- нал наблюдения можно также рассматривать как частный случай нечеткого. В самом деле, если 1, если ог(х) = у, <0 в противном случае, то di задает четкую функцию из Ai в Vi, идентичную оу. При рассмотрении баз можно ввести функцию 1], (2.10) подобную функции (2.9) и основанную на соотношении (2.3).Здесь ю/(х, у)—степень достоверности того, что х принадлежит блоку разбиения Bj/aj, который представлен значением у параметра Wf. На практике, однако, эта функция не используется. В самом деле, если Bj — это группа, то функция со/ является взаимно однознач- ной, и, следовательно, недостоверность наблюдений отсутствует. Если Bj является временем или пространством, то реальное на- блюдение контролируется исследователем, т. е. исследователь при- нимает решение о том, где или когда должно быть проведено на- блюдение. Такой контроль реальных наблюдений, а также относи- тельная свобода выбора соответствующей функции <в/ позволяют исследователю избежать всякой недостоверности, за исключением неустранимых ошибок при измерении времени или пространства. Если, например, он решает, что температура, относительная влаж- ность и т. д. должны фиксироваться па метеостанции 24 раза в сутки, в половине каждого часа, он может задать функцию так, чтобы любой блок результирующего разбиения Bj/atj пред- ставлял собой одночасовой интервал [0 ч—1 ч), [1 ч — 2 ч),... ..., [23 ч — 0 ч). Тогда, если взять конкретное измерение наблю- даемых свойств, скажем в 1 ч 30 мин, то обычно совершенно до- стоверно можно сказать, что это измерение представляет блок [1—2 ч). В принципе и в этом случае возможны ошибки (такие, как грубое нарушение правила измерения пли поломка часов), однако такие случаи для обычного канала наблюдения не рас- сматриваются. Можно следующим образом суммировать наши соображения относительно каналов наблюдения. Для любых практических на- добностей достаточно использовать четкий канал наблюдения для баз, будь то группа, время или пространство. Однако для свойств применимы как четкие, так и нечеткие каналы наблюде- ния (о, и di), и при разных обстоятельствах более подходящим может быть тот или иной тип канала. 55
Рис. 2.1. Четкий и нечеткий каналы наблюдения для полностью упорядоченного признака «возраст человека» Пример 2.2. Пусть свойством является возраст человека из группы В,-. И пусть элементами At будут номера лет в диапазоне от 0 до 100. Положим, что V>= {очень молодой, молодой, средних лет, старый, очень старый}, и пусть Oi — это взаимно однозначная функция Ai/Oi-^-Vt, опреде- ленная следующим образом: {0, 1, ..., 14} {15, 16.........29} {30, 31, ..., 49} {50, 51, ..., 74} — очень молодой, — молодой, — средних лет, — старый, {75, 76, ..., 100}—очень старый. При использовании четкого канала наблюдения очень плохо описываются люди, чей возраст близок к границам между бло- ками Ailoi. Например, 49-летний человек помечается как человек средних лет, а 50-летний, как старый. При использовании нечет- кого канала о,, например такого, какой описан на рис. 2.1, приве- ден оказывается более подходящим, поскольку не дает таких рез- ких скачков. Важно отметить, что нечеткий канал наблюдения да- ет не одно состояние V, для одного наблюдения, как четкий канал, а набор значений б|(х, у) для всех y^Vi. Так, например, при на- блюдении 25-летнего человека через нечеткий канал будут полу- чены следующие 5 значений: di (25, очень молодой) =0.1 Oj (25, молодой) =0.97 5i (25, старый) =0 5i (25, очень старый) =0. ▲ 56
2.3. МЕТОДОЛОГИЧЕСКИЕ ОТЛИЧИЯ Когда мы говорим, что свойство имеет выраженную структуру, то имеем в ви- ду, что структура определена эмпириче- скими отношениями между эмпирически- ми объектами... Чем больше отношений принимается во внимание при определе- нии шкалы значений, тем больше значе- ния шкалы говорят нам о реальном ми- ре... Построить шкалу, гомоморфную от- носительно отношения порядка, но не сохраняющую, скажем, отношение адди- тивности, которое можно определить эм- пирически, значит потерять информа- цию. Дж. Пфанцагль Термин методологическое отличие используется в данной кни- ге для описания особенностей системных задач, по которым раз- личаются равные типы задач внутри одной эпистемологической категории задач. Методологические отличия касаются как систем, так и требований к ним. Такие модификации, как введение в си- стему нового методологического отличия, его удаление или замена одного методологического отличия другим, не изменяют эпистемо- логического уровня системы. Однако они могут повлиять на набо- ры методологических отличий, подходящих к различным требова- ниям. Таким образом, методологические отличия для систем дол- жны выбираться до того, как такие отличия будут выбраны для требований. Как нам подсказывает название, типы задач разнятся только некоторыми методологическими отличиями, требуют разных мето- дов решения, но имеют один и тот же статус в эпистемологичес- кой иерархии систем. Таким образом, методологические отличия представляют собой вторичные критерии классификации систем- ных задач. Они служат дополнением к первичной классификации по эпистемологическим критериям. Эпистемологических типов за- дач слишком много для всякого конкретного методологического исследования. Поэтому методологические отличия предназначены для уточнения типов методологически разрешимых задач. Набор приписываемых в рамках определенной концептуальной схемы методологических отличий систем связан с набором приня- тых эпистемологических типов систем отношением «применимо к»; аналогичное отношение имеется и для требований. В то время как одни методологические отличия подходят только к определенным эпистемологическим типам, другие применимы ко всем. 57
В данном разделе рассматриваются методологические отличия, относящиеся к переменным и их параметрам. Так как переменные н параметры являются компонентами любой системы независимо от ее эпистемологического уровня, эти эпистемологические отли- чия применимы к системам всех эпистемологических уровней. Методологические отличия для переменных и параметров — это характеристики их множеств состояний и, соответственно, пара- метрических множеств. Если переменная (или параметр) пред- ставляет свойство (или базу), то эти свойства не могут быть про- извольными. Характеристики, очевидным образом не подходящие свойству или базе, не следует выделять и в соответствующем мно- жестве состояний или параметрическом множестве. Однако неко- торые предполагаемые характеристики свойства (или базы), не имеющие отношения к рассматриваемой задаче, также не следует признавать свойствами соответствующей переменной (или пара- метра). Во избежание возможных недоразумений приведем следующее замечание для прояснения смысла методологических отличий для самого нижнего эпистемологического уровня — уровня свойств, баз и их абстрактных аналогов (переменных и параметров). Для ре- шения системных задач методологические отличия определяются на нижнем эпистемологическом уровне только для переменных и параметров (как конкретных, так и общих), а не для соответству- ющих свойств и баз. Таким образом, на нижнем эпистемологичес- ком уровне методологические отличия определены в терминах ма- тематических свойств множеств состояний и параметрических мно- жеств. Нужна, разумеется, гарантия, что выделенные свойства от- ражают фундаментальные характеристики соответствующих свойств и баз. Это, однако, вопрос эмпирический, связанный преж- де всего е методикой измерения и не входящий в проблематику решения системных задач. Всякая переменная связана с одним или несколькими парамет- рами, и изменения состояний переменной наблюдаются на полном параметрическом множестве. Таким образом, комбинация свойств множества состояний и полного параметрического множества оп- ределяет самый элементарный тип методологических отличий. Если имеется более одного параметра, то полное параметриче- ское множество представляет собой декартово произведение от- дельных параметрических множеств. Для представления распозна- ваемых свойств этого декартова произведения свойства отдельных параметров должны сочетаться соответствующим образом. Эти свойства полного параметрического множества (декартового про- изведения) совместно со свойствами соответствующего множества состояний используются затем для описания элементарного мето- дологического отличия. Если все отдельные параметрические мно- жества имеют одни и те же свойства, то их легко скомбинировать, 58
и полученные общие свойства будут однородны на всем декарто- вом произведении. Сложнее, когда отдельные параметрические множества имеют разные свойства. В этих случаях по крайней мере некоторые общие свойства не распространяются на все де- картово произведение. Будем сначала для простоты считать, что мы имеем дело с од- ним параметрическим множеством независимо от того, является оно отдельным параметрическим множеством или декартовым про- изведением нескольких, и что выделенными свойствами обладают все это множество. Одним из фундаментальных методологических отличий явля- ется отсутствие математических свойств у множества состояний или соответствующего параметрического множества. Это крайний случай, и он плохо подходит для переменной (или параметра), предназначенной для представления свойства (или базы) и имею- щей явно выраженные и существенные для задачи характеристи- ки. Однако во многих случаях такое предельное методологическое отличие вполне уместно и даже необходимо. Такие, например, пе- ременные как семейное положение (одинокий, женат, разведен, вдовец), политическая принадлежность (демократ, республиканец, независимый), группа крови (Л, В, О, АВ) или пол (мужской, женский), заданные на элементах некой общественной группы, де- монстрируют существенность этого методологического отличия. В литературе по измерениям переменные такого рода обычно на- зывают переменными с номинальной шкалой. Наиболее фундаментальным из выделяемых свойств множеств состояний и параметрических множеств является упорядоченность. Методологически следует различать два типа упорядоченности — частичную и линейную. Частичная упорядоченность — это бинарное отношение на мно- жестве (в нашем случае на множестве состояний или параметри- ческом), являющееся рефлексивным, антисимметричным и транзи- тивным. Линейная упорядоченность сильнее частичной, так как это частичная упорядоченность, обладающая свойством связности (т. е. любая пара элементов множества так или иначе упорядо- чена). А Формально частичная упорядоченность Q, например, множе- ства Vi — это бинарное отношение QcV.+V,, удовлетворяющее следующим требованиям: 1. (х, у)(рефлексивность); 2. если (х, y)^Q и (у, x)gQ, то х=у (антисимметричность); 3. если (х, y)^Q и (у, z)^Q, то (х, <)eQ (транзитивность). Если (х, y)^Q, то х называется предшественником у, а у — преемником х. Если (х, y)^Q и не существует zsQ, такого, что 59
(x, z)^Q и (z, x)eQ, to x называется непосредственным пред- шественником у, а у — непосредственным преемником х. В допол- нение к требованиям рефлексивности, антисимметричности и транзитивности отношение линейной упорядоченности удовлетво- ряет следующему требованию связности: для всех х, y^Vt, если х=£у, то или (х, y)^Q, или (у, x)eQ. ▲ Примерами переменных с частично упорядоченным множест- вом состояний являются служебное положение или образование человека (определенные, например, на группе государственных служащих). Примерами переменных с линейно упорядоченными множествами состояний являются шкала твердости Мооса, высота как характеристики звука или экзаменационные оценки, опреде- ленные на группе студентов. Прекрасным примером упорядоченно- сти параметрического множества является время. Хотя в боль- шинстве случаев такое упорядочение линейно, имеют смысл и ча- стично упорядоченные временные множества, например при иссле- довании отдельных пространственно разделенных процессов (та- ких, как распределенные вычислительные машины, которые обме- ниваются друг с другом информацией и для которых задержка при передаче сообщения сравнима со временем изменения состоя- ний переменных из отдельных процессов). Полезно определить упорядочение и для некоторых групп. Например, группа людей может быть упорядочена по таким отношениям, как «быть стар- ше», «быть потомком», «занимать более высокое положение по ра- боте». Обычно частичные упорядочения и их существенность зави- сит от характера группы и всего контекста задачи. Переменные с линейно упорядоченными множествами состояний называются переменными с упорядоченной шкалой. Кроме частичных или линейных упорядочений существуют и другие математические свойства, определение которых для мно- жеств состояний или параметрических множеств оказывается во многих случаях очень полезным. Одним из наиболее существенных свойств является расстояние между парой элементов изучаемого множества. Эта мера определяется функцией, сопоставляющей лю- бой паре элементов этого множества число, определяющее, на ка- ком расстоянии друг от друга находятся эти элементы с точки зрения некоторого фундаментального упорядочения. Д Для данного множества, скажем множества К, расстояние определяется функцией б вида б: ViXVi^R. Однако для того, чтобы эта функция отвечала интуитивному пред- ставлению о расстоянии, она должна удовлетворять следующим условиям для всех х, у, (61) б(х, г/)^0 (условие неотрицательности); (62) 6(х, у)=0 тогда и только тогда, когда х=у (условие 60
нулевого расстояния, называемое также условием невырожденно- сти); (63) 6(х, у)=5(у, х) (симметричность); (64) 6(х, z)^6(x, у) +6(у, z) (неравенство треугольника). Любая функция, удовлетворяющая условиям .(61)—(64), назы- вается метрическим расстоянием на множестве Vi, а пара (Vi, 6) — метрическим пространством. Метрическое расстояние можно, ра- зумеется, определить как на множестве состояний, так и на пара- метрическом множестве. ▲. Примерами переменных с выраженными и существенными мет- рическими расстояниями являются почти все переменные в физи- ке, например длина, масса, давление, электрическая проводимость, напряжение, сила звука, однако и помимо физики есть множество примеров таких переменных, скажем, количество денег, объемы производства, число дефектов, число несчастных случаев и т. д. Совершенно очевидно, что и пространство, и время — это парамет- ры, к которым вполне естественно применимо понятие метричес- кого расстояния. Однако редко удается определить метрическое расстояние на группах. Одним из таких примеров является группа студентов, линейно упорядоченная по показателям их успеваемо- сти. При этом расстояние для каждой пары студентов определяет- ся как абсолютное значение разницы между их позициями в упо- рядоченном списке. Переменные, с множеством состояний которых связано метрическое расстояние, обычно называются метрически- ми переменными. Еще одним свойством множеств состояний и параметрических множеств, имеющим большое значение как методологическое от- личие, является непрерывность. Это понятие хорошо известно из математического анализа, и нет необходимости рассматривать его здесь подробно. Тем не менее уместно будет привести несколько замечаний относительно некоторых аспектов непрерывности, кото- рые будут использоваться нами в дальнейшем. Д Необходимым условием непрерывности множества является его упорядоченность. Так как линейная упорядоченность является частным случаем частичной упорядоченности, то предпочтительнее определить непрерывность через частичную упорядоченность. Это можно сделать несколькими способами. Одно из определений не- прерывного частичного упорядочения опирается на понятие разреза частично упорядоченного множества: разрез частично упорядочен- ного множества, скажем множества Vi, это разделение этого мно- жества иа два непустых подмножества, например X и Y=Vi—X, такое, что или никакой элемент X не является предшественником (согласно частичному упорядочению, определенному на V,) ника- кого элемента из У и некий элемент Y является предшественником какого-либо элемента X, или никакой элемент из X не является преемником никакого элемента из У и некоторый элемент У яв- 61
ляется преемником некоторого элемента X. Непрерывное частич- ное упорядочение Vi определяется как частичное упорядочение, для которого любой разрез X, У множества Vi характеризуется не- ким элементом из X, являющимся предшественником элемента из У, такого, что или наибольшая верхняя граница X принадлежит У, или наименьшая нижняя граница У принадлежит X. Наилучшим примером непрерывного частичного упорядочения является отношение «меньше или равно», определенное на множе- стве действительных чисел или на его декартовых произведениях. Фактически само понятие непрерывной переменной (или непре- рывного параметра) опирается на требование, чтобы соответству- ющее множество состояний (или параметрическое множество) бы- ло изоморфно множеству действительных чисел. Из этого следует, что множество состояний любой непрерыв- ной переменной или параметрическое множество любого парамет- ра бесконечно и несчетно. Тем самым альтернативой непрерывным переменным и параметрам являются переменные и параметры, за- данные на конечных множествах или, возможно, на бесконечных счетных множествах. Последние называются дискретными пере- менными или параметрами. Непрерывные переменные и параметры представляются дей- ствительными числами, а их дискретные аналоги удобно пред- ставлять целыми числами. Это особенно существенно, если множе- ство состояний или параметрическое множество значений дискрет- ной переменной или параметра линейно упорядочено и, следова- тельно, изоморфно соответствующим множествам значений целых чисел. Для работы с некоторыми переменными и параметрами мо- гут быть использованы метрическое расстояние, определяемое естественным образом как абсолютное значение разницы между целыми, а также целая арифметика. Для нас такие свойства, как упорядоченность, метрическое рас- стояние и непрерывность множеств состояний и параметрических множеств, представляют основу для определения наиболее суще- ственных методологических отличий на уровне переменных и па- раметров. Приведем список перенумерованных альтернатив для этих свойств: Упорядоченность: Расстояние: Непрерывность: О — упорядоченности пет 1 —частичная упорядоченность 2 — линейная упорядоченность О — не определено 1 — определено О — дискретно 1 — непрерывно Статус любой переменной (или параметра) для этих трех свойств может быть однозначно охарактеризован триплетом (упорядоченность, расстояние, непрерывность) 62
Рис. 2.2. Решетки методологических типов переменных или параметров в котором каждое свойство представляется его определенным зна- чением (или его идентификатором). Так, например, триплет (2, 1, 0) описывает дискретную переменную с линейно упорядоченным множеством состояний, на котором определено метрическое рас- стояние. Хотя данные три свойства в принципе определяют 12 возмож- ных комбинаций, три из них (0, 0, 1), (0, 1, 0) и (0, 1, 1) смысла не имеют. В самом деле, если на множестве не определена упоря- доченность, то на нем неЛьзя ни содержательно определить метри- ческое расстояние, ни рассматривать его как непрерывное. Таким образом, имеется девять осмысленных комбинаций. Будем назы- вать эти комбинации методологическими типами переменных и па- раметров. Они могут быть частично упорядочены с помощью от- ношения «быть методологически более определенным чем». На рис. 2.2,а это частичное упорядочение, образующее решетку, пред- ставлено в виде диаграммы Хассе. Упрощенная решетка на рис. 2.2,6 задает схему для свойств упорядоченности и расстояния, но без непрерывности. На уровне переменных и параметров методологическое отли- чие одной переменной представляет собой сочетание методологиче- ских типов этой переменной и соответствующих баз. Каждая из них имеет девять типов. Следовательно, если есть только одна ба- за или требуется, чтобы все базы, входящие в комбинацию, имели один методологический тип (наиболее часто встречающийся слу- чай), то число методологических отличий будет равно 81 (так как методологические типы переменных и параметров не накладывают 63
Таблица 2.1. Решетка методологических отличий для дискретных переменных Н параметров Методическое отличие Непосредственные предшественники в решетке 00/00 10/00 00/10 00/10 10/10 00/20 00/11 00/20 10/20 00/21 00/11 10/11 00/21 00/21 10/21 10/00 20/00 II/00 10/10 10/10 20/10 11/10 10/20 10/11 10/20 20/20 11/20 10/21 10/11 20/11 11/11 Ю/21 10/21 20/21 11/21 20/00 21/00 20/10 20/10 21/10 20/20 20/11 20/20 21/20 20/21 20/11 21/1I 20/21 20/21 21/21 II/00 П/Ю 21/00 11/10 11/20 11/11 21/10 11/20 11/21 21/20 11/11 11/21 21/11 11/21 21/21 21/00 21/10 21/10 21/20 2I/II 21/10 21/21 21/11 21/21 21/21 попе методологических отличий одной число определяется формулой ограничений друг на друга). Если к тому же в нашей схеме будут учитываться только ди- скретные переменные и пара- метры, методологические типы которых приведены на рис. 2.2,6, то число методологиче- ских отличий сократится до 25. Решетка методологических от- личий для этого случая приве- дена в табл. 2.1. Теперь предположим, что имеется два или более, напри- мер т, параметров. Они могут быть одного, двух, трех (неза- висимо от порядка) и т. д. ти- пов. Предположим, что (это довольно разумное пред- положение), тогда общее чис- ло методологических типов полного параметра определя- ется суммой т I +... \ 1 J \ 2 ) [ml При сочетании этой суммы с девятью методологическими типами переменных мы полу- чим общее число возможных переменной и ее параметра, это 2.4. ДИСКРЕТНОЕ И НЕПРЕРЫВНОЕ Теоретические модели обычно со- держат непрерывные функции или бесконечные последовательности, хотя подтверждающие их данные по существу в высшей степени дис- кретны и конечны. П. Саппе Как уже говорилось в предыдущем разделе, в формулировку методологических отличий на уровне переменных и параметров входит дихотомия непрерывных и дискретных множеств. В схеме 64
УРСЗ определены и те, и другие. Однако, если говорить о реали- зации УРСЗ, то данная книга почти исключительно посвящена дискретным системам, т. е. системам с дискретными переменными и дискретными параметрами. Мы будем лишь при случае касаться вопросов, связанных с непрерывными системами, и давать сноски на соответствующую литературу. Есть несколько соображений, по которым мы решили ограни- читься только дискретными системами. Прежде всего, сфера при- менения УРСЗ столь широка, что не представляется возможным описать все аспекты его применения в книге разумного объема. Во всяком случае основная цель книги — это описание архитекту- ры УРСЗ, а не его применений. Поэтому применение УРСЗ опи- сывается не сами по себе, а для обогащения описания его архи- тектуры. В этом смысле, на мой взгляд, лучше включать в текст книги достаточно полные описания возможных применений УРСЗ к некоторым содержательным и интересным примерам, а не да- вать поверхностное описание всего спектра применений. Класс дискретных систем и соответствующих задач как раз и является та- ким подходящим и ясным подмножеством. Хотя может показаться, что непрерывные системы в равной степени подходят для описания архитектуры УРСЗ, я убежден, что для этой цели по многим соображениям больше подходят дискрет- ные системы. Приведем некоторые из этих соображений: (I) Независимо от того, считаете ли вы мир по существу дис- кретным, непрерывным или смешанного типа, факт остается фак- том, что с большинством, если не со всеми наблюдениями связана некоторая неисключаемая конечная ошибка. Значение этой ошиб- ки определяет некую конкретную верхнюю границу уровня разре- шения для данных, собираемых через определенный канал на- блюдения. Это означает, что данные всегда оказываются дискрет- ными независимо от философских убеждений или состояния тех- нологии. (II) В случаях, когда эмпирические соображения, описанные в (I), оказываются несущественными и желательно использовать непрерывные переменные, всегда можно выбрать определяющий дискретные переменные конечный уровень разрешения, позволя- ющий аппроксимировать непрерывные переменные с наперед за- данной точностью; точно так же можно, разумеется, аппроксими- ровать и непрерывные параметры. Этот подход был очень нагляд- но продемонстрирован в работах [131—135], в которых показано, что как и классическая, и релятивистская физика могут быть пе- реформулированы в терминах дискретных переменных, и что в этой формулировке могут быть получены результаты, сколь угодно близкие к результатам, полученным в традиционной формулиров- ке, основанной на непрерывных переменных н дифференциальных уравнениях. 5—6923 65
(Ill) В то время как дискретные переменные (и параметры) всегда могут быть заданы так, чтобы аппроксимировать непре- рывные переменные с требуемой точностью, непрерывные пере- менные применимы только к определенному типу свойств (атри- бутов). В частности, множество проявлений соответствующих ат- рибутов должно иметь структуру, изоморфную множеству дейст- вительных чисел. Это очень строгое ограничение. Таким образом, область применения дискретных переменных и параметров оказы- вается существенно шире области применения их непрерывных аналогов. (IV) Если явления реального мира и описываются с помощью непрерывных переменных и параметров (обычно в виде набора дифференциальных уравнений), то редко оказывается так, что для работы с этими описаниями удается использовать методы непре- рывной математики. Дифференциальные уравнения, описывающие явления реального мира, обычно или не могут быть решены ана- литически (т. е. это нелинейные дифференциальные уравнения), или их аналитическое решение чересчур трудоемко. Следователь- но, или по необходимости, или для удобства приходится для их решения использовать численные методы и цифровые вычисли- тельные машины, что, очевидно, требует, чтобы непрерывные пе- ременные и параметры были преобразованы в свои дискретные аналоги. Вот как об этом говорится в работе [131]: Обычно прн получении научных знаний сначала проводятся эксперименты, дающие дискретные наборы данных. Затем теоретики анализируют эти данные и в классическом духе вводят непрерывные модели. Если уравнения в этих мо- делях нелинейны, онн в наши дни решаются численными методами на компью- терах, и результатами снова являются дискретные данные. Средний этап этой работы идеологически несовместим с первым н третьим. В самом деле, было бы проще и удобней вывод непрерывной модели заменить выводом дискретной и таким образом совершенно отказаться от понятия бесконечности... Понятие бес- конечности и логически следующие из него понятия предела, производной и инте- грала приемлемы в чисто математическом исследовании действительных чисел и действительных функций, однако они не подходят для моделирования физиче- ских понятий и явлений. (V) Работа с непрерывными переменными и параметрами име- ет ряд чисто математических сложностей и ограничений, которые требуют не только более высокой подготовки, но, что еще важнее, затемняют реальные понятия. (VI) Легко заметить, что характерное для докомпьютерной эры главенство методов непрерывной математики постоянно сокраща- ется с тех пор, как в 1950-х гг. появились первые универсальные цифровые вычислительные машины. Непрерывно возрастающая мощность вычислительных машин превосходит возможности ана- литического исчисления. Процесс этот, вероятно, будет продол- жаться и дальше, и в результате в системных исследованиях бу- 66
дут доминировать системы, построенные на дискретных перемен- ных. (VII) В то время как точность созданных человеком непрерыв- ных систем (например, аналоговых вычислительных машин или результатов) ограничена и никакими средствами не может быть поднята выше определенного предела, точность созданных чело- веком дискретных систем (цифровых компьютеров, регуляторов, систем связи и т. д.) является только вопросом стоимости. (VIII) Созданные человеком дискретные системы могут быть в силу своей природы спроектированы так, чтобы они обладали свойствами самокоррекции, что невозможно для созданных чело- веком непрерывных систем. (IX) Дискретные функции (например, выражающие зависимо- сти переменных от их параметров или от других переменных) бо- лее гибки, чем их непрерывные аналоги в смысле способа пред- ставления. Это положение хорошо описано у Э. Барто [33]: ... очень удобно использовать символьные выражения для задания дискрет- ных функций... Можно также определить операторы для этих функций через символьные преобразования этих формул. Однако преимущество использования символьных выражений состоит не только в возможности полностью специфици- ровать функции, как в случае с непрерывными переменными. Дискретные функ- ции могут быть полностью определены списком своих значений, например, с по- мощью запоминания в памяти ЭВМ так, чтобы «адресам» соответствовали аргу- менты функции, а «содержанию» — ее значения. Можно также задать алгоритм, входом которого является аргумент функции, а выходом — ее значение... При- митивные команды, используемые при спецификации алгоритмов (например, цикл или условное ветвление), позволяют кратко определять функции, которые невоз- можно или очень неудобно определяются с помощью обычных алгебраических средств. Кроме всех этих существенных соображений в пользу выбора дискретных систем для демонстрации некоторых аспектов реали- зации УРСЗ, имеется еще одно практическое соображение в их пользу. Непрерывные системы значительно лучше разработаны и описаны в литературе, чем дискретные, и поэтому лучше описать их косвенно, с помощью библиографических замечаний и ссылок. 2.5. ПРЕДСТАВЛЯЮЩИЕ И ИСХОДНЫЕ СИСТЕМЫ Если вы располагаете одним-единствен- ным измерительным прибором, то не мо- жет быть и речи ни о какой науке... И. Бишоп, С. Фейнберг, П. Холланд Свойства, конкретные и общие переменные, а также базы, кон- кретные и общие параметры являются компонентами соответст- венно трех примитивных систем — системы объекта, конкретной 5* 67
представляющей (image) системы и общей представляющей си- стемы, которые вместе с отношениями между ними образуют ис- ходную систему. Одна из этих трех систем введена в разд. 2.1 и формально определяется уравнением (2.1). Оставшиеся две при- митивные системы имеют тот же вид, что и система объекта, но их компонентами являются переменные и параметры, а не свой- ства и базы. Пусть I и I — это, соответственно конкретная и общая пред- ставляющая системы. Тогда i = (to, V.) I i (= Nn}, {(wf, Wt) I e ЛЦ), (2.11) I=({(Ui, Vi)\it=Mn}, {(Wi, (2.12) где соответствующие символы имеют тот же смысл, что и в разд. 2.2. Теперь нужно определить отношения между тремя примитив- ными системами О, I, I. Для упрощения нотации условимся, что для любых ieVn и свойство а, соответствует переменным Vi, Vi, а база bj— параметрам Wj, Wj. Отношение между системой объекта и конкретной представ- ляющей системой задается в виде полного канала наблюдения, состоящего из отдельных каналов наблюдения, по одному для каждого свойства или базы из системы объекта. Обозначим через Q четкий полный канал наблюдения. Тогда е=({М„ К, Oi)\i<^Nn, Ot определяется уравнением (2.2) и должны быть гомоморфны относительно свойств Л,- и Vi}, {(Bj, Wh (O/Jl/eA/m, определяются уравнением (2.3) и должны быть го- моморфны относительно свойств Bj и U7,}), (2.13) где все символы имеют тот же смысл, что и в разд. 2.2. Нечеткий полный канал наблюдения, скажем Q, можно полу- чить, заменив б,- из (2.13) на б„ определенное уравнением (2.9). Функции со/ также можно было бы заменить на функции о/, за- данные уравнением (2.10), однако по соображениям, приведенным в разд. 2.2, такая замена схемой УРСЗ не предусматривается. Отношение между конкретной и общей представляющими си- стемами задаются набором отображений конкретизации (абстра- гирования, по одному для каждой переменной и параметра из этих систем). Будем называть этот набор каналом конкретиза- ции/абстрагирования и обозначать его S. Тогда &=({Vi, Vi, ei)\i^Nn, ei определяются уравнением (2.4) и должны быть изоморфны относительно свойств Vi н V,}, {(Wj, Wj, в/) \j^Nm, Ej определяются уравнением (2.5) и должны быть изоморфны относительно свойств Wj, IF/}). (2.14) Можно рассмотреть канал наблюдения из системы объекта непосредственно в общую представляющую систему. Однако этот 68
канал можно получить из двух каналов, определяемых уравнени- ем (2.13) и (2.14). Он состоит из триплетов (Л,-, V,, OiOer1) и (Bh Wj, (о/Ое/-1), где символ О обозначает композицию. ▲ Теперь можно определить исходную систему, как пятерку S=(O, I, I, Q, S). (2.15); На рис. 2.3 изображены эти пять компонентов, а также нх свя- зи с дометодологическими посылками (исследователь, объект, цель исследования и т. д.) и с системами более высоких эписте- мологических уровней. Рисунок также дает представление об ос- новных методологических понятиях, связанных с исходной си- стемой: 1. С одной стороны, исходная система представляет связи с ре- альным миром. Они проходят через систему объекта О и канал наблюдения Q. С другой стороны, исходная система связана с УРСЗ через общую представляющую систему I и канал конкре- тизации/абстрагирования <8. Эти два компонента (I и 8) пред- ставляют интерфейс между конкретной предметной областью и УРСЗ (как об этом говорилось в разд. 1.2 и как это показано на рис. 1.2). Данный интерфейс, находящийся на самом нижнем эпи- стемологическом уровне, очень важен, поскольку любой интер- фейс на более высоком уровне опирается на него. 2. По существу концептуальная схема УРСЗ — это специаль- ный язык для описания важных системных задач. Область УРСЗ ограничена синтаксическими аспектами решения системных задач. Эти аспекты представляются через разные методологические от- личия общих представляющих систем и их эпистемологически бо- лее высоких аналогов. Таким образом, реализация УРСЗ может быть разработана и описана только в терминах общих представ- ляющих систем и их развития па более высоких эпистемологиче- ских уровнях. При применении УРСЗ в конкретном исследовании или для какой-то другой цели соответствующие семантические аспекты вводятся через 1, О, и данной исходной системы. С абстрагированием связаны функции о(-, со/, ег1 и в/-1; конкрети- зация характеризуется функциями eit е/ и разбиениями ог' = = Ai/Oi, (о(-1 = Вj/(£>j. Прагматические аспекты вводятся на доме- тодологическом уровне. К ним относятся цель и ограничения на определенные действия (научные исследования, системное проек- тирование и т. д.). Некоторые из этих прагматических аспектов находят свое отражение в формулировках языка УРСЗ. 3. Исходная система называется исходной по двум причинам. С одной стороны, например, для научных исследований она явля- ется источником эмпирических данных, т. е. источником описанных на языке УРСЗ абстрактных представлений явлений реального 69
Рис. 2.3. Концептуальные элементы, используемые для определения исходной системы 70
мира. С другой стороны, для таких работ, как инженерное про- ектирование, она является источником интерпретаций абстракт- ных данных, которые или определяются пользователем, или вы- водятся УРСЗ. Как отмечалось в разд. 1.3, при определении системы на объ- екте полезно различать два типа переменных (или соответствую- щих признаков). Мы назвали их входными и выходными перемен- ными. Все, что в дальнейшем будет говориться об отличии между входными и выходными переменными, равным образом относится к конкретным и обобщенным переменным, а также соответствую- щим свойствам. Дихотомия входных и выходных переменных возникла из практических соображений. Она отражает в основном точку зре- ния пользователя, которая, в свою очередь, повлияла, а в некото- рых случаях и определила цель, с которой задавалась система. Выходные переменные исходной системы рассматриваются поль- зователем как переменные, значения которых при соответствую- щих значениях параметров определяются внутри системы, в от- личие от входных переменных, значения которых задаются извне. Все факторы, влияющие на определение входных переменных, обычно называются средой системы. Системы с входными и выходными переменными будем назы- вать направленными системами, а системы, у которых перемен- ные не классифицированы таким образом, нейтральными. Соглас- но этой терминологии исходная система, определяемая уравнени- ем (2.15), также как и три ее примитивные системы (О, I, I) яв- ляются нейтральными. Чтобы преобразовать их в направленные системы, нужно, чтобы в их определении все переменные (и свой- ства) были объявлены как входные или выходные. Пусть, напри- мер, для системы I такое объявление сделано с помощью функции u:Nn-+{0, 1}, такой, что если u(z)=O или u(i) = 1, то это значит, что перемен- ная о, является соответственно входной или выходной. Любую л-ку U= (U(l), и(2),.... л(л)), задающую определенный статус для всех переменных системы, назовем определителем входа-выхода. Ясно, что для п перемен- ных всего может быть 2" объявлений входов-выходов, каждый из которых имеет свой определитель входа-выхода и. Разумеется, переменным и,- и признакам щ соответствует тот же определитель входа-выхода. Определение любой из трех при- митивных систем О, I, I можно легко превратить в определение ее направленного аналога, если добавить к нему конкретный оп- ределитель входа-выхода. Обозначим направленные аналоги ней- 71
тральных систем теми же символами, но с добавлением знака~ Тогда 6 = ({at> Л.) I В,) I /еад, (2.16) /еад, (2.17) Г= {{Щ, V,) | i&Q u {(wlt Wj) I j e Nm}), (2.18) где О, I, I — направленные аналоги нейтральных систем О, I, I. На- правленная исходная система определяется пятеркой S = (6, IJ, @, <§). ▲ (2.19) Отличие входных и выходных переменных на уровне исходных систем выражено не очень ярко. Оно становится более явным на более высоких эпистемологических уровнях, на которых описы- ваются разного рода отношения между переменными. Поскольку считается, что входные переменные не определяются внутри си- стемы, то их состояния рассматриваются как условия, определяе- мые средой и имеющие влияние на выходные переменные. Таким образом, отношения между переменными в направленной системе выражаются условными утверждениями вида «если х, то у», где х описывает состояние входных переменных (определяемое сре- дой), а у — некоторое свойство этой системы. В отличие от на- правленных, в нейтральных системах отношения между перемен- ными описываются простыми утверждениями вида «у истинно», где у — также описывает свойство системы. Выходные перемен- ные направленной системы также могут влиять на ее входные переменные, но это влияние, если оно имеет место, осуществляет- ся не через систему, а, как это показано на рис. 2.4,а, через сре- ду. Таким образом, свойства входных переменных направленной системой не являются предметом исследования в рамках этой си- стемы. Существует два типа вырожденных направленных систем. 1. Направленные системы без выходных переменных (рис. 2.4,6), т. е. системы с и= (О, 0,..., 0). Эти системы методо- логически бесплодны. В самом деле, любая такая система имеет только входные переменные, которые по определению полностью задаются средой, и, следовательно, их свойства невозможно пред- ставить и исследовать внутри самой системы. Таким образом, в системе нечего описывать и изучать. Любое утверждение, кото- рое можно сформулировать внутри системы, бессмысленно, так как оно содержит только условие, но не следствие. Направленные системы этого типа исключены из схемы УРСЗ как бессмыслен- ные. Следовательно, для п переменных имеется только 2П—1 ос- мысленных объявлений входа-выхода. 72
Входные переменные Входные переменные Выходные переменные 61 Выходные переменные 61 г) Рис. 2.4. Методологические отличия направленных и нейтральных исходных систем 2. Направленные системы без входных переменных (рис. 2.4,в), т. е. системы с u=(l, 1,..., 1). Эти системы методологически ин- тересны, поскольку для них можно сформулировать содержатель- ные утверждения. Однако эти утверждения не могут быть услов- ными, поскольку в таких системах нет входных переменных, на которых можно было бы сформулировать эти условия. Таким об- разом, эти утверждения оказываются столь же существенны, как и утверждения, сформулированные для аналогичных нейтраль- ных систем, т. е. для нейтральных систем с такими же наборами переменных, параметров и других компонентов. Однако, как это показано на рис. 2.4,в и г, между системами этих двух типов есть некоторая разница. В то время как все переменные в таких вырож- денных направленных системах объявляются как выходные пере- менные, переменные в соответствующих нейтральных системах ни- как не объявляются. А поскольку они никак сначала не объявле- ны, то в процессе исследования их при необходимости или при желании можно объявить как входные или выходные переменные и сделать систему направленной. Отметим, что хотя эти два типа систем концептуально различны, они являются эквивалентным» в том смысле, что могут быть преобразованы одна в другую про- сто за счет включения или исключения и. 78
Свойства среды направленной системы могут быть и неизвест- ны, и, следовательно, при данном наборе параметров нельзя предсказать состояния ее входных переменных. Однако такое от- сутствие информации па саму систему не влияет, так как состоя- ния входных переменных участвуют в утверждениях только как условия. Для некоторых направленных систем состояние ее вход- ных переменных, определяемое средой, может быть полностью известно. Эта информация также не влияет па описание системы, но может быть использована при решении задач, в которых уча- ствует данная система. Бывает и так, что входные переменные полностью контролируются исследователем, т. е. он сам представ- ляет собой среду. Для нейтральных систем никакой среды нет (рис. 2.4,г). При замене нейтральной системы на направленную вводится среда, и если uy= (1, 1, ..., 1), некая информация, содержавшаяся в систе- ме, перемещается в среду. Таким образом, полученная направлен- ная система содержит меньше информации, чем исходная ней- тральная. Нейтральную систему с п переменными можно заме- нить 2п—1 разными направленными системами (по числу разных n-мерпых определителей входа-выхода и, по для системы без входных переменных (рис. 2.4,в) довольно одной тривиальной за- мены. Следовательно, мы можем считать, что нейтральная систе- ма может быть заменена направленной 2П—2 нетривиальными способами. Отличия между нейтральными и направленными системами и между четкими и нечеткими каналами наблюдения—это еще два методологических отличия исходных систем. Они независимы друг от друга и от отличий в свойствах множеств состояний и пара- метрических множеств. Любая исходная система является или нейтральной, или направленной, а каналы наблюдения ее пере- менных или все четкие, или все нечеткие, или разных типов. Та- ким образом, новые отличия дают 2X3=6 возможностей. Кроме того, в исходную систему могут входить переменные разных ме- тодологических типов (в смысле рис. 2.2). Обозначим общее число методологических отличий, определен- ных для уровня исходных систем, через *S. Тогда при вполне разумном предположении, что число параметров не превышает 9 (т^9), мы получим ‘ Z П\ т Г О \ #S = 6X W )xj]( • } (2-20) где £=min(9,и). Если запретить, чтобы в исходных системах переменные и па- раметры были смешанных методологических типов, то число ме- тодологических отличий станет равным 6X9X9=486. Если кро- ме этого рассматривать только дискретные переменные, то это 74
число сократится до 6X5X5=150. В этом диапазоне и показаны в данной книге некоторые реализационные аспекты УРСЗ. Методологические отличия, определенные для исходных си- стем, весьма важны, поскольку они приложимы и ко всем систе- мам более высоких эпистемологических уровней. Проиллюстриру- ем эти отличия, а также другие свойства исходных систем на сле- дующих двух примерах. Пример 2.3. Пусть объектом исследования являются лесопо- садки деревьев твердых лиственных пород па западе шт. Нью- Йорк. Лесники обычно помечают деревья для выборочной рубки через довольно регулярные промежутки. Главные цели маркиров- ки деревьев для рубки — поддержание или улучшение качества леса и вывоз лесоматериалов, стоимость которых достаточно ве- лика, чтобы это было выгодно и владельцу и лесообрабатываю- щему предприятию. Нель определения исходной системы для дан- ного объекта — получение характеристик деревьев, маркирован- ных для рубки, их оценка и разработка более подходящих и точ- ных’ руководств для маркировки деревьев в будущем. Базой в данном примере является группа деревьев, представ- ляющая собой выбранный для исследований лесной массив. Пусть каждое исследуемое дерево помечается целым числом. Тогда функция о дает отображение «один в один», равно как и функ- ция е. Пусть для исследования объекта было отобрано семь свойств. Приведем их описания и определим соответствующие переменные. Вид дерева: свойство at. Для исследования в данном лесном массиве для всех видов деревьев выделено только четыре класса деревьев. Следовательно, для представления этого свойства нуж- на конкретная переменная с четырьмя состояниями. На рис. 2.5,а определена функция оь связывающая свойство с этой переменной. На том же рисунке определяется функция <?i, которая, как всег- да, представляет собой простую схему переобозначения. Множе- ства Ai и V} никакими свойствами не обладают, и, следовательно, всевозможные свойства целых чисел из множества Vi и не могут быть использованы. Канал наблюдения является четким, т. е. не- посредственно представляется функцией О]. Диаметр (диаметр на уровне груди): свойство а2. Более точ- но это свойство определяется как диаметр ствола па уровне че- тыре с половиной фута от земли. Хотя с помощью рулетки ди- аметр может быть измерен с точностью до 0,1 дюйма, при оцен- ке объема древесины этот диаметр оценивается или измеряется с точностью до 1—2 дюймов. Однако для выборочной рубки де- ревьев достаточно разбить диаметры стволов всего на пять кате- горий. Они определяются на рис. 2.5,6 вместе с функциями о2 и е2. Несмотря на то, что возле границ блоков разбиения Л2/о2 мо- жет иметь место некоторая нечеткость измерения, канал наблю- 75
А, (проявления) о, Й (конкретные . р (обобщенные ’ состояния) е1 о состояния) Твердый клен Белый ясень —— Черная Вишня > J ** Красный дуб * Мягкий клен Желтая береза—_~ —__ Тюльпановый т?ппль — *• 1 ’ Американская ли,ш белый дуб белая сосна — ~ — Ги кар и Осина Хэм лак » - Другие деревья Класс _ ““ дерева _/ * * 0 класс _ дерева Д -* * 1 класс_ дерева jh 2 Класс _ дерева iv * -* J а] И, е2 v2 Рис. 2.5. Определение переменных для признаков ai и аг из примера 2.3 дения о2 можно рассматривать как четкий, так как эта нечеткость практического значения не имеет. Множества Ai, V2, V2 можно рассматривать как линейно упорядоченные с метрическим рас- стоянием, и, следовательно, если нужно, то можно для множест- ва V2 воспользоваться свойствами целых чисел. Товарная высота: свойство а3. Несмотря на то, что этот па- раметр может быть измерен довольно точно, достаточно только оценить его значение и выделить три диапазона: меньше 24 фу- тов, от 24 до 48 футов, больше 48 футов. Эти диапазоны можно представить состояниями О, 1, 2 множества V3. Порядок и рас- 76
стояние для целых чисел из Уз можно использовать в исследова- ниях. Класс кроны: свойство а4. Класс кроны описывает размер и положение верхней части дерева относительно верхушек сосед- них деревьев. Подавленные деревья заслонены другими деревь- ями, относительно мало влияют на соседей, и им в борьбе за су- ществование плохо помогает освобождение от соседей. С другой стороны, доминирующие деревья оказывают большое влияние на соседей. Это свойство считается очень важным показателем того, как дерево реагирует на освобождение от соседей и насколько оно способно дать хорошую древесину. Лесоводы разработали четкие стандарты для классификации класса кроны на четыре со- стояния V4: доминирующая, кодоминирующая, средняя, подавлен- ная, которые могут быть соответственно представлены состояния- ми 0, 1, 2, 3, сохраняющими в V4 линейный порядок. Сорт согласно стандартам ЛССШ (Лесная служба США): свойство аз. Значение этого свойства зависит от числа, размера н взаимного расположения ветвей, сучков и других признаков на- личия в дереве узлов. Выделяется четыре сорта (состояния V5). Они хорошо определены и опираются на стандарты Национальной ассоциации производителей лесоматериалов и Лесной службы министерства сельского хозяйства США. Они называются сортами ЛССШ 1, 2, 3 и местного применения. Их в Vs можно представить в виде целых чисел 0, 1, 2, 3, сохраняющих отношение порядка. Дефекты: свойство Пе- Значения этого свойства говорят о де- фектах дерева, таких, как гнилостность, искривления и развет- вленность, уменьшающие объем древесины, которую можно по- лучить из дерева того же размера, но без дефектов. В V6 выде- ляются три состояния: без дефектов или с небольшими дефекта- ми, частично испорченное, бракованное дерево. Эти состояния в V6 можно, сохраняя порядок, представить значениями 0, 1 и 2. Так как эта переменная представляет собой оценку внутренних дефектов по внешним признакам, она может быть ошибочной, да- же если ее делает очень компетентный наблюдатель. Поэтому в данном случае желательно использовать нечеткий канал наблю- дения, позволяющий наблюдателю в каждом отдельном наблюде- нии выразить степень неуверенности в достоверности его оценки. При этом функция Os явно не задается, а определяется самим на- блюдателем. Маркировка дерева: свойство а?. Исследуемые деревья либо маркируются для рубки, либо пет. Пометим проявления этого свойства в множестве V? цифрами 1 и 0. Множество У7 никаки- ми свойствами не обладает. Мы видим, что определенная в этом примере исходная систе- ма является нейтральной. Однако для формулирования правил маркировки деревьев, предназначенных на сруб, система должна 77
быть переопределена как направленная с входными переменными Ui—Ue и выходной переменной v7. Один канал наблюдения нечет- кий, а остальные четкие, поэтому в исходной системе смешаны четкие и нечеткие переменные. Множество параметров свойства- ми не обладает, а множества состояний имеют два, а, возможно, и три типа: без свойств, линейно упорядоченные и, может быть, линейно упорядоченные с метрическим расстоянием. Пример 2.4, Пусть объектом исследования является женщи- на, страдающая анемией. Целью исследования является наблю- дение так называемого комплексного анализа крови пациентки в течение определенного периода времени. Это позволяет опреде- лить, улучшается ли ее состояние само по себе или следует уста- новить определенный режим лечения. Параметром является время. Измерения делаются один раз в день в 7 ч утра в течение всего сентября 1982 г. Конкретное параметрическое множество представляет собой дни месяца 9.01.82, 9.02.82,..., 9.30.82, которые в соответствующем обобщенном параметрическом множестве можно представить в виде целых чи- сел 0, 1, 2,..., 29, что сохраняет порядок и расстояние. Каждое измерение представляет собой определение состоя- ний четырех описанных ниже переменных по 10 см3 крови, взя- той у пациентки. Все переменные являются численными и опреде- ляются через четкие каналы наблюдения о,, такие, что соответст- вующее разбиение о,/4, состоит из блоков одинакового размера. Переменная принимает значение, равное середине интервала, в который попадает значение свойства. По данным четырем пе- ременным вычисляются другие переменные, входящие в комп- лексный анализ крови. Число красных кровяных телец: свойство а} определяется как число разных кровяных телец в 1 мм3 крови и обычно принима- ет у женщин значения в диапазоне 4.2—5.4 млн/мм3. Оно изме- ряется с точностью до 10 000. Множество состояний К] состоит из значений 4.20, 4.21,..., 5.4 млн/мм3. Согласно предшествующему общему замечанию относительно природы каналов наблюдения в данном примере, блоки Oi-,(x) разбиения Ai/o}, представляемые этими значениями будут иметь такой вид: 4.105<о,~1 (4.20) <4.205, 4.205<ог1 (4.21) <4.215, 5.395<ог! (5.40) <5.405. Конкретные состояния 4.20, 4.21..., 5.40 с помощью функции ег1 могут быть отображены в целые 0, 1,..., 120, так что упорядочен- ность и расстояние в К; сохраняются во множестве целых У). Число белых кровяных телец-, свойство а% определяется как число белых кровяных телец в 1 мм3 крови и обычно у женщин 78
находится в диапазоне 5—10 тыс./мм3. Измеряется с точностью до 100. Множество состояний У2 состоит из значений 5.0, 5.1,... ..., 10 тыс./мм3, представляющих блоки 4.95^о2-1 (5.0) <5.05, 5.05^о2-' (5.1) <5.15 9.95<о2-1 (10.0) <10.05. Функция е2 отображает целые числа 0, 1,...,50 на числа 5.0, 5.1,..., 10,0 соответственно. Гематокрит: свойство аз определяется как процент красных кровяных телец от общего объема крови, взятой на анализ. Ожи- даемый диапазон 37—47%. Измеряется с точностью до 1%. Мно- жество состояний V3 состоит из значений 37, 38,..., 47%, представ- ляющих следующие блоки: 36.5 <о3-‘ (37) <37.5, ,37.5 < 0^(38X 38.0! I • • i 146.5 <оГ*(47)< 47.5- Функция е3 отображает целые числа 0, 1,..., 10 на числа 37, 38,... 47 соответственно. Гемоглобин: свойство а^ оценивается как количество гемогло- бина в граммах на 100 мм крови, диапазон 12—16 г/мм. Измеря- ется с точностью до 0,01 г. Множество состояний Р4 состоит из значений 12.00, 12.01,..., 16.00; функции о4 и е4 определяются так же, как для признаков а,, а2, а3. В комплексный анализ крови входят еще несколько перемен- ных, значения которых вычисляются по определенным формулам из значений введенных базовых переменных. Одна из таких пере- менных, называемая средний размер частицы (СРЧ), определяет- ся как средний объем красного кровяного тельца и измеряется в кубических микрометрах. Ожидаемый диапазон 82—92 мкм3. Она вычисляется с точностью до 1 мкм3 по формуле Cpq _ Гематокрит 10 Число красных кровяных телец, Если исходная система содержит переменные, определяемые через другие переменные, как СРЧ из предыдущего примера, то она содержит и введенные исследователем искусственные отно- шения между переменными. Эти искусственные отношения долж- ны быть описаны при определении исходной системы и отделены от подлинных отношений, возникших непосредственно при иссле- довании явления. 79
2.6. СИСТЕМЫ ДАННЫХ Система — это черный ящик, К. его запорам подходящих Ключей никто не подберет, Мы знаем выход лишь и вход1. К. Боулдинг Исходная система — это схема, по которой могут быть сдела- ны наблюдения отобранных признаков. Если канал наблюдения четкий, то любое реальное наблюдение представляется в виде упо- рядоченной пары, состоящей из значения полного параметра, при котором было сделано наблюдение, и зафиксированного полного состояния переменных. Так как при одном значении параметра может быть сделано только одно наблюдение, множество этих упорядоченных пар является функцией, отображающей полное параметрическое множество в полное множество состояний. Эта функция и представляет собой данные или, точнее, четкие данные. Д В УРСЗ всегда предполагается, что данные должны быть пред- ставлены как обобщенные параметры и переменные (см. рис. 2.3). Следовательно, при формализации понятия данных мы можем ограничиться рассмотрением только обобщенной направляющей системы I, как она определена в (2.12). Пусть W=r1XIF2X...X^TO, V=V1XV2X..XVn. Тогда четкие данные представляются функцией d:W->V. (2.21) Функция d любому значению полного параметра ставит в со- ответствие одно полное состояние переменных. В то время как представляющая система I описывает только потенциальные состояния переменных, функция d дает информа- цию об их действительных состояниях при неограниченном пара- метрическом множестве. Система I в соединении с функцией d можно рассматривать как систему более высокого эпистемологи- ческого уровня (уровня 1). Будем называть такую систему систе- мой данных и обозначать D. Тогда D= (I, d). (2.22) Несмотря на то, что в этом определении отсутствует какой-либо се- мантический оттенок, оно достаточно и вполне удобно для разра- 1 Перевод с английского А. Горлина. — Прим. ред. 80
ботки и описания методологических характеристик УРСЗ. Одна- ко для любого конкретного применения в формулировке должен быть отражен и смысл данных d. Это можно сделать, заменив представляющую систему I в уравнении (2.22) соответствующей исходной системой S. Получившуюся в результате этой замены систему назовем системой данных с семантикой и обозначим SD. Таким образом, sD=(S, d), (2.23) где d — та же самая функция, что и в уравнении (2.22). Однако в данном случае функция d связана с системой S следующим об- разом: если наблюдение, описываемое с помощью 0,-Ое-1 (х,) =yt для всех (где Xi — предполагаемое проявление свойства а,, a у,— соответствующее состояние переменной и,), связывается со значением полного параметра w^W, то d(w) =v, где v= (yi, 1/2,—,«/n)eV. В зависимости от рассматриваемой за- дачи функция d на самом деле может быть определена по край- ней мере тремя разными способами. Во-первых, она может быть результатом наблюдений или измерений, как это бывает при все- возможных эмпирических исследованиях. Во-вторых, ее можно вывести из систем более высоких уровней, как это показано в гл. 3—5. В-третьих, она может быть из каких-то соображений определена самим пользователем, как это бывает в задачах про- ектирования систем. Системы данных D и SD нейтральные, так как они определе- ны, соответственно через нейтральную представляющую систе- му I и нейтральную исходную систему S. Превращение этих си- стем в их направленные аналоги D и SD труда не представляет. Нужно только заменить I на I, a S на S. Таким образом, D=(f, d), (2.24) = (S, d) (2.25) — это направленные системы данных без семантики и с семанти- кой соответственно. Если переменные определяются через нечеткие каналы наблю- дения, то каждое наблюдение записывается как упорядоченная пара, состоящая из значения полного параметра, с которым свя- зано наблюдение, и n-ки (hi, h2,..., hn) функций ft, : Уг-40, 1], (2.26) 6—6923 81
где hi (у) выражает степень уверенности в том, что у является наблюденным состоянием переменной Vi. Формализуем понятие нечетких данных. Пусть v= {Vi-40, 1 ]}х{v2->[0,1]}х ••• X{Vn-*[0,1]}. Тогда нечеткие данные представляются функцией Я: W->V. (2.27) Для любого значения полного параметра weW d(w) =h, где h= (hj, h2,..., hn) eV. Если данные являются нечеткими, то определения систем дан- ных следует модифицировать, заменив в (2.22) — (2.25) функ- цию d функцией a. С каким типом данных — четким или нечет- ким — мы имеем дело, всегда ясно по контексту, поэтому не име- ет смысла для систем данных с четкими и нечеткими данными использовать разные обозначения. Если в определении системы данных с нечеткими данными вхо- дит исходная система S, то функции d и S связаны следующим образом, если наблюдение связано со значением полного пара- метра, описываемого как Oi(Xi, yitk)=zitk. и е-1 (yi,k)=yt,k для всех i^Nn, где х,-— возможное проявление признака а,, то hi(yi,k)=Zi,/c для всех y^k^Vi и всех i^Nn. Четкие данные могут быть представлены в самом разном ви- де. Пусть стандартной формой представления дискретных пере- менных и параметров будет матрица d=IA,w], элементами которой vi,w являются состояния переменных щ, на- блюденные при соответствующих значениях полного параметра w (рис. 2.6,а). Каждый столбец матрицы d задает полное состоя- ние, наблюденное при данном w, а каждая строка — все наблю- дения одной переменной на параметрическом множестве W. Если W линейно упорядочено, то и столбцы в матрице d должны быть упорядочены точно таким же образом. Если используются не- сколько параметров, например группа — время, пространство не- скольких измерений или пространство — время, то может ока- заться удобнее использовать другие формы представления. Не- 82
которые из этих форм будут продемонстрированы в различных примерах. Для нечетких данных стандартной формой представления, по- добной матрице d, является трехмерный массив d = [d. . ], 1 i, и, w1’ а) W элементами которого являются значения степени уверенности в том, что при значении параметра w наблюдалось состояние /,• переменной Vi. Попятно, что i^Nn, w=W, a d. wCE ё=[0, 1]. Массив представляет собой d матриц (страниц, плоско- стей), по одной для каждой переменной. Столбец w в матрице переменной задает функцию ht, определяемую уравнением (2.26) и соответствующую наблюдению, идентифицируемо- му w. ▲ Для пояснения различных характеристик систем данных и их представлений рассмотрим более детально некоторые примеры конкретных систем данных (т. е. систем данных с семантикой). Пример 2.5. При изучении пове- дения животных этологи использу- ют такие методы, которые как мож- но мёныне беспокоят исследуемых животных, находящихся в естест- венной среде обитания. Одним из таких методов изучения поведения группы животных является съемка фильмов, а затем определение уже по фильму характера поведения жи- вотных. Для каждого конкретного вида животных обычно определяют- ся характерные позы и движения. Этологи часто специфицируют их рисунками, сопровождаемыми часто вербальными описаниями. Напри- мер, на рис. 2.7,а изображены важ- нейшие позы чаек, которым даны поясняющие названия; «отдых», движение «вперед» и т. д. Каждая из них также описывается вербаль- но, например «волнение начинается с того, что чайка наклоняется над гнездом (или любой другой вмяти- ной в земле, похожей на гнездо, например, над следом ноги), а за- тем начинает ритмично покачивать головой вверх-вниз». ---t-we W ---*Wf W )' -----* W f tv Jn _______________________ 5; Рис. 2.6. Стандартные формы представления данных для дис- кретных переменных а) матрица d четких данных d; б) трехмер- ный массив d нечетких данных 3 6* 83
Т= 1 2 3 4 5 6 7 8 9 10 11 12 13 /4 15 16 17 18 19 20 Ч v2 1-1 0 3 3 3 3 3 9 3 3 0 2 1 11 /444 45455555445542 / 1 / 444 t= 21 22 23 29 25 26 27 28 29 30 31 32 33 39 35 36 37 38 39 90 V1 V2 9902299999992222202 1 9 3 1 9 2 2 9 9 9 9 9 9 9 9 1 1 / 3 3 1 t- .4/ 92 93 44 95 Vf 0 2 119 Vg 3 3 3 3 9 6} Рис. 2.7. Данные, описывающие погранич- ное столкновение между двумя чайками (пример 2.5) Объектом исследования в данном примере являются две чай- ки: чайка I и чайка II. Переменные определены на следующих характеристиках: at — тип поведения чайки I, 02 — тип поведения чайки II. Характеристики наблюдаются во времени. Период наблюде- ния 90 с. Он разделен па интервалы по 2 с, каждый из которых представляет одно наблюдение. Таким образом, конкретное вре- 84
менное множество (являющееся параметрическим множеством для данного примера), скажем T={ti, может быть оп- ределено разбиением периода времени в 90 с с помощью следую- щего канала наблюдения: О^со-1 (fj) <2 с, 2^со“1 (t2) <4 с, 88s^(o—1 (/45) <90 с. Время t линейно упорядочено и имеет метрическое расстоя- ние. При отображении Т на множество целых чисел, скажем на множество Т=М45 с помощью функции e,(k)=tk(k^N45), порядок и метрическое расстояние сохраняются. Каждое наблюдение данных двух характеристик представля- ется теми кадрами из фильма, которые относятся к данному пе- риоду в 2 с. Этн кадры изучаются этологом, и для каждой чайки определяется один из нескольких перечисленных выше типов по- ведения (состояния из множеств состояний Уь У2). В данном примере, в котором исследуется пограничный конфликт между двумя чайками, для обеих характеристик достаточно пяти одина- ковых типов поведения (т. е. У] — У2). Названия этих типов, а также их целые обозначения (элементы обобщенных множеств состояний Vi, V2) приведены на рис. 2.7,6. Типы поведения, назы- ваемые «выпрямление» и «волнение», входят в число основных поз, изображенных на рис. 2.7,а. «Разбрасывание травы» опре- деляется так: «неистово клюет землю, вырывает растения и раз- брасывает их в стороны движениями головы». Два оставшихся типа поведения «нападение» и «отступление» хорошо характери- зуются своими названиями. На рис. 2.7,в приведена матрица дан- ных, полученная по реальному фильму. При этом /еТ и гл <, y2>tsV1(=|/2). Определенная в этом примере система является нейтральной системой с семантикой. Ее переменные дискретны, а параметром является время. Параметрическое множество (время) линейно упорядочено и обладает метрикой. Данные четкие. По поводу этого примера необходимо сделать два замечания. Во-первых, оба канала наблюдения о, :Л->-1Л (f=l, 2), где А,— это предполагаемый набор возможных действий, одина- ковы, представлены самим исследователем, и их нельзя опреде- лить математически. Они определяются по сочетанию картинки и вербального описания. 85
Во-вторых, л'юбое наблюдение (столбец матрицы данных) представляет со'бой сделанное исследователем заключение отно- сительно того, «что прсизошло в соответствующий 2-секупдный период времени,- Этот тодход довольно сомнителен, поскольку действия чайки (описагные в терминах типов поведения, опреде- ленных па множестве состояний) не обязательно начинаются и заканчиваются па граЕИцах 2-секундных интервалов. В подоб- ного рода иссле'Д°вапи1 лучше было бы временное множество Т представить иея*в1*с, пе изменению состояния переменных. Вре- менное множество Г огределяется неявно по следующему прави- лу: весь период наблюгения (в нашем примере 90 с) делится на временные интервалы, J течение которых ни одна из переменных (в нашем случай гереяепных две) не меняет своего состояния, если по крайней* мере одна переменная изменяет свое состояние, один временной ингервал кончается и начинается следующий. Если важно зн^ть длительность отдельных действий, то можно ввести новую п-ереиешую— длительность временного интервала (измеряемую с необхот.имой точностью) и запоминать значения этой переменной* в качестве части данных. Неявное определение временных множеств (гак с введением дополнительной перемен- ной, содержащей длительность неявно заданных временных ин- тервалов, так и без этей переменной) часто бывает более подхо- дящим, чем лю(бое явное определение. Оно также бывает полез- но, а часто и д^елетелто для переменных, параметром которых является то или инее пространство. Пример 2.6. Типичньм объектом изучения в музыковедении яв- ляется музыкальное сочинение. Пусть этим объектом в пашем примере будет етовремечная мелодия блюза. Ее партитура, при- веденная на рис'- 2.8,а, состоит из двух частей — мелодии и гар- монии. Мелодия приведена в обычной потной записи, а гармо- ния— в терминах так зазываемой нотации «фейк бук», часто применяемой ддхазевыми музыкантами. Для определения па этой мелодии блюза (и.:и любого другого музыкального сочинения) содержательной системы пужпо рассмотреть три типа признаков: высоту тона, ритм и гармонию. Все они меняются во времени. Соответствующие временные интервалы могут быть определены через длительность сапой короткой ноты в сочинении. Назовем эту длительность М- В данном примере длительность равна */8. Время (как параметр) может быть определено явно или неявно. При явном задании времени элементами соответствующего вре- менного мпожествв Т будут метки интервалов времени [0, ДО» [ДЕ 2Д0 и т. д-, а элементами обобщенного временного множе- ства Т соответствующие целые числа (например, 1, 2,... что со- хранит порядок и расстояние). При неявном определении вре- менные интервалы, представленные в Т, определяются длитель- ностью звучаний отдельных нот из мелодии. В данном примере 86
принято неявное определение, представляющееся более подходя- щим. Три признака — высота тона, ритм и гармония — могут быть представлены переменными самыми разными способами. Напри- мер, высота тона в мелодии может быть описана одной перемен- ной, скажем переменной щ, состояния которой определяют тона в нашей мелодии (см. рис. 2.8,6). Но можно их представить и с помощью двух переменных, одна из которых задает октаву, а вторая—12 тонов хроматической гаммы. Высота тона может быть представлена и тремя переменными — одна задает октаву, вторая — один из семи основных тонов (a, b,...,g) в каждой ок- таве, и одна — для знаков вариации на полтона Ь (бемоль) и * (диез). Ритм мелодии — это характеристика, зависящая от вре- мени, и, следовательно, определение переменной, ее представля- ющей, зависит от определения времени как параметра. Когда параметр «время» определен (как в нашем примере) неявно, пе- ременная для задания ритма, скажем переменная v2, должна оп- ределить длительности отдельных нот, составляющих мелодию. Эти длительности кратны Ы (или 1/8), как это показано на рис. 2.8,6. Капал наблюдения о2, с помощью которого вводятся временные интервалы [О, Д/), [А/, 2Д/),..., [4Д/, 5Д/), совершенно ясен. Если говорить о гармонии, то пусть обобщенная переменная из будет связана с соответствующей конкретной переменной, у3 через канал абстрагирования, определенный на рис. 2.8,6. В дан- ном случае канал наблюдения Оз представлен стандартными оп- ределениями символов гармонии из «фэйк бук» (элементы Уз). Обратим внимание на то, что гармонию также можно предста- вить с помощью двух переменных, одна переменная для основ- ной ноты (С, F, G) и одна для типа аккорда (С или С7). Если переменные, задающие высоту тона, ритм и гармонию, определены так, как это показано на рис. 2.8, то мелодия блюза полностью описывается матрицей данных на рис. 2.8,в. Повторя- ющаяся часть мелодии задана в матрице столбцами с двойным указанием времени. Пример 2.7. На рис. 2.9,в приведена периодическая матрица, определяющая нужную последовательность сигналов светофоров на перекрестке. Конкретные переменные, описывающие сигналы светофоров для транспортных потоков, идущих в направлениях север — юг, юг — север, запад — восток и восток — запад, обозна- чены соответственно СЮ, ЮС, ЗВ и ВЗ. Каждая из этих пере- менных имеет три состояния: красный, желтый, зеленый (к, ж и з). Стрелка левого поворота для транспорта, следующего в на- правлении север—восток, обозначена СВ, а стрелка правого по- ворота юг — восток — ЮВ. Эти переменные имеют два состояния: стрелка или горит, или нет (обозначаются с и н). Параметром яв- ляется время. Временное множество Т состоит из шести интерва- 87
Г>ГГ''ГГГ"Г ' |<- lilt HI II II tit It till '. 0,1, 2,3, 4, 7,8, 9, 10, 11, 12, 13, 14, 15, 16,17,18, 19 =V, c2 V2 V3 e3 Уз Vo лов ti, представляющих следующее разбиение интервала времени в 90 с, налагаемое каналом наблюдения: 0<о)-! (6) < 15, 15<(о~1 (/2) <25, 25<т-> (f3) <50, (t4) <60, бО^и-Ц/зХбО, во^и-чмоо. 88
1 2 3 68 4 69 5 70 6 71 7 72 8 73 9 74 10 75 11 76 12 77 13 78 14 79 15 80 16 81 17 82 18 и. 8 10 13 17 17 13 8 10 13 16 16 13 8 10 13 17 17 13 *2 1 1 1 1 3 1 1 1 1 1 3 1 1 1 1 1 3 1 •Ъ 0 0 0 0 0 0 0 0 0 2 2 2 2 2 2 0 0 0 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 8 10 8 11 0 13 18 19 18 0 13 19 18 17 13 11 8 5 1 1 1 6 1 1 1 3 1 2 1 1 3 1 1 1 1 2 0 0 0 1 1 1 2 2 2 2 2 2 2 2 2 2 2 0 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 5 6 7 8 8 10 8 15 15 12 8 10 в 15 15 12 8 10 2 2 2 5 1 1 1 1 3 1 1 1 1 1 3 1 1 1 0 0 0 0 0 0 0 3 3 3 3 3 3 2 2 2 2 2 119 120 121 122 123 124 125 126 127 128 55 56 57 58 59 60 61 62 63 64 65 66 67 8 13 11 10 9 8 6 5 1 0 8 10 13 8 10 12 13 0 1 1 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1 4 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 S) Рис. 2.8. Система данных, представляющая мелодию блюза (пример 2.6) Реальные ситуации на перекрестке для каждого из шести вре- менных интервалов /2,...»/е схематически изображены на рис. 2.9,6. Система данных полностью определяется заданием дан- ных для одного периода. Замена матрицы данных, изображенной на рис. 2.9,а, матрицей данных для обобщенных переменных три- виальна: поскольку множества состояний никакими свойствами не обладают, отображение на множество целых чисел может быть произвольным. Пример 2.8. Покрытие моря льдом — один из признаков, за которым постоянно наблюдают климатологи. Признаки такого рода обычно наблюдаются и в пространстве, и во времени. Дан- ные в этом примере получены по фотографиям со спутников и отражают процент водной поверхности в высоких широтах (от 50 до 76° ю. ш.) южных морей, покрытых льдом. Наблюдения со- 89
t 1-й период ^7 ts 2-й период tit tl2 t • • tf tz tj ч ts ts t3 t]0 сю 3 3 3 ж к к 3 3 3 ж к К ... св с н н н н н с н н н н н ... юс к к 3 ж к к к к 3 ж к к •. • юв с с с н н н с с с н н н • • • 38 - S3 к к к к 3 ж к к к к 3 ж « • I a) 5) Рис. 2.9. Описание работы светофоров на перекрестке (пример 2.7) браны за 1 год. Предполагается, что канал наблюдения о выде- ляет шесть состояний, отражающих процент поверхности, покры- той льдом: льдов нет, низкий, средний, высокий, очень высокий (но меньше 100%) и полное покрытие льдами (т. е. 100%). Эти состояния обозначены целыми числами 0, 1,..., 5, так что линей- ный порядок сохраняется. Эти состояния задают следующее раз- биение отрезка [0, 100%]: о-1 (нет)=0%, 50<о-1 (высокий %)<75%, 0<о-1 (низкий %)<25%, 75<о-1 (очень высокий %) <100%, 25<о_| (средний %) <50%, о-1 (полное покрытие) = 100%. В данном случае имеются два параметра: время и одномерное пространство — широта. Время представлено месяцами одного го- да и определяется, как обычно, разбиением всего периода в 1 год на 12 интервалов. Широта измеряется с точностью до 2° и также определяется обычным образом. На рис. 2.10 приведены два набора данных: один для Тихо- океанского сектора южных морей, один для Атлантического. Это значит, что на самом деле в данном примере определены две раз- ные системы данных. Элементы данных представляют собой сред- немесячные показатели за пять лет (1973—1977 гг.). Оба набора данных представлены в обычной матричной форме. Строка мат- рицы дает «моментальный снимок» — одновременное наблюдение ледового покрытия на разных широтах. Столбец матрицы описы- вает динамику ледовой ситуации на одной широте в течение года. Если есть несколько переменных, то каждый элемент матрицы данных будет представлять собой л-ку, содержащую конкретные состояния всех переменных (т. е. элемент V). 90
ЛуоалрмстВо----------* I Градусы широты время 50 52 54 55 58 60 62 64 66 63 70 72 74 76 Марь 0 0 0 1 1 1 1 7 2 3 3 4 4 4 ,, Февраль 0 О 0 0 7 1 1 7 2 2 3 3 3 4 ^Морт 0 0 0 0 0 1 1 7 2 2 3 4 4 4 Апрель 0 0 0 0 0 7 1 7 2 3 4 4 5 5 Май 0 0 0 0 7 7 1 2 3 4 4 5 5 5 Июнь 0 0 0 7 7 2 2 3 4 4 5 5 5 5 Я!ЮЛЬ .. .0 О 7 7 7 2 3 4 4 4 5 5 5 5 Адгуст 0 7 7 7 2 5 4 4 4 5 5 5 5 5 Сентябрь 0 1 7 7 2 3 4 4 5 5 5 5 5 5 Октябрь я 1. 7 7 2 3 3 4 4 5 5 5 5 5 Ноябрь 0 1 7 7 2 2 2 3 4 4 5 5 5 5 Декабрь 0 0 7 7 1 2 2 2 3 4 4 4 5 5 а) 50 JL 54 Градусы широты 72 74 76 56 58 60 62 64 66 68 70 Январь 0 0 0 0 0 7 1 7 7 4 .4 4 4 Февраль 0 0 0 0 0 0 0 7 7 1 3 4 4 3 Март 0 0 0 0 0 0 0 0 7 1 3 4 If 4 Апрель 0 0 0 0 0 0 0 1 1 2 4 5 5 5 Май 0 0 0 0 0 1 1 7 2 4 4 5 5 5 Июнь 0 0 0 0 0 1 1 2 3 4 5 5 5 5 Июль 0 0 0 0 0 1 1 3 4 5 5 5 5 5 АВгуст 0 0 0 0 0 1 2 3 4 4 5 5 5 ' 5 Сентябрь 0 0 0 0 1 1 7 3 4 5 5 5 5 5 Вктябоь 0 0 0 0 1 1 7 3 4 5 5 5 5 5 Ноябрь 0 0 0 0 0 / 1 3 4 4 5 5 5 5 Декабрь 0 0 0 0 0 7 1 2 2 3 4 5 5 5 3) Рис. 2.10. Данные, полученные со спутников, приведенные по месяцам (средние за 5 лет, 1973—1977 гг.), о ледовой обстановке в южных морях (пример 2.8): а — тихоокеанский сектор южных морей; б — атлантический сектор южный морей Пример 2.9. Добавим к исходной системе, определенной в при- мере 2.4 (комплексный анализ крови), еще один параметр — группу пациентов, страдающих анемией. Остальное остается без изменений. При этом данные удобно представить в виде матри- цы, изображенной на рис. 2.11. Каждый элемент матрицы пред- ставляет собой четверку, являющуюся полным состоянием четы- рех переменных, которые наблюдались в определенный день у определенного пациента. На этом примере иллюстрируется си- стематическая подготовка медицинских данных для дальнейшей обработки. 91
День 1 День 2 Пациент 1 Пациент 2 • ' Пациент п Рис. 2.11. Медицинские данные (примеры 2.4 и 2,9] Пример 2.10. Для демонстрации работы с нечеткими данными рассмотрим две переменные из примера 2.3 (посадки деревьев)? товарную высоту (fa) и дефекты (ие). Пусть обе эти переменные определяются через нечеткие каналы наблюдения, которые, од- нако, не заданы явно, а представлены самим наблюдателем. Все остальное так же, как в примере 2.3. При этом массив нечетких данных будет иметь такой вид, как это показано на рис. 2.12,а. Каждый элемент массива задает степень уверенности (уверенно- сти исследователя) в том, что данное дерево (помеченное целым числом w) характеризуется определенным состоянием одной из данных переменных. Этот трехмерный массив нечетких данных аг= 1 2 3 4 5 6 7 8 • • • 'о 0.2 0.8 0.0 0.0 1.0 0.0 0.5 0.0 V3 1 0.9 0.6 0.7 0.0 0.0 0.6 0.5 1.0 • • • I2 0.0 0.0 0.3 1.0 0.0 0.5 c.c 0.0 ’о 0.3 0.9 0.0 0.6 1.0 0.0 0.7 0.2 ve / 0.7 0.3 0.0 0.6 0.0 0.5 0.3 0.9 0.2 0.0 1.0 0A 0.0 0.5 0.1 0.0 a) 1 2 3 9- 4 6 7 8 ... V3 1 0 1 2 0 1 1 1 ... v6 1 0 2 1 0 2 0 1 ... 8J Рис. 2.12. Нечеткие данные (из примера 2.10): а — нечеткие данные; б — соот- ветствующие четкие данные 92
можно сопоставить с матрицей данных на рис. 2.12,6, построен- ной в предположении, что обе эти переменные определяются с по- мощью четких каналов наблюдения. Кроме методологических отличий, введенных для исходных систем, для систем данных можно выделить еще два. Первое — это отличие между полностью и не полностью определенными дан- ными. Данные называются полностью определенными тогда и только тогда, когда определены все их элементы матрицы или массива данных; в противном случае данные называются не пол- ностью определенными. Будем в дальнейшем различать два типа не полностью определенных данных: 1) все случаи, в которых некоторые данные при заданном па- раметрическом множестве недоступны (как это бывает в некото- рых экспериментальных или исторических исследованиях); 2) все случаи, в которых несущественно, имеются ли некото- рые данные (как в некоторых задачах проектирования систем, в которых подобные элементы данных называются безразличны- ми условиями). Если данные определены не полностью, то отдельные множе- ства состояний должны быть расширены некими подходящими (стандартными) символами для обозначения элементов массивов данных, являющихся или «недоступными», или «несущественны- ми». УРСЗ должен иметь соответствующие возможности для ра- боты с такими элементами. Второе методологическое отличие систем данных относится только к системам данных с линейно упорядоченными полными параметрическими множествами. При этом можно говорить о периодических данных, т. е. о данных, которые повторяются при расширении параметрического множества. Образцы периодиче- ских данных приведены в примерах 2.6 и 2.7. Исходные системы и системы данных это эпистемологические типы систем, имеющие по преимуществу эмпирическую природу. В этом смысле их связь с различными традиционными дисциплинами науки и другими предметными областями значительно сильнее, чем связь с пими систем более высоких эпистемологических уровней, являющихся по преимуществу теоретическими. В самом деле, для того, чтобы определить на объекте исходную систему так, чтобы эта система отвечала целям исследования, необходимы соответствующие зна- ния и опыт работы в определенной предметной области. Обычно существует много способов определения исходной системы, и вы- бор какого-то определенного способа, при котором соответствую- щие вопросы формулируются и разрешаются наилучшим спосо- бом,— важнейшая проблема для исследователя. Но и после опре- деления исходной системы для получения содержательных дан- ных необходимы специальные знания и инструменты. Главная цель разбора разнообразных примеров, приведенных в данной 93
главе, состояла в том, чтобы продемонстрировать решение раз- личных вопросов, возникающих в процессе определения исходной системы и получения для них данных. ПРИМЕЧАНИЯ 2.1. В литературе часто ие делается различия между объектом и системой, определенной на объекте. Такая терминологическая нечеткость может быть источ- ником недоразумений. В некоторых случаях для наших понятий объекта и систе- мы используют соответственно термины «реальная система» и «модель». Это неудачные термины, поскольку, если им следовать, наука о системах будет иметь дело с моделями, а не с системами. Я думаю, что лучше пользоваться термином «система» для обозначения только операционально описанных абстрактных представлений множеств свойств и баз. Тогда термином «модель» можно обо- значить равного рода отношения подобия между парами сравнимых систем, т. е. систем одного эпистемологического уровня. 2.2. Во многих случаях проблемы определения исходных систем на иссле- дуемых объектах и сбора данных о них связаны с различными вопросами теории и практики измерений. Эти вопросы неразрывно связаны с традиционными дис- циплинами науки. Поэтому они находятся вне сферы УРСЗ и, следовательно, в данной книге не рассматриваются. В качестве дополнительного чтения можно рекомендовать несколько книг, посвященных общим аспектам измерений [102, 197, 247, 310]. 2.3. Теория нечетких множеств была предложена Л. Заде в 1965 г. [351]. С момента опубликования этой фундаментальной статьи Заде теория начала бурно развиваться. В книге Дюбуа и Прада [98] дан хороший обзор состояния этой теории и ее приложений на конец 7-х гг. Отдельные работы в этой области появляются во многих журналах, однако самым важным источником является специализированный журнал Fuzzy Sets and Systems (Нечеткие множества и системы) издательства North-Holland. 2.4. Синтаксические, семантические и прагматические аспекты исходных си- стем (см. рис. 2.3) можно кратко охарактеризовать следующим образом. К син- таксическим аспектам относится то, что связано с отношениями между знаками, например правила построения предложений из слов, но не смысл и применение этих знаков (слов предложений). Семантические аспекты включают отношения знаков к понятиям, по которым определяется смысл этих знаков (слов, предло- жений), но не их применение. В прагматические аспекты входят отношения зна- ков к понятиям, по которым этим знакам приписывается некоторое прнменеиие. Синтактика (или синтаксис), семантика и прагматика — это три основных аспек- та семиотики (общей теории знаков, сформулированной Ч. Моррисом в 1938 г.). Слово «семиотика» происходит от греческого sema (знак). Семиотика опреде- ляется Моррисом как «общая теория знаков во всех их видах и проявлениях у животных или людей, индивидуумов или обществ [229—231]. 2.5. Лучшими источниками сведений о последних разработках и тенденциях в исследованиях по переформулированию различных разделов прикладной и тео- ретической физики (равно как и некоторых других дисциплин естествознания) иа языке дискретных переменных и параметров являются две книги Гринспена 94
[131, 135] специальный выпуск журнала International Journal of General Sys- tems on Discrete Models (V. 6, № 1, 1980, P. 1—45) и книга И. Инхема [164]. 2.6. Данные, использованные в примере 2.5 (см. рис. 2.7), опубликованы в статье Н. Тимбергена «Эволюция поведения чаек» (Scientific. American, Dec. 1960). Данные из примера 2.8 (см. рис. 2.10) опубликованы Барклом, Робинсо- ном и Куком в журнале Nature (September, 30, 1982). УПРАЖНЕНИЯ 2.1. Определите общее число методологических отличий для исходных си- стем, содержащих: а) две переменные и один параметр; б) две переменные и два параметра; в) пять переменных и три параметра. 2.2. Повторите у пр. 2.1, но для систем данных. 2.3. Повторите упр. 2.1 и 2.2 при условии, что: а) рассматриваются только дискретные переменные и параметры; б) все переменные имеют один н тот же методологический тип; в) все параметры имеют один и тот же методологический тип; г) выполнены все три условия (а), (б) и (в), ио переменные могут иметь методологический тип, отличный от типа параметров. 2.4. В предположении, чго время в примере 2.6 определено явно, а) определите переменную, описывающую ритм; б) задайте соответствующую матрицу данных для мелодии. 2.5. Найдите подходящие формы представления данных в виде массивов для следующих исходных систем: а) для исходной системы, аналогичной системе, определенной в примере 2.8, ио с тремя параметрами: временем, широтой и долготой; б) для исходной системы, подобной аналогичной системе из (а), по с нечет- ким каналом наблюдения; в) для исходной системы, определенной в примере 2.3; г) для исходной системы с двумя дискретными переменными, базирующими- ся на четких каналах наблюдения, и с трехмерным дискретным пространст- вом, задаваемым декартовыми координатами. 2.6. Определите подобно тому, как это сделано в примере 2.7 (светофоры), соответствующую исходную систему и матрицу данных для следующих процес- сов, связанных с созданными человеком объектами: а) работу входного и выходного клапанов, поршня н свечи зажигания одно- го цилиндра двигателя внутреннего сгорания; б) работу двух шлюзовых камер и трех ворот обычной системы шлюзов при постоянном потоке судов, двигающихся в обоих направлениях (рис. 2.13), в) недельное расписание работы маленького аэропорта (опишите все, что касается пассажиров, времени взлетов и посадок, номера выходов, самолеты как переменные и параметры); г) управление музыкальным автоматом, исполняющим мелодию из приме- ра 2.6 (см. рис. 2.8,а), которое основывается на предположении, что испол- нение каждой ноты управляется во времени с помощью двух сигналов. 95
Шлюзовые Шлюзовые Шлюзовые ворота! ворота 2 ворота3 Судно! р. Верхнее течение шлюзовая камера 1 Шлюзовая камера 2 Нижнее течение •*- Судно 2 Рис. 2.13. К упражнению 2.6 2.7. Определите исходную систему на объекте, с которым постоянно взаимо- действуете в вашей повседневной жизни, и соберите соответствующие даииые для это системы. Этим объектом можете быть вы сами; подобное самоисследоваиие можно мотивировать желанием оценить качество вашей жизни; в систему можно включить ряд разного рода переменных, характеризующих, например, ваши пси- хологические свойства, питание, сон, условия работы, физические упражиения, погоду, прием лекарств и т. д.: эти показания могут фиксироваться ежедневно или в другой более подходящей шкале времени. Затем эти даииые можно будет проанализировать с помощью методов, описанных в гл. 3—5. 2.8. Определите нечеткий канал наблюдения для измерения электрического тока в диапазоне от 0 до 10 мА с точностью до 1 мА прн следующих допу- щениях: 1) максимальная ошибка измерения составляет 0,1 мА и 2) вероятность ошибки линейно убывает с расстоянием от границы между блоками разбие- ния интервала [0, 10], индуцированного соответствующим четким каналом наблюдения (в данном случае блоки представляют собой интервалы по 1 мА) 2.9. Пусть есть двумерное (или трехмерное) пространство, представленное декартовыми координатами. Понятно, что множество состояний, представленные каждой из координат, полностью упорядочены и обладают метрикой: 1) покажите, что это пространство может быть упорядочено только частич- но, если требуется сохранить полную упорядоченность каждой из координат; 2) определите частичную упорядоченность этого пространства, при которой координаты остаются полностью упорядоченными; 3) определите в этом пространстве расстояние через расстояния, определен- ные для координат. 2.10. Покажите, что такие свойства некоторых признаков из примера 2.4, как полная упорядоченность н расстояние, сохраняются и для множества состоя- ний соответствующей абстрактной переменной. 2.11. Дайте математические определения канала наблюдения и канала абстрагирования для переменной щ из примера 2.4 и для параметров (время, широта) из примера 2.8. 96
ГЛАВА 3. ПОРОЖДАЮЩИЕ СИСТЕМЫ Главной целью теоретизирования явля- ется такая организация информации, при которой оказывается возможным сделать неочевидные выводы. Д. Хейсе 3.1. ЭМПИРИЧЕСКОЕ ИССЛЕДОВАНИЕ Наука должна начинаться с фактов и заканчиваться фактами, независимо от промежуточных теоретических построе- ний. Дж. Кемени Для любого содержательного эмпирического исследования не- обходимы три предпосылки. Во-первых, должен быть определен объект исследования; во-вторых, должна быть известна цель ис- следования этого объекта; в-третьих, должны быть определены ограничения, при которых проводится исследование. Объект исследования определен в гл. 2 как часть мира, раз- личаемая как единое целое в течение достаточно длительного пе- риода времени и подходящая для какого-либо конкретного иссле- дования. Цель исследования можно представить как набор вопросов об объекте, на которые исследователь (или его заказчик) хотят по- лучить ответы. Если, например, объектом исследования является г. Нью-Йорк, то целью исследования могут быть ответы на такие, например, вопросы: каким образом можно сократить преступность в городе или как улучшить движение транспорта; если объектом исследования является вычислительный комплекс, то целью ис- следования может быть поиск ответов на вопросы: каковы узкие места в комплексе, что можно сделать для повышения его про- изводительности — и тому подобное; если исследуется больница, то возможны такие вопросы: как повысить готовность оказать срочную помощь в опасных случаях, как сократить среднее время пребывания пациента в больнице или что можно сделать для сокращения платы за лечение при сохранении его качества? Если музыковед изучает творчество какого-либо композитора, напри- мер Игоря Стравинского, то его вопрос будет, вероятно, выгля- деть так: каковы основные особенности сочинений Стравинского, отличающие их от произведений других композиторов? Ограничения в эмпирическом исследовании представляют ог- раниченные возможности выбора инструментов, ограниченные фи- нансовые возможности и время, людские ресурсы и мощность 7—6923 97
Объект исследования Цель иссле- дования Ограничения на исследования Определение исходной системы исходная система Сбор данных Системе денных Обработка данных Интерпре- тация Параметрически' инвариантные. свойства ч •Продолжение обра- ботки данных • новый способ обработки данных • Новый тип свойств > Упрощение • Выводы [заключитель- ный отчет; ' •Продолжение исследования [предварительный отчет! •Продолжение измерений им наблюдений •Переопределение исходной системы Рис. 3.1. Основные этапы эмпирических исследований систем вычислительной техники, правовые, моральные и другие нормы, которых должен придерживаться исследователь. Основные этапы эмпирического исследования изображены на рис. 3.1; они послужат нам руководством при изложении мате- риала данного раздела. Первым этапом любого эмпирического исследования является определение исходной системы на соответствующем объекте. Этот этап достаточно подробно рассмотрен в гл. 2 и изображен на рис. 2.3. Основной проблемой этого этапа исследования является выбор обычно из многих возможностей исходной системы, наилуч- шим образом соответствующей цели исследования и удовлетво- ряющей имеющимся ограничениям. Решение этой проблемы, без- условно, зависит от контекста. Оно требует со стороны исследо- вателя не только опыта и знаний в изучаемой области, но и специального исследования. Перед тем как выбрать какую-либо оп- ределенную исходную систему для эмпирического исследования, часто приходится изучить сначала различные гипотетические ва- рианты систем более высоких эпистемологических уровней. С самого начала при выборе подходящей исходной системы возникают две проблемы: выбор свойств и баз и выбор каналов наблюдения для них. Каналы абстрагирования рассматриваются позже, когда возникает необходимость перевести систему на язык УРСЗ. Выбор свойств и баз, возможно, самое важное решение, при- нимаемое в процессе эмпирического исследования, так как этот выбор влияет на все последующие этапы этого процесса. Принять решение очень непросто и не всегда удается рационально объяс- нить это решение. Решение часто опирается на некие априорные идеи, которые, когда они достаточно четко сформировались в со- знании исследователя, называются научными теориями. Некото- рые ученые, занимающиеся философией пауки, настаивают на том, что любой осмысленный выбор свойств для эмпирического 98
исследования всегда опирается на векую теорию, которая или сформулирована явным образом, или возникла у исследователя подсознательно, или является частью нашего унаследованного гететически врожденного знания. Важно, чтобы в процессе определения исходной системы ис- следователь знал все возможности современной методологии си- стем. В противном случае он может без особой необходимости ограничить свой выбор. Одно из этих ограничений хорошо описа- но у Эшби [24]: Тот, кто имеет некоторый опыт работы с математическими понятиями, легко может приобрести привычку считать, что под термином переменная всегда пони- мается численная шкала с аддитивной метрикой. Данное предположение являет- ся совершенно излишним ограничением, которое иногда приводит к фатальным заблуждениям. Метеорологи давно работают с пятью «типами облаков», вете- ринары — с разными «паразитами у свиней», а гемаматологи — с четырьмя основ- ными «группами крови». Современная математика, использующая методы теории множеств, умеет работать с переменными такого типа, без которых в науках о поведении обойтись невозможно. Другое часто встречающееся в эмпирических исследованиях ограничение — это использование только четких каналов наблю- дения, даже если для некоторых признаков и баз нечеткие кана- лы наблюдения подходят значительно лучше. Подобное ограни- чение является совершенно излишним, поскольку сейчас уже име- ются методы работы с нечеткими данными. После выбора свойств и баз исследователь должен опреде- лить для них канал наблюдения. Как уже говорилось в гл- 2, ка- налы наблюдения задают разбиения заданного множества прояв- лений свойства или значений параметра. Любое такое разбиение будем называть разрешающей формой (resolution form). Хотя в некоторых случаях разрешающие формы не могут быть опреде- лены математически (если только не принимать какие-то метафи- зические допущения), вполне возможно определить, является ли одна разрешающая форма уточнением другой или ее укрупнени- ем (в смысле стандартного уточняющего упорядочения, опреде- ленного на разбиениях заданного множества). Подобное сравне- ние двух разрешающих форм делается не математически, а с по- мощью сопоставления соответствующих процедур измерения. Диапазон возможных разрешающих форм всегда имеет верхнюю границу, определяемую разрешающей способностью имеющихся измерительных инструментов. Нижней границей является любая разрешающая форма, состоящая только из двух блоков. Выбор формы из этого диапазона зависит от цели исследования. После определения исходной системы становится возможным сбор данных. Этот процесс сводится к наблюдению или измере- нию отобранных свойств при определенных значениях баз и за- 7* 99
писи этих наблюдений в некой подходящей форме (см. разд. 2.6). Если исследователь имеет возможность управлять некоторыми свойствами, он может этим воспользоваться. В этом случае свой- ства, которыми он собирается управлять, рассматриваются как входные свойства, что дает направленную исходную систему. За- тем исследователь предлагает некие эксперименты, в которых согласно осуществимой экспериментально стратегии, связанной с целью исследования, задаются входные свойства. При этом на- блюдаются выходные свойства. В результате получается система данных. После определения системы данных начинается следующий этап эмпирического исследования — обработка данных. Его целью является определение неких параметрически инвариантных свойств переменных, позволяющих экономно представлять дан- ные и, если нужно, порождать их. На этом этапе УРСЗ может очень помочь исследователю. При этом или используются все данные для вывода нужных параметров инвариантных свойств, или сначала обрабатывается только часть данных, а остальные резервируются для последующей проверки полученных свойств. Существует ряд параметрически инвариантных свойств, но все они имеют нечто общее. Каждое такое свойство описывает огра- ничение, наложенное на переменные исходной системы, не меня- ющиеся в пределах параметрического множества. Если, напри- мер, параметром является время, то любое инвариантное време- ни свойство описывает ограничение на переменные, не меняющие- ся во времени. Разные параметрические инвариантные свойства могут служить характеристиками типов ограничений, связывае- мых с различными эпистемологическими уровнями, или, наоборот, могут отличаться только способом, каким представляется один и тот же тип ограничений, связанный с определенным эпистемоло- гическим уровнем. На первых отличиях базируется различение эпистемологических уровней систем, вторые служат для представ- ления методологических отличий на определенном эпистемологи- ческом уровне. После того как данные каким-то образом обработаны и опре- делены соответствующие параметрически инвариантные свойст- ва, им необходимо дать интерпретацию с учетом цели исследо- вания, т. е. нужно посмотреть, насколько они полезны для поиска ответов на поставленные в исследовании вопросы. Если на вопро- сы можно ответить адекватно, то исследование успешно заверше- но и исследователь может подвести итоги и готовить заключи- тельный отчет. В противном случае он может попытаться обра- ботать данные другим способом. Этот процесс может повторяться несколько раз, причем можно искать параметрически инвариант- ные свойства как того же уровня, так и других эпистемологиче- ских уровней. В конечном счете исследователь получает набор 100
порождающих систем или систем более высокого уровня, каждая из которых с определенной точки зрения правильно представляет данные. Подобный набор взаимодополняющих систем, каждая из которых отражает определенные свойства данных, часто дает исследователю лучшее понимание проблемы, чем какая-либо од- на система. Система (или системы), полученная в результате обработки данных, иногда оказывается слишком сложной, чтобы человек мог ее охватить целиком, и, следовательно, такая система не может помочь исследователю лучше попять проблему. В подобных слу- чаях необходимо или по крайней мере желательно уменьшить сложность этой системы. Таким образом, УРСЗ должен распола- гать средствами упрощения систем разных типов по критериям, указанным пользователем. После обработки данных и интерпретации полученных свойств исследователь может также захотеть собрать дополнительные данные для того, чтобы повысить свою уверенность в правильно- сти полученных свойств, или пересмотреть их на основе новых данных. Подобный повторный сбор данных изменяет систему дан- ных, но оставляет без изменений исходную систему. Однако ис- следователь может сделать и более решительное изменение — пе- реопределить исходную систему. В этом случае он, разумеется, должен повторить весь процесс для новой исходной системы. Вся процедура эмпирического исследования систем, согласно рис. 3.1, может быть теперь описана следующим образом: 1) дан объект, цель и ограничения эмпирического исследова- ния; на объекте определяется исходная система (подробности см. на рис. 2.3); 2) для данной исходной системы собираются данные и пред- ставляются в удобном виде, обычно в виде массива данных; 3) данные обрабатываются с целью определения неких пред- ставляющих их параметрически инвариантных свойств; 4) полученные параметрически инвариантные свойства интер- претируются в соответствии с целью исследования и делаются окончательные выводы или исследование начинается снова с эта- па 3, 2 или 1. УРСЗ должен уметь работать со всеми задачами, связанными с этапом обработки данных. Поэтому он должен иметь возмож- ность: 1) вывода из заданных данных параметрически инвари- антных свойств всех нужных типов; 2) сравнения выведенных свойств и исключения тех систем, свойства которых не удовлетво- ряют критериям пользователя; 3) упрощения систем различных типов в соответствии с определенными пользователем критерия- ми упрощения. Эти три возможности УРСЗ рассматриваются в данной главе только относительно систем эпистемологического уровня, следующего непосредственно за уровнем систем данных. 101
'Этот уровень называется уровнем 2 (см. рис. 1.3). На этом уров- 'не параметрически инвариантные свойства представляют собой •непосредственные описания (разного рода) общего ограничения, связанного с используемыми переменными. Системы, содержащие подобные описания, называются порождающими. Целью данной главы является определение порождающих систем и демонстра- ция некоторых типов задач, в которых они используются. Порождающие системы (как и системы более высоких эписте- лиологических уровней) определяются и рассматриваются в дан- ной книге на языке обобщенных представляющих систем (абст- рактных переменных и параметров). Это означает, что они пред- ставляются в терминах языка УРСЗ, т. е. без семантики. Однако •в тех случаях, когда рассматриваются приложения, порождающая система дополняется исходной системой, через которую и вво- .дятся соответствующие семантические аспекты. Обобщенная пред- ставляющая система, входящая в обе эти системы, представляет собой интерфейс между языком УРСЗ и объектно-ориентирован- ным языком конкретной дисциплины. Естественно, в обеих этих системах обобщенная подобная система должна быть одной и ~той же. 3.2. СИСТЕМЫ С ПОВЕДЕНИЕМ Система с поведением существует для того человека, который задает маску. Р. Карни Термин поведение используется в данной книге просто для по- лучения характеристики общего параметрически инвариантного •ограничения на переменные обобщенной представляющей систе- мы и, может быть, на некоторые дополнительные абстрактные не- пременные. Дополнительные переменные определяются на пара- метрическом множестве с помощью правил сдвига (translation ru- le). Такое правило может быть применено или к переменной из заданной представляющей системы, или к введенной по каким- либо методологическим соображениям гипотетической перемен- ной, обычно называемой внутренней. Вопросы, связанные с вну- тренними переменными, рассматриваются в разд. 3.10. В остальных разделах этой главы предполагается, что внутренние переменные в рассмотрение не вводятся. Так как описание парамет- рически инвариантного ограничения на рассматриваемые пере- менные может быть использовано для порождения состояний пе- ременных при данном параметрическом множестве, системы, со- . держащие такие ограничения, называются порождающими -системами. Поведение представляет собой одну из форм задания этого ограничения. 102
Для заданной обобщенной представляющей системы диапазон, возможных типов параметрически инвариантных ограничений за- висит от свойств, приписываемых параметрическому множеству.. Если на этом множестве никаких свойств не определено (как эта- часто бывает для групп), то состояния переменных могут ограни- чивать только друг друга. Однако если параметрическое множе- ство упорядочено, состояния переменных могут ограничиваться не только другими состояниями, но и состояниями выбранного со- седства для каждого конкретного значения параметра. Посколь- ку соседство является основой для представления параметриче- ски инвариантного ограничения, оно само должно быть парамет- рически инвариантным. Соседство на упорядоченном параметрическом множестве- обычно называется маской (почему, будет объяснено ниже) в- определяется через переменные, параметрическое множество и- набор правил сдвига на параметрическом множестве. Правила сдвига, скажем правило гу,— это однозначная функция г,-: W->W, (3.1> которая каждому элементу W ставит в соответствие другой (при- чем единственный) элемент W. Если, например, параметрическое- множество полностью упорядочено (как в случаях, когда рас- сматривается время или одновременное пространство) и представ- ляет собой множество последовательных целых положительных, чисел, то любое правило сдвига может быть задано простым? уравнением rz(w)=w+p, (3.2>* где р — целая константа (положительная, отрицательная или; нуль). При р=0 г/ называется тождественным правилом сдвига.. Пусть задана обобщенная представляющая система I, опре- деляемая уравнением (2.12). Обозначим через V множество пе- ременных из I, а через R набор правил сдвига, рассматриваемых; для этих переменных. Тогда множество переменных S = {Si, 52, называемых выборочными переменными, может быть введено- с помощью уравнений S*' w = Vi, г/(w) ^-З)- для некоторых переменных Vi^V и правил сдвига r^R; Sk,w обо- значено состояние выборочной переменной Sk при значении пара- метра w, a j.tw}—состояние переменной и,- при значении па- раметра r/(w), т. е. при значении, полученном для заданного w,_ при применении правила сдвига г/. Для полностью упорядоченно- го параметрического множества, правила сдвига которого имеют- 103.
вид (3.2), уравнение (3.3) может быть переписано в более опре- деленном виде Так как любое правило сдвига из набора /? может быть примене- но к любой переменной из множества V, то множество всех воз- можных выборочных переменных представляется декартовым произведением VXR. В действительности рассматриваются вы- борочные переменные, характеризуемые отношением MCVXR (3.5) так, что всякой паре (и„ Г/)^М соответствует одно уравнение из (3.3). Отношение М представляет схему соседства на пара- метрическом множестве, в терминах которого определены выбо- рочные переменные. Как уже говорилось выше, эта схема обыч- но называется маской. Понятно, что для введения идентификато-. ров выборочных переменных k должна быть введена некая одно- значная функция (кодирование). А: Л1—м ।, (3.6) где |Af| —это мощность множества М. Если выборочная переменная $й определена через перемен- ную Vi и некоторое правило сдвига согласно уравнению (3.3), то множество состояний $л, очевидно, то же самое, что и множество состояний Vi, т. е. Vi. Однако для удобства обозначений будем множество состояний выборочной переменной обозначать 5^; смысл любого Sfe N J м!) однозначно определяется маской в терминах одного нз множеств V,- Таким образом, де- картово произведение С = $i X ^2 X ••• X $ [ м । представляет собой полное множество состояний выборочных пе- ременных. Рассмотрим сначала понятие маски и связанное с ним пове- дение представляющих систем для полностью упорядоченных па- раметрических множеств, а затем распространим его на частично упорядоченные параметрические множества. Обозначим полно- стью упорядоченные параметрические множества Т, а их элемен- ты t При этом уравнение (3.4) немного изменится: t+p- (3.7) Для полностью упорядоченных параметрических множеств маска может быть изображена в виде вырезки из матрицы, пред- ставляющей декартово произведение VXR. Это показано на рис. 3.2,а, на котором строки помечены идентификаторами i пере- 104
s1,7 = vi,6 = s2,7 = v!,7 = s3,7 = v2,7 = $4,7 = Vi,a = S5,7 = v3, 5 ~ $6,7 = v3,6 = $7,7 ~ VS,7 = 5t,7 = = $6,7 я v<t,7 ~ ^10,7 ” Vjit7 я Рис 3.2. Пояснение понятия маски для полностью упорядоченных параметриче- ских множеств менных из множества V, а столбцы — целыми константами р, свя- занными с правилами сдвига вида (3.2). Элементы матрицы или пусты, или представляют собой идентификаторы k выборочных переменных, приписанные парам (г, р) согласно (3.7); пустые эле- менты матрицы соответствуют элементам VX#. не входящим в маску. В визуальном представлении становится ясно, почему мы используем термин «маска». Часто бывает удобно разбить маску М на подмаски Mit каж- дая из которых связана с одной переменной Vi из подобной си- стемы. Формально Л1,= {(а, Р) | (а, 8)<=Л1, 0=0,}. (3.8) В визуальном (матричном) представлении М подмаски Mt представляют собой строки. В любой маске один столбец соответствует тождественному правилу сдвига (р=0). Этот столбец имеет особое значение, по- скольку связанные с ним выборочные переменные идентичны ба- 105
"зовым переменным заданной представляющей системы. Будем этот столбец в масках называть справочником. Если маска по- мещена на матрицу данных таким образом, что справочник сов- падает с определенным значением t, то маска выделит только не- жоторое подмножество элементов, а именно элементы, представ- .ляющие полное состояние выборочных переменных при данном значении t. Так, например, на рис. 3.2,6 изображена маска (оп- ределенная на рис. 3.2,а), помещенная на матрицу данных d при (справочник маски совпадает с /=7). Полное состояние выборочных переменных для этого положения маски показано на рис. 3.2,в. Обратите внимание на то, что состояния справочника выборочных переменных s2, s3, s7, s9, $ю в точности те же (для .любого t), что и состояние базовых переменных соответственно Vi, v2, Сз, v5. Остальные выборочные переменные представля- ем собой состояния из параметрического соседства в t. Для лю- «бой маски при любом t схема соседства сохраняется. Если t — «ремя, то переменная $4 будет представлять будущее (относи- тельно рассматриваемого значения t) состояние переменной v2, в переменные Ss и s4 будут представлять, например, прошлые со- стояния переменной v3. Любая маска представляет определенную точку зрения, в со- ответствии с которой представляются ограничения на базовые переменные. Самый простой способ задания определенной мас- жи— это перечисление всех полных состояний соответствующих выборочных переменных. В общем виде подобный перечень явля- ется подмножеством декартова произведения С, т. е. многомер- ным отношением, определенным па С. Это отношение определяет- ся функцией fB: С-ЧО, 1}, (3.9) 'такой, что /в(с) = 1, если состояние с входит в перечень, и fe(c) = =0 в противном случае. Таким образом, функция fe — это типич- ная функция выбора. Она выбирает состояния выборочных пере- менных из множества всех потенциальных состояний (из декар- това произведения С). Так как подобный выбор дает по крайней мере некоторые сведения о поведении этих переменных, функцию :fa обычно называют функцией поведения (behavior). Функция, ‘Определяемая уравнением (3.3), задает только один из сущест- вующих типов функций поведения, разными способами описываю- ’.адих ограничения на переменные. В разд. 3.3 вводятся разные -функции поведения, которые рассматриваются как методологи- ческие отличия. В этом разделе мы ограничимся выбирающей •функцией поведения, определяемой (3.9). Обратите внимание на то, что функция fe определяет реаль- но встречающиеся состояния с, по не определяет значение пара- метра, при котором они имеют место. Таким образом, эта функ- :щия является параметрически инвариантной. Обратите также «06
внимание на область определения fB. Она одинакова для всех: типов функций поведения и определяется через маску, которая,, в свою очередь, определяется через переменные и параметры представляющей системы. Отсюда следует, что некоторая система,, скажем система Fb, характеризующая параметрически инвариант- ное ограничение на множество переменных через функции пове- дения, определяется тройкой FB=(I, М, fB), (3.10)* где I — обобщенная представляющая система; М — маски, опреде- ленная на I; fB — функция поведения, определенная через М и I. Будем такую систему называть системой с поведением. Несмотря на то, что любая система с поведением, определяе- мая (3.10), неким конкретным параметрически инвариантно опи- сывает ограничения на переменные представляющей системы, она не содержит описания того, как использовать это ограничение для порождения данных. Для разработки такого описания нужно разбить выборочные переменные на два подмножества: 1) переменные, состояния которых порождаются из ограниче- ния; назовем их порождаемыми переменными-, 2) переменные, состояния которых используются как условия' в процессе генерации, назовем их порождающими переменными. Для заданной системы с поведением одним из способов опре- деления порожденных и порождающих переменных является оп- ределение для данной маски М двух подмасок М„ и М_ . Будем « g Ма = (М, Mg, ML), (3.11), где Л4а, Al(JAf_ = Af, ЛкПМ_ = 0, S g ® g ® g называть маской порождения, т. е. это маска М и ее разбиение* на порождаемую подмаску Mg и порождающую подмаску Л1_.. По аналогии с разбиением М на Мв и Л1_ множество М. ... идеи- 5 g I Al I тификаторов k выборочных переменных можно разбить на два под- множества, скажем Kg и К. представляющих идентификаторы со- ответственно порождаемых и порождающих переменных. Для удобства обозначений кодирующая функция (3.6) может быть, заменена двумя функциями с помощью которых множества состояний G и G соответственно- порождаемых и порождающих переменных задаются декартовы- ЮГ
ми произведениями G = X Sft. k^K- s (3.13) ZGB(g>g) | Теперь способ представления состояния порождаемых перемен- ных (скажем geG), определяемого по состоянию порождающих переменных (скажем, geG), можно выразить функцией 1}, (3.14) где 1, если g может иметь место или если имеет место g О если g не может иметь место или если имеет место g. Назовем эту функцию порождающей функцией поведения. Если маску М и функцию /в из (3.10) заменить соответствен- но на Ма и foe, то получится альтернативная система Egs=(I, Ма, faB). (3.15) Будем называть такую систему порождающей системой с пове- дением. Использование порождающей системы с поведением для по- рождения данных включает следующие два этапа: а) для некоторого значения /еТ задано состояние geG; для определения состояния geG при том же значении используется функция fcB', б) значение t заменяется на новое и повторяется этап а). Необходимо прояснить несколько вопросов, связанных с двух- этапной процедурой порождения. Во-первых, на этапе а) неявно предполагается, что при заданном значении t состояние g извест- но. При первом выполнении этого этапа данное состояние опре- деляется пользователем как подходящее начальное условие. Од- нако после этого все полностью определяется самим процессом порождения, т. е. состояниями g и g, связанными с предшествую- щим значением t. При этом предполагается, что значения t должны на этапе (б) изменяться в соответствии с порядком, за- данным па множестве Т. Таким образом, значения t заменяются или на Н-1, или на t—1. В первом варианте начальное условие должно быть определено для наименьшего возможного значе- ния t, а во втором — для наибольшего возможного значения t. Во-вторых, из необходимости порождения данных в одном из двух порядков следует, что существует только два содержатель- ных разбиения маски М на Mg яМ~, каждое из которых соответ- 108
ствует одному из двух порядков порождения. Если данные по- рождаются в порядке возрастания (убывания) t, то Mg содержит ровно по одному элементу каждой подмаски Mi (i^Nn), опреде- ленной в (3.8), элемент с наибольшим (наименьшим) значением р; остальные элементы М входят в М^. Таким образом, графиче- ски получается, что Mg — это множество самых правых элемен- тов М (правый край этой маски) или, наоборот, множество са- мых левых элементов М (левый край маски). _ В-третьих, предполагается, что для любого состояния geG имеется по крайней мере одно состояние geG, допустимое функ- цией fae [т. е. foB(g, g) = l]. Если допускается только одно со- стояние, то для любого начального условия данные порождаются однозначно; такие системы называются детерминированными. Если допускается более чем одно состояние, то порождение дан- ных проблематично, так как порождаемое состояние не всегда однозначно определено. Для таких систем выбирающие функции поведения не подходят. Более содержательно они описываются функциями поведения других типов, рассматриваемых в разд. 3.3. Для детерминированных систем представление (3.14) порождаю- представлением щей функции поведения fcB может быть заменено более простым fCB:G=>G. ▲ (3.16) Пример 3.1. Для пояснения процесса порождения данных по- рождающей системой с поведением типа, определяемого уравне- нием (3.15), положим, что подобная система состоит из упорядо- ченного параметрического множества T—Ngg и пяти переменных Vi,...,v5, состояния которых будут определены ниже. Воспользу- емся маской, заданной на рис. 3.2. Данные могут порождаться или в порядке возрастания, или в порядке убывания значений па- раметра t. Оба эти варианта показаны соответственно на рис. 3.3 и 3.4. В первом случае (рис. 3.3) порождаемые выборочные пере- менные— это переменные, соответствующие правому краю маски, т. е. S2, $4, s7, s9, Хю; остальные выборочные переменные являются порождающими. Порождение данных в матрице данных происхо- дит слева направо. Пусть порождающая функция поведения faB, представленная в виде (3.16), определяется уравнениями sk,t — Si,t + S3,i“bss.i + se.t + ss.t (mod k) при k=2, 4, 7, 9, 10, Множества состояний порождаемых пере- менных определяются этими уравнениями, а множества состоя- ний порождающих переменных — их положением в маске. Напри- мер, множество состояний порождаемой переменной $4 — это О, 1, 2, 3, так как уравнение для $4 берется по модулю 4; порож- дающая переменная S3 имеет то же множество состояний, что и 109
С’ Рис. 3.3. Данные, порожденные в порядке возрастания значений параметра t (пример 3.1) $4, так как обе эти переменные определены через одну и ту же переменную представляющей системы (т. е. 5з=54=У2). Первой осмысленной позицией маски на матрице данных (по- зиция определяется положением справочника маски) является позиция /=3; позиции t=l и t—2 смысла не имеют, так как со- стояния некоторых выборочных переменных для этих позиций не определены (Н-р не входит в множество Т). Начальное усло- вие состоит из шести элементов матрицы данных: ц1>2, о2,з, »з,ь ^4,1. ^4,2- Пусть, например, все эти элементы равны 1. Еще пять но
J) Рис. 3.4. Данные, порожденные в порядке убывания значений параметра t (пример 3.1) элементов матрицы данных — dm, u2,i, ^2.2, 05,1, »з,2 — не могут быть порождены, а могут быть заданы пользователем, но для порождения данных эти переменные не нужны. На рис. 3.3,а, б, в, г подробно показано порождение состояний соответственно для t=3, 4, 5, 6; кружками обведены порожденные состояния. На рис. 3.3,3 показано начальное условие и несколько больший фраг- мент порожденной матрицы данных. Если данные порождаются в порядке убывания t (см. рис. 3.4), то порождаемыми переменными являются переменные, представляющие левый край маски, т. е. переменные sIt S3, sg, sg, ill
sio. Данные в матрице данных порождаются справа налево. Пред- положим теперь, что faa определяется уравнениями $A,t = $21t-|_S4,tH-S6,t_|_S7,l_|_59,l (mod #-|-1) при &=1, 3, 5, 8, 10. Порождение данных при £=98, 97, 96, 95 подробно показано на рис. 3.4,а, б, в и г. На рис. 3.4,д показано начальное условие и несколько больший фрагмент порожденной матрицы. 3.3. МЕТОДОЛОГИЧЕСКИЕ ОТЛИЧИЯ Прагматики правы, по крайней мере с точки зрения методологии,— безуслов- но, нет лучшего способа обоснования метода, чем установить, что «он работа- ет» для каких-то конкретных задач. Н. Решер Параметрически инвариантное ограничение на множество вы- борочных переменных может быть охарактеризовано разными способами. Простое описание, рассмотренное в разд. 3.3, может ограничиться заданием функции выбора, определенной на соот- ветствующем множестве состояний. Хотя функция выбора явля- ется, вероятно, наиболее подходящим формальным аппаратом для задания ограничений в детерминированных системах, в которых порождение данных удобно описывать с помощью функции (3.16), для работы с недетерминированными системами функции выбора не годятся. Традиционно с недетерминированными системами работают методами теории вероятностей. При этом основным понятием при описании ограничений на переменные является понятие вероят- ностной меры. Несмотря на то, что это наиболее развитый и важ- нейший математический инструмент для работы с недетермини- рованными системами, в настоящее время вероятностная мера рассматривается только как частный случай более общего клас- са мер, называемых нечеткими мерами. Любая мера ставит в соответствие подмножествам заданного множества какие-либо действительные числа, характеризующие (измеряющие) количество некоего свойства, связанного с каждым подмножеством. Под множеством мы будем понимать множество всех состояний выборочных переменных и рассматривать такое свойство как степень правдоподобия того, что может иметь место любое из состояний для каждого определенного подмножества. Степень правдоподобия обычно задается действительным числом из единичного интервала; чем больше число, тем выше степень правдоподобия. Любой класс мер определяется через некие ма- тематические свойства, задаваемые набором правил вычисления, 112
которые относятся к соответствующему классу мер. Для соотне- сения этих математических свойств с общепринятыми понятиями различным классам мер были даны содержательные названия, такие, как вероятность, возможность, правдоподобие, доверие. Несмотря на то, что эти названия позволяют быстро сориентиро- ваться в этих мерах, буквально их понимать не следует. Вопрос о том, подходит или нет некая мера для данного приложения (и аналогичные вопросы), должен решаться исходя из математи- ческих свойств этой меры, а не по общепринятому смыслу ее на- звания. Д В нашем случае меры определяются на подмножествах де- картового произведения С. Отсюда мера определяется функцией ц:^(С)->[0, 1], (3.17) где &(С)—мощность множества С. Чтобы функция являлась ме- рой, она должна обладать следующими свойствами нечетких мер: (1*1) |Х(0) = О; |Х(С)= 1; (р.2) если A'jGXj, то р.(А'1)<!л(А'2); (цЗ) если ... или Х^Х^Э ..., то lira |* (Xt) = р. lim (<¥(). /-*00 Требование (р.1) очевидно. Требование (у.2), обычно называемое свойством монотонности, не допускает, чтобы подмножество дру- гого подмножества С обладало большей мерой, чем включающее подмножество. Согласно требованию (рЗ), называемому непре- рывностью, предел мер бесконечной монотонной последовательно- сти подмножеств С должен совпадать с мерой предела этой по- следовательности. К дискретным системам, в которых С всегда является конечным множеством, требование непрерывности, есте- ственно, неприменимо. В литературе описаны самые разные классы нечетких мер, имеющих разные свойства. На рис. 3.5 приведена диаграмма, изо- бражающая отношение включе- ния для некоторых мер. Так, на- пример, класс вероятностных мер входит в класс мер правдо- подобия и в класс мер дове- рия, но не пересекается с клас- сами мер возможности или необ- ходимости. Классы нечетких мер рассма- триваются как методологические отличия. Они используются в по- рождающих системах и во всех системах более высоких эписте- рис 35 Некоторые классы нечетких мологических уровней. Чтобы мер нечеткие меры Меры доверия (убежден- ности) Возможност- ные меры четкая возмож- ность Вероятностные меры меры правдо- подобия Четкая необходимость (уверенность) Меры необходи- мости
(3.18) и определяемой формулой к (X) = max fB (с). (3.21) сеХ По тем же соображениям, что и для функций распределения ве- роятностей, мы снова использовали обозначение fe- Обратите внимание на то, что функция выбора (3.9) представ- ляет собой частный случай функции распределения возможностей, но не функции распределения вероятностей. Это функция распре- деления возможностей, у которой степень возможности fB (с) для любого сеС равна или 0, или 1. Этот частный случай обычно называют четкой функцией распределения возможностей (рис. 3.5). При этом порождающая функция поведения /св имеет вид foe: GXG->[0, 1]: (3.22) где /св(б, g)—условная вероятность или соответственно услов- ная возможность при условии g. Чтобы подчеркнуть, что /ов задает условные вероятности или условные возможности, для обозначения вероятности (или возможности) g при заданном g вместо /ов(и, g) используется стандартное обозначение /gb (gj g). Функцию выбора (3.4) можно рассматривать как частный (четкий) случай возможностной интерпретации функции (3.22), но не как частный случай ее вероятностной интерпретации. Одна- ко для детерминированных систем порождающая функция пове- дения в виде (3.16) представляет методологический интерес и, следовательно, имеет смысл методологически отличать эту форму от возможностной. Применение или неприменение функции (3.16) —это вопрос, относящийся к реализации УРСЗ, но не к его архитектуре. С точки зрения пользователя УРСЗ достаточно, что- бы различались только вероятностная и возможностная интерпре- тации и, может быть, некоторые другие полезные классы нечет- ких мер. До сих пор мы рассматривали только нейтральные системы с поведением (базовые и порождающие). Для описания их на- правленных аналогов необходимо разбить соответствующее мно- жество выборочных переменных на два подмножества: 1) выборочные переменные, определяемые средой, т. е. вход- ные переменные [переменные и(-, для которых u(i) =0]; 2) остальные выборочные переменные, связанные с рассмат- риваемой маской. Эти два подмножества выборочных переменных можно опре- делить, разбив заданную маску М на две подмаски. Пусть под- маска Ме определяет выборочные переменные, задаваемые сре- дой, а подмаска №_.•—остальные. Тогда тройка М = (М,Л1£, Л1-), (3.23) 8* 115
для которой справедливо, что Ме, м-см, Ме U М- = Л1, МеЦМ- = 0, определяет маску направленной системы с поведением. Л Согласно разбиения МеМ и на М-множество W । м f идентификаторов выборочных переменных, определяемых М, разобьется на подмноже. ства Ке и К-. Кодирующая функция (3.6) будет заменена соответ, ственно на две функции : Ме ► Ке. е е е > и будут определены следующие два множества состояний: (3.25) необходимые для направленных систем. Функция поведения на- правленных систем имеет вид : Е X Ё—[0, 1], (3.26) где fs(e, е) —это условная вероятность или условная возможность (или какая-то другая мера) и, следовательно, вместо записи /в(е, е) можно использовать стандартную форму /в(е|е). Теперь можно определить направленную систему с поведением как тройку FB=(T,MJB). (3.27) Порождающая функция поведения для направленных систем может быть введена с помощью разбиения М- на два подмно- жества Mg и М-, соответствующих порождаемым и порождающим переменным. Делается это точно так же, как было описано для М. Таким образом, порождающая маска для направленных систем задается четверкой MG = (М, Ме; Mg, М-), где {Ме, Mg, М-} — это разбиение М. Снова определяются коди- рующие функции (3.12), но {/Wg) М-} рассматривается теперь как 1 1R
a) 6) Ke = {l,2, 5,4} K-e = {5,6,..., to} Ь'Н™ ">} I K-д = {5, 6,8} Рнс. 3.6. Разбиения маски для направленной представляющей системы с полностью упорядоченным параметрическим множеством и и=(0, 0, 1, 1) для обоих возможных порядков порождения данных )азбиение М-. Множества G и О определяются формулами (3.13). Геперь ?0B:EXG XG —[0, 1], (3.28) 'Де /ов(е, g, g)—это условная вероятность или возможность (или какая-то другая мера), и, следовательно, в соответствии : традицией ее можно записать в виде foe(gIе, g). Для детерми- <ированных систем fae можно переписать в более удобном виде ?gb:EXG-G, (3.29) который представляет собой направленный аналог порождающей функции поведения, определенной (3.16). Если предположить, что :мысл (методологическое отличие) /св определен, то направлен- ия порождающая система с поведением определяется тройкой FGB = OG>M-± (3.30) На рис. 3.6 показано разбиение маски па три подмаски Ме, Иг, М- (и соответствующее разбиение идентификаторов выбо- 117
рочных переменных) в предположении, что гл и п2 — это-входные переменные. На рис. 3.6,а и б показаны два варианта, соответст- вующие порождению данных в порядке возрастания и убывания значений параметра. 3.4. ОТ СИСТЕМ ДАННЫХ К СИСТЕМАМ С ПОВЕДЕНИЕМ История науки, описывающая процессы открытия закономерностей в природе, представляется значительно более прав- дивой, чем история поисков данных для проверки гипотез, рожденных, как го- ворится, во всеоружии. Г. Саймон Важный класс системных задач, часто называемый индуктив- ным моделированием систем, может быть (в контексте УРСЗ) описан в первом приближении как множество задач, связанных с подъемом по эпистемологической иерархии систем. Все задачи этого класса характеризуются следующим общим описанием: дано конкретная система, скажем система х, определенного эписте- мологического уровня; множество всех конкретных систем некоего более высокого эпи- стемологического уровня, совместимых с системой х (т. е. осно- ванных на той же представляющей системе, с теми же методоло- гическими отличиями, скажем множество У; набор соответствующих требований Q относительно неких свойств систем из множества У, причем одним из этих требова- ний является требование, чтобы данная система х была аппрок- симирована как можно точнее системой более высокого уровня и требуется определить Yq— подмножество У, такое, чтобы любая система из Yq удовлетворяла всем требованиям, определенным в наборе Q. Для того чтобы продемонстрировать в данном разделе задачи определения систем с поведением, представляющих заданную си- стему данных и обладающих некими подходящими дополни- тельными свойствами, будем считать, что х — это система данных с номинальными переменными1, У — множество всех систем с по- ведением с вероятностными или возможностными функциями по- ведения, совместимыми с х, а набор Q состоит из: 1) подмножества Уг множества У, определенного или пользо- вателем, или УРСЗ (как выбор по умолчанию); 2) требования, чтобы несогласованность между соответствую- ' Номинальные переменные — это переменные с номинальной шкалой, т. е. шкалой, допускающей только взаимооднозначные преобразования. — Прим. ред. 118
щими переменными заданной системы данных и системы с пове- дением нз Ур была как можно меньшей; 3) требование, чтобы степень неопределенности при порожде- нии данных системой с поведением из подмножества Yq была как можно меньшей; 4) требованием, чтобы система из подмножества Yq была как можно более простой; 5) предпочтения требования 2 требованиям 3 и 4. В этой общей формулировке требование 1 сводится к опреде- лению множества допустимых масок. Если параметрическое мно- жество не упорядочено, то понятие параметрического соседства не определено, и, следовательно, существует только одна осмыс- ленная маска. Эта маска, определяемая тождественным прави- лом сдвига; она называется маской без памяти. Поскольку в этом случае имеется только одна приемлемая маска, задача оказыва- ется довольно тривиальной [требования 3, 4 и 5 просто непри- менимы]. Эта задача сводится к определению для заданных дан- ных функции распределения вероятностей или возможностей, удовлетворяющих требованию 2. Она решается полным перебором данных с помощью маски без памяти (в данном случае порядок выбора не важен) и определения для каждого состояния выбо- рочных переменных с (в данном случае онн совпадают с основ- ными переменными) числа N(с) их появлений в данных. Числа ЛЦс) для всех сеС обычно называются частотами состояний с. Они используются для вычисления по некоторым правилам соот- ветствующих функций вероятностей или возможностей. Вычислять распределение вероятности или возможности по частотам можно разными способами. Выбор способа зависит от того, какой смысл придает пользователь этим вероятностям или возможностям. Так, например, если вероятности рассматривают- ся как характеристики данных, то обычно вычисляются относи- тельные частоты, т. е. отношения М(с) к общему числу имеющих- ся выборок из данных по используемой маске. Отсюда /в(с)= -У(с)-. (3.31) 2 ЛГ(а) аес Если, однако, вероятности рассматриваются как оценки ча- стот по уже имеющимся результатам наблюдения, то они вычис- ляются по формуле /в(с) = (W (с) + 1) / / S ЛГ(а)+|С|\ (3.32) / \ «SC / Поскольку распределения возможностей менее ограничены, чем их вероятностные аналоги (например, к ним не надо добав- 119
л ять 1), существует еще больше возможных правил для вычис- ления их по частотам /У(с). Естественный способ вычислений рас- пределения возможностей, который можно считать аналогом фор- мулы (3.31)—это считать значение возможности равной отноше- нию частоты N (с) к максимальной зафиксированной частоте, т. е. fB (с) = /V (с) /шах W (а). (3.33) ctsC По другой формуле распределение возможности вычисляются по соответствующим вероятностям. Пусть /в (с) и f'e(c) —это со- ответственно возможность и вероятность состояния с (сеС). Тогда fB(c) = S min [/в (с), 4(a)]. (3.34) аес По этой формуле распределение возможности выражается че- рез верхние границы значений вероятностей (см. примечание 3.3). Для иллюстрации применения формул (3.31) — (3.34) в табл. 3.1 приведены распределения вероятностей и возможно- стей для конкретного распределения частот. Д Для нечетких данных простым подсчетом вычислить N (с) нельзя, так как полное состояние с с некоторой степенью досто- верности dc,w наблюдается при любом конкретном значении па- раметра w. Степень достоверности (для четких данных она рав- на либо 0, либо 1) определяется некой функцией а: [0, 1]2-*[0, 1], агрегирующей отдельные степени достоверности d. . , связанные t, ц. w' с компонентами с. Функция а, называемая агрегирующей функ- Таблица 3.1. Сравнение разных распределений вероятностей и возможностей для одних и тех же частот Af(c) fB (с) вычисляется по формуле *1 ъ N(c) (3.31) (3.32) (3.33) (3.34) и (3.31) (3.34) и (3.32) 0 0 0 20 0.20 0.194 0.4 0.7 0.722 0 0 I 0 0.00 0.009 0.0 0.0 0.072 0 1 0 10 0.10 0.102 0.2 0.5 0.538 0 1 1 5 0.05 0.056 0.1 0.3 0.354 1 0 0 0 0.00 0.009 0.0 0.0 0072 I 0 1 50 0.50 0.472 1.0 1.0 1.000 1 1 0 10 0.10 0.102 0.2 0.5 0.538 I I I 5 0.05 0.056 0.1 0.3 0.354 120
цией, должна обладать по крайней мере следующими свойствами: (al) а непрерывна; (а2) а симметрична, т. е. а(х, у)=а(у, х); (аЗ) а ассоциативна с точки зрения композиции, т. е. а(х, а(у, z))=a(a(x, у), z); (а4) а монотонно неубывающая функция, т. е. если y>z, то а(х, у) ~^а(х, г). Понятно, что класс функций, удовлетворяющих этим требо- ваниям, бесконечен, но в задачи этой книги не входит изучение этого класса. Простыми примерами агрегирующих функций явля- ются функции а(х, у)=ху и а(х, y)=min(x, у). После вычисления агрегированных степеней достоверности для всех элементов данных (dc,w идентифицируется значением пара- метра w и состоянием сеС) эти значения можно суммировать для каждого с. В результате будут получены числа, аналогичные частотам N(c). Целесообразно назвать их псевдочастотами (по- скольку они не обязательно являются целыми числами) и обо- значить ЛЦс), как и настоящие частоты. Таким образом, для не- четких данных N (с) вычисляется по формуле АГ (с) = 2 4, w, W в которой суммирование осуществляется по всем содержательным выборкам данных, причем каждая выборка соответствует опреде- ленному значению параметра w, однозначно определяющему по- ложение справочника используемой маски на параметрическом множестве. После вычисления псевдочастот их можно использо- вать вместо частот при вычислении распределений вероятностей или возможностей, применяя соответственно формулы (3.31) или (3.33) или какие-либо Другие подходящие правила вычисления. ▲ Из этого небольшого обзора видно, что хотя значения N(c) для конкретных данных и заданной маски и определяются однозначно, существует бесконечно много способов вычисления распределения вероятностей или возможностей состояний (сеС) по частотам или псевдочастотам. Поэтому важно, чтобы УРСЗ разрешал пользователю самому определить то, как следует ис- пользовать частоты или псевдочастоты. Если выбор не определен, УРСЗ должен предоставлять меню возможностей, предпочтитель- но тех, которые наиболее часто используются. Если пользователь не высказал своего предпочтения, УРСЗ должен применить некий стандартный способ вычисления, например (3.31) или (3.33) со- ответственно для вероятностей и возможностей, и некую стандарт- ную операцию агрегирования для нечетких данных (например, операцию взятия минимума или произведение). Наиболее типич- 121
ные варианты демонстрируются в этой книге на разнообразных примерах. Помимо реализации разных вариантов вычисления распреде- ления вероятностей или возможностей, необходимо также позво- лить пользователю включать в вычисление некую дополнительную информацию, связанную с ограничениями на переменные. Будем эту информацию, не входящую в собственно данные, называть дополнительной (back ground). Она может принимать самые раз- ные формы, и некоторые из них будут продемонстрированы в примерах. Пример 3.2. Данные по 12 переменным были собраны в 1976 г. для группы из 200 государственных служащих, работающих в одной организации. Эти данные были использованы в исследо- вании, целью которого было вскрытие возможных несправедли- востей. В данном примере рассматриваются только пять из 12 пе- ременных; они приводятся в табл. 3.2. Параметрическое множе- ство (группа из 200 служащих) не упорядочено, и, следовательно, можно использовать только маску без памяти. Пользователь принял решение описать ограничение па пере- менные с помощью функции распределения возможностей и вы- брал формулу (3.33) для вычисления степеней возможностей по зафиксированным частотам отдельных состояний. Однако кроме этого он захотел использовать имеющуюся дополнительную ин- формацию об ограничениях на переменные, обусловленные пра- вовыми и другими нормами. Сделано это было с помощью выде- ления трех типов состояний: Таблица 3.2. Определение переменных из примера 3.2 Свойства Переменная Состояния переменной Год рождения >1 1:1930 или раньше 2:1931-1945 3:1946 или позже Пол 1'2 1: мужской 2: женский Год поступления 1'3 1: 1960 или раньше на службу 2:1961-1970 3; 1971 или позже Суммарная оценка работы 1: 20% или менее 2:21%-40% 3:41%-60% 4:61%-80% 5: 81 % или более Средняя почасовая оплата I: $4,99 или менее 2: S5.00-S9.99 3: S10.00-S14.99 4: SI5.00 или более 122
а) наблюдаемые состояния; степени возможности этих состоя- ний вычисляются по формуле (3.3); б) состояния, которые невозможны в силу дополнительной ин- формации (запрещены законом или другими нормативами); по- нятно, что для этих состояний fB(c)=O; в) состояния, которые не наблюдались, но в принципе воз- можны; целесообразно приписать этим состояниям ненулевую степень возможности, меньшую, чем минимальная степень воз- можности, вычисленная для наблюдаемых состояний, т. е. вы- брать некое значение из интервала °<fB(c)<min/B(a), а где а — это индексы наблюдаемых состояний; в данном исследо- вании было принято решение воспользоваться значением fu (c) = -vminMa)- z a Все возможные согласно дополнительной информации состояния с перечислены в табл. 3.3, в которой также приведены их часто- ты N(c) и степени возможности /в(с). Понятно, что ЛГ(с)=#О только для тех состояний, которые наблюдались. Предположим теперь, что параметрическое множество полно- стью упорядочено. В этом случае из одной и той же системы дан- ных можно получить множество систем с поведением, отличаю- щимся масками. Если для заданных данных они определены до- статочно корректно, то они одинаково хорошо отвечают требова- нию согласованности. Точнее, выражение «достаточно корректно» означает, что функция поведения хорошо согласуется с данными (и, возможно, с некоторой дополнительной информацией) с точки зрения маски и типа выбранных ограничений. Как уже объяснялось выше, для маски без памяти функцию поведения, хорошо согласующуюся с данными и дополнительной информацией, можно получить из частот состояний (т. е. соответ- ствующих выборочных переменных) для данных, отображенных с помощью рассматриваемой маски. Всякая маска представляет собой некоторое окно, через которое отбираются рассматривае- мые данные из матрицы данных (или из массива более высокого порядка). При движении этого окна вдоль всей матрицы данных частоты состояний соответствующих выборочных переменных оп- ределяются подсчетом того, как часто наблюдается каждое со- стояние. Если все выборочные позиции перебираются, то направ- ление движения маски по матрице данных не имеет значения, од- нако удобнее осуществлять это движение в соответствии с уста- новленным на параметрическом множестве порядком (слева направо или наоборот). 123
Таблица 3.3. Возможностная функция пвведения из примера 3.2 С »1 t>2 Ъ t’4 Ч /«(с) N(c) С »1 «2 t'4 Ъ Гв(с) N(c) 1 1 I 1 2 I 0.1 II 2 40 2 2 2 4 4 0.111 2 2 1 1 1 з 4 0.056 0 41 2 2 2 5 4 0.056 0 3 1 I 2 2 I 0.1 II 2 42 2 2 3 2 2 0.056 0 4 1 I 2 4 I 0.HI 2 43 2 2 3 2 3 0.056 0 5 I I 3 3 1 0.056 0 44 2 2 3 2 4 0.1 II 2 6 I 1 3 4 I 0.1 II 2 45 2 2 3 4 1 0.056 0 7 I 2 I I 2 0.056 0 46 2 2 3 4 3 0.056 0 8 1 2 I I 4 0.1 II 2 47 2 2 3 4 4 0 333 6 9 I 2 I 2 2 0.167 3 48 2 2 3 5 4 0.222 4 10 I 2 I 2 4 0.889 16 49 3 1 3 4 1 0.056 0 И I 2 I 3 2 0.056 0 50 3 2 I 1 4 0056 0 12 I 2 I 3 4 0.222 4 51 3 2 I 2 2 0.056 0 В 1 2 1 4 I 0.056 0 52 3 2 1 2 4 0.167 3 14 I 2 1 4 4 0.778 14 53 3 2 1 3 4 0.167 3 15 I 2 I 5 4 0.222 4 54 3 2 I 4 2 0.056 0 1б I 2 2 3 4 0.056 0 55 3 2 I 4 4 0 333 6 17 I 2 2 4 4 0.167 3 56 3 2 1 5 4 0.056 0 18 I 2 2 К 4 0.056 0 57 3 2 2 I 4 0.111 2 19 1 2 3 2 4 0.056 0 58 3 2 2 2 2 0222 4 20 I 2 3 3 I 0.056 0 59 3 2 2 2 4 0.667 12 21 I 2 3 3 4 0.056 0 60 3 ? 2 3 2 0.056 0 22 I 2 3 4 4 0.056 0 61 3 2 2 3 4 0.333 6 23 1 2 3 5 4 0.056 0 62 3 2 2 4 2 0222 4 24 2 1 3 2 I 0.056 0 63 3 2 2 4 3 0.056 0 25 2 I 3 4 1 0.056 0 64 3 2 2 4 4 0.167 3 26 2 1 з 4 2 0.111 2 65 3 2 2 5 4 0111 2 27 2 2 1 I 2 0.056 0 66 3 2 3 I I 0056 0 28 2 2 I 1 4 0.222 4 67 3 2 3 I 2 0.111 2 29 2 2 1 2 I 0.111 2 68 3 2 3 1 4 ОШ 2 30 2 2 I 2 4 1.000 18 69 3 2 3 2 I 0 167 3 31 2 2 I 3 4 0.167 3 70 3 2 3 2 2 0 167 3 32 2 2 I 4 2 0.056 0 71 3 2 3 2 4 0.556 10 33 2 2 I 4 4 0.667 12 72 3 2 3 3 2 0222 4 34 2 2 I 5 4 0.167 з 73 3 2 3 3 4 0 167 3 35 2 2 2 I 2 0.056 0 74 3 2 3 4 2 0056 0 36 2 2 2 2 2 0.056 0 75 3 2 3 4 4 0.500 9 37 2 2 2 2 4 0.222 4 76 3 2 3 5 1 0.056 0 38 2 2 2 3 2 0.056 0 77 3 2 3 5 4 0.167 3 39 2 2 2 3 4 0.056 0 Для конкретных целей одни маски могут подходить лучше, чем другие, но никакая маска не является правильной или непра- вильной. Эта мысль очень хорошо выражена Дж. Кейсом в книге «В эту игру могут играть только двое» (Only Two Can Play This Game, Bantam Books, N. Y., 1974, p. 99; первый раз эта книга вы- шла в издательстве Julian Press, N.Y., 1972; Джеймс Кейс — это псевдоним Дж. Сп. Брауна): Вы можете смотреть иа мир как угодно, выбрать любое окно. Даже не обя- зательно, чтобы это было всегда одно и то же окно. При этом, естественно, мир, 124
то, что вы видите и что ие видите, и угол, под которым вы смотрите, зависит от того, каким окном вы пользуетесь. Но может ли быть окно правильным или неправильным? Окио есть окно ... очень полезно попытаться заглянуть и в дру- гое окно, если то, что вы видите в вашем, выглядит бессмысленным или недоста- точным. Если вид из окна вас устраивает, то, естественно, менять окно не нужно. Кроме того, при смене окна вам необходимо некоторое время, чтобы настроиться на то, что вы видите. Если рассматриваемая маска представляет собой один стол- бец (маска без памяти), то выборки по всем значениям парамет- ра являются полными. Однако, если маска состоит нз более чем одного столбца, то некоторые выборки в начале и конце парамет- рического множества (левый и правый края матрицы данных) окажутся неполными (см. рис. 3.3 и 3.4). Точнее, число неполных выборок для каждого края матрицы данных равно числу столб- цов в маске минус 1. Число столбцов в маске М будем называть глубиной маски и обозначать ДЛ1. Тогда дЛГ=1-|-тахр—minp, (3.35) где операторы шах и min применены ко всем целым (цг-, ?+р)еЛ4. Так, например, для маски, определенной на рис. 3.2, ДЛ1=4, для масок без памяти ДЛ1= 1. Есть по крайней мере два соображения, по которым примене- ние масок с большой глубиной в общем случае нежелательно. Во-первых, если маска используется для порождения данных, как это было показано в разд. 3.2, то чем больше ее глубина, тем большее требуется начальное условие. Это, вообще говоря, не желательно. Во-вторых, если маска используется для выборки данных, то число неполных выборок равно 2(ДЛ1—1). Это озна- чает, что с ростом глубины маски все меньше имеющихся данных используется для определения функции поведения. Следователь- no, с увеличением глубины маски сужается эмпирическая основа, на которой строится функция поведения. Это, разумеется, также нежелательно. Оба эти соображения, а также практические сооб- ражения, связанные со сложностью вычислений, приводят к тому, что глубина маски обычно выбирается не очень большой. Таким образом, представляется целесообразным определить ограничен- ность глубины маски как требование 1 для рассматриваемого ти- па задач. Для заданной системы данных, дополнительной информации (если она доступна), маски и описания ограничений на выбороч- ные переменные функция поведения однозначно определяется описанной выше процедурой выборки. Эта однозначность являет- ся прямым следствием требования соответствия. Для каждой конкретной задачи система данных и дополнительная информация фиксированы. Предположим, что тип ограничения как методоло- гическое отличие также фиксирован. Тогда системы с поведени- 125
ем, удовлетворяющие требованию соответствия (т. е. претенден- ты для решающего множества Kq), однозначно определяются (и отличаются одна от другой) своими масками. Сведение мно- жества Y к подмножеству Уг в соответствии с требованием 1 мо- жет быть представлено как ограничение на множество допусти- мых масок. Как уже говорилось выше, желательно ограничить глубину маски. Это можно сделать, определив наибольшую допу- стимую маску, скажем маску М как декартово произведение где /?= {(/+р) | pi<Р^р2}- Подобная маска может быть представлена в виде полной матрицы с п строками и 1+рг—pi (=АЛ1) столбцами. Будем на- зывать ее М-матрицей. Если пользователь задает только AM, но не конкретные значения pi и р2, то УРСЗ выбирает для них не- кие стандартные значения, например р2=0, a pi= 1—AM. При заданной наибольшей допустимой маске М все ее содер- жательные подмаски образуют ограниченное множество Yr систем •с поведением. Термин «содержательная подмаска» характеризует подмаски М, удовлетворяющие следующим требованиям: (ml) в подмаску входит по крайней мере один элемент из каждой подмаски М,-, определенной уравнением (3.8) (т. е. один элемент из каждой строки М-матрицы); (m2) в подмаску должен быть включен по крайней мере один элемент с правилом сдвига /+р2 (крайний правый элемент из М-маски). Требование ml необходимо для покрытия заданной системы данных, т. е. для того, чтобы гарантировать, что любая базовая переменная из заданной системы данных была бы включена в лю- бую из систем с поведением из ограниченного множества Yr. Тре- бование m2 препятствует дублированию эквивалентных подмасок, т. е. подмасок, преобразуемых одна в другую только с помощью добавления константы к правилу сдвига /+р (сдвиг ряда в Да- маске). Можно легко получить формулу для числа N(п, AM) содер- жательных подмасок наибольшей допустимой маски, где п — чис- ло базовых переменных, а AM — глубина маски М: К (п, ДМ) = (2ЛМ - 1)" — (2 — 1)". (3.36) Первый член выражения (3.36) задает число подмасок М, удов- летворяющих условию ml, а второй член — число масок, нару- шающих условие m2. В табл. 3.4 приведены значения N (п, ДМ) при п, АМ^Ю. Эта таблица разделена на три области, для ко- торых размеры наибольшей допустимой маски представляются: а) легко поддающимися вычислительной обработке (левая верх- няя область); б) в принципе поддающимися обработке, что по- 126
Таблица 3.4. Число содержательных масок Af(n, ДМ), вычисленное по формуле (3.36) л 1 2 3 4 5 6 7 8 9 4 1 10 1 1 2 4 8 16 32 64 128 256 512 2 1 8 40 176 736 3,008 12.160 48.896 196,096 785,408 3 1 26 316 3.032 26,416 220.256 1.8 х 10® 1.5 х 10’ 1.2 х 10* ~ 10’ 4 1 80 2,320 48,224 872,896 1.5 х 10’ ~ 2.4 х 10' ~ 10’ ~ 10“ ~ 10" 5 1 242 16,564 742,568 ~ 2.7 х 10’ ~ 9.6 х 10“ ~ 10‘° ~ 10" ~ 10" ~ 10" 6 1 728 116,920 ~ 1.1 х 10’ ~ 8.8 х 10’ ~ 10“ ~ 10" ~ 10" ~ 10" ~ 10" 7 1 2.186 821,356 ~ 1.7 х 10* ~ 10" ~ 10" ~ 10" ~ 10" ~ 10" ~ Ю2’ 8 1 6,560 ~ 5.8 х 10е ~ 10’ ~ 1012 ~ 10" ~ 10" ~ ю" ~ 1021 ~ 10" 9 1 19,682 - 4 х 10’ ~ 10й - |0‘3 - 10" ~ 10" ~ ю21 ~ 10" ~ ю2’ 10 1 59,048 ~ 2.8 х 10* ~ 10" - 10" ~ 10" ~ |021 - ю24 ~ 102’ ~ 10" 127
требует длительной работы очень мощного компьютера (средняя область); в) не поддающимися вычислительной обработке (пра- вая нижняя область). Разумеется, эти области показаны только для наиболее типичного случая. Они определяются, по крайней мере, до некоторой степени тем, какими вычислительными мощно- стями располагает исследователь. Так, например, если он имеет в своем распоряжении мощную систему параллельных вычисле- ний, то область случаев, поддающихся вычислительной обработке, может быть расширена почти вдвое. Если число содержательных масок оказывается слишком ве- лико, чтобы поддаваться вычислительной обработке, УРСЗ дол- жен предложить пользователю меню имеющихся дополнительных ограничений, накладываемых на наибольшую допустимую маску. Такими ограничениями могут быть, например, следующие: фиксация множества порождаемых выборочных переменных; фиксация числа выборочных переменных; фиксация верхней границы числа выборочных переменных; ограничение, при котором рассматриваются только маски без пропусков (примером пропуска является элемент, иденти- фицируемый координатами г = 4, р=—1 в маске, изображен- ной на рис. 3.2,а). Подобные ограничения или их комбинации существенно сокраща- ют множество YT, и таким образом, увеличивают размер наиболь- ших допустимых масок, поддающихся вычислительной обработке. Несмотря па то, что эти ограничения играют важную роль при уменьшении вычислительной сложности, особенно в тех случаях, когда нежелательно изменять наибольшую допустимую маску, любое такое ограничение деформирует исходную задачу. Даже в том случае, если это ограничение подтверждается некими кон- текстными соображениями, его следует использовать для умень- шения сложности вычислений только в самом крайней случае. В дальнейшем в данной главе будут рассматриваться обоб- щенные задачи, для которых ограниченное множество Yr состоит из систем с поведением — по одной системе для каждой содержа- тельной подмаски выбранной наибольшей допустимой маски (предполагается, что она находится в области масок, поддаю- щихся вычислительной обработке). Как уже объяснялось выше, любая такая система определяется таким образом, что она хо- рошо согласуется с заданной системой данных и дополнительной информацией по маске и принятому типу описания ограничений. Таким образом, требование согласованности имеет более высокий приоритет, чем остальные требования, как это и требуется в п. 4) формулировки задачи. Теперь остается только применить условия 3) и 4) обычно называемые условием детерминированности и ус- ловием простоты, для вывода подмножества решений Yq ограни- ченного множества Yr. 128
Несмотря на то, что в формулировках конкретных типов за- дач возникают и дополнительные требования, условия детерми- нированности и простоты имеют всеобщее значение. Поэтому обычно они не опускаются. Часто сначала определяется множе- ство решений, удовлетворяющих этим условиям (и, разумеется, условию согласованности), а затем входящие в это множество системы с поведением изучаются исследователем. Он может ис- пользовать их в качестве вспомогательного представления базо- вых переменных. Однако, если необходимо дальнейшее сокраще- ние множества решений, исследователь производит их оценку и сравнение согласно некоторым вспомогательным критериям. Эти критерии могут определяться как контекстом, так и вкусами ис- следователя. 3.5. МЕРЫ НЕЧЕТКОСТИ Законы математики настолько нечетки, насколько они связаны с реальностью, и настолько четки, насколько не связаны с ней. Альберт Эйнштейн Ясно, что степень недетерминированности должна измеряться обобщенной нечеткостью, сопутствующей порождению данных. А значит, она должна быть определена через порождающие функ- ции поведения fee и foe для нейтральных и направленных систем с поведением (см. соответственно уравнения (3.22) и (3.28)). Если эти функции представляют собой функции распределения вероят- ностей, то мера обобщенной нечеткости хорошо известна — это шенноновская энтропия, введенная. К. Шенноном в 1948 г. [283]. Обозначим через Р множество всех распределений вероятно- стей, которые могут быть определены на конечных множествах альтернативных (взаимно исключающих) выходов. Тогда вероят- ностная мера нечеткости — это функция Я:Р^[0, оо], обладающая некоторыми свойствами. Следующие свойства явля- ются необходимыми свойствами любой содержательной меры не- четкости (см. примечание 3.6): (Н1) симметричность — нечеткость инвариантна относительно перестановки вероятностей; (Н2) расширяемость — нечеткость не меняется при добавлении к рассматриваемому множеству выходов выходов с нуле- вой вероятностью; (НЗ) квазиаддитивность — нечеткость совместного распределе- ния вероятностей не больше суммы нечеткостей соответ- ствующих безусловных распределений его компонентов; 9—6923 129
(Н4) аддитвность — для распределений вероятностей любых двух независимых множеств выходов нечеткость совмест- ного распределения вероятностей равна сумме нечетко- стей отдельных распределений вероятностей; (Н5) непрерывность — нечеткость — это непрерывная функция на всех своих аргументах. Известно, что только функции вида н (j (г) I х£Л) = -а 2 f(x) log* f (х) обладают свойствами (Hl) — (Н5); (f(x)|xeEX)e=P — это распределение вероятностей для определенного конечного множества X альтернативных выходов х, где а — произвольная положительная константа, а b — произвольное основание лога- рифмов. Если потребэвать выполнения еще и нормализующего свойства Н (0.5; 0.5) = 1 (нечеткость двух равновероятных выходов равна 1), то мера не- четкости определяется однозначно: Н(/(л) | x£*)==- S fWlogJU). (3.37) хеХ Обычно функцию (3.37) называют шенноновской энтропией. Она измеряет нечеткость в единицах, называемых битами. Смысл этих единиц ясен, так как любое целое значение нечеткости, измерен- ное в них, скажем значение и, эквивалентно предсказанию значе- ний истинности и суждений или и двоичных цифр при условии, что они равновероятны. Если предположить, что любое конечное множество X рассма- триваемых альтернативных выходных значений характеризуется определенным распределением вероятностей, то удобнее упростить обозначения и писать Н(Х) вместо H(f (х) |хеХ). Легко видеть, что О^Н(X)<log2 |Я|. (3.38) Нижняя граница Я(Х)=0 достигается в том случае, когда веро- ятности всех выходных значений, за исключением одного, равны 0; верхняя граница достигается тогда, когда вероятности всех собы- тий одинаковы, т. е. равны 1/|Х|. Отношение энтропии к ее верх- ней границе H(X)=tf(X)/log2|X| (3.39) называется нормализованной энтропией; понятно, что 0<Н (Х)<1. (3.40) 130
В нашем случае множествами выходов являются множества С, G, G, Е, а распределения вероятностей представляются функция- ми поведения fB, foe, fe, fos, определяемыми соответственно фор- мулами (3.18), (3.22), (3.26), (3.28). Для упрощения записи опу- стим индексы В и GB, а также знак'4. Таким образом, f(c), f(g|g), f(e, е), f(g|e, g) обозначают вероятности, определяемые соответственно формула- ми (3.18), (3.22), (3.26), (3.28); смысл любого из этих обозначе- ний однозначно определяется заключенными в скобки аргумента- ми. Кроме того, определим безусловные вероятности f(g) = Е f(C), (3.41) c>g где c)>g указывает на то, что g является ^подмножеством состоя- ния с (подсостоянием с); формально, если С> (Ck I *Gtf,CI), g = (gd/e2, zcjvICI )э то g<c тогда и только тогда, когда gj — Cj для всех j^Z. Для направленных систем безусловные вероятности вычисляются по немного измененной формуле f(g I е) = _2_/(ё| е). (3.42) e)*g Условные вероятности, характеризующие процесс порождения данных, связаны с основными (совместными) и безусловными ве- роятностями следующим образом: f(g I g) = f(c)//(g); (3.43) f (g I e, g) = f (e“| e/f (g | e). (3.44) Первая формула описывает эту связь для нейтральных, а вто- рая—для направленных систем. При заданной порождающей маске для нейтральной системы, через которую определяются множества состояний G, G генери- руемых и генерирующих выборочных переменных, порождающая нечеткость tf(G|G) определяется как средняя нечеткость, бази- рующаяся на вероятностях f(g|g). взвешенных вероятностями f(g) порождающих условий: tf(G| G) = - 2_f(g) S /(g|g)log2/(g |g)J (3.45) gSG Это значение определяет степень недетерминированности данной нейтральной порождающей системы с поведением. 9* 131
_Для направленных систем порождающая нечеткость //(G|EX XG) вычисляется по формуле //(G|EXG) = - 2 2 /(е, g) Е f(g |e,i)logj(g|e,g"), ееЕ g£G (3.46) которую можно непосредственно применять в том случае, когда можно и имеет смысл определять вероятности f(e|g), т. е. когда направленная система получена из нейтральной. Если мы не рас- полагаем вероятностями состояний элементов множества Е или эти вероятности несущественны, тогда в качестве базовых вероятно- стей берутся вероятности f(e|e) [аналог вероятностей f(c) для нейтральных систем], исходя из которых вычисляются остальные необходимые вероятности. В этом случае нечеткость //(G|EXG) вычисляется по формуле Н (О | Е X G) ----У Е f(g [ е) 2 Hg I е, g) log2 (g | e, g) 1 eEi-: geo ge0 (3-47) где вероятности f(g|e) и f(g|e> g) вычисляются по заданным вероятностям f (e| e) согласно формулам (3.42) и (3.44). А Формулы (3.45), (3.46) и (3.47) можно заменить другими, более удобными для вычисления. Например, уравнение (3.45) можно модифицировать следующим образом: H(G | G) = -2f(g I g)logj(g I g) g =—3SHg)f(g 1 g)iogj(g 1 g) g g = -SSf(c)[logJ(c)/f(g)] g s = tf(C)+2S f(c)iogt/(g) g « = H (C) 4- S log2 f (g) 21 (c) g g = //(C) + 2f(g)logJ(g) g = 77(C)-Я (G) ▲ 132
Таким образом, //(G|G) можно вычислить, не используя услов- ные вероятности, по формуле H(G\G)=H(C)—H(G). (3.48) Точно так же уравнения (3.46) и (3.47) можно заменить соответ- ственно уравнениями Н (G | Е X О) = Н (С) — Н (Е X G), (3.49) tf(G[EXG)=y±F£tf(E|e)- J //(G[e)j, (3.50) LeeE е£Е Максимальное значение порождающей нечеткости любого типа равно log2|G|; следовательно, нормализованная порождающая нечеткость получается делением порождающей нечеткости на ее максимальное значение. Например, H(G|G)=/7(G|G)/log2|G|. Пример 3.3. На рис. 3.7,а показана вероятностная функция поведения f(c) для четырех выборочных переменных sI( s?, S3, s4, каждая с двумя состояниями — 0 и 1. Состояния с нулевой веро- ятностью в таблице не приводятся. Выборочные переменные опре- делены через две базовые переменные и2 с помощью маски, изображенной на рис. 3.7,6. Поскольку выборочные переменные $2, S3 суть сдвиги одной и той же базовой переменной vt, распре- деления вероятностей их состояний должны быть одинаковы; они и в самом деле одинаковы; оба имеют вероятности 0.7 и 0.3 соот- ветственно для состояний 0 и 1. Аналогично переменные $i, s4 (сдвиги и2) имеют одинаковое распределение вероятностей: 0.6 и 0,4 соответственно для состояний 0 и 1. Следовательно, для дан- ной маски приведенная функция распределения вероятностей яв- ляется корректной функцией поведения. Если данная система интерпретируется как нейтральная, ее порождающая нечеткость tf(G|G) может быть вычислена по фор- муле (3.48). Для первого члена формулы мы имеем // (С) =—2X0.2 log2 0.2—6X0.1 log2 0.1 = =0.9288+1.9932=2.922. Значение второго члена зависит от порядка порождения и от со- ответствующей маски. На рис. 3.7,в и г показаны два возможных порядка порождения. Для порождения слева направо имеем //(G) =—0.5 log20.5—0.1 log20.1 — -2X0.2 log2 0.2=0.5+0.3322+0.9288= 1.761, //(G| G)=//(C)—//(G) = 2.922—1.761 = 1.161. 133
ei г) Рис. 3.7. К примеру 3.3: вероятностная нейтральная система Для другого порядка порождения (рис. 3.7,г) мы получим Н (G) = —2 X 0.3 log2 0.3—0.4 log2 0.4= 1.0422+0.5288= 1.571, tf(G | G) =2.922—1.571 = 1.351. Следовательно, нам можно выбрать один из двух порядков по- рождения; первый порядок предпочтительнее, так как имеет более низкую порождаемую нечеткость. Поскольку в данном примере log2|G|=2, то нормализованные значения вычислительных по- рождающих нечеткостей получаются делением их на два. В некоторых случаях применим только один порядок порож- дения. Если, например, параметром является время, то в каждом случае имеет смысл только один из порядков, определяемый целью использования системы с поведением. Если опа использу- ется для предсказания, то состояния должны порождаться в по- рядке возрастания времени (слева направо); если же она исполь- зуется для ретроспекции, то состояния должны порождаться 134
в порядке убывания времени. В данном примере, если парамет- ром является время, то оказывается легче предсказывать буду- щие состояния системы, чем определять прошлые. Предположим теперь, что Vi интерпретируется как входная переменная и что по функции поведения на рис. 3.7,а определена соответствующая направленная система. Теперь для вычисления порождающей нечеткости можно воспользоваться формулой (3.49). Нечеткость Н(С) уже была вычислена раньше; Я(ЕХО) зависит от порядка порождения. В любом случае множество Е представляется состояниями переменных s2, $з; G представляется или состояниями S] (в порядке возрастания параметра) или со- стояниями s4 (в порядке убывания параметра). В первом случае нечеткость //(ExG) связана с переменными sb s2, S3: //(ExG) =-0.4 log2 0.4—6X0.1 log2 0.1 = = 0.5288+1.9932=2.522; H(G I EXG=// (С) —H (EXG) =0.922—2.522=0.4. Во втором случае она представляет нечеткость переменных s2, S3, $4: //(Ex G) = —0.3 log2 0.3—3X0.2 log2 0.2—0.1 log2 0.1 = = 0.5211 + 1.3932=2.2465; //(G| Ex G) =2.922—2.2465=0.6755. Таким образом, снова оказывается, что предсказывать будущие состояния легче, чем определять прошлые. * Предположим теперь, что мы не располагаем никакой инфор- мацией относительно входной переменной Ui или что эта инфор- мация несущественна (например, в том случае, когда Vi контро- лируется пользователем). Тогда все вычисления должны прово- диться для приведенных па рис. 3.8,а условных вероятностей f(e|e). Как показано на этом рисунке, список вероятностей раз- бит на четыре части, соответствующие разным состояниям е. Нечеткости для каждого состояния также приведены на рис. 3.8,а. Здесь же показано разбиение маски на {Ме, М-}. Ситуация при порождении состояний слева направо, включая значения tf(G|e) для каждого состояния е, показана на рис. 3.8,в. Из формулы (3.50) получим Я(G| EXG) = 1/4(3.522—2.7219) =0.200025. Другой порядок порождения изображен на рис. 3.8,г. Для него имеем Н (G | Е X G) = 1 /4 (3.522-0.971) =0,63775. 135
е ё ь Sr f(Ple) H(E\e) 0 0 0 0 OA 0 0 0 1 OA 1.522 0 0 1 0 0.2 0 1 0 0 0.5 '1.0 0 1 1 0 0.5- 1 0 0 z 0.5 1.0 1 0 z 7 0.5 / 1 z 0 1.0 0.0 в) г) Рис. 3.8. К примеру 3.4: вероятностная направленная система Д Рассмотрим теперь порождающую нечеткость в системах, описываемых с помощью функций распределения возможностей. Пусть П—это множество всех распределений возможностей, имею- щих по крайней мере одно ненулевое значение, которые можно определить на конечных множествах альтернативных выходов (распределения возможностей только с нулевыми значениями для наших целей не подходят). Тогда возможностная мера нечеткости представляет собой функцию U: П->[0, со], (3.51) ]36
обладающую определенными свойствами. Прежде чем рассмат- ривать эти свойства, нужно сначала ввести некоторые понятия, связанные с распределениями возможностей. 1. Распределение возможностей, скажем т = (Ф,нелг|Х|)еп, (3.52) определенное на конечном множестве X альтернативных выходов к называется нормализованным распределением возможностей тогда и только тогда, когда max <рг = 1; i попятно, что <fi=f (х) для некоторого взаимооднозначного соот- ветствия между N । х । и X. 2. Пусть для любого распределения и возможностей f, напри- мер для распределения, определенного в (3.52), и для любого действительного Ze [0, 1] с:Пх[0, 1]->^(N) (3.53) такая функция, что c(f,0 = {Z-EAZ|X| I Ф^О- (3.54) Эта функция называется функцией 1-уровня, а множество с (f, I) — множеством /-уровня от f. 3. Для заданного распределения возможностей (3.52) назовем Lf — {I | (Ef (Е N । х ]) (фг = /) или I = 3} (3.55) уровпевым множеством для f. Обозначим через • • •> М уровневое множество для f, где Zi=0, q= |Lf |, причем из i<j следует, что k<lj. Пусть для удобства If = max фг. I Понятно, что — Кроме того, //=1 тогда и только тогда, когда f является нормализованным распределением возможностей. 4. Для любого meN пусть !f= (‘(pJieWnOen, 2f= (2<pz | еП, два распределения возможностей. Тогда ’f называется субраспре- делением 2f тогда и только тогда, когда для любого i^Nm max1 фг = тах2фг и ’фг<2Фг. 137
Пусть 4^2f означает, что Ч является субраспределением 2f. По- нятно, что отношение «Ч субраспределение 2f» представляет собой частичное упорядочение, определенное на любом множестве рас- пределений возможностей с числом элементов, равным т. Обоз- начим это множество тП. Далее, (тП, —это решетка с объе- динением и перечислением, определяемыми соответственно как ifV2f = (max[‘<pi, 2<pi] | i^Nm), ЧДЧ= (minf’q)/, 2<p(]\i(=Nm) для любых 4, 2femn. Теперь, располагая определенными понятиями, связанными с распределениями возможностей, мы можем вернуться к обсуж- дению главного вопроса — о мере возможностной нечеткости. Хотелось бы, чтобы возможностные аналоги свойств (Hl) — (Н5), которыми обладает шенноновская энтропия, также выполнялись бы и для возможностной меры нечеткости. Возможностные анало- ги этих свойств можно сформулировать точно так же, как (Н1) — JH5), за тем только исключением, что слово «вероятность» нужно везде заменить на слово «возможность». Функция вида (3.51), удовлетворяющая этим свойствам, известна. Ее можно предста- вить в виде ?-i u (f)=т S(Zft+i ~lk} 10ga! с (f* /a+i) 1 - (3-56) f k=I или в более простом виде (3.57) Эта функция называется U-нечеткостью. Помимо возможностных аналогов свойств (Н1) — (Н5), {/-нечеткость обладает некоторы- ми другими полезными свойствами. Важнейшим из них является монотонность: для любых Ч, 2ТетП(ягеМ), если 1 f^2f, то (/(4)^ ^(/(2f). Пример 3.4. Вычислим (/-нечеткости для следующих распре- делений нечеткостей: 4(0.1, 0, 0.5, 0.8, 0.8, 0.8, 0.1, 0.7, 0.8), 2f (0.3, 0.2, 0.9, 1, 1, 1, 0.9, 0.8, 1). Вычислим соответствующие уровневые множества: Ltf = {0, 0.1, 0.5, 0.7, 0.8}, Ltf = {0, 0.2, 0.3, 0.8, 0.9, 1}. 138
Используя уравнения (3.56) или (3.57), получаем: и = о(0-110ga 8+°’410ga 6 + °’2 logz 5+0)1 loga 4) = = 1.25 (0,3 + 1,034 + 0,464 + 0.2) = 2.4975; U (2f) =0.2 log2 94-0.1 log2 84-0.5 log2 74-0.1 log2 6+ 4-0.1 log2 4=0.6344-0.34-1.4044-0.2584-0.2=2.796. Как и в случае с распределениями вероятностей, целесообраз- но допустить, что любое рассматриваемое конечное множество альтернативных выходов характеризуется определенным (уни- кальным) распределением возможностей. Затем для того, чтобы обратить внимание на множество, для которого вычисляется не- четкость, будем вместо записи U (f (х) | х^Х) использовать сокра- щенную запись U(X). Легко показать, что 0^[/(X)^log2|X|, (3.58) аналогично (3.38). Нижняя граница достигается в том случае, когда распределение возможности всех выходов, за исключением одного, равны 0; верхняя граница достигается, когда возможности всех выходов равны между собой (и, разумеется, не равны нулю). Отношение U(X) = [/(%)/log2|X| (3.59) — это нормализованная U-нечеткость, для которой 0<U(X)<l. (3.60) Известно также, что условная [/-нечеткость [/(У|Х) может быть вычислена без использования условных возможностей по формуле [/(Х|У) = [/(ХХК)-С/(К), (3.61) что является точным аналогом шенноновской энтропии. Эта услов- ная [/-нечеткость нормализуется делением на log21X |. Подобно случаю с распределениями вероятностей, обозначим через _ _ _ /(с), /(g I б), /(ё|е), f(g|e, g) возможности, определенные соответственно уравнениями (3.18), (3.22), (3.26), (3.28). Кроме того, безусловные возможности для нейтральных систем равны f(g) = maxf(e | е), (3.62) с> g а для направленных систем f(g | e) = maxf(e| е). (3.63) е> g 13»
if s2 Sj fici C 0 0 0 1.0 О О 1 0.25 0 1 1 0.25 1 0 0 0.5 1 1 1 0.5 Порядок порождения д) г) Рис. 3.9. К примеру 3.5: возможностная нейтральная система Определение условных возможностей через совместные и без- условные возможности является спорным вопросом теории воз- можностей. К счастью, можно избежать использования условных возможностей, если применить формулу (3.61). Возможностные аналоги ключевых формул (3.48), (3.49), (3.50) будут иметь со- ответственно следующий вид: (7 (G | G) = (7 (С) — (7 (О); (3.64) (7(G [ EXG) = (7(C) — У(ЕХС); (3.65) (7(G | EXG) = (3.66) При использовании этих формул не нужно вычислять условные возможности. Условные возможности /(е|е), необходимые для вычисления (7(Е|е), заданы (или определяются непосредственно из данных), а не вычисляются из совместных или безусловных возможностей; возможности f(g|e)—это маргиналы от f(e|e), вычисленные по формуле (3.63). Пример 3.5. Рассмотрим ситуацию, представленную на рис. 3.9, где f(c) —это возможность состояния с. Функция /(с) одинакова 140
для обоих порядков порождения. Из формулы (3.64) имеем U(С) =0.25 log2 5+0.25 log23+ 0.5 log21=0.58+0.396=0.976; U (G) = 0.5 log2 2+0.5 log21 = 0.5; [/(GJ G) = U (C)-U (G) =0.976-0.5=0.476. Будем теперь рассматривать переменную и, как входную, а следующие возможности f (е|е) заданными: *1 *2 s3 f(e | е) 0 0 0 1,0 0 0 1 0,25 1 0 0 0,5 0 1 1 0,5 1 1 1 1,0 При этом (7(G| EXG) вычисляется по формуле (3.66). Тогда при порядке порождения слева направо и наоборот имеем соответст- венно «1 «2 f(8 I е) «2 «з f(g I е) 0 0 1,0 0 0 1,0 1 0 0,5 0 1 0,25 О 1 0,5 10 0,0 1 1 1,0 11 1,0 Для первого порядка порождения получаем t/(G|ExG) = 1/2(1.146-1) =0.073; для второго порядка порождения £7 (G | ExG) = 1 /2(1.146-0.25) =0.448. Хорошо известно, что средняя нечеткость, связанная с конеч- ным набором альтернативных выходов и оцениваемая как шенно- новская энтропия или как ^/-нечеткость, может также рассматри- ваться как средний объем информации, получаемый в результате эксперимента с этим набором. Однако, если мера нечеткости принимается в качестве меры информации, фактически оценива- ются только синтаксические аспекты информации, но не ее семан- тические или прагматические аспекты. 141
3.6. ПОИСК ПОДХОДЯЩИХ СИСТЕМ С ПОВЕДЕНИЕМ Факты сами себя не классифицируют. Р. М. Хатчинс Располагая теперь мерами нечеткости, через которые выража- ется степень детерминированности, вернемся в данном разделе к типу задач, введенному в разд. 3.4; дана система данных D с полностью упорядоченным параметрическим множеством и с наибольшей допустимой маской М, совместимой с D; требуется определить все системы с поведением, удовлетворяющие требова- ниям согласованности, детерминированности и простоты, причем требование согласованности более приоритетно, чем остальные два. Как уже говорилось выше, любая наибольшая допустимая маска М содержит набор корректных масок, каждая из которых является подмножеством М. Для каждой маски может быть опре- делена функция поведения (определенного выбранного типа), хорошо согласующаяся с данными, с помощью разреженной вы- борки данных. Однако на практике достаточно провести выборку только для маски. М. Функции поведения для ее подмасок могут быть получены вычислением подходящих проекций функции по- ведения соответствующей маски М. Для заданной функции {в, определенной через полные состоя- ния неких выборочных переменных, любая из ее проекций также является функцией поведения, соответствующей fB в смысле субсостояний, основанных на определенном подмножестве выбо- рочных переменных. Пусть sk(k [м()—выборочные перемен- ные, через которые определяются состояния fa', М — маска, через которую выбираются значения выборочных переменных. Пусть [fB|Z] — проекция 1в, где подмножество множества иденти- фикаторов выборочных переменных, т. е. ZczN. Тогда I Z]: X —► [0, 1], (3.67) k^—Z так что [fs |Z](x) = a({f(c) | с> х}), (3.68) где а — некая агрегирующая функция, определяемая характером функции fB. Например, [fBlZ](x)= S fB(c), (3.69) с)>х где /в—распределение вероятностей; А — для распределений возможностей, [/в i 2](х) = maxfB(c). (3.70) <£>Х 142
Будем в контексте любой конкретной задачи через ’/в обозна- чать функцию поведения для наибольшей приемлемой маски М. Через Чв (i—2, 3, ...) будем обозначать функции поведения для ее различных осмысленных подмасок ‘М, каждая из которых свя- зана с множеством lZ с N j m j идентификаторов выборочных пере- менных. ▲ За исключением очень небольших наборов данных, с точки зре- ния вычислений проще определять функции поведения с помощью проекций, а не через выборки данных. Чем больше объем данных, тем больше вычислительного времени экономится, если вместо выборок данных использовать проекции. Таким образом, лучше производить выборку только однажды для наибольшей приемле- мой маски, а затем определять функции поведения для всех содер- жательных подмасок как соответствующие проекции. Пример 3.6. Определим проекцию вероятностной функции по- ведения, приведенной на рис. 3.7,а и возможностной функции пове- дения, приведенной на рис. 3.9,а, для Z={1, 2}. Применив форму- лу (3.69) для вероятностной функции, получим: *i s2 [fl{l, 2J(x) х = 0 0 0.5 (=0.2+0.24-1) 0 1 0.1 1 0 0.2(=0.1+0.1) 1 1 0.2(= 0.1+0.1) Для возможностной функции по формуле (3.70) имеем 81 S2 [fl{l,2}](x) х = 0 0 1.0 0 1 0.25 1 0 0.5 1 1 0.5 Для заданной системы данных D и наибольшей допустимой маски М требование соответствия приводит к ограниченному мно- жеству y,= fFB= (I,<M,'f) |i=l, 2......(W(n, AM)}, содержащему по одной системе с поведением для каждой осмыс- ленной маски ’МеМ; пусть для удобства ]Л!=М. Следующим шагом решения рассматриваемой задачи должно быть вычисление степеней недетерминированности и сложности для всех систем из множества Yr. Как было показано в разд. 3.5, степень недетерминированности задается соответствующей мерой порождающей нечеткости, опре- деляемой для вероятностных систем шенноновской энтропией, а для возможностных систем ГУ-нечеткостью. Для определения порожда- 143
ющей нечеткости требуется, чтобы был определен порядок по- рождения (и соответствующее разбиение любой маски). Если до- пускается несколько порядков порождения, то для каждой маски мы берем порядок с наименьшей порождающей нечеткостью. Что касается меры сложности, то тут возможно много вариан- тов (см. гл. 6). Возьмем для примера простую, но содержательную меру, которую часто используют пользователи УРСЗ, — размер (мощность) маски. Пусть (i=l, 2, ...)—значения соответствующих порож- дающих нечеткостей для систем с поведением 'FB из ограниченно- го множества Yr. Поскольку любая система FB однозначно иденти- фицируется своей маской М, мощность которой | ‘М | задает ее сложность, статус системы Тв в смысле порождающей нечеткости и сложности удобно описывать парой (|'Af|, fqu). Теперь рассмат- риваемую задачу можно обсуждать в терминах масок ‘М, а не соответствующих систем с поведением Тд. Численное упорядочение масок *М, идентифицирующих системы С из Yr по их мощности, задает упорядочение сложности < на мно- жестве Yr. Численное упорядочение значений определяет упо- и рядочение по нечеткости^ на множестве Yr. В то время, как упорядочение по сложности полностью определяется самими мас- ками, упорядочение по нечеткости может быть определено только после оценки масок. Для любого множества порождающих масок мы можем определить частичное упорядочение {Ма^Ма тогда и только тогда, когда ‘g = 'gH;g<'g- (3.71) (или 'е-<'е для направленных систем), которое мы будем назы- вать упорядочением подмасок. Это упорядочение часто оказывает- ся полезным при разработке различных эвристических процедур поиска на множестве систем Yr. Пример упорядоченности по сложности и упорядоченности под- масок для наибольшей допустимой маски М при п=3 и ДМ=2 приведен на рис. 3.10. При этом предполагается, что данные по- рождаются слева направо. Все содержательные подмаски изобра- жаются своими матрицами и помечены в левом верхнем углу свои- ми идентификаторами i. По сложности они разбиты на четыре группы. Маски с одинаковой сложностью расположены на одном уровне. Например, маски с идентификаторами 2—7 образуют группу со сложностью 5, маски 8—19 — другую группу со слож- ностью 4 и т. д. С точки зрения упорядоченности по сложности любая маска некоторого уровня является непосредственным пре- емником любой маски ближайшего более высокого уровня и не- посредственным предшественником любой маски ближайшего более низкого уровня. На рис. 3.10 стрелками показано упорядо- 144
Рис. 3.10. Содержательные маски для п~3 и ДМ=2, классифицированные согласно упорядоченности по сложности и упорядоченности подмасок
чение по подмаскам. Из этого примера видно, что упорядочение по сложности — это связное квазиупорядочение (рефлексивное и транзитивное отношение, определенное для любой пары систем). Упорядочение по подмаскам — это частичное упорядочение, но решетки оно не образует. Однако оно представляет собой на- бор решеток по одной для каждого множества порождаемых вы- борочных переменных (в нашем примере это крайние правые эле- менты масок). Упорядочение по нечеткости связное, но из-за того, что не- сколько разных систем могут иметь одинаковую порождающую нечеткость, это отношение не является антисимметричным. Сле- довательно, в общем случае это связное квазиупорядочение, ко- торое в некоторых частных случаях оказывается полным упоря- дочением. Таким образом, на множестве Yr определены два связных ква- зиупорядочения — по сложности и по нечеткости. Было бы же- лательно объединить их неким .подходящим образом. Поскольку для рассматриваемого типа задач требуется, чтобы и сложность и порождающая нечеткость систем во множестве решений Yq, была минимизирована, соответствующее объединенное упорядо- чение определяется следующим образом: ‘Fb^'Fb тогда и только тогда, когда с U |‘Л1|<|'Л1| иг<7„<4, (3.72) где ‘FB, 'Ев^Уг. Это упорядочение не является связным, посколь- ку пары ‘Fb, 'Fb, для которых |‘Л!| < |Ш| и lqu>?qu или |‘М| > > |!М| и ‘ди<.!<]и (подобные пары, разумеется, могут существо- вать), несравнимы. Оно также неантисимметрично, так как не исключена возможность того, что pAf| = |ЛЛ1| и iqu=lgu для некоторых i^j. Следовательно, объединенное упорядоче- ние— это общего вида квазиупорядочение (рефлексивное и транзитивное отношение) на Yr. Теперь множество решений Yq можно определить как множе- ство всех систем из Yr, которые или эквивалентны, или несравни- мы относительно объединенного упорядочения (3.72). Две систе- мы из Yr, скажем системы iFB и !FB, несравнимы в смысле объ- единенного упорядочения, если выполнено одно из следующих условий: (a) iFB более сложна и более детерминирована, чем <FB или ’Ев менее сложна и менее детерминирована, чем lFB. Формально YQ = CFB^Yr j (v^)('FB<VF8<'Fe)}. (3.73) Системы из множества решений Yq будем называть подходящи- ми системами с поведением для рассматриваемого типа задач. 146
В) Рис. 3.11. К примеру 3.7 J0* 147
Пример 3.7. Чтобы пояснить различные вопросы, изучаемые в данном разделе, рассмотрим этологическую систему данных, описанную в примере 2.5 (см. также рис. 2.7). Определим все подходящие в смысле (3.73) системы с поведением для этой си- стемы данных в предположении, что пользователь хочет получить описания вероятностных систем с поведением и использовать их для предсказания. Предположим сначала, что АМ=2. Тогда имеется восемь со- держательных масок, которые вместе с их упорядочением подма- сок и указанием трех уровней сложности изображены на рис. 3.11,а. После выполнения исчерпывающей выборки для наи- большей приемлемой маски ’Af=M по определенной пользовате- лем формуле по частотам N(с) вычисляются вероятности fB(с), а порождающая нечеткость вычисляется или по формуле (3.45) или по более подходящей формуле (3.48). Если для вычисления вероятностей используется формула (3.31), то порождающая не- четкость равна 1.11. Затем для остальных семи содержательных масок по формуле (3.69) определяются соответствующие проек- ции и вычисляются их порождающие нечеткости. Результаты этих вычислений показаны па рис. 3.11,6 (в правом нижнем углу масок). На рис. 3.11,6 также изображено упорядочение ма- сок по нечеткости. В этом при- мере упорядочение является полным, поскольку значения нечеткости у всех разные. Объ- единенное упорядочение по сложности и нечеткости (3.72) изображено на рис. 3.11,в. Как мы видим, минимальными с точки зрения объединенного упорядочения являются маски Рис. 3.12. Подходящие системы с поведением из примера 3.7 148
с идентификаторами 1, 2, 6. Следовательно, Vq={!Fs, 2Fs, 6Fs}. Предположим теперь, что АМ=3. Тогда согласно формуле (3.36) имеется 40 содержательных масок. После их обработки, аналогичной обработке для случая АМ=2, мы получим пять под- ходящих систем с поведением, маски которых, значения сложно- сти и порождающие нечеткости приведены на рис. 3.12,а. Остав- шиеся 35 масок хуже с точки зрения их сложности, как и с точки зрения четкости, и, следовательно, их вовсе не нужно рассматри- вать. Рис. 3.12,а — это типичный пример ответа УРСЗ на запрос пользователя. При соответствующих запросах могут также вы- даваться различные дополнительные характеристики множества решений, такие, как график зависимости нечеткости от сложно- сти, изображенный на рис. 3.12,6. Описанный здесь поиск подходящих систем с поведением мо- жет быть реализован самыми разными способами. Основной принцип заключается в том, что содержательные маски получа- ются с помощью некоторого алгоритма из наибольшей приемле- мой маски в порвдке уменьшающейся сложности. Среди масок одинаковой сложности выбираются только маски с минимальной порождающей нечеткостью. При этом если значение этой мини- мальной нечеткости меньше или равно значению нечеткости для предшествующего уровня сложности, то все ранее принятые си- стемы отбрасываются. В результате применения этой процедуры у нас остаются только подходящие системы. Важно понимать, что задачи данной категории представляют собой тему со многими вариациями. Например, можно многими разными способами вычислять вероятности или возможности, можно использовать разные определения сложности, можно вы- двинуть дополнительные условия, такие, как задание наибольшей приемлемой нечетности. При определении объединенного упоря- дочения пользователь может взвесить предпочтения для масок с меньшей глубиной, сложностью и нечеткостью (а также и до- полнительные требования) и т. д. УРСЗ должен быть спроекти- рован так, чтобы в нем имелся набор стандартных вариантов для всех ключевых категорий задач. Среди них должен быть и вариант, определяющий выбор варианта по умолчанию, но вме- сте с УРСЗ должен предоставлять пользователю максимально возможную свободу определения его собственных вариантов за- дачи.
3.7. СИСТЕМЫ С ИЗМЕНЯЮЩИМИСЯ состояниями Фундаментальным понятием кибернети- ки является понятие «различия»: т. е. или по существу два объекта различи- мы или один объект изменяется во вре- мени. У. Росс Эшби Предположим, что снова задана система данных с полностью упорядоченным параметрическим множеством. Как было пока- зано в разд. 3.2—3.6, эта система данных может быть описана параметрически инвариантно через множество подходящих си- стем с поведением, согласующихся с системой данных и удовлет- воряющих требованиям, выдвинутым пользователем. Несмотря на то, что системы с поведением совершенно адекватно описы- вают полное ограничение па исследуемые выборочные перемен- ные, существует и другая форма представления этого ограниче- ния, часто представляющаяся пользователю более подходящей. Эта форма обычно называется отношением изменения состояния (state-transition relation) или сокращенно ST-отпошением. Это отношение определяется не на отдельных состояниях, а на после- довательных парах состояний; порождающие системы, в которых используется эта формула представления состояний, называются системами с изменяющимися состояниями или ST-системами. Д Для ST-систем маски выборочные переменные, множества со- стояний выборочных переменных и их декартово произведение С определяются точно так же, как и для систем с поведением, за исключением двух отличий: (1) к ST-системам неприменимо раз- деление выборочных переменных на порождаемые и порождаю- щие, и (2) содержательные маски в ST-системах имеют дополни- тельные ограничения (это будет пояснено ниже). Аналогами функций поведения в ST-системах являются функции изменения состояния (или ST-функции). Для нейтральных систем они опре- делены на С2 = СХС, а не на С, а для направленных систем па Е2ХЕ2, а не на EXE- Для нейтральных систем аналогами функций поведения оп- ределяем формулами (3.18), (3.22), (3.16), являются следующие ST-функции: fs : С2->[0, 1], (3.74) где f(c, с')—это вероятность, возможность или некая другая ха- рактеристика состояния с', следующего непосредственно за со- стоянием с (согласно выбранному порядку порождения); /gs : С2->[0, 1], (3.75) где fos(c, с') —условная вероятность или возможность того, что при текущем состоянии с следующим состоянием будет состоя- ло
ние с'; будем поэтому использовать общепринятую запись fos(c'| с): fes: С-+С, (3.76) где }gs(c.)=c', т. е. следующее состояние однозначно определяет- ся текущим состоянием с; функция специального вида (3.76) применима, разумеется, только к детерминированным системам. Будем fas называть порождающими ST-функциями. Аналогами нейтральных систем с поведением (3.10) и (3.15) являются соответственно ST-система Fs= (1, М, fsl (3.77) и порождающая ST-система Fos= (I, Ма, fas), (3.78) где I, М и Ма имеют тот же смысл, что в системах с поведением. Для заданных системы данных и маски ST-функция fs, хоро- шо согласующаяся с системой данных и маской, может быть оп- ределена с помощью полной выборки данных аналогично тому, как это делалось для функции поведения /в. Единственное отли- чие состоит в том, что в результате выборки получаются частоты W (с, с') пар последовательных состояний, а не частоты N (с) от- дельных состояний. Пара (с, с')еС2 называется переходом из состояния с в дру- гое состояние с' согласно объявленному па параметрическом множестве порядку порождения. Одним из важнейших свойств ST-функций является то, что переходы в некоторое состояние должны находиться в равновесии с переходами из этого состоя- ния. Если используются вероятности, то для любого состояния хеС имеем S fs(c, х) = )в(х), сес 2 /5(х.с')-/в(х), c'sC и, следовательно, 2 f(C, х)= 2 fs(x. с'), с&с с'ес что и определяет равновесие переходов. Если используются воз- можности, то уравнение (3.80) будет иметь вид maxfs(c, х) = maxfs(x, с’). (3.81) сес с'ес Состояния с, с' могут рассматриваться как состояния, опре- деляемые двумя взаимосвязанными масками М, М'. Маскн свя- 151 (3.79) (3.80)
заны между собой простым сдвигом в соответствии со следующи- ми правилами сдвига: (ui, р)еЛ1 тогда и только тогда, когда (Vi, p-f-l)eAfz (3.82) если данные порождаются в порядке возрастания параметра, или (Vi, р)еЛ1 тогда и только тогда, когда (и;, р—1)еЛГ, (3.83) если данные порождаются в обратном порядке. Маски М, М' ис- пользуются вместе для описания пар состояний с, с'. Чтобы избежать противоречий и неполноты при порождении данных, содержательные маски в ST-системах должны удовлетво- рять следующему требованию (в дополнение к требованиям для масок в системах с поведением): для заданной маски М, если (vt, pi)eM и (и„ р2)еЛ/ и pi<p2, то (и,, р)^Л4 для всех це- лых р, таких, что pi^p^p2. Это значит, что маски в ЗТ-системах не должны содержать «пробелы», подобные элементам (и4, —1) на рис. 3.2. Маски, удовлетворяющие этому дополнительному требованию, будем называть компактными масками. Для обоснования этого требования предположим, что маска М ST-системы некомпактна. Тогда существует по крайней мере одна пара элементов из маски М, скажем пара (и,, pi) еЛТ, (vit р2)еМ, такая, что pi<p2, (и,-, Pl+l)^Af, (vh р2+1)^М, (3.84) и р2^р для всех (и,, р)еЛ4. Из (3.82) имеем (vi, pi 4-1) <=ЛГ и (vh р2+1)еЛГ. (3.85) Обозначим выборочные переменные, базирующиеся па этих элементах М', через s, и s2. Состояния St, $2 являются компонен- тами с'. Тем самым они должны быть или определены для каж- дого значения параметра по состоянию с, или порождаться в со- ответствии с распределением вероятностей или возможностей fos(c'|c) для каждого конкретного с. Однако ни один из этих вариантов для $! невозможен. Из-за (3.84) оно не может быть определено по состоянию с, не может быть и корректно порожде- но при любом значении параметра t, так как = S2,/+Р.-Р2, и, таким образом, Si определяется состоянием $2 при значении ^параметра t—(р2—pi). Нет никакой гарантии, что порожденное состояние $] будет соответствовать этому ранее определенному состоянию. С другой стороны, если состояние $1 порождается, то с' становится неполным, так как ранее определенное состояние 152
неизвестно (т. е. оно не является компонентом с). Следователь- но, пр'и любом значении t состояние $! не может быть пи опреде- лено из с, ни порождено с помощью порождающей ST-функции. Иллюстрацией к доказательству того, что маски с «пробела- ми» недопустимы в ST-системах, служит рис. 3.13; компонент следующего состояния с' при значении параметра Цг) не может быть ни определен из состояния с в момент времени t (рис. 3.13,в), пи порожден с помощью ST-функции, так как уже порожден при значении параметра t—3 (рис. 3.13,а). Удобно представлять ST-функции (3.74) и (3.75) в виде квад- ратных матриц, строки и столбцы которых связаны соответствен- но с с и с'. Элементами этих матриц являются значения соответ- ственно fs(c, с') или /оз(с'|с). ▲ Пример 3.8. Одним из подходов к оценке производительности вычислительной техники является постоянный контроль за ап- паратным обеспечением. Значение этого подхода будет возра- стать по мере возрастания сложности оцениваемых вычислитель- ных систем. При контроле аппаратного обеспечения наблюдаются определенные ключевые переменные, обычно описывающие со- 153
стояние отдельных компонентов вычислительной системы. Дела- ется это в течение определенного времени обслуживания системы пользователями с помощью так называемых аппаратных мо- ниторов. Данные обрабатываются аппаратным монитором и ана- лизируются с целью обнаружения узких мест в системе и поиска способов повышения производительности, которая также долж- на быть каким-либо образом определена. Обычно в состав аппаратных мониторов входят счетчики, ко- торые в процессе сбора данных или считают число происшедших событий (режим счета), или измеряют длительность событий (временной режим). Это значит, что обычно аппаратный монитор предоставляет исследователю не фактические данные, а обоб- щенные. Например, монитор определяет, что центральный про- цессор (ЦП) вычислительной системы был загружен в течение .43% времени наблюдения, что канал был занят в 15% всех на- блюдений, но не дает фактической последовательности событий, которые бы можно было затем обрабатывать и анализировать. Прн этом часто теряется важная информация, способствую- щая лучшему пониманию вопросов, связанных с производитель- ностью компьютера. Например, совершенно выпадают из анали- за динамические аспекты работы компьютера. Согласно концепции УРСЗ все наблюдения должны быть за- фиксированы, а затем обработаны любым подходящим способом (см. рис. 3.1). В данном примере по времени было сделано 409 610 наблюдений для четырех переменных ub v2, v3, и4. Каждая пере- менная имела два состояния 0 и 1, характеризующие состояние конкретного компонента аппаратного обеспечения: 0 означает, что компонент был неактивен во время наблюдения, а 1 — что активен. Переменная v, описывает работу ЦП, а остальные три переменных — работу трех важных каналов связи системы. Для получения вероятностной ST-функции из этого огромного набора данных, превышающего 1,6 млн. бит, с помощью маски без па- мяти была сделана выборка для двух последовательных состоя- ний. Это дало 15 состояний (см. Уабл. 3.5,а) и 113 переходов. Состояния 7—15 появляются очень редко: вероятность того, что система находится в одном из этих состояний 0.009. Если для уп- рощения ST-функции, объединить эти состояния в одно (см. разд. 3.9), что удобно для исследователя, получится матрич- ное представление порождающей ST-функции, приведенное в табл. 3.5,6. Элементами матрицы являются условные вероятно- сти /ов(с'|с). Обозначение -~0 используется для вероятностей, которыми можно пренебречь; через 0 обозначены переходы, ко- торые вообще не наблюдались. В матрице подчеркнуты элемен- ты, соответствующие переходу из состояния снов'а в это состоя- ние. В табл. 3.5,6 также приведен вектор-столбец значений fe(c) функции поведения fB при той же маске (маска без памяти), ко- 154
Таблица 3.5. ST-функция для исследования по оценке производительности вычислительной системы (пример 3.8) а) С 1’ 1 v2 V3 Г4 С Г1 1'г гз 1 1 0 0 0 9 0 1 0 1 2 1 0 0 I 10 1 0 1 1 3 I I 0 1 И I I I 0 4 I I 0 0 12 I 1 I I 5 0 0 0 0 13 0 I I 0 6 1 0 1 0 14 0 0 1 0 7 0 I 0 0 15 0 0 1 1 8 0 0 0 1 6) с7 = 1 2 3 4 5 6 7-15 - с = I 0.844 0.064 0.004 0.057 0.028 0.002 0.001 0.458 2 0.173 0.757 0.049 0.011 0.003 ~ 0 0.007 0.175 3 0.022 0.093 0.725 0.155 -0 0 0.005 0.092 4 0.109 0.008 0.059 0.816 0.001 ~0 0.007 0.242 5 0.755 0.056 0.002 0.036 0.146 0.00! 0.004 0.016 6 0.103 0.007 0 -0 -0 0.811 0.079 0.008 7-15 0.050 0.I4I 0.054 0.170 0.002 0.063 0.520 0.009 /cs(c'l£) /Я(С) торая обычно и является результатом контроля работы аппарат- ного обеспечения. Попятно, что fs(c, c')=fcs(c'\c)-fB(c). (3.86) Поэтому для Дальнейшей обработки можно вычислить и значе- ния fs(c, с'). Хотя определение функции fas или другого подхо- дящего представления собранных данных для соответствующих исходных систем, определенных на компьютерных комплексах, проводится в рамках УРСЗ, интерпретация полученных результа- тов должна проводиться специалистами по оценке производи- тельности вычислительных систем. В некоторых случаях предпочтительнее представлять ST-функ- ции в виде диаграмм. Такая диаграмма представляет собой на- бор узлов, по одному для каждого состояния наблюденных вы- борочных переменных, и ориентированных связей между узлами, соответствующих реально существующим переходам. Узлы на ди- аграмме должны быть помечены соответствующими идентифика- торами состояния с, а связи помечены значениями fs(c, с') или /os(c'|c); в последнем случае желательно также пометить узлы
Рис. 3.14. ST-диаграмма правовой системы США значениями /в (с) так, чтобы значения fs(c, с') можно было вы- числить при необходимости из уравнения (3.86). Пример 3.9. С помощью ST-систем часто бывает удобно эф- фективно описывать правовые ограничения в различных законо- дательных учреждениях, таких, как местное и федеральное пра- вительства. На диаграмме (рис. 3.14) приведена четкая возмож- ностная ST-фупкция, описывающая законодательную систему США с точки зрения ограничений на выполнение пожеланий граждан (сокращенно П) в новый закон. Данная ST-система ос- новывается на маске без памяти, и ее представляющая система состоит из семи базовых переменных и их множеств состояний: Ui— политическая притягательность (0 — низкая; 1 — высо- кая) ; v2 — П разделяет поручитель граждан в конгрессе (0 — нет; 1 — да); «•> — статус П в палате представителей (0 — отклонено или не рассматривалось; 1—прошло простым большинством; 2 — прошло большинством в 2/3 голосов); и4 — статус П в сенате (0 — отклонено или не рассматрива- лось; 1 — прошло простым большинством; 2 — прошло большинством в две трети голосов); 156
v5 — утверждение /7 президентом (0 — нет; 1—да); v6 — одобрение П судебной властью (0—нет; 1—да); V7 — правовой статус П (0 — отсутствует; 1 — законопроект; 2 — законодательный акт; 3 — закон). Параметром является время, определенное неявно, а по из- менению состояний переменных. В узлах диаграммы записаны со- стояния переменных в порядке v2, —, »7- Ни узлы, ни связи никак не помечены, так как в данном случае естественной пред- ставляется дихотомия всех состояний переходов на возможные (т. е. допускаемые существующими законами) и неразрешенные (т. е. законами не допускаемые). Поэтому на диаграмме изобра- жены только узлы и связи, имеющие степень возможности 1, а ос- тальные узлы и связи, имеющие степень возможности 0, опу- щены. Диаграмма на рис. 3.14 описывает только правовые ограниче- ния. На ней не показаны затруднения, которые возможны при осуществлении любого из переходов. Данные относительно пре- дыдущих значений П могут быть использованы для представле- ния этих трудностей в виде степеней возможности в диапазоне [О, 1]. Для конкретного П и определенных политических и дру- гих обстоятельств степени возможности отдельных переходов могут быть субъективно оценены экспертом или группой экс- пертов. А Любую ST-систему легко можно преобразовать в изоморфную систему с поведением. Чтобы показать, как это делается, возь- мем произвольную ST-систему FS=(I, М, fs), где М, разумеется, компактная маск'а. Предположим, что любое следующее состояние соответствует большему значению пара- метра, чем предшествующее. Рассмотрим теперь систему с поведением FB=(I, М+, fB), где М+ определяется через М следующим образом: (и,, р)еЛ1+, если (щ, р)еЛ4 или (щ, р—1) еЛ!. (3.87) Тогда для любого набора данных из общей представляющей системы I все выборки данных, дающие одну пару состояний для маски М, скажем пару (с, с'), дают и одно и то же состояние для маски Л1+, скажем состояние с+. Если данные полностью выби- раются с помощью обеих масок, то частоты с, с' и с+ должны быть одинаковы. Следовательно, fs(c, с')=Мс+), 157
где состояние с+ состоит из с и порождаемой части с', назовем ее c'g. Таким образом, функция поведения эквивалентна ST- функции fs при однозначном соответствии у: с2-*-С+, (3.88) где у(с, с')=с+ тогда и только тогда, когда с+=с, c'g. Маску М+ (3.87) будем называть расширенной маской М. Она определена в предположении, что состояния порождаются в порядке возрастания параметра. При обратном порядке аль- тернативная расширенная маска, скажем маска +М, определя- ется несколько иначе: (vt, р)е+М, если (и,-, р)еМ или (и,, р—1)еЛ4. (3.89) Можно аналогично тому, как это было показано для Л1+, по- казать, что система с поведением FB=(I, +M, fB) изоморфна ST-системе, определенной для той же представляющей системы 1 и маски М. Соответствие между масками М, М+ и масками М, +Л! пока- зано соответственно на рис. 3.15ja и б. На рисунке также показа- Рис. 3.15. Изоморфизм п ops док порождения 31 между системами с поведением и ST-системами 158
' но однозначное соответствие (3.88) и его аналог для маски +М и +с<=+С. Для заданной системы с поведением FB=a, изоморфная ST-система при той же представляющей системе I существует только тогда, когда М — компактная маска и s3=2 для любой подмаски Mi. Если эти условия выполнены, то по- нятно, что ST-система Fs=(I. где М-— порождаемая часть (согласно определенному порядку по- рождения), которая изоморфна при соответствующем однозначном соответствии между множествами состояний С (основанном на Л1) и GXG (основанном на М-). Данное преобразование из системы с поведением в изоморфную ЗТ-систему для одного из порядков порождения показано на рис. 3.15,в. Для направленных систем изменяющими состояние аналогами функций поведения определяемыми уравнениями (3.26), (3.28)’, (3.29), будут соответственно следующие ЗТ-функции: £:ЕаХЁа —[0, 1], (3.90) где Е имеет тот же смысл, что и для систем с поведением, и fs(e, е'|е, е')—условная вероятность или возможность, смысл ко- торой однозначно определяется ее общепринятым обозначением ?GS:EaXEa-[0, 1], (3.91) где fGS(t' [ е, е', е)— порождающие условные вероятности или воз- можности; ?GS:EaXE^E, (3.92) где fCs(e, е', е)=е'. Изменяющими состояния аналогами для направленных систем с поведением (3.27) и (3.30) будут соответственно направленная ST-система Fs = (T,M,fos), (3.93) и направленная порождающая ST-система Fs=(bMG.U. (З-94) где I и Мо определяются так же, как и для систем с поведением.
ё'= 00 01 а> 10 11 ?'= 6) 00 01 10 11 ё = 00 0,1 0 0 0 ё=00 1 0 0 0 01 0 0 0.15 0.25 ё =01 01 0 0 0.375 0.625 e = oi 10 0.2 0.2 0 0 е'= 10 10 0.5 0.5 0 0 е'=Ю 11 0 0 0.05 0.05 11 0 0 0.5 0.5 00 01 ю 11 ё'= 00 ‘ 01 10 11 ё = 00 0 0.3 0 0 ё = оо 0 1 0 0 01 0 0 0.2 0 е = ю 01 0 0 1 0 е~Ю 10 0.1 0.1 0 0 е'=01 10 0.5 0.5 0 0 е' = 01 11 0 0 0.2 0.1 11 0 0 2/3 1/3 6) г> Рис. 3.16. Трехмерный массив, представляющий направленную ST-систему (пример 3.10) Функции (3.90) и (3.91) удобно представлять в виде массивов квадратных матриц (трехмерных массивов) по одной матрице для каждого условия е, е'. Удобны также диаграммы, подобные диа- граммам для нейтральных ST-систем. Для направленных систем связи на диаграммах помечаются не только значениями соответ- ствующей ST-функции, но и условиями е, е'. Функции (3.92) мож- но представлять в виде матриц, строки которых соответствуют со- стояниям е, столбцы — состояниям е', а элементами являются со- ответствующие состояния е'. Эти функции представляются также в виде диаграмм, таблиц и в некоторых случаях с помощью алге- браических формул. ▲ Пример 3.10. На рис. 3.16 приведена простая направленная ST-система (без интерпретации). Ее представляющая система со- стоит из входной переменной Ui и выходной переменной иг, каждая 160
Рис. 3.17. ST-функция, описывающая метаболизм класса бактерий имеет два состояния 0 и 1. Маска системы М показана на рис. 3.16,а, а на рис. 3.16,6 приведены соответствующие компоненты состояний, порожденные двумя ее последовательными положени- ями на матрице данных. На рис. 3.16,в и г показаны соответствен- но функции fs и fos в виде трехмерных массивов. В данном при- мере массив состоит из двух матриц. Пример 3.11. В работе [199] предложена детерминированная на- правленная ST-система, описывающая метаболизм бактерий опре- деленного класса с биохимической точки зрения. Бактерии рассма- 11—6923 161
триваются как сложные мультиэнзимные совокупности, а метабо- лизм как множество всех возможных последовательностей биохи- мических реакций в бактериях. В этом примере используется маска без памяти. На рнс. 3.17 приведена диаграмма ST-функции в форме (3.92). Состояния вы- ходных переменных (на рис. 3.17. они помечены числами) пред- ставляют множество всех субстратов, производимых соответству- ющими химическими реакциями. Состояния входных переменных (они обозначены буквами) представляют коэнзимы, участвующие в химических реакциях. Полный список дающих переходы коэнзи- мов и получаемых субстратов приведен в работе [199]. Коэнзимы, помеченные S/, S2, S8, S36, S49, эквивалентны субстратам, полу- ченным соответственно в состояниях 1, 2, 8, 36, 49. Пример 3.12. При применении оральных противозачаточных средств используются четыре гормона: стимулирующий фоллику- лы, гормон FSH, лютенизирующий гормон LH, экстроген Е и про- гестерон Р. Несмотря на то, что содержание этих гормонов в жен- ской крови может быть измерено с высокой точностью, нет необ- ходимости использовать высокоточные данные, если предметом исследования является контроль рождаемости, основанный на при- менении эстрогена в виде противозачаточных пилюль. Для каждо- го гормона может быть определен критический пороговый уровень содержания и имеет значение только то, превышает фактический уровень этот порог или нет. Таким образом, для описания каждого гормона достаточно переменной, имеющей всего два состояния. Пусть переменная находится в состоянии 0, если уровень содер- жания гормона ниже порогового, и в состоянии 1 в противном слу- чае. Параметром является время, определяемое неявно по измене- ниям состояний переменных. Кроме этих четырех переменных, рас- сматриваемых как входные, в систему входит выходная переменная, описывающая влияние противозачаточных пилюль. Пусть эта пе- ременная находится в состоянии 0, если пилюли не используются, и в состоянии 1 в противном случае. На рис. 3.18,а и б приведены соответственно матрицы данных для нормального менструального периода с использованием про- тивозачаточных пилюль и без их использования. Переменные О]— t»5 имеют следующий смысл: t»i — FSH; V2 — LH, v3 — E; v*— P; v5 — противозачаточные пилюли. Пусть для выборки из матриц данных используется маска, изображенная на рис. 3.18,в. В дан- ном примере матрицы периодические (за последним столбцом каж- дой матрицы следует ее первый столбец). Выбрав с помощью этой маски данные из матриц и вычислив вероятности, получим диа- грамму, изображенную на рис. 3.18,г. Она представляет порож- дающую ST-функцию в виде (3.91). Узлы помечены состояниями выборочных переменных ui—v3 в их естественном порядке. Связи помечены состояниями е' (входной переменной U5=$6> принадле- 162
f= 1 г з it 5 в 0 0 б 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 a) t= / 2 3 4 5 6 7 8 9 10 V 12 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 / 1 1 0 0 0 0 0 0 0 0 0 0 0 6) 0,, 0/0.33 "0/0.67 i>0 ( 10000 «-----( 01000 )-------*-----( 11100 ) 4---------7 0/0.5 4-------------7 0/0.5 --------' Рис. 3.18. Система контроля рождаемости (пример 3.12) жащей следующему состоянию) и, если оно не единственное, так- же вероятностями соответствующих переходов. Предполагается, что е=е', поскольку данные для других возможностей отсутству- ют. Как можно видеть, система является детерминированной при условии, что противозачаточные пилюли принимаются в соответ- ствии с тем, как это показано жирными стрелками на диаграмме. Эта единственная последовательность переходов минует состоя- ния, в которых может произойти оплодотворение. Пример 3.13. Для пояснения смысла пространственной инвари- антности рассмотрим два примера мозаик. Первая представляет собой черно-белую шахматную доску (рис. 3.19,а). Его парамет- рическое множество состоит из 64 клеток пространственной решет- ки. Оно описывается координатами х и у. Несмотря на то, что каждая из координат полностью упорядочена, параметрическое множество упорядочено только частично. На параметрическом множестве определена одна переменная, скажем переменная V. Она имеет два состояния: Ч (для черного цвета) и Б (для белого). Обозначим через vx,y состояние v для клетки с координатами х, у. 11* 163
Тогда выборочные переменные определяются уравнением sk, х, y = Vx+a, y+fi, где Sk,x,y — состояние выборочной переменной sk для клетки со значениями координат х, у. Для порождения состояний на всем параметрическом множестве достаточно двух выборочных пере- менных, например $1, *> У=ух, у, S2, X, y—vx+t, у. На рис 3.19,6 приведены изображение соответствующей маски с обозначением возможных порядков порождения (в предположе- Рис. 3.19. Пространственная инвариантность (пример 3.13) 164
нии, что порождается переменная $г), а также функция поведения в виде (3.16), полученная из данных с помощью выборки. Несмот- ря на то, что значение $2 однозначно определяется по Si, в каче- стве начального условия необходимо знать весь столбец, соответ- ствующий х=1. Для сокращения начального условия до одной клетки (x=t/=l) используем дополнительную выборочную пере- менную, определяемую уравнением 53, х, y — Vx, у+1- На рис. 3.19,в изображены соответствующая маска, порядки по- рождения и функция поведения. В данном случае порождение должно начинаться с верхнего левого угла пространственной ре- шетки. Для трех элементов, изображенных на рис. 3.19,г, имеется четыре аналогичных маски. Для каждой маски предполагается, что переменная $i является справочной переменной и в то же вре- мя порождающей. Каждая маска связана с определенными поряд- ками порождения и требует особого начального условия (эти усло- вия соответствуют четырем углам шахматной доски). В качестве второго примера предположим, что при тех же па- раметрическом множестве и переменной имеются маска и порож- дающая функция [снова в форме (3.16)], определенные так, как это показано на рис. 3.19,в. Тогда рис. 3.19,е порождается этой функцией поведения при условии, что в качестве начальных усло- вий заданы рисунки первого столбца и первой строки. Таким обра- зом, мы можем породить двухмерный пространственный рисунок из двух одномерных, что в нашем примере оказывается эквива- лентным. 3.8. ПОРОЖДАЮЩЕ СИСТЕМЫ ...взаимоотношения между воспринимае- мыми объектами являются, по крайней мере до некоторой степени, созданиями разума, который затем приписывает их внешнему миру. Таким образом, их мож- но рассматривать как «рабочие гипоте- зы» или, употребляя более точное слово, модели того, как организован реальный мир. Р. Розен Термин «порождающая система» используется в этой книге в качестве общего наименования для всех систем уровня 2 в эписте- мологической иерархии систем. В этих системах обобщенное пара- метрически независимое ограничение на рассматриваемые пере- менные описывается с разных сторон. В предшествующих разделах данной главы были введены четыре типа порождающих систем, 165
причем система любого типа может быть или нейтральной, или направленной. системы с поведением базовые: уравнение (3.10)—нейтральные; уравнение (3.27) — направленные; порождающие: уравнение (3.15)—нейтральные; уравнение (3.30)—направленные; ST-системы базовые: уравнение (3.77)—нейтральные, уравнение (3.93)—направленные; порождающие: уравнение (3.78)—нейтральные; уравнение (3.94)—направленные. Если в некотором контексте отличия между этими четырьмя типа- ми систем несущественны, то удобнее любую из них называть просто нейтральной или направленной и обозначать ее просто F или F. Как было показано в разд. 3.7, любая ST-система может быть преобразована в изоморфную систему с поведением, в то время как обратное преобразование возможно только при определенном типе масок. Следовательно, системы с поведением более общие, чем ST-системы. Два основных недостатка ST-систем очевидны: ограниченность из-за использования только компактных масок и собственная из- быточность, проистекающая из наложения текущего и следующего состояний. Это свойство всех масок, за исключением тех, в кото- рых для любой базовой переменной определено только одно пра- вило перехода. Из-за этих недостатков методологические средства УРСЗ, предназначенные для порождающих систем, реализованы только на основе систем с поведением. Если пользователю нужна ST-система, то его задача решается в терминах изоморфных си- стем с поведение.м и при дополнительных ограничениях, налагае- мых па маски в ST-системах. После решения задачи результиру- ющие системы с поведением преобразуются в изоформные ST-си- стемы и выдаются пользователю в нужной форме. ST-системы, когда они применимы, представляют для пользо- вателей определенные преимущества. По-видимому, ST-функции понятнее человеку, чем аналогичные функции поведения. Проис ходит это, вероятно, потому, что для ST-функций порождающие и порождаемые состояния выбираются из одного и того же множе- ства состояний, а для функций поведения — из двух разных мно- жеств состояний. Совпадение порождающего и порождаемого мно- жеств состояний также делает возможным использование удобных диаграмм как на рис. 3.14, 3.17, 3.18. Для порождающих систем выделены различные методологиче- ские отличия. Это отличия, выделенные для систем более низких 166
уровней, и некоторые новые. Среди первых наиболее существенны- ми являются: упорядоченность параметрического множества, что позволяет ввести важное понятие маски; упорядоченность множеств состояний, что играет существенную роль в упрощении процедур для порождающих систем (см. разд. 3.9) и при работе с неполностью определенными наборами данных; отличие четких и нечетких каналов наблюдения, дающих соот- ветственно четкие или нечеткие данные и требующих применения различных методов обработки данных; отличие между нейтральными и направленными системами, с которыми следует обращаться по-разному. Методологическими отличиями, относящимися к порождающим системам, но не к системам данных и исходным системам, явля- ются: детерминированность и недетерминированность систем; для недетерминированных систем различаются типы нечетких мер, характеризующих параметрически инвариантное ограничение на рассматриваемые переменные, в частности меры вероятности и возможности; по используемой маске различаются порождающие системы без памяти и системы, зависящие от прошлого. Разумеется, эти методологические отличия характеризуют и си- стемы более высоких эпистемологических уровней. 3.9. УПРОЩЕНИЕ ПОРОЖДАЮЩИХ СИСТЕМ Один из способов достижения некоторой точности — не учитывать большую часть имеющейся информации. П. Хаммер На некотором этапе обработки заданной системы данных ча- сто желательно бывает упростить соответствующие этой системе данных порождающие системы. В некоторых случаях упрощения требует пользователь, для которого существующие порождающие системы оказываются слишком сложными для понимания. В дру- гих случаях упрощение требуется из-за предполагаемого исполь- зования порождающих систем или по разным методологическим соображениям. Существует два основных метода одновременного упрощения систем данных и соответствующих порождающих систем: 1) упрощение за счет исключения некоторых переменных из со- ответствующей подобной системы; 2) упрощение за счет определения классов эквивалентности со- стояний некоторых переменных. 167
Д Пусть множество переменных порождающей системы И со- стоит из п переменных и любое подмножество V, за исключением пустого множества, представляет содержательное упрощение пер- вого рода. Следовательно, имеется 2П—2 нетривиальных упроще- ния первого рода. Они частично упорядочены по отношению «под- множество». Если для удобства включить исходное множество V и пустое множество, то множество упрощений с частичным упо- рядочением образует решетку. Назовем эту решетку решеткой пе- ременных или V-решеткой и обозначим 3?v. Понятно, что V-pe- шетка может быть описана или как 2?v=(<?(V), <=), или как 2’v=(^(V), Л, U)- Обозначим через fe функцию поведения заданной системы с по- ведением с переменными, составляющими множество V. При упро- щении этой системы с помощью сокращения множества V до под- множества V новая (упрощенная) функция поведения fa опреде- ляется проекцией Гв(Р) = [МИ (р), (3.95) определенной уравнением (3.69). Сокращения второго рода сводятся к уменьшению числа со- стояний, выделяемых для отдельных переменных. Одним из спосо- бов их описания является определение функции Oij: Vi-^V'i, (3.96) где Vi — заданное множество состояний (переменной vi); V't— упрощенное (сокращенное) множество состояний той же перемен- ной; Qi,j(x) — новое состояние, присвоенное исходному состоянию г, а /—это идентификаторы, с помощью которых различаются раз- ные функции вида (3.96), примененные к множеству состояний од- ной и той же переменной. Если Ог,/(х) =ог,/(«/), то состояния х и у из Vi при упрощении оказываются неразличимыми. Функция (3.96) должна быть гомоморфна относительно всех математичес- ких свойств исходного множества 1Л, которые считаются сущест- венными с точки зрения рассматриваемой задачи. Будем функцию (3.96), являющуюся гомоморфизмом в описанном выше смысле, называть упрощающей функцией. Любая упрощающая функция индуцирует разбиение на множе- стве Vi. Используя стандартное обозначение будем это разбиение обозначать Vi/Oi,i. Любое разбиение Vifoi.i состоит из групп со- стояний Vi, которые неотличимы при данном упрощении. Будем такое разбиение (которое сохраняет существенные свойства V,) называть разрешающей формой. Разрешающие формы, определенные на каком-то множестве состояний Vi, могут быть упорядочены с помощью обычного отно- 168
шения уточнения, определенного на разбиениях данного множе- ства. Хорошо известно, что такое отношение уточнения является отношением частичного порядка и образует решетку. Для двух заданных разбиений, скажем X и У, определенных на одном и том же множестве, будем говорить, что X является уточненным раз- биением У тогда и только тогда, когда для любой группы х из X существует группа у из У, такая, что №{/. Если X, уточняющее разбиение У, то У называется укрупненным разбиением X. Решет- ку разрешающих форм, определенных на множестве состояний Vi, будем называть разрешающей решеткой и обозначать Любая разрешающая решетка множества состояний Vi может быть опре- делена или в виде ^ = ({^/аг.Д, <), или в виде ^ = ({^/аи}, X, +), где X и + обозначают соответственно произведение и сумму раз- биений. Если рассматриваемое множество состояний не обладает мате- матическими свойствами, которые должны быть сохранены, то в качестве разрешающей формы приемлемо любое разбиение. В этом случае разрешающая решетка содержит все разбиения, которые могут быть определены на этом множестве состояний. Если мно- жество состояний состоит из m состояний, то число разрешающих форм в решетке, скажем решетке Am, определяется формулой Л..= У( . )Л„Л.-1. (3.97) Ниже показано огромное число разрешающих форм даже для не- большого числа состояний: m 2 3 4 5 6 7 8 9 10 2 5 15 52 203 877 4 140 21 147 115975 Поскольку наименьшая уточненная разрешающая форма (все со- стояния в одном блоке) смысла не имеет, а наибольшее уточне- ние не дает упрощения, то число осмысленных упрощений равно Лщ 2. Если множество состояний полностью упорядочено и требуется сохранить эту упорядоченность при упрощениях, то число разре- шающих форм существенно меньше числа, задаваемого формулой (3.97). ПуСТЬ Xi, Х2, • -, Хт — ЭТО СОСТОЯНИЯ И Xk<Xk+\ (£=1, ... 169
..т—1). Тогда для любого k^~m—1 Xk и х^-н или объединяются в одну группу или нет. Только эти решения определяют конкрет- ное разбиение. Таким образом, для т состояний принимается т—1 бинарное решение. Следовательно, для полностью упорядо- ченных множеств состояний Лт=2т~'. (3.98) Очевидно, что эта решетка для т состояний изоморфна булевской решетке для упорядочения подмножеств любого множества из т—1 элемента. В следующей таблице приводятся значения Лт, вычисленные по формуле (3.98); в этом случае число разрешаю- щих форм существенно меньше, чем в случае неупорядоченных множеств состояний: т 2 3 4 5 6 7 8 9 10 2 4 8 16 32 64 128 256 512 Число содержательных упрощений снова равно Ат—2. ▲ Пример 3.14. Пусть переменная, описывающая образование че- ловека, имеет следующие состояния: е — начальное образование; h — полная средняя школа; с — колледж; g— ученая степень. Понятно, что неравенство e<h<c<g является естественным упо- рядочением этих состояний, и, следовательно, существует восемь разрешающих форм, решетка которых изображена на рис. 3.20,а в форме диаграммы Хассе. Группам в отдельных разрешающих формах (они показаны черточками над соответствующими буква- ми) можно дать соответствующие названия, например eg — колледж или ученая степень; kc — полная средняя школа или колледж; eh — не выше средней школы; ehc — любое образование, кроме ученой степени; heg — образование выше начального. Стрелка на диаграмме указывают направление уточнения разби- ений. Для упрощения исходной системы нужно двигаться в на- правлении, обратном стрелкам. Для сравнения рассмотрим переменную, состояниями которой являются цвета светофора: красный, желтый, зеленый. Поскольку они не упорядочены, все разбиения множества состояний прием- лемы в качестве разрешающих форм. Диаграмма Хассе для этой решетки приведена на рис. 3.20,6. Буквы к, ж, з означают соответ- ственно красный, желтый и зеленый цвета. 170
Рис. 3.20. Решетки разрешающих форм для полностью упорядоченного (а) и неупорядоченного (о) множеств (пример 3.14) 6) Д Каждый элемент V-решетки определяет конкретный выбор переменных из исходной представляющей системы. Для любой вы- бранной переменной ее разрешающая решетка состоит из всех возможных разрешающих форм. Если выбрано несколько перемен- ных, то любая разрешающая форма для одной переменной может быть объединена с любой разрешающей формой другой перемен- ной. Все эти комбинации можно включить в одну решетку, пред- ставляющую выбранный набор переменных. Будем называть ее объединенной разрешающей решеткой. Математически она пред- ставляет собой произведение отдельных разрешающих решеток. Оно определяется следующим образом: пусть X], %2, •••> Хп— множества элементов отдельных разре- шающих решеток выбранных переменных, а X — множество эле- ментов соответствующей разрешающей решетки. Тогда Х=Х,Х^Х • • ХХп, и для двух заданных п-ок (xb Х2, . . Хп) (Уу, У2, Уп)^Х мы определяем, что (*1, Х2, . . ., Хп)^(у\, У2.Уп) тогда и только тогда, когда Xj^y, для всех разрешающих решеток (/=1, 2, ..., п). Понятно, что общее число элементов объединен- ной разрешающей решетки равно произведению числа элементов отдельных разрешающих решеток, т. е. п |Х| =п 1^1’ /=1 17!
однако только некоторые из них являются содержательными упро- щениями. В частности, любая комбинация, в которую входит наи- меньшая уточненная разрешающая форма (разбиение на одну группу) одной из разрешающих решеток, является бессмыслен- ной. Комбинация всех наиболее уточненных разрешающих форм также не представляет упрощения. Следовательно, общее число элементов объединенной решетки, представляющих содержатель- ные упрощения, | Xs | определяется по формуле п I | = IJ( | Aj|—1)—1. (3.99) /=1 В частном случае, когда все отдельные решетки одинаковы и каж- дая состоит из Лт разрешающих форм, мы получаем |Xs| = (Am-l)"-l. (3.100) Более того, если все разрешающие решетки построены на пол- ностью упорядоченном множестве с т состояниями, то |Xs| = (2m-1—1)"—1. ▲ (3.101) Пример 3.15. Предположим, что для упрощения выбраны две переменные, каждая с тремя состояниями 0, 1, 2. Предположим, также, что эти состояния полностью упорядочены: 0<1<2. Тогда отдельные разрешающие решетки (X/, =С) одинаковы и состоят из четырех разрешающих форм, как это показано на рис. 3.21. Раз- решающие формы для осмысленных упрощений обведены на диа- грамме Хассе кружками. Объединенная разрешающая решетка (X2, ^) приведена на рис 3.21,6. Она содержит 16 разрешающих форм, но осмысленными являются только, обведенные кружками. Л Теперь предположим, что исходная система, которая должна быть упрощена, содержит п переменных v2, ..., vn, которым со- ответствуют множества Хь Х2, ..., Хп разрешающих форм. Тогда общее число осмысленных упрощений (в которые входит и исклю- чение переменных) А(ХЬ Х2, ..., Хп) определяется формулой ЛГ (Xlt Хг.Xп} = [J | Х} | - 2. (3.102) f=i Эта формула получена исходя из того, что одноблочное разбиение множества состояний (например, разбиение d, изображенное на рис. 3.21) может рассматриваться как исключение соответствую- щей переменной. Тогда осмысленным уточнением является любой элемент разрешающей решетки, за исключением наименее и наи- более уточненных объединенных разрешающих форм (на рис. 3.21, это аа и dd). Если все переменные имеют одно и то же множество 172
Рис. 3.21. Разрешающая (х, (а) и объединенная разрешающая (б) (х2, ^), решетка из примера 3.15 разрешающих форм, скажем множество X, то формула (3.102) значительно упрощается и принимает следующий вид: ад, Х2.....ХП) = |Х|"~2. (3.103) Если же, кроме того, множества состояний переменных полностью упорядочены и каждое состоит из т состояний, то Х2, ..Хп) =2n(™-1)—2. ▲ (3.104) Если принято решение о том, какие упрощения данной системы с поведением следует выполнить, то функцию поведения упрощен- ной системы следует определять через функцию поведения данной системы. Если исключаются некоторые переменные, то сначала вы- числяется проекция (3.95). Если требуются дальнейшие упрощения с помощью укрупнения разрешающих форм некоторых из остав- шихся переменных, то должны быть сделаны изменения, анало- гичные проекции. Сначала, как требуется, делается укрупнение разрешающих форм. Это дает группы состояний, неразличимых для новых разрешающих форм. Каждый блок заменяется одним состоянием. Вероятность (или возможность) этого состояния рав- на сумме вероятностей (или наибольшей возможности) всех со- стояний, входящих в группу. Пример 3.16. Предположим, что требуется упростить вероятно- стную функцию поведения (см. табл. 3.6,а), исключив переменную 173
Таблица 3.6. Упрощение функции поведения (пример 3.16) а) /в(с) «2 б) L/в ! {»2.₽э}](«) «э С - 0 0 0 0.20 X- 0 0 0.20 0 1 1 0.05 1 0 0.12 Блок 0 2 2 0.04 1 J 0.24 J 1 1 I 0.09 I 2 0.13 1 1 2 0.06 2 0 0.15 1 г- 2 1 0 0.12 2 I 0.04 1 БЛ°К 2 1 1 0.10 2 2 0.12 2 1 2 0.07 2 2 0 0.15 2 2 1 0.04 в) 2 2 2 0.08 t'2 1‘з /в О) У- 1 1 0.56 1 2 0.13 2 1 0.19 2 2 0.12 ui и применим следующую упрощающую функцию к множествам состояний Иг=Уз переменных v2 и и3: Vg=V3 V2'-Vs‘ О 1 1 1 2 2 Сначала мы используем уравнение (3.69) для вычисления проек- ции [fs|{u2. Уз}] (см. табл. 3.6,6). Затем мы идентифицируем блоки состояний, неразличимых после применения упрощающей функции (эти блоки показаны в табл. 3.6,6). И, наконец, мы сум- мируем вероятности всех состояний в каждой из групп и получаем упрощенную функцию поведения, представленную в табл. 3.6,в. Упрощение систем представляет собой важный тип системных задач. В общих чертах он может быть охарактеризован как про- цесс уменьшения определенной неким образом сложности системы некоторого эпистемологического уровня, в то же время сохраняю- щий возможно больший объем информации, содержащейся в си- стеме. Все задачи этого класса подходят под следующее общее описание: конкретная система х определенного эпистемологического уровня; множество систем того же типа Yx, рассматриваемых как со- держательные упрощения х; 174
набор требований Q, рассматриваемых как свойства систем из множества Yx, определяющих подмножество У<? множества Ух, та- кой, что любая система из Yq удовлетворяет всем требованиям из Q. Для демонстрации класса задач упрощения порождающих си- стем положим, что х — система с поведением, Yx— множество всех содержательных упрощений х, базирующихся на том же множе- стве переменных, что и х (т. е. системах с поведением, базирую- щихся на всех содержательных объединенных разрешающих фор- мах, выводимых из х без исключения переменных), а также поло- жим, что Q состоит из двух требований: 1) чтобы системы из YQ были как можно проще; 2) чтобы степень порождающей нечеткости систем из Yq была как можно меньше. Будем называть требование 1 требованием простоты, а требо- вание 2 требованием четкости. Чтобы конкретизировать требование простоты для систем с по- ведением следует задать определенную меру сложности. УРСЗ должен давать пользователю возможность самому определять ме- ру сложности, в том числе и по умолчанию. Пусть, например, сложность системы с поведением оценивается числом реальных состояний системы, т. е. числом состояний, имеющих ненулевые вероятности или возможности. Это очень простая мера, но, воз- можно, наиболее содержательная. В этом смысле эта мера явля- ется наиболее подходящим вариантом для меры по умолчанию. Будем использовать обозначение IM = |{clfB(c)>0} I (3.105) для данной меры сложности системы с поведением Fb, где fe— функция поведения системы. Что касается требования четкости, то оно выражается или че- рез вероятностную нечеткость //(G|G), определяем уравнением (3.45), нли возможностную нечеткость L7(G| G), определяем урав- нением (3.64). Пусть kqu и |*/в[ (&=1, 2, ...)—соответственно значения порождающих нечеткостей и сложностей систем с пове- дением ftFs из множества Ух. Верхние индексы k можно интерпре- тировать как идентификаторы соответствующих объединенных разрешающих форм отдельных систем *FS. Численное упорядочение значений kqu и | | задает упорядо- и с чение по нечеткости sg: и упорядочение по сложности на мно- жестве У х. В общем случае эти два порядка предпочтений проти- воречат друг другу. Очевидно, что и упорядочение по нечеткости и упорядочение по сложности рефлексивны, транзитивны и связны, но не антисим- метричны. Следовательно, они представляют собой связные квази- упорядочения. Объединенный порядок предпочтений определя- 175
ется следующим образом: * ь 7FB< FB тогда и только тогда, когда « г и 1%1<1%1, (3.106) где Тв, feFB^yx— обобщенное квазиупорядочение (рефлексивное и транзитивное отношение) на Yx. Теперь можно определить множество решений YqczYx, назы- ваемое множеством допустимых упрощений х, как множество всех систем из Yx, таких, что они или эквивалентны, или несравнимы с точки зрения объединенного упорядочения (3.106). Формально Yq= {'FB€= Yx | (VfeFBe^) (*fJ<'Fb=^Fb<*Fb)}. (3.107) После того как множество Yq допустимых упрощений заданной порождающей системы определено, пользователь может использо- вать все системы из Yq в качестве взаимодополняющих упрощений исходной системы, может выбрать одну самую подходящую или может воспользоваться дополнительными критериями для сокра- щения этого множества. Задачи типа упрощения, как они описаны в данном разделе, имеют, разумеется, много разных вариантов, прежде всего из-за различных определений сложности и дополнительных требований. Интересно сравнить задачу этого типа с задачей определения под- ходящих систем с поведением для заданной системы данных, ко- торая подробно рассматривалась в разд. 3.4 и 3.6. Задачи этих двух типов имеют определенное сходство, которое можно исполь- зовать при реализации УРСЗ, т. е. некоторые процедуры, разра- ботанные для одного типа задач, могут быть легко приспособлены для другого типа. Если разрешается упрощение заданной системы с поведением с помощью исключения переменных, то множество Yx становится больше и некоторые введенные понятия должны быть соответствующим образом обобщены, однако основные ре- зультаты остаются неизменными. Пример 3.17. Рассмотрим вероятностную систему с поведением, функция поведения которой и маска изображены на рис. 3.22,а, б. Представляющая система очевидна. Предполагается, что парамет- рическое множество и все множества состояний полностью упо- рядочены. Воспользуемся этой системой, чтобы продемонстриро- вать задачу определения всех допустимых упрощений без исклю- чения выборочных переменных. Сначала мы должны определить множество Yx всех допустимых упрощений. Поскольку имеются две базовые переменные, каждая с полностью упорядоченным множеством состояний, в которые входят по три состояния, то имеется восемь содержательных объ- единенных разрешающих форм. Каждая из форм, изображенных на рис. 3.21, представляет одно содержательное упрощение. Каж- 176
6} Рис. 3.22. Упрощение системы с поведением (пример 3.17) дое уже определенное упрощение характеризуется значениями сложности и порождающей нечеткости. Эти значения приведены на рис. 3.22,в, на котором показано результирующее объединенное упорядочение по сложности и нечеткости; на рис. 3.22,в использу- ются те же метки, что и на рис. 3.21,6. Для сравнения приводятся и значения исходной системы, помеченные как аа. При изучении диаграммы на рис. 3.22,в выделим три допусти- мых упрощения данной системы, основанные на разрешающих формах ас, Ьс и сс. Последние две системы одинаковы как по сложности, так и по нечеткости, и, следовательно, в данном при- мере упорядочение не является антисимметричным. Любопытно отметить, что упрощения для ab и Ьа повышают порождающую нечеткость, но при этом не снижают сложности заданной системы. 12—6923 177
Функции поведения двух из трех допустимых упрощений с раз- решающими формами ас и сс показаны на рис. 3.22,г и 3.22,д. Мы не приводим подробности определения этих функций и вычисле- ния значений на рис. 3.22, а предлагаем читателю самому прове- сти по крайней мере некоторые вычисления. 3.10. ИССЛЕДОВАНИЕ И ПРОЕКТИРОВАНИЕ СИСТЕМ Для большинства задач, связанных с проектированием и анализом систем, характерно создание и работа с моделя- ми реальных и теоретических явлений... Самое трудное — это создать такую структуру, такой контекст, в котором лю- бые два решения задачи, независимо от того, насколько равными способами они были получены, можно было бы точно, объективно и всесторонне сравнить меж- ду собой. А. У. Уэймор Системные задачи могут возникать в двух основных контекстах: при исследовании и при проектировании систем. Задачей исследова- ния систем является накопление знаний о различных наборах пере- менных и параметров, определенных с конкретными целями на суще- ствующих объектах. Задачей проектирования систем является ис- пользование накопленных знаний для создания новых объектов, для которых на специфицированные переменные наложены опре- деленные ограничения. Несмотря на то, что системные задачи как при исследовании систем, так и при их проектировании существу- ют па любом эпистемологическом уровне иерархии систем, в этом разделе мы ограничимся общим рассмотрением задач, связанных с исходными системами, системами данных и порождающими си- стемами. Задачи для систем более высоких уровней рассматрива- ются в гл. 4, 5. Рассмотрим сначала некоторые вопросы, связанные с проекти- рованием систем. Наиболее важной чертой проектирования систем является то, что параметрически инвариантное ограничение на не- которые конкретные переменные определяется пользователем. Со- вершенно иначе обстоит дело с исследованием систем, где это ог- раничение неизвестно, и задача состоит в том, чтобы адекватно охарактеризовать с учетом конкретной цели исследования. Ограничение при проектировании систем определяется или явно на языке конкретной порождающей, обычно направленной системы, или неявно на языке системы данных. В первом случае задача проектирования сводится к определению набора структури- 178
рованных систем, удовлетворяющих заданным требованиям. Эти вопросы рассматривается в гл. 4. Во втором случае необходимо определить некие порождающие системы, адекватно описывающие ограничения, содержащиеся в данных. Эта задача соответствует классу задач, рассматриваемых в разд. 3.4 и 3.6 в контексте ис- следования систем, однако в случае проектирования систем систе- ма данных по определению содержит всю информацию о способе, каким накладываются ограничения на переменные. При проектировании системы функция данных часто определя- ется неявно через описание их свойств, а не явно в виде матрицы или массива данных. Допустим, например, что имеется простая направленная система с одной входной переменной, множество со- стояний которой состоит из 26 латинских букв и пробела, и с од- ной выходной переменной с двумя состояниями 0 и 1. Входная пере- менная определяется последовательностью букв и пробелов про- сматриваемого английского текста. Требуется, чтобы выходная переменная при определенных условиях была равна 1, например, при условии, что последнее слово просматриваемого текста конча- лось на ING, и 0 в противном случае. Задача состоит в том, чтобы преобразовать это неявное определение системы данных в некую порождающую систему, которая бы для любого английского тек- ста порождала бы (детерминированным образом) требуемые со- стояния выходной переменной. Методы решения задач подобного типа хорошо разработаны в рамках теории конечных автоматов. Соответствующий набор таких методов должен быть, разумеется, включен в состав УРСЗ. Поскольку на эту тему имеется обширная литература, то нет смысла описывать эти методы в данной книге. При сравнении исследования систем и их проектирования на уровне систем данных и порождающих систем, необходимо отли, чать два класса систем данных, встречающихся при исследовании систем. К первому классу относятся системы данных, в которых переменные не имеют смысла вне параметрического множества, на котором они определены. Примерами таких систем являются: музыкальное сочинение, рассматриваемое как система дан- ных (пример 2.6), переменные которой, очевидно, не имеют смысла вне временного множества, соответствующего всему со- чинению; любая система данных с пространственным параметром, в которой пространственное множество не может быть расши- рено, например система пространственных данных по акустике концертного зала или система, определенная для земного ша- ра, в котором параметрическим множеством являются значения широт и долгот для всего земного шара; любая система данных, определенная на всей группе опре- деленного типа, например все сочинения какого-либо компози- тора, все служащие определенного нанимателя и др. 12’ 179
Системы данных такого типа содержат всю информацию об огра- ничениях на их переменные. Тем самым они методологически подобны системам данных, определяемым при проектировании систем. Будем такие системы называть полными системами данных. Второй класс систем, который при исследовании, по-видимому, встречается чаще, составляют системы, в которых переменные не ограничены тем параметрическим множеством, для которого име- ются данные. Можно говорить о том, что практически все системы, параметром которых является время, относятся к этому классу (пример с музыкальным сочинением — редкое исключение). При- меры полных систем данных для параметров других типов, хотя и встречаются чаще, также не являются типичными. Существует два основных метода исследования систем. При одном подходящие порождающие системы (или системы более вы- соких уровней), базирующиеся на определенных требованиях, вы- водятся из заданной системы данных. Для наиболее типичных тре- бований этот процесс рассматривается в разд. 3.4 и 3.6. Этот ме- тод обычно называется методом открытия. При другом методе ги- потетическая порождающая система (или система более высокого уровня) постулируется, а затем ее правильность проверяется сравнением порождаемых ею (при соответствующих начальных условиях) данных с эмпирическими данными. Если система не проходит проверки, основанной на некоем конкретном критерии правильности (критерии совпадения), то она отвергается и посту- лируется новая система. Этот подход к исследованию систем обыч- но называется методом постулирования. Понятно, что при использовании метода открытия любая по- рождающая система, полученная непосредственно из системы дан- ных, является неким экономным представлением каких-то аспек- тов системы данных. То, какие именно аспекты представляются по- рождающей системой, зависит от ее маски и характера функции поведения или ST-функции. Если порождающая система детерми- нирована, то это экономное описание всей системы данных своего рода «стенографическое» описание. Если система данных является полной, то метод открытия сво- дится к нахождению моделей ее данных. Обнаруженные модели данных могут затем использоваться для разных целей. Если си- стема неполная, то необходимо различать две проблемы, связан- ные с найденными моделями (т. е. с полученными подходящими системами данных): объяснение данных в рамках заданного параметрического мно- жества, вывод данных вне пределов параметрического множества, т. е. предсказание, восстановление (retrodiction) или обобщение дан- ных. 180
Разница между этими двумя проблемами, которые часто в ли- тературе смешиваются, хорошо описана в одной из статей Г. Сай- мона [288]: Открытие закона означает только нахождение модели данных; будет ли мо- дель выполняться для новых данных, наблюдаемых впоследствии, решается в процессе проверки закона, а не при его открытии... Открытие начинается с конкретных фактов и ведет к общим законам, которые какнм-то образом вы- водятся из этих фактов; процессы проверки открытий эволюционируют от зако- нов к предсказаниям конкретных фактов на основе этих законов. Тот факт, что некий процесс выявляет модель из конечных наборов данных, ничего не говорит о предсказывающей силе такой модели для новых наблюдений. Двигаясь от обна- ружения моделей к предсказанию, мы движемся от теории процессов открытия к теории процессов проверки законов. Для объяснения того, почему определен- ные нами на основе наблюдений модели часто дают правильные предсказания (если это так), необходимо обратиться к проблеме индукции и, возможно, вы- двинуть некие гипотезы относительно единообразия природы. Однако теория про- цессов открытия в этой гипотезе не нуждается. Эта теория утверждает, что данные образуются согласно неким моделям, и скорее показывает, как опреде- ляется модель, если опа существует. Это вопрос не описания или психологии, а нормативный и логический. Отделяя задачу обнаружения модели от задачи предсказания, мы можем построить подлинную нормативную теорию открытия — логику открытия. Если метод открытия используется для неполных систем дан- ных, то порождающие системы (или системы более высоких уров- ней) определяются на столько для объяснения имеющихся данных, сколько для расширения данных за пределы заданного параметри- ческого множества, что делает возможным предсказание, восста- новление и обобщение данных. Этот процесс требует, разумеется, применения индуктивного рассуждения некоего типа. Следователь- но, УРСЗ должен располагать пакетом хорошо обоснованных ме- тодологических средств для индуктивных рассуждений. Соответст- вующие вопросы обсуждаются в гл. 4. Задачи определения подходящих порождающих систем рассма- тривались в разд. 3.4 и 3.6 в неявном предположении, что выбо- рочные переменные определены только через переменные, вклю- ченные в заданную систему данных, т. е. через наблюдаемые пере- менные. Это ограничение не обязательно и может в некоторых случаях затруднить получение достаточно простых порождающих систем с незначительной порождающей нечеткостью или вовсе без нечеткости. Эти задачи могут быть обобщены, если разрешить пользователю постулировать гипотетические состояния некоторых дополнительных переменных, не входящих в число наблюдаемых переменных. Такие переменные обычно называются внутренними переменными, а их состояния — внутренними состояниями. Несмотря на то, что гипотетические внутренние состояния мо- гут вводиться из самых разных соображений, обычно они вводятся 181
для усиления зависимости между порождающей нечеткостью и сложностью подходящих порождающих систем. При введнии внут- ренних состояний требуется, чтобы для заданных данных была определена модель порождения этих состояний. В то же время эти переменные должны способствовать уменьшению общей порожда- ющей нечеткости. Подобное определение моделей возможно толь- ко для полных систем данных и изучается в рамках теории конеч- ных автоматов, детерминированных и вероятностных. Понятия внутренних переменных и состояний весьма сущест- венны при проектировании систем. Введение внутренних состояний в процессе проектирования систем сводится к соответствующему переопределению накладываемых ограничений. После их введения на абстрактном уровне внутренние переменные и их состояния могут быть конкретизированы любым подходящим способом. Од- нако при исследовании систем использование внутренних перемен- ных довольно проблематично, поскольку они не несут семантичес- кой нагрузки и нельзя, как при проектировании систем, конкре- тизировать их подходящим образом. Таким образом, проектирование систем всегда представляет со- бой процесс подъема по эпистемологической иерархии систем. Он начинается с определения или порождающей системы, или систе- мы данных и набора требований относительно структуры систем. Задача определения подходящих порождающих систем по задан- ной системе данных принадлежит к тому же классу задач, что и задачи, обсуждаемые в разд. 3.4 и 3.6, с той лишь разницей, что допускается использование внутренних переменных. Исследование систем осуществляется с помощью: подъема по иерархии посредством обнаружения систем бо- лее высоких уровней, для которых системы более низких уров- ней обладают определенными свойствами, и, если система дан- ных неполная, соответствующих индуктивных выводов (метод открытия); постулирования порождающих систем или систем более вы- сокого уровня и отбрасывания тех из них, которые не удовлет- воряют проверке на соответствие между эмпирическими и по- рожденными данными (метод постулирования); любой комбинации метода открытия и метода постулирова- ния, например подъема по иерархии до определенного уровня и постулирования систем на более высоком уровне. Наибольшее внимание в этой книге уделяется задачам, связан- ным с методом открытия. Объясняется это двумя соображениями. Прежде всего, учебным характером книги. Метод открытия, при котором системы вводятся в порядке возрастания их концептуаль- ной сложности, очень удобен для объяснения и формулирования всей концептуальной схемы УРСЗ. Второе соображение заключа- 182
ется в том, что метод открытия недостаточно полно описан в лите- ратуре, методы постулирования и проектирования систем освеще- ны вполне удовлетворительно. ПРИМЕЧАНИЯ 3.1. Понятия маски и выборочных переменных, центральные понятия для порождающих систем, введены А. Свободой в начале 1960-х гг. для проектирова- ния и классификации переключательных схем [301, 302], а затем использованы при создании сложной и нетрадиционной методологии работы с переключатель- ными схемами. 3.2. Литература по теории вероятностей обширна. Классическая книга А. Н. Колмогорова [195] до сих пор остается наилучшим аксиоматическим иссле- дованием теории вероятностей. Хороший сравнительный обзор различных аксио- матических оснований и интерпретаций теории вероятностей дается в книге Т. Файла [107]. 3.3. Формула (3.32) выведена Р. Кристенсеном [75] исходя из принципа максимума энтропии, являющегося одним из принципов индуктивного рассужде- ния, рассматриваемого в гл. 4. Он также получил обобщенную формулу для оце- ночных вероятностей, учитывающую любую дополнительную информацию. Фор- мула (3.34) получена Дюбуа и Прадом [100]. В настоящее время ведутся рабо- ты по нахождению всех подходящих функций преобразования распределений частот в распределения возможностей. 3.4. Идея возможностной меры, которая является основой теории возможно- стей, была выдвинута Л. Заде в 1978 г. [360]. Возможностные меры образуют лишь малое подмножество множества нечетких мер, введенного М. Суджено в 1977 г. [398]. Это множество не пересекается с множеством вероятностных мер, которые также образуют класс нечетких мер. Пури и Ралеску показали [265], что возможностные меры могут быть определены только на конечных мно- жествах и некоторых специальных классах бесконечных множеств. Соотиошеиия между различными подмножествами нечетких мер, изображенные на рис. 3.5, хорошо описаны в ч. II, гл. 5 обзорной книги Дюбуа и Прада [98]. 3.5. Как уже упоминалось в разд. 3.5, понятие условной возможности являет- ся опорным вопросом в теории возможностей. Противоречие возникает из отно- шения понятий невзаимодействия (noninteraction) и независимости. Ясно, что в теории вероятностей эти понятия эквивалентны. Пусть хеХ и ре У, где X и К — конечные множества событий. Вероятностное невзаимодействие определяется как р(х, у)=р(х) -р(у) для всех xsX и реУ, где р(х, у)—совместная вероят- ность событий х и у. Вероятностная независимость определяется как р(х\у)=- =р(х) и р(у\х)=р(у), где р(х|у) —условная вероятность х при заданном у, а р(1/|*) — условная вероятность у при заданном х. Поскольку совместная ве- роятность событий р(х, у) определена как р(х, р)=р(х|р)-р(р)=р(р|х)-р(х), то множества событий X и Y независимы тогда и только тогда, когда они ие взаимодействуют. В теории возможностей вовсе не очевидно, что невзаимодействие и независи- мость являются эквивалентными понятиями. В литературе на этот счет высказы- ваются две точки зрения [160, 238]. Два конечных множества событий X и У 183
с распределениями возможностей соответственно f(x) и f(y) (х^Х, ysY) на- зываются невзаимодействующими тогда и только тогда, когда f(x, u)=min [f(x), f(y)] (3.108) для всех хеХ и уеУ. Эти множества называются независимыми тогда и только тогда, когда f(x\y)=f(x), (3.109) f(y\x)=f(y) (З.ИО) для всех хеХ и ysY, где f(x\y) и f(z/|x) — условные возможности соответствен- но х при заданном у и у при заданном х. В работе [160] утверждается, что уравнения f(x, (/)=min [f(y), f(xfy)], (3.111) f(x, j/)=min [f(x), №|x)] (3.112) должны выполняться для любых двух множеств событий, характеризующихся распределениями возможностей f(x), f(y). Тогда ясно, что как из (3.109) и (3.111), так и из (3.110) и (3.112) следует (3.108). Таким образом, из независи- мости возможностных событий следует их невзаимодействие. Однако обратное неверно. В самом деле, из (3.108) и (3.111) мы получаем , . )= ifW’ если f(x) <f(y), у UfW> 1]> если f(x)>f (у) (3.113) (и аналогичное выражение для другой условной возможности). Следовательно, из невзаимодействия вовсе не следует независимость. В работе [238] смысл условной возможности понимается совершенно иначе. В этой работе «нормализо- ванные» условные возможности определены таким образом, чтобы по аналогии с теорией вероятностей возможиостное невзаимодействие было эквивалентно воз- можностной независимости. Это следует из формулы если f (х) <f (у). (3.114) если f (х) > f (у), (f (X, у), 4 f (у) где f(x)/f(y)—нормализующий коэффициент. 3.6. Шенноиовская энтропия, являющаяся естественной мерой нечетности и информации для событий, описываемых вероятностными распределениями, зани- мает главенствующее место в литературе с тех пор, как она была предложена К. Шенноном в 1948 г. [283]. Сначала она была введена для анализа систем связи, но ее значение и применения вышли далеко за пределы ее первоначального назначения. Эффективность введения шенноновской энтропии для общесистемной методологии, вероятно, одного из важнейших ее применений, была оценена су- щественно позже других ее применений. Насколько мие известно, сначала един- ственным сторонником такого применения шенноновской энтропии был Р. Эшби. Несмотря на то, что первые идеи в этой области были опубликованы еще в 1956 г. в классической книге [17], он вернулся к данной теме, получив значи- тельно более сильные результаты через 10 лет [20], и продолжал ею интересо- ваться до конца жизни [23, 25, 26]. Литература по теории информации, базирующейся на шенноновской энтро- 184
пии, очень разнообразна. Из многих имеющихся книг по теории информации книга [4] представляется иаилучшим образом возможных аксиоматических опи- саний шенноновской энтропии н различных ее обобщений, книга [137] является хорошим обзором применений теории информации, а книга [330] — превосходным концептуальным и математическим исследованием роли информации в научном выводе. 3.7. Общепризнано, что впервые мера информации и нечеткости была введе- на Р. Хартли в 1928 г. [149]. Он определил информацию, необходимую для опи- сания элемента конечного множества из п элементов как двоичный логарифм п. Этой мере часто приписывается одна из двух вероятностных интерпретаций. Со- гласно первой она рассматривается как специальная мера, различающая только нулевые и ненулевые вероятности, т. е. мера, нечувствительная к реальным зна- чениям вероятностей. При второй интерпретации эта мера рассматривается как шенноновская энтропия при условии, что все элементы множества имеют равные вероятности. Подобные попытки классифицировать меру Хартли как шеннонов- скую энтропию некорректны, поскольку энтропия логически независима от ве- роятностных условий. На самом деле она несопоставима с шенноновской энтро- пией, поскольку предполагает выполнение такого свойства, как монотонность (чем больше множество, тем больше его информация по Хартли), что неприме- нимо к распределениям вероятностей (их нельзя упорядочить аналогичным образом). В одной из моих статей, написанной совместно с М. Хигаси [157], показано, что информация по Хартли представляет собой частный случай возможностной информации, выражающейся (/-нечеткостью из уравнения (3.56) или (3.57), для четких распределений возможностей (с возможностями, равными только 0 или 1). В статье также доказывается, что (/-нечеткость удовлетворяет возмож- ностным аналогам всех аксиом шенноновской энтропии (они перечислены в разд. 3.5) и, кроме того, обобщенному свойству монотонности (чем больше распределение возможностей, тем больше его U-нечеткость). Противоречие, свя- занное с условными возможностями (см. замечание 3.5), снимается требованием того, чтобы класс неинтерактивных множеств выходов, относящийся к классу независимых множеств выходов, удовлетворял требованию аддитивности. В статье условная (/-нечеткость (см. уравнение (3.64)) определяется без исполь- зования противоречивого понятия условной возможности. 3.8. Некоторые методы, возникшие в теории конечных автоматов (детермини- рованных и вероятностных), предназначены для частных случаев задач вывода подходящих порождающих систем из полных систем данных. Эти методы, как правило, примените только к направленным системам и используют внутренние состояния. Поэтому данные методы подходят для проектирования систем, их использование при исследовании систем весьма ограничено. Среди множества имеющихся книг по теории автоматов книга [47] представляется наилучшим обзором как детерминированных, так н вероятностных автоматов. Методологиче- ски более ориентированные на теорию систем исследования можно найти в одной из моих книг [180]. Один конкретный результат из теории автоматов заслуживает особого вни- мания как пример превосходного взаимодействия между пользователем и УРСЗ при решении задачи. При этом подходе [307] описание переходов из состояния 185
в состояние для детерминированного конечного автомата с внутренними состоя- ниями строится с помощью вопросов к пользователю относительно системы дан- ных, причем алгоритм построен так, что пользователь отвечает только, возможна или нет некоторая последовательность входов-выходов. После завершения про- цесса ответов на вопросы (за конечное число шагов, если данные полны) ST-си- стема определяется алгоритмически в соответствии с полученными ответами. Таким образом, при этом подходе не требуется, чтобы пользователь сам полно- стью определял свою задачу, алгоритм помогает ему сделать это. К статье [307] есть два дополнения [140. 308]; в них дается доказательство корректности алго- ритма и обсуждаются некоторые тонкие вопросы, связанные с ним. 3.9. Возможность использования постулированных внутренних состояний в системных исследованиях рассматривается в работах [123, 124]. В них пока- зано, что использование внутренних состояний в процессе вывода порождающих систем из эмпирических данных не поддается вычислениям даже для очень не- больших наборов данных. Этот результат служит подтверждением вывода, при- веденного в разд. 3.10, что использование внутренних состояний при исследова- нии систем большого значения не имеет, по играет важную роль при проектиро- вании систем. 3.10. Из многих имеющихся методологий проектирования систем методоло- гия, предложенная У. Уэймором [343], представляется наилучшим кандидатом на включение в УРСЗ. Она достаточно обща, хорошо сформулирована н концеп- туально достаточно близка схеме УРСЗ, так что такое включение может оказать- ся вполне возможным. 3.11. В этой главе часто упоминаются такие понятия, как объяснение, пред- сказание и восстановление. Это очень важные философские понятия. Поскольку соответствующее рассмотрение этих понятий выходит за рамки данной книги, я могу в качестве дополнительного чтения рекомендовать две книги: книгу [330], в которой эти понятия описываются на языке теории информации, и книгу [258], в которой обсуждаются фундаментальные философские вопросы, связанные с этими понятиями (на примере вероятностных ST-систем). В ней также имеется обширная библиография. А 3.12. Для систем с непрерывными переменными и параметрами параметриче- ски инвариантные ограничения на переменные описываются в общем случае диф- ференциальными уравнениями с постоянными коэффициентами. Понятно, что в данном случае выборочными переменными являются производные, определен- ные через базовые переменные и правила сдвига. Производная самого высокого порядка в дифференциальном уравнении является аналогом глубины маски. Ре- шения дифференциальных уравнений при различных начальных условиях имеют смысл порождаемых данных. Эмпирические данные представляют собой непре- рывные функции на параметрическом множестве. Пусть, например, функция o(/)=sin/ представляет эмпирические данные для некоторой области t, где v— переменная, a t — время. Тогда a(0=cos? и о(0 = =—sin t. Следовательно, дифференциальное уравнение б(0-)-ц(0=0 является инвариантным относигельно времени характеристикой переменной v, так как опа одинакова для любого значения t. При решении этого дифферен- те
циального уравнения при соответствующих начальных условиях получаются исходные функции. А 3.13. Интересно рассматривается понятие среды в статьях [117, 245]. 3.14. Общая формулировка задачи определения подходящих систем с пове- дением, примерами которых являются уравнения (3.73) и (3.107), была пред- ложена В. Гейнсом [114]. А 3.15. Понятие энтропии первоначально было предложено Больцманом в 1986 г. в виде ь Н (f (х) I х е: [а, &]) = — J f (х) log f (х) dx, а где [—плотность распределения вероятностей, определенная для непрерывной переменной хе[о, 6]. Несмотря на то, что по форме она похожа на шеннонов- скую энтропию, энтропия Больцмана не является аналогом шенноновской энтро- пии для непрерывных переменных, как этого можно было бы ожидать. На самом деле, энтропия Больцмана не является предельным случаем шенноновской энтро- пии и, соответственно, не является мерой нечеткости и информации. Однако в виде b н I-------fW— \ = С ( ), ,,d В g(x)\x(E[a,b]) J К ’ а опа становится аналогом шенноновской кросс-энтропии н ( f(X) \ V rf.A 10gffX) s\g(x)|x£x) 2j logg(x) ’ xeX где X — конечное множество состояний переменной х, a f, g — функции распре- деления вероятностей, определенные па X. Подробности приводятся в некоторых книгах по теории информации [137, 202, 268]. УПРАЖНЕНИЯ 3.1. Пусть даны следующие периодические временные последовательности со- стояний 0, 1 одной переменной v, причем для каждого случая период подчерки- вается: t = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16... ц = 0 1 0101010 1 0 1 0 1 0 1... у, = 0 0 1 1 00110 0 1 1 О 0 1 1... V, = 000 1 11 0 1 0 0 О 1 1 1 0 1... V, = 0 0 0 0 1 0 1 1 1 1 0 10 0 1 1... Для каждой такой последовательности найдите: а) детерминированную систему, порождающую данную последовательность слева иаправо и наоборот; б) ST-системы, изоморфные системам с поведением, определенным в а). 187
3.2. Рассмотрим двумерную «шахматную» пространственную решетку разме- ром 8X8 (пример 3.13), на которой определена одна переменная v с двумя со- стояниями (черная и белая клетки). Пусть есть система с поведением, включаю- щая выборочные переменные 31, х, У = ^Х, У) $3 X, y = Vx+t,y, S1, х, g — Vx, у+1, s4, х, y = Vx+l, у+1. Поведение системы определяется следующим образом: з4— черная клеска, если s2 — белая и si=s3 или если s2 — черная клетка и 3|¥=«з; в противном случае .»< — белая клетка. а) Определите мозаичный рисунок доски, порожденный системой с поведе- нием при условии, что верхний ряд п левый столбец (начальные условия) представляют собой следующие последовательности: ББЧББЧББ и БЧЧВВЧЧВ, где Б — белая клетка, а Ч — черная. б) Определите ST-систему, изоморфную этой системе с поведением. в) Исследуйте влияние различных начальных условий на порождаемую мо- заику. 3.3. Определите подходящие порождающие системы для некоторых хорошо знакомых вам механизмов. Можно, например, взять такие объекты, как цифровой замок, лифт, торговый автомат, вышивальный автомат, двигатель внутреннего сгорания, десятичный сумматор. 3.4. Разработайте следующие порождающие системы: а) детерминированную систему с поведением, описывающую выплаты ссуды за дом. Пусть выплата ссуды (в размере 50 000 дол. при 10 % годовых) производится в течение 20 лет. Можете придумать собственный вариант. Си- стема должна порождать суммы (в долларах и центах) ежемесячных вы- плат по основной сумме и по процентам; б) четкую возможностную ST-систему, описывающую (подобно системе нз примера 3.9) пути развития карьеры служащего в большой промышленной компании, например в компьютерной фирме. Пусть переменные, определяю- щие категорию работы, описывают уровень технической подготовки, руко- водства, работы с заказчиками, а также участие в торговых операциях. Пусть каждая переменная имеет четыре состояния: нет, низкое, среднее, высокое. Если вы не знакомы ни с какой конкретной компанией, опишите возможную систему, исходя из общих соображений; в) систему с поведением, полностью описывающую некоторый итеративный численный алгоритм, например алгоритм Ньютона — Рафсона для вычисле- ния корня квадратного из положительного рационального числа. Предполо- жим, что результат должен быть получен с определенной точностью; г) четкую возможностную ST-систему, описывающую правила какой-либо игры, например шахмат или шашек. Не пытайтесь специфицировать ST-функ- цню явно, а опишите ее с помощью набора предложений. Этих предложений должно быть достаточно для определения согласно правилам игры (для лю- бого заданного состояния) всех возможиостных (разрешенных) следующих состояний. 3.5. В качестве продолжения упр. 2.7 определите все подходящие системы с поведением для системы данных, получающейся в этом упражнении, для неко- 188
st s2 s3 s4 acfB(a) s, s? Sj ccfB(fl) a= О 0 0 1 0.2 0 1 1 1 0.2 1 1 2 1 0.2 1111 0.2 2 1 0 0 0.2 г) fi= О О О 1 0.2 0 111 0.2 1 1 1 1 OA 1 1 0 0 0.Z fl) Рис. 3.23. Иллюстрация к упражнениям 3.6 (a), 3.7 (б) и 3.8 (в) торой разумной наиболее подходящей маски. Выполните это упражнение и для вероятностной, и для возможностной методологии. 3.6. Рассмотрите вероятностную ST-систему, основанную на наблюдении пе- ременной с тремя состояниями (0, 1, 2), ST-функция которой показана на рис. 3.23,а для маски Mt. Система предназначается для предсказания. Определи- те для этой системы: а) ST-системы для масок М2 и М; б) изоморфную систему с поведением для расширенной маски Л11+; в) системы с поведением для всех осмысленных подмасок ЛЬ+; г) подходящие системы с понедеиием из тех, что определены в в), такие, что порождающая нечеткость и размер маски минимизированы; д) изоморфные ST-системы для тех систем с поведением, определенных в г), для которых они существуют. 189
3.7. Пусть частоты N(c) на рис. 3.23 были определены из эмпирических данных для состояний с четырех выборочных переменных, базирующихся на двух наблюдаемых переменных Vi, v2, полностью упорядоченном параметрическом множестве из 1500 наблюдений и маске М. Требуется для целей предсказания определить следующее (используйте как вероятностную, так и возможностную методики): а) системы с поведением для Л1; б) изоморфные ST-системы для систем с поведением, определенных в а); проверьте, удовлетворяет ли каждая из этих систем балансу переходов, вы- раженному в уравнениях (3.80) и (3.81); в) системы с поведением для всех осмысленных подмасок М; определите те из них, которые являются допустимыми (в обычном смысле); г) направленные системы с поведением для маски М прн условии, что v2 является входной переменной; вычислите также порождающую нечеткость при условии, что используется имеющаяся информация о переменной и2; д) то же, что и в г), по при условии, что информация о переменной v2 не- доступна. 3.8. Определите для целей предсказания возможностную и вероятностную функции поведения, базирующиеся на маске Л1={(ц|, —1), (ot, 0), (а2, 0)} для периодического массива нечетных данных (с полностью упорядоченным пара- метрическим множеством), изображенного на рис. 3.23,в. а) Используйте агрегирующие функции «произведение» и «минимум». б) Предложите и используйте в этом примере другие агрегирующие функции, удовлетворяющие требованиям, предъявляемым к таким функциям. 3.9. Воспроизведите пример 3.7 для ЛМ=2 с использованием возможностей методологии. 3.10. Рассмотрите нейтральную систему данных с двумя переменными, пол- ностью упорядоченным параметрическим множеством и данными, задаваемыми матрицей Г 001 1 1202121 102222101212220220 L 0 0 1 12212022000221 121001201002 22210200101021 102222101212220 22210121222022000221 121001201 11 120100202012201 1 11202121 110 11120212111011000112212002102 000001 1221200210200101021 1022 001010 2 1 102222101212220220002 0120120120122022000221121001 2' 0120120120120100202012201111 2. 190
Пусть множество состояний этих переменных полностью упорядочено (т. е. 0<1<2). Определите по этой системе данных: а) вероятностную и возможиостиую функции поведения для маски из двух столбцов, которую можно использовать и для представления, и для восста- новления; б) все содержательные упрощения системы с поведением, определенной в а), основанные только на укрупнении разрешающей формы; в) для каждого упрощения, полученного в б), определите все подходящие системы с поведением для всех удовлетворяющих обычным требованиям до- пустимых подмасок маски из двух столбцов. 3.11. Повторите пример 3.10 в предположении, что система данных направ- ленная. Пусть первая переменная рассматривается как входная, а имеющаяся информация об этой переменной является нерелевантной (например, контроли- руется пользователем). 3.12. Предположим, что для проверки группы электронных плат определен- ного типа вы ввели переменную, характеризующую два типа наблюдаемых де- фектов. Эта переменная имеет четыре состояния: 0 — не наблюдается ин один из двух типов дефектов; 1 — наблюдаются дефекты только первого типа; 2 — наблюдаются дефекты только второго типа; 3 — наблюдаются дефекты обоих типов. Это множество состояний упорядочено только частично, поскольку состоя- ния 1 и 2 несопоставимы. а) Определите все разбиения множества состояний, сохраняющие эту частич- ную упорядоченность. б) Опишите (желательно в виде диаграммы Хассе) полученную для этой переменной разрешающую решетку. 3. 13. Добавим еще одну переменную к переменной, описанной в упр. 3.12. Она описывает общее число зафиксированных дефектов обоих типов. Пусть эта переменная имеет десять состояний: 0 — дефектов иет, 1 — один дефект, 9 — девять дефектов. Понятно, что это множество состояний можно рассматривать как полностью упорядоченное. а) Определите число элементов объединенной разрешающей решетки и число содержательных разрешающих форм в этой решетке. б) Приведите примеры по крайней мере трех полных путей в этой решетке от максимально уточненной до наиболее укрупненной разрешающей формы, в) Вычислите общее число содержательных упрощений, существующих для порождающей системы или для системы данных, основанных на этих двух переменных. 3.14. Пусть для каждого члена группы определены следующие три перемен- ных и соответственно три множества состояний: образование (переменная Е): 191
О — ниже средней школы, 1 — средняя школа, 2 — колледж, 3 — ученая степень; политическая принадлежность (переменная Р): д — демократ, р — республиканец, н — независимый; пол (переменная S): ж — женский, м — мужской. а) Определите решетку переменных (V-решетку) для данного примера. б) Примите решение, какими математическими свойствами (если они есть) должно обладать каждое множество состояний. в) Определите разрешающую решетку и ее подмножество содержательных разрешающих форм для каждого из множеств состояний. Полученный результат зависит, разумеется, от решений, принятых в б). г) Вычислите общее число содержательных упрощений, существующих для любой порождающей системы или системы данных, основанной иа этих трех переменных. 3.15. Повторите упр. 3.14 для систем, определеиниых табл. 3.1 и 3.2. 3.16. Пусть порождающая система состоит из трех наблюдаемых перемен- ных. Одна из них имеет шесть состояний, которые частично упорядочены. Пусть это упорядочение представляет собой следующий список непосредственных уточ- нений: 0^1, 0^2, 1^3, 1^4, 2^5, 3^4, 4^5. Множества состояний двух дру- гих переменных полностью упорядочены; они имеют соответственно семь и пять состояний. Определите общее число содержательных упрощений: а) основанных только на укрупнении разрешающей формы; б) включая те, что получены исключением некоторых переменных. 3.17. Выведите формулу (3.36) для числа содержательных подмасок наи- большей допустимой маски. 3.18. Дана наибольшая допустимая маска М, состоящая из п строк и ДМ столбцов. Выведите формулу для а) числа содержательных подмасок М, порождающая часть которых пред- ставляется самым правым столбцом М; б) числа содержательных подмасок М, содержащих п-\ k элементов, где 0<; (ДМ—1)п; в) числа содержательных компактных подмасок М; г) числа всех содержательных подмасок М, таких, что для определяемых ими систем с поведением существуют изоморфные ST-системы. 3.19. Докажите неравенства (3.38) для шенноновской энтропии н неравенства (3.58) для возможностной нечеткости. 3.20. Выведите формулы (3.102)—(3.104). 3.21. Вычислите числовые данные, приведенные на рис. 3.22 для примера 3.17. 192
Т а б л и ц а 3.7. К примерам 3.24—3.27 а) б) S1 Sj fs (0 31 Зз S3 /в(с) с = 0 0 0.05 с = 0 0 1 0.20 0 1 0.20 0 1 0 0.15 0 2 0.15 0 1 1 0.10 I 0 0.10 1 0 0 0.20 I 1 0.05 1 0 1 0.05 1 2 0.10 1 1 0 0.10 Л 0 0.25 1 1 1 0.20 2 2 0.10 3.22. Докажите следующую теорему: если /в (с) вычисляется по формуле (3.32), то V (i. g) + 1 2 Л g) + |G| ’ _ gee где N(g, gj=/V(c). 3.23. Рассмотрим порождающую систему, основанную на одной базовой пе- ременной и, имеющей порядковую шкалу значений и три состояния, помеченные целыми 0, 1, 2. Пусть, далее, это множество состояний {0, 1, 2} лниейно упо- рядочено, так же как упорядочены эти целые числа. Параметром является время (линейно упорядоченное). Система описывается вероятностной функцией пове- дения, приведенной в табл. 3.7,а, в которой выборочные переменные s1 и з2 опре- делены следующим образом: 31, t — Vt-t, Sz,t—Vt. Определите все содержательные упрощения, основанные на укрупнении разре- шающей формы, сделанные в предположении, что данное поведение будет исполь- зоваться для предсказания. Затем определите те из них, которые являются эле- ментами множества решений. 3.24. Порождающая система, основанная па одной базовой переменной а и линейно упорядоченном параметре t, описывается вероятностной функцией по- ведения, приведенной в табл. 3.7,6. Выборочные переменные sb s2, S3 определены следующим образом: Si, t=Vi, S2, i=a;+i, Зз. i=a<+2, Определите: а) восстановительную порождающую нечеткость этой системы; б) матричное представление восстановительной ST-формы, соответствующей данному поведению; в) матричное представление порождающей версии ST-формы, полученной в б); 13-6923 193
г) представление полученной в в) ST-формы в виде диаграммы. 3.25. Повторите упр. 2.24 для целей предсказания. 3.26. Оцените порождающую систему из примера 3.24 для всех содержа- тельных подмасок при условии, что она используется для предсказания, и опре- делите множество решений согласно двум критериям предпочтения: простоте, оцениваемой как размер маски, и порождающей нечеткости. Изобразите зависи- мость порождающей нечеткости от размера маски. 3.27. Повторите упр. 3.26 при условии, что система предназначается для восстановления. ГЛАВА 4. СТРУКТУРИРОВАННЫЕ СИСТЕМЫ Мир по большей части не делится для нас на системы, подсистемы, среду и т. д. Мы сами его так подразделяем, исходя из разных соображений, обычно сводящих- ся к одному общему: для удобства. Дж. Гоген, Ф. Варела 4.1. ЦЕЛОЕ И ЧАСТИ При установке порядка появились име- на. Поскольку возникли имена, нужно знать предел их употребления. Знание предела позволяет избавиться от опас- ности. Лао Цзы1 Определение порождающей системы (или множества подходя- щих порождающих систем), рассматриваемое в гл. 3, это теорети- чески только первый этап исследования систем. При введении бо- лее высоких эпистемологических уровней возникают новые проб- лемы. Данная глава посвящена задачам, связанным со структури- рованными системами. Структурированная система, если говорить в общих чертах, представляет собой набор исходных систем, систем данных или порождающих систем, имеющих общее параметрическое множество. Системы, образующие структурированную систему, обычно назы- ваются ее элементами. Некоторые переменные у них могут быть общими. Общие переменные обычно называются связывающими переменными. Они представляют взаимодействия между элемента- ми. Естественно называть эти три типа систем структурированны- 1 Дао Дэ Цзин. Древнекитайская философия: Пер. с кит., — М.: Мысль, 1972.—Т. 1.—С. 125.—Прим. ред. 194
ми исходными системами, структурированными системами данных и структурированными порождающими системами. Для некоторых задач удобно также выделить более частные типы структурирован- ных систем, например структурированные представляющие систе- мы, структурированные системы с поведением или структуриро- ванные ST-системы. Для заданной структурированной системы одного из этих ти- пов существует связанная с ней система, определяемая всеми пе- ременными, входящими в ее элементы. Эта система (предполага- ется, что она того же типа, что и элементы структурированной си- стемы) рассматривается как некая полная система, т. е. система, представляющая в виде некоторого целого все входящие перемен- ные. С этой точки зрения элементы любой структурированной си- стемы интерпретируются как подсистемы соответствующей полной системы, а полная система — как суперсистема этих элементов. При этом структурированные системы становятся, по существу, представлениями полных систем в виде различных подсистем. Статус системы как полной системы или подсистемы не явля- ется, разумеется, абсолютным. Например, некая система с поведе- нием в одном контексте может рассматриваться как элемент структурированной системы (и, следовательно, как подсистема полной системы с поведением), а в другом — может рассматри- ваться как полная система, подсистемы которой образуют струк- турированную систему. Любая исходная система, система данных или порождающая система существует как бы в двух «лицах». В одном контексте она имеет статус подсистемы, а в другом — статус суперсистемы. Можно, таким образом, говорить не только о том, что «часть — это амплуа целого» (как предлагает Р. Глен- вилл), но и о том, что целое—это ампула части. Подобная двойст- венность дает возможность представить любую полную систему как иерархию структурированных систем, т. е. как структурирован- ную систему, элементами которой являются структурированные си- стемы, элементами которой также являются... и т. д. вплоть до элементов, состоящих из отдельных переменных. Природа этой иерархичности хорошо описана в работе [127]: На заданном уровне иерархии конкретная система может рассматриваться и как внешняя (для систем расположенных ниже ее), и как внутренняя (для си- стем, расположенных выше); таким образом, статус (т. е. отличительный знак) данной системы меняется при переходе через ее уровень вверх или вниз. Выбор более высокого нли более низкого уровня рассмотрения связан с тем, интерпре- тирутся данная система как автономная илн управляемая (ограниченная). Зачем нужно представлять полную систему как совокупность ее подсистем? Причин несколько. Одна из них связана с наблю- дением или измерением. Если в параметры входит время, то часто бывает технически невозможно или, по крайней мере, неразумно одновременно наблюдать (измерять) все переменные, имеющие от- 13* 195
ю'° ю9 § 10s § ю7 В ’0В £ ю9 I и4 | 103 10г 10 “23456789 10 Чисм переменнь.х, п Рис. 4.1. Емкость памяти ЭВМ, иеобходимая для представле- ния полной системы и соответ- ствующей структурированной системы (fe=10) ношения к цели исследования. В этом случае можно собрать данные только частично, для наибольшего возможно- го подмножества переменных. В дру- гих случаях исследователь вынужден использовать чужие данные, собран- ные различными организациями или последователями для собственных нужд и покрывающие только часть переменных, необходимых ему для ра- боты. Другой причиной структурирования систем является сложность, которая в свою очередь, связана, е обозри- мостью рассматриваемой системы. Одной из характеристик системы явля- ется объем памяти компьютера (необ- ходимый для хранения системы. Рас- смотрим, например, п переменных с k состояниями каждая. При работе с полной системой этих переменных для запоминания ее состояния нужно располагать nkn ячейками памяти, если хранить в ячейке по одному из k состояний. Кроме того, если использовать струк- турированную систему, состоящую из всех подсистем с двумя пе- ременными, то для той же цели понадобится только k2n(n—1) яче- ек памяти. С ростом значений k и п это число, как показано на рис. 4.1 для £=10, растет значительно медленнее, чем nkn. Если же структурированная система содержит только некоторые из двух переменных систем, это сравнение будет еще более разительным. Несмотря на то, что при малых п и k структурированные системы могут потребовать большего объема памяти, чем соответствующие полные системы, ясно, что в основном для важных практических случаев, особенно при больших k и п, их требования к памяти су- щественно ниже. Другой аспект возможности обработки систем связан с числом систем, которые должны быть рассмотрены в некоторых задачах Для сравнения чисел полных и структурированных систем опреде- ленного типа снова рассмотрим п переменных с k состояниями. Кроме того, будем отличать, является ли любое состояние системы возможным. Тогда имеется 2A” возможных полных систем, п (п—1)2**-1 возможных структурированных систем, состоящих только из бинарных (состоящих из двух переменных) подсистем, и п2к* возможных структурированных подсистем, состоящих только из п бинарных подсистем. Несмотря на то, что все эти чис- ла достаточно велики, чтобы можно было бы говорить о полном переборе вариантов даже для небольших п и £, число структури- 196
рованиых систем (в обоих случаях) растет заметно медленнее, чем число возможных полных систем. Например, при л=10 и fe=2 структурированных систем, содержащих все бинарные подсистемы, 720, а возможных полных систем 10308 (т. е. находится за пределом Бремерманна, рассматриваемом в разд. 6.4). Таким образом, в об- щем случае легче осуществлять поиск на множестве всех возмож- ных структурированных систем определенного типа, чем на множе- стве всех возможных полных систем, хотя и в том, и другом слу- чае часто бывают неизбежны некоторые ограничения. Имеется много соображений в пользу применения структури- рованных систем в технике. Некоторые из них связаны с обозри- мостью процесса проектирования. Основные из этих соображений уже обсуждались. Другие связаны с наличием ограниченного на- бора подходящих готовых элементов (модулей), с эффективностью реализации, а также с различными вопросами надежности, прове- ряемости и ремонтопригодности проектируемой системы. Практические соображения, связанные с обозримостью задачи, эффективностью, ремонтопригодностью и т. п., не единственные соображения, по которым желательно использовать структуриро- ванные системы. В исследовании систем структурированные систе- мы имеют более фундаментальное значение. Соответствующим об- разом обоснованная структурированная система дает исследовате- лям сведения, не содержащиеся, по крайней мере явно, в соответ- ствующей полной системе. Эти дополнительные сведения могут по- мочь ответить на определенные вопросы, возникающие в процессе исследования, помочь лучше разобраться в задаче. Со структурированными системами связана одна из самых спорных философских проблем — проблема взаимоотношения меж- ду целым и частями. Эта проблема рассматривается не только в древнегреческой философии, но и в значительно более древней китайской философии, в частности в книге И Цзин 1 и более позд- них работах. Это хорошо описывается в статье А. Бама [31]. Нет проблемы более важной для понимания природы существо- вания, знания, ценностей или логики, чем проблема природы це- лого и его частей и их взаимоотношений. Совершенно ясно, когда мы говорим «часть», то имеем в виду «часть цело- го», а нод «целым» подразумеваем «целое, состоящее из частей». В этом смысле нет частей, не являющихся частями целого, и нет целого, не состоящего из ча- стей. Целое и части взаимосвязаны; каждое понятие зависит от того, что пред- ставляет собой другое и в то же время одно не есть другое. Часть целого ие есть целое, а целое, состоящее из частей не является ии одной из своих частей. Однако проблемы в понимании того, как соотносятся друг с другом целое и части, приводят к появлению теорий, по-видимому, отрицающих или, по крайней мере, модифицирующих первоначально ясные понятия. Некоторые трудности воз- 1 И Цзин. Книга перемен — одна из пяти книг, входящих в конфуцианский канон. — Прим. ред. 197
никают также из-за того, что существуют разные типы целого и разные отноше- ния часть-целое. Гоген и Варела предлагают четыре альтернативных критерия оценки целостности системы [127]: Интересно посмотреть, как можно оценить степень целостности системы. Всег- да, разумеется, можно нечто выделить и назвать «системой», но это нечто не всегда окажется тождественным понятием «цельная система», «естественное един- ство», «связанный объект» или «понятие». Что же делает одни системы более связными, более естественными, более «цельными», чем другие? ... Согласно одному подходу, полнота — это способность к соответствующему отображению существенных новых свойств... С другой точки зрения полнота измеряется сте- пенью сложности сокращения системы... Третий подход состоит в том, что си- стема считается настолько полной, насколько ее части взаимосвязаны, т. е. на- сколько трудно найти относительно независимые подсистемы... Согласно чертвер- тому подходу система тем полнее, чем она сложнее, т. е. чем труднее свести ее к описаниям взаимосвязей компонентов более низкого уровня. Философская контроверза «часть-целое» нашла свое отражение в противопоставлении двух научных методологий — редукциониз- ма и холизма (от греческого holos, что значит целый). Редукцио- низм опирается на следующий тезис: свойства целого объяснимы через свойства составляющих его элементов. Холизм же отрицает этот тезис и утверждает, что нельзя без потерь анализировать це- лое с точки зрения его частей. Это утверждение часто формулиру- ется в виде известного высказывания «целое больше суммы со- ставляющих его частей», настоящий автор которого, вероятно, останется неизвестным. В схеме УРСЗ дихотомия целого и частей выражается двойст- венной ролью исходных систем, систем данных и порождающих систем, являющихся одновременно и суперсистемами и подсисте- мами. Различные вопросы, связанные с взаимоотношением целого и частей, которые часто бывают окружены некой таинственностью, могут быть па самом деле четко сформулированы в виде системных задач и изучаться соответствующим образом. При этом две мето- дологические доктрины оказываются взаимодополняющими, что хорошо сформулировано в работе [127]: В большинстве исследований холизм и редукционизм занимают полярные по- зиции. Это, вероятно, является следствием исторически сложившегося размеже- вания между эмпирическими науками, по большей части редукциональными и аналитическими, и европейскими школами философии и общественных наук, пы- тающимися нащупать динамику общностей. Обе эти позиции вполне допустимы па определенном уровне описания и, по существу, дополняют друг друга. С одной стороны, можно спуститься на более низкий уровень и изучать свойства компоиеитов, не принимая во внимание их системные взаимосвязи. С другой стороны, можно, не обращая внимания на структуру компонентов, исследовать их поведение только с точки зрения их 198
вклада в поведение большей единицы. Оба направления анализа всегда, вероят- но, явно или неявно существуют, поскольку для наблюдателя оба эти уровня описаний взаимосвязаны. Невозможно представить себе компоненты, если нет системы, из которой они абстрагированы, и нет целого без составляющих его частей... Эти уровни описания по большей части не представляются явно как взаимо- дополняющие в основном из-за того, что в большинстве областей современной науки существует различие между описываемой методологией и практикой. По- зиция редукционалиста достаточно сильна, однако анализ системы не может быть начат без знания степени связности исследуемой системы; аналитик индук- тивно должен представлять себе, что он имеет дело а целостным явлением. Не- смотря на то, что официально наука стоит на позиции редукционализма, на прак- тике используются оба подхода. Нельзя быть чистым холистом или редукциона- листом: эти точки зрения на системы являются взаимодополняющими... Редук- ционализм занимается более низким уровнем, а холизм — более высоким. В лю- бом достаточно полном описании они переплетены, и каждый подход имеет свои достоинства н недостатки. Более коротко и образно мысль о том, что в зависимости от цели исследования систем нужно быть готовым работать как с целым, так и с частями, выражена в работе [300]: Я за тонкое балансирование между частями и целым. Нельзя находиться ни в одной из крайностей. Это балансирование должно продолжаться бесконечно. Со структурированными системами связаны некоторые наибо- лее важные типы системных задач. Это типы задач, имеющие в основном операционные формулировки на языке УРСЗ, и свя- занные с вопросами взаимоотношений между целым и частями. Некоторые из них относятся к исследованию, а некоторые к проек- тированию систем: одни возникли из практики, другие имеют тео- ретическое значение или затрагивают определенные философские вопросы. В этой главе определяются структурированные системы различных типов и рассматриваются некоторые связанные с ними ключевые задачи. 4.2. СИСТЕМЫ, ПОДСИСТЕМЫ, СУПЕРСИСТЕМЫ Мы думаем одновременно о целом и ча- сти только тогда, когда думаем о взаи- моотношении между ними, вместо того, чтобы думать о самих вещах. Амос И Цяо Шан В гл. 2 и 3 были определены различные системы трех эписте- мологических уровней. Для двух заданных систем одного из этих типов часто бывает нужно определить, соотносятся ли эти системы как часть и целое. Однако для того, чтобы это можно было сде- 199
лать, в схеме УРСЗ необходимо определить некий конкретный смысл отношения часть-целое, что должно достаточно хорошо от- ражать общепринятое понимание этого отношения. Это, в свою очередь, означает, что в формализме УРСЗ на отношение часть- целое должны быть наложены некоторые условия, с помощью ко- торых общепринятое понимание адекватно описывалось бы на язы- ке УРСЗ. Одной очевидной особенностью отношения часть-целое является то, что при рассмотрении целое и часть сопоставлены, т. е. они являются понятиями одного типа. Отсюда следует требование, что- бы системы, связанные отношением часть-целое, также были со- вместимы. Ясно, что для того, чтобы системы были совместимы, необходимо, чтобы они были одного типа. Кроме того, здравый смысл подсказывает, что эти системы должны быть определены на одном и том же полном параметрическом множестве.. Совместимость систем является необходимым условием того, что системы связаны отношением часть-целое, но недостаточным. Если есть две совместные системы, скажем системы х и у, то в со- ответствии со здравым смыслом х воспринимается как часть у только тогда, когда х полностью включается в у неким соответ- ствующим образом, определяемым типом этих систем. Требования совместимости и включенности, видимо, адекватно описывают самую суть отношения часть-целое. Чтобы как можно более общим образом определить смысл этого отношения никаких добавочных требований не нужно. Остается, разумеется, определить отношение часть-целое для исходных систем, систем данных и по- рождающих систем так, чтобы оба этих требования выполнялись. Введем сначала соответствующую терминологию и обозначе- ния. Пусть система х рассматривается как часть системы у. Будем х называть подсистемой у, а у — суперсистемой х. Формально бу- дем обозначать, что х является подсистемой у (а у — суперсисте- мой для х), следующим образом: х<у. Пусть теперь *S и yS— исходные системы. Для определения отношения «подсистема» (и обратного отношения «суперсистема») необходимо выполнить условие совместимости исходных систем. Это значит, что они должны быть одного методологического типа (т. е. иметь одни и те же методологические отличия) и должны быть определены для одних и тех же параметров, как и для соот- ветствующих баз. Требование включенности для исходных систем выражается в виде нескольких отношений включения: *S рассматривается как исходная подсистема »S (предполагается, что *S и »S— сравни- мые исходные системы) тогда и только тогда, когда множества переменных (и обобщенных, и конкретных) и множество свойств системы *S являются подмножествами соответствующих множеств системы »S и, соответственно, множества состояний и проявлений 200
свойств, а также множества наблюдений и каналы конкретизации системы *S являются подмножествами соответствующих систем »S. Данный набор отношений включения, которые должны выпол- няться, чтобы выполнилось отношение «подсистема», удобно пред- ставить через отношения одного индексного множества. Элементы этого множества идентифицируют отдельные сущности разных множеств (переменные, свойства, каналы), причем предполагается, что соответствующие друг другу обобщенные переменные, конкрет- ные переменные и свойства помечаются одним и тем же элемен- том индексного множества (так же, как в формальном определе- нии исходных систем в гл. 2). Пусть переменные, свойства и дру- гие характеристики систем *S, J'S помечены (идентифицированы) соответственно индексными множествами V, »/. Тогда отношение *S— подсистема J'S «полностью» описывается отношением вклю- чения х1<^у1 для их индексных множеств. Обычно считается, что Пример 4.1. Пусть ]S — исходная система из примера 2.3 (со- стояние деловой древесины). Тогда lJ=N7. Пусть 2S — исходная система, определенная как подсистема 1S(2S<(IS) с помощью ин- дексного множества 2/= {1, 2, 3, 7}. Тогда 2S будет состоять из всех элементов, входящих в ]S, за исключением Vi, Vt, Vi, Vi, ait Ai, Oi, 6i при i=4, 5, 6. Д Для направленных исходных систем отношение «подсисте- ма» находит отражение и в соответствующих идентификаторах входов-выходов. Пусть *S, J'S — направленные исходные системы, такие, что XS<(!'S, и пусть *u=(*u(j) yu=(yu(j) \j&J) — идентификаторы их входов-выходов. Тогда xu(j)=yu(j) для всех j&J. Для отслеживания значений, свя- занных с отдельными компонентами *11 и уц, удобно считать, что для любого идентификатора входа-выхода элементы «(/) упорядо- чены в порядке возрастания значений /. ▲ Определенное для исходных систем отношение «подсистема» легко может быть распространено на системы данных. Понятно, что для двух сравнимых систем данных *D, ^D, которым соответ- ствуют исходные системы *S, J'S, *D является подсистемой данных yD, т. е. *D<yD, тогда и только тогда, когда ZS^»S и *D содержит только данные, содержащиеся в J'D и относящиеся к переменным, входящим в ZS. Существенно, чтобы массивы данных были поме- чены таким образом, чтобы для каждого элемента можно было 201
однозначно определить, к какой конкретной переменной он отно- сится. Пример 4.2. Обозначим через !D(!S, >d) и 2D=(2S, 2d) систему данных ’D из примера 2.6 (блюз) и подсистему *D исход- ная система которой определяется индексным множеством {1, 2} (т. е. рассматриваются только высота тона и ритм, но не гармо- ния). Тогда 2S будет содержать все компоненты ’S, за исключе- нием из, Уз, Уз. ^з, Дз, ^з, Оз, оз, и матрицу, изображенную на рис. 2.8, но без третьей строки. Д Теперь остается только определить отношение «подсистема» для двух вариантов порождающих систем — систем с поведением и ST-систем. Пусть xFb=(xS, хМ, xfB), «FB= (yS, уМ, yfB) — сравнимые системы с поведением и пусть XI, yJ — множества идентификаторов переменных, соответствующих исходных систем *S, yS. Тогда *Fb является подсистемой системы с поведением уРв, т. е. *f -гуу гв 1 в тогда и только тогда, когда выполнены следующие три условия: 1) XJ с.у], так что XS <SS; 2) хМс.уМ, так что (оь Г}}^.ХМ тогда и только тогда, когд vlt г})(^уМ и 3) xfe= [yfelxKJ, где x/( — множество идентификаторов выбо- рочных переменных, соответствующих ХМ, т. е. xfB является про- екцией 1 yfB для выборочных переменных системы XFS. Чтобы система xFs=(xS, ХМ, xfs) являлась ST-подсистемой сравнимой ST-системы 4/Fs=(^S, ум, yfs), необходимо, чтобы были выполнены условия 1, 2, а вместо условия 3 должно быть выполнено немного измененное условие 4) где РМ*№]ес, с') = a ({yfs(ус, »с') |*с>*с, ус')>хс'}); где а, как и в разд. 3.6, некая агрегирующая функция, определяемая типом функции yfs (т. е. для вероятностных систем это сумма, а для возможностных систем — минимум). ▲ Пример 4.3. Рассмотрим отношение подсистема-суперсистема для двух систем с поведением, изображенных на рис. 4.2. Обе си- 1 Операция проецирования определяется и поясняется в разд. 3. 6. 202
Система с поведением' Ffl *1: Переменные с ддумя состояниями Полностью упорядоченное параметрическое множестдо Т Система с подедением zFg 21: Переменные с двумя . состояниями vt, гл4 Полностью упорядоченное параметрическое множестдо Т 2М: р v, S/ So Ss Ss Si Sz Ss № 'с-0 0 0 0 0 0 0.20 2C=0 0 0 0.30 0 0 0 0 7 0 0.05 0 1 0 0.05 о 0 1 1 0 0 0.05 1 1 0 0.35 0 1 0 0 0 0 005 1 1 1 0.30 / 1 0 0 1 0 0.10 1 1 1 0 0 0 0.05 Подсистема системы F5 1 1 1 0 1 0 0.05 1 1 7 7 0 0 0.10' 1-г, 1 1 1 1 7 0 0.05 tB< *8 1 1 1 1 1 1 0.30 Суперсистема2^ Рис. 4.2. Пример отношения подсистема с поведением/суперсистема с поведением (пример 4.3) стемы определены на одном и том же полностью упорядоченном параметрическом множестве. Их представляющие системы Ч, 21 содержат соответственно переменные Vi, v2, v3, и4 и и4, каждая из которых имеет два состояния. Им может быть дана некоторая интерпретация (каналы конкретизации и наблюдения), однако в данном примере эта интерпретация несущественна. Функциями поведения систем являются распределения вероятностей. Система 2FB удовлетворяет трем условиям, определяющим, что 2FS являет- ся подсистемой системы 'Fb, т. е. 2Fs<'Fb. Поскольку эти системы вероятностные, то при проецировании 2, 6}] в качестве агрегирующей функции используется сумма. Например, значение для 2/в(000) получается суммированием первых трех вероятностей из таблицы для Понятия подсистемы с поведением и ST-подсистемы достаточно легко распространить и на другие типы порождающих систем (по- рождающие системы с поведением, направленные системы с пове- 203
дением и т. д.). Нужно только подходящим образом идентифици- ровать порождающие, порождаемые и входные переменные для обеих рассматриваемых систем. 4.3. СТРУКТУРИРОВАННЫЕ ИСХОДНЫЕ СИСТЕМЫ И СТРУКТУРИРОВАННЫЕ СИСТЕМЫ ДАННЫХ Возвращаясь к общей проблеме целого и его частей, необходимо признать, что сложность, а следовательно и богатство идей, связанных с этой проблемой, про- истекает, по крайней мере, отчасти из-за того, что одна и та же система может быть разбита на части многими спосо- бами. С. Ватанабе Как уже указывалось выше, структурированные системы — это множества исходных систем, систем данных или порождающих си- стем. Они нужны для объединения нескольких систем в большие. Для того чтобы такое объединение было осмысленным, необходи- мо, чтобы отдельные системы — элементы структурированной си- стемы, были совместимы, т. е. были одного типа и определены на одном и том же параметрическом множестве. По существу, это то же условие совместимости, выполнение которого требуется для от- ношения «подсистема» (разд. 4.2). Кроме условия совместимости нужно еще потребовать, чтобы никакой элемент не был подсистемой другого элемента той же структурированной системы. Выполнение этого требования позволя- ет избежать перемешивания уровней отдельных структурирован- ных систем для того, чтобы они были иерархически упорядочены, как об этом говорится в разд. 4.1. Более того, в структурирован- ной системе подсистемы, состоящие из любых элементов, полно- стью избыточны в том смысле, что любая содержащаяся в них ин- формация также может быть выведена из элементов их суперси- стем. Таким образом, в структурированных системах они беспо- лезны. Назовем это требование требованием неизбыточности. Избыточные элементы часто используются в технических систе- мах для обнаружения и коррекции ошибок. Как показано в разд. 4.4 (пример 4.8), требование неизбыточности никоим образом не исключает из рассмотрения системы такого типа. Для формального определения структурированных систем пред- положим, что нейтральная структурированная система состоит из q элементов (нейтральных систем того же типа), удовлетворяю- щих требованиям совместимости и неизбыточности. Элементы 204
идентифицируются индексом х, где xeNq. Пусть, кроме того, JZ={t>(|teWn} (4.1) является множеством всех переменных, входящих в элементы си- стемы, и пусть ХУ— множество переменных элементов х (x^Nq). Тогда Будем для удобства обозначений переменные из множеств XV идентифицировать с помощью того же индекса i, что и перемен- ные из полного множества V, определенного в (4.1). Тогда любой элемент однозначно идентифицируется множеством своих перемен- ных XV. Различные типы структурированных систем будем обозначать стандартным для этого типа символом с префиксом S. Так, через SS, SD, SFs, SFs обозначены структурированные системы, эле- ментами которых являются соответственно нейтральные исходные системы, направленные системы данных, нейтральные системы с поведением и направленные порождающие ST-системы. Таким образом, префикс S используется как оператор, показывающий, что несколько систем определенного типа объединено в большую систему. Элементами структурированных систем простейшего типа явля- ются нейтральные исходные системы. Системы этого типа опреде- ляются как множество SS={(*V, *S)|xetfJ, (4.3) где *S для каждого x^Nq — нейтральная исходная система (эле- мент SS); через ХУ обозначено множество переменных, входящих в *S; это обозначение удобно использовать как идентификатор элементов структурированной системы. Разумеется, исходные си- стемы *S из (4.3) должны удовлетворять требованиям совмести- мости и неизбыточности, но только этим требованиям. Если два элемента SS, скажем элементы, идентифицированные как х, y=Nq, имеют общие переменные, т. е. xVQ^^0f (4.4) то эти элементы соединены. Будем это множество общих перемен- ных называть соединением элементов х и у, а переменные из этого множества — соединяющими переменными. Соединения — это важ- ные характеристики структурированных систем, так как онн опре- деляют взаимодействия между их элементами. Понятно, что для нейтральных структурированных систем соединения симметричны, т. е. не зависят от порядка, в котором рассматриваются элементы. Для удобства соединение между нейтральными элементами х и у 205
Рис. 4.3. Части розового куста, явля- ющиеся элементами структурирован- ной системы, определенной в приме- ре 4.4 структурированной системы бу- дем обозначать как Cx.y^V(]yV. (4.5) Пример 4.4. Рассмотрим с точки зрения садовника структу- рированную исходную систему, определенную для розового куста в горшке. Эта система задается для того, чтобы определить пути повышения ежегодного урожая. Все переменные этой системы имеют два одинаковых парамет- ра: группу изучаемых розовых ку- стов и время. На самом деле па- раллельно исследуется несколько групп, причем каждая характе- ризуется определенными свойст- вами, такими, как тип почвы, удоб- рения и заболевания растения, ча- стота срезания цветов и т. д. Не- обходимо, чтобы наблюдения де- лались для каждого члена группы раз в два дня в течение одного года; если нужно, то исследование может быть продлено еще на несколько лет. В объекте исследования — розовом кусте в горшке — можно выделить шесть частей: почва, корни, стебель, сок растения, листья и цветы (см. рис. 4.3). Исходная система определена для каждой из этих частей через следующий набор из 19 переменных (для простоты мы опускаем описание наблюдений и каналов конкрети- зации) : (влажность почвы) —низкая, средняя, высокая; V2 (способность корней поглощать влагу) — низкая, средняя, высокая; Оз (способность корней поглощать минеральные вещества) — низкая,средняя, высокая; и4 (способность стебля переносить сок) — хорошо, плохо; t>5 (частота расположения цветов на стебле) — малая, сред- няя, большая; и6 (частота расположения листьев на стебле) — малая, сред- няя, большая; V7 (характеристики цвета сока) — плохие, средние, хорошие; t>8 (характеристики запаха сока) — плохие, средние, хорошие; Vg (характеристики выработки сока) — плохие, средние, хоро- шие; 206
t>io (количество листьев) — небольшое, нормальное, избыточ- ное; ин (цвет листьев) —плохой, хороший; U12 (развитие листьев) —задержанное, нормальное; и13 (окраска цветка) — бледная, обычная, интенсивная; и14 (запах цветка)—слабый, обычный, интенсивный; t>i5 (размер цветка)—небольшой, нормальный, огромный; Vie (количество цветов) — небольшое, большое, огромное; On (температура воздуха по Фаренгейту) — ниже 60, 60—69, 70—79, 80—89, 90° и выше; и18 (осадки) —ниже нормы, норма, выше нормы; t>19 (среднее число солнечных часов за день) —меньше 3, 3—6, больше 6. Шесть элементов структурированной системы определяются сле- дующими подмножествами полного множества переменных: Х=1 (пОЧВа) —О), 017, У1в; х=2 (корни) —О], о2, о3; х=3 (стебли) —о2, v3, о4, v5, v6, щ7, v}9; Х—4 (СОК) — О2, Оз, О4, О7, О8, О9, On, У19’, Х=5 (листья) —Об, Ою, Он, 012, 017, О18, О19; х=6 (цветы) — о5, Oj3, oI4, vi5, oi6, vi7, о18, oj9. Соединения отдельных элементов легко получить, взяв пересечения этих множеств. Например, С1,2={0]}, С2>5=0 , С3,4= {о2, Оз, О4, Ой, О1э} и т. д. Определим структурированную систему SS, элементами которой являются направленные исходные системы, как множество SS={(*X, XY, *S) |хе=ЛМ, (4.6)] где хХ, XY— множества входных и выходных элементов соответ- ственно. Понятно, что (4.7)’ Если не считать выделения входных и выходных переменных, то множество (4.6) совершенно аналогично определенному формулой (4.3) множеству для нейтральных структурированных систем SS. Однако элементы *S любой направленной структурированной си- стемы SS должны удовлетворять еще одному требованию, связан- ному с идентификаторами входов-выходов: ни одна из переменных из множества V, определенного уравнения (4.2), не может быть объявлена как выходная более чем для одного элемента. Это тре- бование обеспечивает согласованность состояний всех переменных при любом значении параметра. В самом деле, если переменная 207
объявлена как выходная для более чем одного элемента структу- рированной системы, то ее состояния будут определяться (контро- лироваться) при любом значении параметра всеми этими элемен- тами, что, как правило, будет приводить к несогласованности (к заданию нескольких различных состояний переменной при од- ном и том же значении параметра). Избежать этой несогласован- ности можно только тогда, когда все элементы влияют на эту пе- ременную одинаково, что является исключительным, очень редким случаем. При этом, однако, ничто не будет потеряно, если потре- бовать, чтобы только один из этих элементов (любой) был объяв- лен управляющим этой переменной элементом. Это требование, которое должно выполняться для всех направленных структури- рованных систем, назовем требованием однозначности управления. Классификация переменных каждого элемента направленной системы на входные и выходные и требование однозначности уп- равления имеют важные следствия для понятия соединения эле- ментов. Для двух заданных элементов х, у направленной структу- рированной системы можно определить два направленных соеди- нения. Одно из этих соединений, ведущее из х в у, обозначается Сх,у и определяется как Сх,у=хУ[}уХ. (4.8) Второе ведет из у в х, обозначается Сх,у и определяется как Сх^УЛ*Х. (4.9) Поскольку для х=£у (из-за требования однозначности управления), понятно, что Сх,у^Су>х (4.10) для разных элементов х, у. Кроме соединений элементов направленной структурированной системы, имеются также соединения элементов со средой системы. Будем для удобства рассматривать среду как отдельный элемент с уникальной меткой х=0. Несмотря на то, что на самом деле сре- да не является элементом структурированной системы [как это следует из (4.6)], такой подход позволяет нам определить на- правленные соединения С0,х и Сх.о (xettq) среды с элементами структурированной системы точно так же, как и соединения эле- ментов. Д Если переменная объявлена выходной переменной некоего элемента х направленной структурированной системы, то эта пе- ременная не управляется средой (из-за требования однозначности управления) и, следовательно, не входит ни в какое соединение С0,х. Однако если некая переменная не объявлена как выходная ни для какого элемента, то остается только рассматривать ее как переменную, управляемую средой. Следовательно, такая перемен- ная должна быть включена в некое соединение Со<х. Поэтому все 208
переменные в любом хХ, не объявленные ни в каких элементах как выходные, образуют соединение среды с элементом х. Фор- мально Co,. = *Xn(V-U yY) (4.11) для любого X^Nq. Для описания соединений Сх<0 (x^Nq) рассмотрим переменные из множества XY, не объявленные как входные ни для какого эле- мента направленной структурированной системы. По определению, эти переменные не входят ни в какие соединения элементов струк- турированной системы. Таким образом, их надо рассматривать как соединения со средой, т. е. как входящие в соединение Сх<0. Остальные переменные также могут быть включены в Cx,q. Вопрос о том, рассматривать ли их как соединения со средой или нет, остается в компетенции пользования. Формально *rn(V-U yX)QCx,0QxY (4.12) H^q ДЛЯ любого X^Nq. ▲ Пример 4.5. Определим направленную структурированную си- стему, состоящую из пяти исходных систем. Система предназначе- на для изучения деятельности высших судебных инстанций шт. Нью-Йорк (США) по делам, рассматриваемым в уголовном суде. Система описывает прохождение дела через уголовный суд и суды высших инстанций, утверждающие приговор. Эта система определяет структуру сбора и обработки данных. Параметром в системе является время. В зависимости от кон- кретных целей наблюдения делаются ежемесячно, еженедельно или даже каждый день, начиная с некоторой фиксированной даты, скажем с 1 января 1970 г. В систему включены следующие пере- менные (множество V): — общее число исков, поступивших в уголовный суд (в те- чение конкретного периода наблюдения — месяц, неделя или день); V2 — число исков, прекращенных в результате соглашения сто- рон; из — число отклоненных исков; и4 — число задержанных дел; V5 — число дел, по которым вынесены оправдательные приго- воры; Уб — число дел, переданных на утверждение высших инстан- ций; vj — число дел, не переданных на утверждение (это дела, в ко- торых единственным наказанием является штраф или возмещение убытков); 14—6923 209
Vi—число дел, в которых нарушены условия утверждения; ид — число дел, приговоры по которым отмечены судом высшей инстанции; uio — число дел, приговоры по которым отмечены учреждениями уголовного суда. Рассматриваемая структурированная система состоит из пяти элементов (рис. 4.4). Их множества входных и выходных пере- менных приведены в табл. 4.1 Прямоугольниками, которым даны условные названия, на схеме показаны элементы структурирован- ной системы и ее среды. Связи между блоками представляют пе- ременные, соединяющие элемнты (а также среду). Полное мно- жество соединений CXtU (х, r/=0, 1, ..., q) представлено матрицей (табл. 4.2), обычно называемой матрицей соединений. Аналогично структурирован- ным исходным системам опреде- ляются и струтурированные си- стемы данных; SD={(XK *D)|xe^}, (4.13) SD={(xX, XY, XD) (4-14) Таблица 4.1. Определение элементов направленной структурированной системы из примера 4.5 (эквивалентно схеме на рис 4.4) Рис. 4.4. Схема структурированной системы из примера 4.5 X ХХ 1 {‘’2.t’3} 2 { 1’2 } {»«, *>s} 3 {С4. с,} {^6, м 4 {М { V8i v9 } 5 {г3, f5, г7, i;9} {t’lO } Та б л и ц а 4.2. Матрица соединений структурированной системы, описанной в примере 4.5 Q, 0 I 2 3 4 5 0 0 {fl} 0 0 0 0 1 0 0 {»2 } 0 0 {»>} 2 0 0 0 {f*} 0 {fsj 3 0 0 0 0 {f«} {M 4 0 0 0 {fe} 0 {f<>} 5 { •’l 0 } 0 0 0 0 0 210
Поскольку любая система данных содержит исходную систему, структурированные системы данных должны удовлетворять всем условиям, которым должны удовлетворять исходные системы (со- вместимости, неизбыточности, однозначности управления). Кроме того, обычно требуется, чтобы они удовлетворяли локальной со- гласованности данных, определяемой следующим образом: для всякой соединяющей переменной соответствующие ей данные должны быть одинаковыми во всех элементах, в которые входит эта переменная. А Формально, если Ui&Cx.y (ИЛИ Vi^Cx,y), то xVt'W = yVi!W для всех weW, где xvi:W и yVi,w (weW) —подмно- жества данных, соответствующих переменной и, в элементах х и У- А Обычно предполагается, что структурированные системы дан- ных локально согласованы. Однако если множества данных, свя- занных с разными элементами, собираются независимо друг от друга, например разными группами экспериментаторов, то полу- ченные множества данных могут и не удовлетворять требованию локальной согласованности данных. Нарушение этого условия ве- дет к аналогичным противоречиям и на более высоких эпистемо- логических уровнях, поэтому необходимо на некотором этапе исследования разрешить их. Процедуры разрешения локальных про- тиворечий до сих пор должным образом не разработаны. Пред- ставляется, однако, что в общем случае более удобно и осмыслен- но противоречия разрешаются на уровне структурированных по- рождающих систем (они вводятся в разд. 4.4), а не на уровне структурированных систем данных. Поэтому задача разрешения локальных противоречий рассматривается именно на уровне структурированных порождающих систем. 4.4. СТРУКТУРИРОВАННЫЕ СИСТЕМЫ С ПОВЕДЕНИЕМ У любой системы есть автор, и он пре- следует при изучении системы свои соб- ственные цели. В. фон Лукаду, К. Корнвакс Структурированные порождающие системы определяются в столь же общем виде, как и другие типы структурированых си- стем. Они также должны удовлетворять условиям совместимости и неизбыточности, которым должны удовлетворять исходные структурированные системы. Они также должны удовлетворять не- которым дополнительным требованиям относительно масок и функций поведения или ST-функций своих элементов. Тот факт, 14* 211
что множество выборочных переменных порождающей системы в общем случае больше множества переменных соответствующей исходной системы или системы данных, дает некоторые новые воз- можности для соединения порождающих систем в структурирован- ную систему. Как было показано в разд. 3.7, любая ST-система может быть преобразована в изоморфную систему с поведением. Поэтому бу- дет достаточно рассмотреть структурированные порождающие си- стемы в предположении, что их элементами являются системы с поведением, т. е. без потери общности рассмотреть только струк- турированные системы с поведением. Пусть нужно соединить заданное множество систем с поведе- нием в структурированную систему. Для каждой рассматриваемой системы с поведением, идентифицированной как элемент х (хе е^) структурированной системы, обозначим через XV и *S соот- ветственно множество переменных ее исходной системы и множе- ство ее выборочных переменных. Пусть у= и ХУ={^Н(=ЛГ1И}; (4.15) A&V t] s= и (4.16) Понятно, что VcS и *Vc:*S для всех x^Nq. (4.17) Для нейтрального варианта SFs структурированная система с поведением теперь может быть определена так: SFs={(*S, *Fs)|xeMJ. (4.18) Чтобы однозначно идентифицировать элементы х множествами XS, предположим, что выборочные переменные из всех множеств XS (x<^Nq) идентифицируются тем же индексом k, что использу- ется для идентификации переменных во всем множестве S [уравне- ние (4.61)]. Соединения Сх.у элементов х, y^.Nq структурирован- ной системы SFB определяются теперь как пересечения множеств выборочных переменных C^y=*Sn»S. (4.19) В представлении (4.18), которое не содержит никаких ограни- чений на порядок порождения и на результирующее разбиение пе- ременных из множеств XS (x^Nq) и S на порождающие и порож- даемые переменные, обычно требуется, чтобы для всех пар эле- ментов х, y^Nq выполнялось только одно дополнительное усло- вие, а именно следующее уравнение: (4.20) 212
Это условие обеспечивает то, что проекции функций поведения xfB, у}в для любой пары элементов из SFB равны относительно их общих переменных (соединяющих переменных). По существу, это требование сводится к требованию, чтобы переменные из разных элементов, считающихся (определяемых) одинаковыми, были дей- ствительно равны независимо от элементов, в которые они входят. Будем это требование называть локальной согласованностью по- ведения. Как уже говорилось, системы с поведением *FB, являющиеся элементами SFB, на практике часто определяются на локально не- согласованных множествах данных и, следовательно, не удовлет- воряют требованию локальной согласованности поведения. Для ра- боты с такими структурированными системами в различных проб- лемных контекстах, нужно сначала разрешить эти несогласованно- сти (см. разд. 4.11). В остальных разделах этой главы считается, что структурированные системы с поведением локально согласо- ваны. После определения порядка порождения для структурирован- ной системы с поведением SFe множество выборочных переменных S и SFs разбивается на порождающие и порождаемые перемен- ные, соответственно обозначаемые как SguSg. Полученная струк- турированная система должна удовлетворять требованию одно- значности управления. В данном случае это означает, что любая переменная из Sg должна порождаться одним и только одним эле- ментом структурированной системы. В свою очередь, это значит, что множества порождаемых переменных xSg (x^Ng), связанные с отдельными элементами структурированных систем, должны об- разовывать разбиение множества Sg. Взяв один определенный элемент х (x^N4) структурированной системы SFs, рассмотрим теперь множество переменных :(*snsa'-*sr. Это (с глобальной точки зрения) множество порождаемых пере- менных, соединенных с элементом х, но не порождаемых этим эле- ментом. Понятно, что с локальной точки зрения (отдельный эле- мент) это входные переменные, хотя с глобальной точки зрения (структурированная система) они являются порождаемыми пере- менными. Следовательно, сам элемент должен рассматриваться как направленная система, в то время как структурированная си- стема рассматривается как нейтральная в том смысле, что пере- менные множества не разбиты на входные и выходные. Это не значит, что в определении структурированных систем есть некото- рая несогласованность. Это просто следствие того, что для струк- турированных систем возможны два сосуществующих подхода — локальный (с точки зрения элементов систем) и глобальный (рас- сматривающий структурированную систему как целое). С локаль- ной точки зрения все элементы, с которыми связан некий элемент, 213
образуют его среду. Это нечто вроде внутренней среды, определен- ной только для структурированной системы. С глобальной точки зрения среда (или внешняя среда) не выделяется. Однако нам представляется, что в данном случае предпочтительнее рассматри- вать структурированную систему как направленную, у которой все переменные из множества V объявлены выходными. Теперь остается обсудить только роль множества порождаю- щих переменных *Sg для отдельных элементов структурированной системы, т. е. значение переменных из множеств Г) х$ Для всех л G Nq. Состояния этих переменных должны быть доступны данному элементу на каждом шаге процесса порождения, как того требует функция поведения. Они могут быть доступны или изнутри, т. е. выводиться обычным образом из предыдущих состояний, так же как предыдущие состояния порождаемых и входных переменных, или снаружи, т. е. через входные переменные, представляющие со- единения с другими элементами структурированной системы. Таким образом, эти переменные рассматриваются или как порождающие переменные, или как входные переменные элемента. Одну из этих альтернатив должен выбрать пользователь. В любом случае будем эти переменные обозначать *S~. Спецификация их действительной роли входит в определение системы с поведением, представляю- щей этот элемент, а также в определение направленных соедине- ний элементов. Итак, порождающие системы с поведением, объединяемые в структурированную систему, обычно должны рассматриваться как направленные системы. Поскольку такой подход возможен всегда, мы определяем SFGB = «Ч- XS” XpGB) I * G (4-21) понимая, что при этом не требуется никакого содержательного оп- ределения SFos. Под это определение подходит и особый (вырожденный) слу- чай, когда ни одна из переменных из V не объявляется как вход- ная. xSg и xSe — это соответственно порождаемые и входные пере- менные элементов х: XS- — это множество переменных, введенных и рассмотренных в предыдущем параграфе. В зависимости от то- го, какая из альтернатив выбрана, в это множество входят вход- ные или выходные переменные элемента. Как и в предшествующем определении структурированной исходной системы, предполагает- ся, что переменные из всех этих трех множеств и все элементы x^Nq идентифицируются индексом Ь, определенным в уравнении (4.16). Для любого x^Nq эти три множества образуют разбиение множества -*5. Кроме того, для некоторого y^Nq {0} переменные 214
из множества XSQ входят в соединения Сх,у, в то время как пере- менные из множества xSe входят только в соединения Су>х, пере- менные из *S- могут входить в соединения с любым направлени- ем или вовсе не входить в соединения. Будем структурированные системы вида (4.18) или (4.21) на- зывать соответственно структурированными системами с поведе- нием основного и порождающего типа. Понятно, что из структури- рованной системы с поведением основного типа может быть выве- дено семейство структурированных систем с поведением порождающего типа. Структурированные системы этого семейства отличаются одна от другой: 1) разбиением S на S- и Sg; 2) разбиением S- на xSg(x ^Nq); 3) использованием переменных из множеств xS-(x Разбиение 1 определяется разными порядками порождения для предсказания или восстановления. Разбиение 2 определяется пере- крытиями переменных из множества Sg с элементами структури- рованной системы. Говоря точнее, переменная из множества Se, входящая в один и только один элемент, очевидно, должна порож- даться этим элементом. С другой стороны, переменная, входящая в несколько элементов, может порождаться любым из этих эле- ментов, но только одним из них. Выбор этого элемента обычно осу- ществляется исходя из порождающей нечеткости (чем меньше по- лучающиеся порождающие нечеткости, тем предпочтительнее этот вариант), а также некоторыми вспомогательными критериями, определенными пользователем. Альтернативы типа 3) не влияют на порождающую нечеткость выбранной структурированной систе- мы. Они представляют собой просто варианты формального пред- ставления. Пользователю должна быть предоставлена возмож- ность повлиять на выбор представления; если представление ему безразлично, то нужно использовать один из вариантов по умол- чанию. Пример 4.6. Рассмотрим структурированную систему основного типа (4.18), состоящую из двух подсистем, базирующихся на од- ном и том же полностью упорядоченном параметрическом множе- стве. Каждый из элементов состоит из двух бинарных переменных, определяемых вероятностными функциями поведения. Маски *Л1 и 2М и функции поведения '/в и 2fe показаны соответственно на рис. 4.5,а и б. Ясно, что эта структурированная система удовлетворяет требованию неизбыточности. Она также локально согласована, как это показано на рис. 4.5,в. Полная маска, схема, а также две частичные маски приведены на рнс. 4.6,а. Остальные схемы и мас- ки на рис. 4.6 представляют собой характерные примеры некото- рых структурированных систем порождающего типа, которые мо- гут быть получены из этой системы основного типа. 215
Р = Элемент х=1 -1 0 элемент x.=Z 9- -1 0 и) Ч 1 2 - 6 И vz 3 4 1 ... 3 4 U3 5 f1 sz % % (а/ з3 % S5 se а б) = 0 0 0 0 0 0 1 1 1 1 0 0 0 1 1 1 0 0 1 1 SJ 0 0 1 0 1 1 0 0 1 0 1 1 0 1 1 0 9 1 1 0 1) 0.05 = 0.05 0.10 0.20 0.05 0.05 015 0.15 0.15 o.oS 0 0 0 0 0 0 1 1 1 1 1 1 0 0 0 1 1 1 0 0 0 0 1 1 0 1 1 0 0 1 0 0 1 1 1 1 0 0 1 0 1 0 0 1 0 1 0 1 0.05 0.10 0.10 1 0.05 0.20 0.05 0.05 0.10 0.10 0.05 0.05 0.10 8) 3"= 0 0 1 1 0 1 0 1 0.251 = 0.30 ( 0.30 (-- 0.151.= 0.05 + 0.20'! = 0.15+0.15) - 0.05 + 0.05 + 0.15 + 0.05) = 0.10 + 0.05) 0,251 = 0.05 + 010 + 0.10) 0.30 ( = 0.05 + 0.20 + 0.05) 0.301 = 0.05 5 0.10 + 0.10 + 0.05) 0.151 = 0.05 + 0.10) Рис. 4.5. К примеру 4.6 Для вычисления общего числа существенно отличных структу- рированных систем порождающего типа, которые можно получить из приведенной в этом примере системы основного типа, предполо- жим, что соединение со средой содержит все порождаемые пере- менные, равно как и все остальные переменные, рассматриваемые как соединяющие переменные. Тогда в этом примере имеются 24 порождающие системы для каждого из двух порождающих поряд- ков (предсказание, восстановление). Для целей предсказания они получаются комбинированием следующих вариантов для перемен- ных: две возможности для переменной $] и две для переменной $5 (они рассматриваются или как соединяющие, или нет); три возможности для переменной $3 (она или не рассматривается как соединяющая, или имеет одно из двух возможных направлений); два возможных направления для переменной s4. Если учитывать оба порядка порождения, то в данном примере существуют 48 воз- можных порождающих структурированных систем. Далее вариан- ты любой системы можно получить, по-разному определяя соеди- нения со средой. Из 48 вариантов пять, представляющих важнейшие варианты, показаны на рис. 4.6,6—4.6,е. Будем для удобства называть их си- 216
p = -7 0 a) g g Рис. 4.6. Основной тип структурированной системы с поведением и некоторые полученные системы порождающего типа (пример 4.6) стемами Ь, с, f. Первые четыре варианта (системы b — е) предназначены для предсказания, а последний вариант (система f) для восстановления. Структурированные системы b и с подобны в том смысле, что и в той и в другой системе выборочные переменные входят в разные соединения. Их роль отлична от роли переменных $з, s*. В систе- ме b переменная $4 порождается первым элементом lfe (на языке 217
функций поведения она однозначно определяется по приведенной на рис. 4.5,6), а переменные s3, $4 используются как входные пере- менные второго элемента. В системе с переменные s3, s4 играют противоположную роль. Для этих двух систем можно сравнить их порождающие нечеткости, связанные с переменной $4. Они равны 0,2427 для системы b и 0.6754 для системы с. (Вычисление порож- дающих нечеткостей, описанные в разд. 3.5, мы предоставляем выполнить читателю в качестве упражнения.) Таким образом, си- стема b является более предпочтительной, поскольку она порож- дает состояния переменной $4 с существенно меньшей нечеткостью, чем система с (порядка 36% нечеткости системы с) и, следова- тельно, является лучшим предиктором, чем система с. Система d похожа на систему с в том смысле, что они одина- ковым образом порождают переменную S4. Их отличие состоит в том, что переменные sb s3, s5 в качестве соединяющих перемен- ных играют разные роли, а также в формальном определении пер- вого элемента. Несмотря на эти отличия, по существу, системы с и d порождают данные одинаково. То же относится и к системе е. Ее единственное отличие от системы d состоит в том, что перемен- ная S3 используется как входная переменная для второго элемен- та, а не как порождающая переменная. Система f — это одна из 24 имеющихся в данном примере вос- станавливающих систем. Основной вопрос, связанный с выбором одного из этих вариантов, состоит в том, какой из двух элементов более предпочтителен для порождения переменной s3. Порождаю- щие нечеткости равны 0.8609 (для системы f) и 0.9559 (для си- стем, в которых s3 порождается вторым элементом). Несмотря на то, что порождение s3 первым элементом дает несколько меньшую нечеткость, разница значительно меньше, чем для случая пред- сказания. Пример 4.7. Продемонстрируем гибкость, имеющуюся в опре- делении структурированных систем. Предположим, что четыре разных изделия а, Ь, с и d производятся четырьмя разными под- разделениями фирмы. Допустим далее, что для произведения одной единицы продукции а требуется две единицы продукции b и три единицы продукции с; для произведения одной единицы продукции d требуется две единицы продукции а, одна единица продукции с и четыре едини- цы продукции Ь. Каждое подразделение ежедневно должно знать, сколько про- дукции ему необходимо произвести. Соответствующее количество продукции будем представлять переменными ра, рь, Рс Ра. Их зна- чения определяются заказом, наличием готового продукта и объ- емами этого продукта, необходимыми другим подразделениям для производства их собственных продуктов. Заказы будем представ- лять переменными оа, оь, ос оа, а объемы готовой продукции — 218
b t>a ' b °ь b oc b »d Pa Рь Pc Pd Рис. 4.7. Структурированная система (пример 4.7) переменными ia, 1ь, Ь, id. Эти объемы определяются значениями ра, рь, Pc, Pd. Будем переменные, связанные с одним подразделением (имею- щие одинаковые индексы), рассматривать как переменные, кото- рые образуют элемент структурированной системы. В их число входят и переменные ра, рь, Рс, Ра, определяющие объемы продук- ции данного подразделения, которые должны быть переданы дру- гим подразделениям. Таким образом, структурированная система состоит из четырех элементов, соединенных так, как это показано на рис. 4.7. Входные переменные любого элемента, представляю- щие сведения об объемах заказов и готовой продукции, а также потребности других подразделений определяются средой (отделом торговли и складом), а также другими производственными под- разделениями. Элементы представляют собой детерминированные направленные системы с поведением (без памяти), а параметром является время. Определим функции поведения элементов следу- ющими простыми уравнениями: а{в: Ра~оа—1я-[-'2ра, bfB: pb=ob—ift+2pa+4pd, cfB , Pc=Oc—lc+2Pa+Pd, dfe : Pd—Oa—la. Пример 4.8. На этом примере будет показано, что требование неизбыточности структурированных систем не противоречит тому, что в технике (в частности, вычислительной технике) для обнару- жения и исправления ошибок часто используются именно избы- точные системы. Одна из простейших схем корректирования оши- бок состоит в том, что три системы параллельно выполняют одну и ту же работу, оперируя одними входными переменными. Подоб- ная схема показана на ‘рис. 4.8, где три последовательных двоич- ных сумматора оперируют переменными щ и v^. При нормальной 219
Рис. 4.8. Простая структурированная система для корректирования ошибок (пример 4.8) работе состояния их выходных переменных ц3, и4, и$ равны, одна- ко если произошел случайный сбой или если устройство вышло из строя, то одно значение будет отличаться от двух других, чтобы распознать подобные ситуации и дать возможность системе в це- лом продолжить работу, состояния выходных переменных трех одинаковых устройств оцениваются двумя специальными система- ми. Одна из них на рис. 4.8 называется «большинство». Она вы- бирает то состояние выходной переменной (0 или 1), которое име- ют по крайней мере две из трех переменных из, v4, v5, т. е. состоя- ние выходной переменной и6 равно тому состоянию, которое имеет большинство входных переменных. Вторая специальная подсистема, названная «сообщение об ошибке» предназначена для обнаруже- ния любой несогласованности состояний переменных из, v4, vs и для выдачи соответствующего сообщения об ошибке. Ее поведе- ние может быть описано следующим утверждением: и7=1 (сооб- щение об ошибке) тогда и только тогда, когда состояния перемен- ных u3, v4, V5 неодинаковы, в противном случае и7=0 (нормальная работа). Если сообщения об ошибках появляются редко, это го- ворит о случайных сбоях; частое появление таких сообщений гово- рит о том, что одно из трех основных устройств (сумматоров) вы- шло из строя. Структурированная система, изображенная на рис. 4.8, удов- летворяет требованию неизбыточности. Несмотря на то, что си- стема содержит две избыточные подсистемы (два из трех сумма- торов), они отличаются своими выходными переменными и, если 220
смотреть глубже, своими внутренними переменными. Таким обра- зом, избыточность в технике совершенно не похожа на ту избы- точность, которая запрещается требованием неизбыточности. Из- быточность в первом смысле означает, что одна и та же работа выполняется параллельно несколькими устройствами, которые от- личаются выходными (и внутренними) переменными. Во втором понимании избыточность состоит в том, что структурированная система содержит систему, которая либо неотличима от другой системы, либо является подсистемой другой системы, входящей в эту структурированную. Пример 4.9. В этом примере система из предыдущего примера, изображенная на рис. 4.8, используется для демонстрации уров- ней структурного уточнения. Рассмотрим более детально один из блоков на рис. 4.8 —последовательный двоичный сумматор. Его поведение обычно описывается следующими уравнениями: Zt^xt-^yt—ct-i (mod 2), (а) ct = (xt+yt+ct-r—Zt)/2, (б) где xt, yt — состояния входных переменных в момент t, равные О или 1 (и упорядоченные по времени в порядке возрастания зна- чений); zt— состояние выходной переменной (суммарный бит) в момент t; Ct (ct-i) — состояние внутренней переменной, представ- ляющей цифру переноса в момент t (/—1). Согласно этому опи- санию двоичный сумматор представляет собой структурированную систему, схема которой изображена на рис. 4.9,а. Ее элементы, описанные уравнениями (а), (б), также могут быть детализиро- ваны и представлены в виде структурированных систем. Напри- мер, элемент, представляющий уравнение (б), сам может быть представлен как структурированная система, элементами которой являются стандартные логические функции от двух переменных (рис. 4.9,6). Теперь понятен смысл парных процессов укрупнения и уточне- ния структуры. При укрупнении схемы структурированная система корректирования ошибок на рис. 4.8 является элементом большей структурированной системы (арифметического устройства). При дальнейшем структурном укрупнении эта структурированная си- стема становится элементом еще большей структурированной си- стемы (центрального процессора вычислительной машины) и т. д. до тех пор, пока не будет достигнут максимальный уровень, необ- ходимый для конкретного исследования. Но при уточнении струк- туры любой элемент системы корректирования ошибок (например, сумматор) может рассматриваться как соответствующая структу- рированная система (например, та, что изображена на рис. 4.9,а), а любой элемент этой структурированной системы также может рассматриваться как структурированная система (рис. 4.9,6) и т.д. 221
5) Рис. 4.9. Уточнение и укрупнение структуры (пример 4.9) до тех пор, пока не будет достигнут необходимый уровень уточ- нения. Два или более уровня структурного уточнения также могут быть объединены в одну систему, т. е. в структурированную систе- му, элементами которой являются структурированные системы, элементами которых являются структурированные системы... и т. д. Эта рекурсия, разумеется, заканчивается на тех элементах, кото- рые не являются структурированными системами. 222
Будем структурированные системы, содержащие несколько уровней уточнения, называть многоуровневыми структурированны- ми системами и помечать обобщенным оператором Sk, где k — чи- сло уровней уточнения. Например, S2FB — это двухуровневая структурированная система с поведением, т. е. структурированная система, элементами которой являются структурированные систе- мы с поведением. 4.5. ЗАДАЧИ ПРОЕКТИРОВАНИЯ СИСТЕМ Иерархическая схема — одна из самых важных структурных схем, используе- мых при проектировании сложных си- стем. Герберт А. Саймон Структурированные системы используются при решении наибо- лее важных системных задач, возникающих как при исследовании, так и при проектировании систем. В общем случае эти задачи представляют собой системные формулировки различных вопро- сов, связанных с отношением между частями и целым. Проблемы типа часть-целое, возникающие при исследовании систем, сущест- венно отличаются от тех же проблем, возникающих при их проек- тировании. В данном разделе мы рассмотрим структурированные системы с точки зрения их роли при решении системных задач проектирования. Изучению роли этих систем при исследовании си- стем, роли более сложной и хуже изученной, посвящены оставшие- ся разделы этой главы. Как указывалось в разд. 3.10, первым этапом проектирования является определение порождающей системы, представляющей за- дание, которое должна выполнить данная система. В общем слу- чае это задание представляет собой преобразование состояний со- ответствующих входных переменных в состояния выходных пере- менных. Таким образом, полученная порождающая система всегда является направленной. Кроме того, это обычно детерминирован- ная система. Часто эта система не является уникальной, что пока- зывается в следующем примере. Пример 4.10. Снова рассмотрим последовательный двоичный сумматор, введенный в примере 4.9. Его задачей является сумми- рование двух двоичных чисел, передаваемых последовательно раз- ряд за разрядом в порядке возрастания значимости разрядов. Обычная система с поведением, используемая для представления этой задачи, описана в примере 4.9. Ее маска и поведение показа- ны на рис. 4.10,а. Помимо входных и выходных переменных х, у, г, полностью описывающих ее задачу, система включает еще и внут- реннюю переменную с — переносимый разряд. На рис. 4.10,6 пока- 223
Ss=sl+s2+s,f (mod 2) sJ-[sl +s2 f [j-4+Ss-Se t(0^ s5 -se)(mod2)}p} (mad 2) “ [Sf+s^^-is^s^s^imod 2)]/2 a) 6) Phc. 4.10. Два варианта систем с по- ведением, представляющих последо- вательный двоичный сумматор (при- мер 4.10) зана альтернативная система с по- ведением (ее маска и поведение), не содержащая внутренних пере- менных. Эти системы, несмотря на то, что они решают одну и ту же за- дачу преобразования входных переменных х и у в выходную пе- ременную z, совершенно различ- ны. Различия, хорошо видные при сравнении масок, необходимо влекут за собой различия в струк* турах, реализующих поведение. Так, например, если предполо- жить, что предшествующие значе- ния переменных (т. е. значения, определенные при р=—1) непос- редственно доступные команде задержки, то эти две системы с поведением включают структури- рованные системы, изображенные соответственно на рис. 4.9,а и 4.10,в. Эти две структурированные системы, совершенно одинако- вые с точки зрения среды, представляют собой совершенно раз- ные основы для проектирования. Выбор одной из систем может быть осуществлен пользователем сразу или процесс проектирова- ния может быть продолжен для обеих систем, а выбор осуществ- лен на более позднем этапе. Следующим после определения конкретной системы с поведе- нием этапом проектирования является определение структуриро- ванной системы, удовлетворяющей таким требованиям: 1) она реализует функцию поведения или ST-функцию выбран- ной порождающей системы; 224
2) все ее элементы представляют собой порождающее системы с определенными (подходящими) функциями поведения или ST- функциями; 3) она удовлетворяет некоторым целевым критериям, опреде- ляемым как необходимые; 4) она принадлежит к определенному классу структурирован- ных систем (т. е. удовлетворяет некоторым структурным ограни- чениям). Требование 1) очевидно, поскольку предполагается, что эта структурированная система выполняет требуемое задание и это задание представляется функцией поведения или ST-функцией данной порождающей системы, то эта функция, в свою очередь, должна представляться этой структурированной системой. Требо- вание 2) говорит об имеющихся технологических возможностях. Оно представляет собой перечень всех модулей (компонентов, кир- пичиков), которые можно использовать при создании проектируе- мой структурированной системы. Важно быть уверенным в том, что выбранных типов элементов достаточно для реализации данной порождающей системы. Требования 3) и 4) представляют собой условия оптимизации соответственно по целям и по ограничениям. Обычно имеется множество воможных целевых критериев и огра- ничений. Часто они представляют собой комбинации таких факто- ров, как стоимость, сложность, систематичность, время реакции, надежность, тестируемость, ремонтопригодность и т. д. Задача реализации заданной функции поведения или ST-функ- ции с помощью элементов определенных типов сводится в принци- пе к задаче нахождения подходящей (в смысле целевых критери- ев и ограничений) декомпозиции функций, соответствующих от- дельным выходным переменным данной системы, на функции, представляемые элементами заданных типов. Д Одним из методов решения этой задачи, который применим только в определенных случаях, является использование формаль- ных правил некой алгебры, операции которой соответствуют функ- циям, представленным этими элементами. Этот метод, если счи- тать систему детерминированной, состоит из следующих шагов: а) Для каждой функции, соответствующей выходной перемен- ной, определяется алгебраическое выражение. Оно может быть, например, подходящей канонической формой определенного типа. Эти алгебраические выражения задают определенный способ ком- позиции функций проектируемой системы из функций, соответст- вующих элементам. Таким образом, эти выражения удовлетворя- ют требованиям 1) и 2) для задачи проектирования. Если, что маловероятно, отсутствуют целевые критерии и ограничения, то задача проектирования решена. б) Полученные выражения преобразуются согласно правилам данной алгебры к виду, удовлетворяющему целевым критериям и 15—6923 225
6) ограничениям. В общем случае может быть несколько решений. Обычно бывает достаточно определить только одно. Другой метод решения задачи декомпозиции, применимый только к дискретным системам, состоит в том, что декомпозиция производится независимо от алгебраических преобразований, а не- посредственно с помощью действий над определениями рассматри- ваемых функций (их табличным, матричным или каким-то другим подходящим представлением) или с использованием соответству- ющих функциональных уравнений. Для демонстрации этого мето- да предположим для простоты, что все имеющиеся элементы име- ют две входные переменные и одну выходную. На рис. 4.11,а пока- заны входные и выходные переменные проектируемой системы и одного из ее элементов. Будем считать, что любая выходная пере- менная является функцией выходных переменных, а именно: Un+l=fn+I (U], Uj, • •Un), Vn+2=fn+2(V!, U2, ..., Un), (4.22) Un-f-in—fn+m(U|, V2, ., Un) для проектируемой системы и y=g(xi, х2) (4.23) для этого элемента. Теперь представим, что элемент включен в систему FB таким образом, что его выходная переменная идентич- на одной из выходных переменных Fb, скажем переменной vn+i. Это дает структурированную систему, схема которой показана на рис. 4.11,6. Она состоит из двух подсистем: одна — это данный элемент, а другая — модифицированная система FB. Структуриро- ванная система содержит две переменные zi и z2, не входящие в 226
исходную систему Fb. Поскольку в этой системе переменные vn+i и у рассматриваются как идентичные, то функциональное уравнение fn+i(v,, и2, ..., vn)—g(xl, х2) (4.24) должно выполняться. Решение этого уравнения представляет со- бой две функции Xi=hi(ui, v2, .... Un), (4.25) X2 = /l2(Ui, U2, . . ., Un). Чтобы эти функции были решением уравнения (4.24), это уравне- ние должно, разумеется, выполняться при подстановке данных функций вместо переменных xt и х2. Поскольку в данном случае считается, переменные xt, х2 идентичны новым переменным Zi и z2 (см. рис. 4.11,6), то можно переписать уравнение (4.25) следую- щим образом: Zi=hi (о,, u2, ..., Un), (4.26) Z2 = /l2(Ui, U2, . . ., Un). Обычно решений уравнений (4.24) может быть много. Следова- тельно, основная проблема состоит в выборе одного решения. Прежде всего, множество решений сокращается за счет решений, не удовлетворяющих заданным структурным ограничениям. Кроме того, ищутся такие решения, для которых функции hi, h2 зависят от как можно меньшего числа переменных Ui, и2, ..., ип. В самом деле, чем меньше это число, тем сильнее декомпозиция и тем легче при необходимости осуществлять дальнейшую декомпозицию функций hi, h2. И, наконец, оставшиеся решения упорядочиваются относительно целевых критериев и те решения, которые оказыва- ются худшими по всем критериям (или их подмножество), выби- раются как основа для продолжения процесса декомпозиции. Шаг декомпозиции, изображенный на рис. 4.11,6, должен быть повторен для всех выходных переменных un+i, ип+2........vn+m и, если нужно, для новых переменных zb z2, ..., введенных в процессе декомпозиции. Декомпозиция прекращается в тех случаях, когда все новые переменные становятся идентичны входным переменным Ut, и2, ..., ип. Понятно, что на каждом шаге декомпозиции нужно испытывать новые элементы и сравнивать их возможные деком- позиции. Многошаговая декомпозиция показана на рис. 4.12. Для про- стоты используется только один тип элементов, тот, что изображен на рис. 4.11,а. На рис. 4.13 приведены эффективные типы декомпо- зиций системы с одной выходной переменной на элементы с двумя входными переменными и одной выходной. Показаны все типы де- композиций для л=3, 4, 5, 6, для которых па каждом шаге деком- 15* 227
v„ Vt V2 Рис. 4.12. Пример возможной ситуации после семи тагов декомпозиции позиции новые переменные зависят от непересекающихся поды жеств входных переменных, унаследованных от предшествую! декомпозиции. Это наиболее подходящие типы декомпозиций, ела на рис. 4.13 — это количество входных переменных, от кс рых зависят соответствующие выходные или промежуточные ш менные. ▲ Легко видеть, что вычислительная сложность задачи проег рования с ростом числа входных и выходных переменных пре тируемой системы растет очень быстро. То же происходит и с { том числа возможных типов элементов. Так, например, npi входных переменных и т выходных и одном типе элементов с j\ мя входными переменными и одной выходной число эффектив! шагов декомпозиции, показанных на рис. 4.13, равно произве нию (л—1)т, а для е типов элементов (е^2) оно равно j e<n-i)?n с каждой декомпозицией, разумеется, связано реше соответствующего функционального уравнения, оценка и сравне его решений и отбор наиболее перспективных из них с точки з ния всего проекта. Есть два основных способа сделать обозримой задачу проек рования. Один из них — представление общего задания в виде рархии частных заданий таким образом, чтобы на каждом уро 228
Рис. 4.13. Примеры декомпозиций, основанных па элементах с двумя входным» и одной выходной переменной иерархии сложность проектирования была относительно небольшой^ Подобная организация имеет некоторые дополнительные преиму- щества, связанные с надежностью, тестируемостью и восстанавли- ваемостью. Другой способ уменьшения сложности проектирования,, состоит в ослаблении целевых критериев. Вместо того чтобы тре- бовать получения оптимального проекта, соглашаются на «хоро- ший» или «приемлемый». Такой подход к проектированию систем? позволяет использовать эвристические методы. Из-за большого числа возможных типов элементов оказывает- ся слишком сложным включить в УРСЗ различные конкретные ти- пы проектирования, основанные на определенных алгебрах или. типах функциональных уравнений. Поэтому УРСЗ должен слу- жить источником информации для пользователя. Если для задачи, проектирования, заданной пользователем, имеется некий опреде- ленный метод проектирования, УРСЗ должен предоставить поль- зователю исчерпывающую информацию об этом методе. Средства УРСЗ для решения проблемы проектирования на уровне структу- рированных систем должны разрабатываться, в рамках общего, подхода к декомпозиции как оптимизации (для небольших задач) или как средства удовлетворения требований (основанного на со- ответствующих эвристических методах). 22Ф<
4.6. ЗАДАЧИ ИДЕНТИФИКАЦИИ ...даже зная свойства частей и законы их ваимодействия, очень непросто выве- сти свойства целого. Герберт А. Саймон В исследованиях систем важное место занимают две взаимодо- полняющие задачи, связанные с взаимоотношением обобщенной системы с поведением и разных множеств ее подсистем. Одна из них основывается на предположении, что система с поведением, рассматриваемая как обобщенная, уже задана. Задача состоит в определении того, какие структурированные системы, состоя- щие из множеств подсистем заданных обобщенных систем, под- ходят для реконструкции данной системы с поведением с прием- лемым уровнем точности. Во втором случае структурированная система с поведением задана, и задача состоит в том, чтобы вы- вести свойства неизвестной обобщенной системы. В литературе эти задачи называют соответственно задачей ре- конструкции и задачей идентификации. В этом разделе рассматри- вается задача идентификации, а в следующем — задача реконст- рукции. Задача идентификации распадается на две подзадачи. Одна состоит в определении множества всех обобщенных систем с пове- дением, представленных данной структурированной системой в том смысле, что функции поведения их элементов являются про- екциями функции поведения любой из этих обобщенных систем. Это множество обобщенных систем называется реконструктив- ным семейством рассматриваемой структурированной системы. Вторая подзадача заключается в выборе из реконструктивного семейства такой обобщенной системы, которая задает в опреде- ленном смысле лучшую гипотезу относительно реальной обобщен- ной системы. РЕКОНСТРУКТИВНОЕ СЕМЕЙСТВО Рассмотрим структурированную систему с поведением SF вида (4.18) ', элементы которой представлены множествами выборочных переменных и функциями поведения xf (xsN4). Бу- дем говорить, что система с поведением сопоставима с данной структурированной системой SF, если обе системы определены для одних и тех же параметров и переменных, а также используют один и тот же тип функций поведения (например, функции рас- пределения вероятностей или возможностей). Обозначим через множество функций поведения всех систем с поведением, 1 Поскольку до конца данной главы будут рассматриваться только системы с поведением, индекс В мы опускаем. 230
сопоставимых с SF, а через ^Sp множество функций поведения систем с поведением из реконструктивного семейства SF. fs Fsf тогда и только тогда, когда (4.27) для всех x^Nq. Для вероятностных или возможностных функций поведения уравнения (4.27) представляются соответственно си- стемами уравнений Ч(хс) = S f(c) (4.28) с>хС или 7(*С)= max f(c), (4.29) с)>хс где x^Nq. В этих уравнениях определяются значения xf(xc), значе- ния f(c) определяются для всех обобщенных состояний входящих в уравнения переменных. Положим, что се С и хс&С для всех X^Nq. Чтобы определить значения f(c), которые можно интерпрети- ровать как вероятности или возможности состояний с, уравнения (4.28) или (4.29) нужно дополнить требованием, чтобы f(c)^O для всех сеС. Несмотря на то, что f(c) должны для вероятност- ных систем удовлетворять некоторым дополнительным требовани- ям, таким, как f(c)^l и 2 /(с)= 1, сеС легко увидеть, что эти дополнительные требования учитываются видом этих уравнений и требованием, чтобы /(с)^О для всех сеС. Взаимоотношение между заданной структурированной систе- мой и соответствующими обобщенными системами с поведением описывается множеством из S 1'С| X&Iq уравнений вида (4.28) или (4.29) с |С| неизвестными, f(c), удов- летворяющей неравенствам f(c)^O для всех се С. Обычно неко- торые из этих уравнений зависят от остальных и могут быть исключены. Если заданная структурированная система непротиворе- чива, то полученная система уравнений [т. е. система линейно-не- зависимых уравнений вида (4.28)] имеет по крайней мере одно решение в области неотрицательных действительных чисел. Идентификация обобщенной системы с поведением по задан- ной структурированной системе однозначна тогда и только тогда, 231
Таблица 4.3. Элементы структурированной системы из примера 4.11 Г1 ‘/(‘с) 1-2 1'3 V(2C) f3 *с = 0 0 0.4 2с = 0 0 0.4 Зс = 0 0 0.4 0 1 0.3 0 1 0.2 0 1 0.3 I 0 0.2 1 0 0.1 I 0 0.1 I I 0.1 1 1 0.3 I 1 0.2 когда решение ограниченной системы уравнений существует (т. е. структурированная система непротиворечива) и оно единственно. Это бывает довольно редко. Если решение не единственно, что бы- вает значительно чаще, то идентификация неоднозначна. По суще- ству, это означает, что данная обобщенная система, хоть для нее и выполняются все ограничения на переменные структурирован- ной системы, содержит некоторую дополнительную информацию. Это и есть конструктивное выражение известного утверждения на- уки о системах, что «целое больше суммы составляющих его час- тей». Пример 4.11. Рассмотрим структурированную систему, эле- ‘ментами которой являются системы с поведением без памяти, каждая из которых содержит по две из трех переменных иь v2, v3. Каждая переменная имеет одно из двух состояний 0 или 1. Вероятностные функции поведения элементов 2f, 3f приведены в табл. 4.3. Легко убедиться, что эта структурированная система локально согласована. Например, вероятность того, что и2 = 0 равна 0.6 (и 0.4 для и2=1) независимо от того, вычисляется она >как проекция 7 или 2f. Обозначим через р0, pt,р7 (табл. 4.4) неизвестные вероят- ности состояний обобщенных систем с поведением. Тогда рекон- структивное семейство данной структурированной системы опи- сывается неравенствами pt^O (i^N07) и 12 уравнениями вида 74.28) Таблица 4.4. Обозначения, используемые в примерах 4.11, Po+Pi— 0.4 (1), р0-|-р4—0.4 (5), Ро+Р2=О.4 (9); 4.12 и 4.14 и v2 1'з /(С) р2+Рз = 0.3 (2), Рз + р7 = 0.3 (6), с = 0 0 0 /(000) = Ру Pi+p3 = 0.3 (10), 0 0 0 I I 0 /(001) = р, /(010) = р2 P4+Ps = 0.2 (3), pi+p5=0.2 (7), 0 1 I 0 I 0 /(011) = р3 /П00) = р4 рз+р7 = 0.2 (11), I I 0 1 I 0 7(101) = ps /(НО)-р6 Ре + р7 = 0.1 (4), p2+p6 = 0.1 (8), 1 1 I /(1! I) - р, P4+p6 = 0.1 (12). 232
Исследовав эти уравнения, получаем, что все неизвестные могут быть выражены через одну из них, скажем через р0. В самом! деле, из (1): £1 = 0.4—р0; из (5) : р4=0.4—0О; из (9) : р2=0.4—р0; из (2): рз = 0.3—02—— 0.1+ро; из (3): 05 = 0.2—04=—0.2+ро’, из (6): 07=0.3—0з = О,4—0О; из (8): 06 = 0.1—02 = —0.3+00. Таким образом, 0^02=04=07=0.4—0о, (а> Рз ——0.1+00, (б). 05 = —О.2+0о, (в) 06 = —0.3+00. Из неравенств для каждого из уравнений получаем следующие- ограничения на р0: а) 0] (или 02, Рт) ^0 дает 0о^О.4; б) Рз^О дает ро^О.1; в) Рз>0 дает ро^О.2; г) р6^0 дает ро+О.З. Так как должны выполняться все эти ограничения, из неравенств» следует, что р0 должно принимать значения в диапазоне О.З^ро^О.4. Если задаться значением р0 из этого диапазона, то из уравнений а)—г) можно однозначно определить значения неизвестных. В табл. 4.5 показано, как таким образом определяется реконст- руктивное семейство для данного примера. Пример 4.12. Рассмотрим структурированную систему, эле- ментами которой являются системы с поведением без памяти с переменными Ui, v2 и v2, v3 с двумя состояниями каждая. Веро- ятностная функция элементов 7» 2f определяется следующим об- разом: «2 7 (1с) у2 t’s 7(2с) 0 1 0.3 0 0 0.1 1С= 1 0 0.5 2с= 0 1 0.4 1 1 0.2 1 1 0.5
Таблица 4.5. Реконструктивное семейство из примера 4.11 t-'i Pl =/(с) с = 0 0 0 0.3 ро 0.4 (степень свободы) 0 0 1 Pi = 0А-ро 0 I 0 Рз = 0.4-р0 0 1 1 Рз = — 0.1 +р0 1 0 0 Р* = 0.4 — pq 1 0 1 Рз = —0.2 + ро 1 1 0 р6 = -0.3+ро 1 I 1 р7 = 0.4 - р0 При определении реконструктивного семейства этой системы будем использовать для неизвестных те же обозначения, что и в примере 4.11. Тогда реконструктивное семейство будет описы- ваться неравенствами 0,^(teA/o,?) и следующими восемью урав- нениями: Po+Pi = 0.0, (1) 024-03 = 0.3, (2) 04 “I”05 == 0.5, (3) Рб+р7 = 0.2, (4) Ро + 04 — 0.1, (5) Pi+P5=0.4, (6) Р2+Рб = 0.0, (7) Рз+Р7 = 0.5, (8) Из уравнений (1), (7) и неравенств имеем 0o = 0i=02=06 = = 0. Отсюда просто определить оставшиеся вероятности: р3 = О.З, 04=0.1, 05=0.4, 07=0.2. Следовательно, в данном случае иден- тификация однозначна. То есть данный пример — это пример од- ного из тех редких случаев, когда «целое равно сумме составляю- щих его частей». Пример 4.13. Чтобы продемонстрировать более общий тип ре- конструктивного семейства, рассмотрим структурированную си- стему из трех элементов, причем каждый элемент содержит три Таблица 4.6. Элементы структурированной системы из примера 4.13 1>| 1'2 У(‘с) »з У(2с) »з У(3с) *с = 0 0 0.25 Зс = 0 0 0.17 Зс = 0 0 0.11 0 1 0.18 0 I 0.16 0 1 0.14 1 0 0.20 0 2 0.12 0 2 0.18 I i 0.37 1 0 0.14 1 0 0.20 I 1 0.18 1 1 0.20 1 2 0.23 1 2 0.17 234
переменных щ, t»2, Оз- Пусть t/ и v2 принимают состояния из мно- жества {0, 1}, а из—из множест- ва {0, 1, 2}. Элементы представ- ляют собой вероятностные систе- мы с поведением без памяти. Их функции поведения 2/, V при- ведены в табл. 4.6. Будем исполь- зовать приведенные в табл. 4.7 обозначения неизвестных вероят- ностей состояний полной системы. Составление уравнений, опи- сывающих реконструктивное се- мейство, и определение их реше- ний при ограничениях р<^0(/е eM>,i) предоставим читателю. Скажем только, что система из Таблица 4.7. Обозначения, используемые в примере 4.13 •>2 «3 /(с) с = 0 0 0 /(000) = р0 0 0 1 /(001) = Р1 0 0 2 /(002) = р2 0 1 0 /(010) = р3 0 1 1 /(011) = р* 0 1 2 /(012) = р} 1 0 0 /(100) = р6 1 0 1 /(101) = р7 1 0 2 /<Ю2) = р8 1 1 0 /(1Ю) = р, 1 1 1 /(1Н) = Р.о 1 1 2 /(112) = Рп 16 исходных уравнений с 12 неизвестными сводится к 10 линейно- независимым уравнениям с двумя степенями свободы. Если пред- положить, что свободными являются неизвестные рю и рп, то мы получим следующие неравенства: 0.04<Ср10^0.18, 0.05^рц^0.17, 0.23 ^Рю+Рп =5^0.34. Область значений для рю и рп, определяемая этими уравнениями, показана на рис. 4.14; это выпуклое множество, натянутое на че- тыре точки (0.06, 0.17), (0.17, 0.17), (0.18, 0.16), (0.18, 0.05). Для любой пары значений р10 и рп из этой области значения осталь- ных неизвестных однозначно определяются следующим образом: Ро = О.34—рю—Рп, pi = —0.04+рю, р2=—0.05+рц, Рз =—0.023+рю+рп, р4 = 0.18—р10, р5 = 0.23—рп, рб = —0.17—|— pi о—НPi 1, р7=0.20—рю, р8 = 0.17—рп, р9 = 0.37—Рю—’Рп- А Пример 4.14. Рассмотрим структурированную систему, эле- ментами которой являются возможностные системы с поведением с теми же наборами переменных, что и в примере 4.12. Функции 235
Рис. 4.14. Описание реконструктивного семейства из примера 4.13 'зюведения элементов приведены в табл. 4.8. Как видно, они не иормализованы. Для описания реконструктивного семейства этой структуриро- ванной системы снова воспользуемся обозначениями из табл. 4.4. Тогда реконструктивное семейство определяется неравенствами (t^Noj) и следующими 44.29): шах(р2, Рз) =0.5, (1) тах(р3, Р?) =0.6, (2) тах(ро, Pi) =0.8, (3) тах(р6, р?) =0.8, (4) восемью уравнениями в виде тах(р0, Ра) =0.8, (5) тах(р2, р&) =0.8, (6) тах(р4, рз) =0.9, (7) max(pi, р5) =0.9, (8). Из уравнения (1) следует, что ни р2, ни р3 не могут быть больше 0.5; следовательно, из (6) следует, что ре = 0.8, а из урав- яения (2), что р? = 0.6. Из уравнения (5) следует, что р4 не мо- 236
Таблица 4.8. Элементы структурированной системы из примера 4.14 У(’с> 1’2 «3 7(2с) с = 0 0 0.8 2с = 0 0 0.8 0 1 0.5 0 1 0.9 1 0 0.9 1 0 0.8 1 1 0.8 1 1 0.6 жет быть больше 0.8, а значит, из уравнения (7) следует, что Р5=0.9. Согласно этим результатам данная система может быть сведена к двум независимым подсистемам уравнений тах(р2, Рз) =0.5, тах(р0, pi) =0.8, тах(ро, р4) =0.8, Единственное уравнение при условии, что р2^0 и р.з^О, имеет решение р2=0.5 и 0^рз^0.5 или р3 = 0.5 и 0^ро^0.5. Пара уравнений, при условии, что ро^О, Pi^O и р4^0, имеет ре- шение р0 = 0.8 и 0^pi^0.8, а также 0^р4^0.8 или Pi = p4 = 0.8 и О^ро^О.8. В данном реконструктивном семействе легко выделить одно максимальное и четыре минимальных распределения возможно- SF стей. Они приведены в табл. 4.9, где через/' и . (t&V4) обозначены соответственно максимальное и минимальные распре- деления, а через SF — рассматриваемая структурированная си- стема. Реконструктивное семейство состоит из этих четырех рас- пределений, а также из всех распределений, находящихся между максимальным распределением и любым из четырех мини- мальных. Для возможностных структурированных систем известно, что в общем случае их реконструктивные семейства всегда имеют вид, что и в примере 4.14. То есть реконструктивное семейство всегда содержит одно максимальное семейство (предполагается, что 237
Таблица 4.9. Максимальное и минимальные распределения возможностей для реконструктивного семейства из примера 4.14 «1 1'3 fSF fSF, I fsF.2 *SF.3 fSF,4 с = 0 0 0 0.8 0.8 0.8 0 0 0 0 1 0.8 0 0 0.8 0.8 0 I 0 0.5 0.5 0 0.5 0 0 1 I 0.5 0 0.5 0 0.5 1 0 0 0.8 0 0 0.8 0.8 1 0 I 0.9 0.9 0.9 0.9 0.9 1 1 0 0.8 0.8 0.8 0.8 0.8 1 1 1 0.6 0.6 0.6 0.6 0.6 данная структурированная система согласована) и множество решений, состоящее из возможностных распределений, находя- щихся между максимальным решением и одним из нескольких минимальных решений. Более того, возможность любого полного состояния переменных, входящих в любое минимальное решение, равна или возможности этого состояния в максимальном реше- нии, или нулю. Данный результат, равно как и некоторые другие результаты, связанные с задачей определения реконструктивного семейства для заданной структурированной системы, получены недавно и для возможностных, и для вероятностных систем. По- скольку полное описание этих результатов выходит за рамки данной книги, мы в примечании приводим только краткий обзор наиболее важных результатов. КОЭФФИЦИЕНТ ИДЕНТИФИЦИРУЕМОСТИ Часто необходимо иметь подходящую меру для оценки разме- ра реконструктивного семейства. Если эта мера является адек- ватной, то ее можно использовать для оценки нечеткости, свя- занной с реконструкцией обобщенной системы по заданной струк- турированной системе, а также как степень идентифицируемости реальной структурированной системы. Для возможностных систем размер реконструктивного семей- ства адекватно оценивается произведением П Il+fSF(c), (4.30) сед где — максимальный элемент реконструктивного семейства ^SF, а А — множество всех полных состояний, для которых степень возможности в реконструктивном семействе определяется не един- ственным образом [т. е. множество полных состояний, для кото- рых решение ограниченной системы уравнений вида (4.29) не 238
единственное]. Обратите внимание, что это произведение всегда больше или равно 1 и что его значение пропорционально мощно- SF сти множества А и значениям f (с); оно равно 1 только тогда, когда множество А пустое (т. е. если существует единственное решение). Если принять произведение (4.30) в качестве разумной оценки размера реконструктивного семейства, то естественно было бы определить реконструктивную нечеткость «SF, связанную со структурированной системой SF, как логарифм этого произведе- ния, т. е. USF= log, П I1 + fSF(c)l = S log2[l+fSF(c)]. (4.31) CSA ceA Понятно, что 1^1’ где считается, что |С|—реконструктивная нечеткость всего мно- жества обобщенных систем, сопоставимых с SF. Можно использовать меру называемую коэффициентом идентифицируемости, в качестве ра- зумного показателя возможности определения единственной обоб- щенной системы по заданной структурированной системе SF. Понятно, что o<iSF< 1. 1 = 1 только тогда, когда | — 1; кг = 0 только тогда, когда ОГ ( А | = | С | , и fSF (с) = 1 для всех с С. Коэффициент идентифицируемости бывает полезен при реше- нии некоторых системных задач, особенно при сравнительных ис- следованиях структурированных систем. В общем случае значи- тельно легче определить коэффициент идентифицируемости структурированной системы, чем реконструктивное семейство: для этого достаточно определить максимальное решение и со- стояния с единственными решениями (т. е. С—А). Пример 4.15. Определим коэффициент идентифицируемости структурированной системы, определенной в примере 4.14. Отме- тим, что в этом примере | С| =8, а множество А состоит из пер- вых пяти состояний, перечисленных в табл. 4.9. Используя зна- 239
чения fSF (с) для этих состояний, получим реконструктивную не- четкость hSf = 31og2 1.8 + 21og2 1.5 = 3.714. Отсюда L„ = 1 — 3,714/8 = 0.536. Л аг ЕДИНСТВЕННЫЙ ВЫБОР ИЗ РЕКОНСТРУКТИВНОГО СЕМЕЙСТВА Рассмотрим теперь вторую подзадачу задачи идентифика- ции— задачу выбора из реконструктивного семейства одной обоб- щенной системы как гипотезы о реальной обобщенной системе. Эта задача тривиальна, если реконструкция однозначна (т. е. ес- ли ISF= 1). В остальных случаях (если данная структурированная систе- ма SF согласована и, следовательно fSF¥=0, этот выбор совершен- но произволен, если только мы не определим некий критерий и не потребуем, чтобы система, выбранная из реконструктивного се- мейства, наилучшим образом удовлетворяла этому критерию. В этом случае задача выбора превращается в задачу оптимизации с последующим произвольным выбором из лучших, с точки зрения данного критерия, систем. Если исполнительный критерий оптими- зации обеспечивает единственность оптимизации, то из данной задачи исключается элемент произвольности. Критерии оптимизации всегда используются исходя из неких фундаментальных соображений и, следовательно, определяются этими соображениями. С эпистемологической точки зрения самым существенным соображением для выбора обобщенной системы является ее максимальная независимость со всех точек зрения, за исключением только условия для проекций (4.27). Более конкрет- но это соображение можно сформулировать так: для заданной структурированной системы из реконструктивного семейства сле- дует выбирать такую обобщенную систему, которая опирается на всю информацию, содержащуюся в этой структурированной си- стеме, но только на эту информацию. Такую обобщенную систе- му можно было бы назвать несмещенной реконструкцией. Это система, реконструированная по структурированной системе без смещений, т. е., с одной стороны, использующая всю имеющуюся информацию, а с другой, — не использующая никакой другой до- полнительной информации. Выбор несмещенной реконструкции, по существу, представля- ет собой индуктивный вывод. Он может быть описан как следую- щая оптимизационная задача. 240
По заданной структурированной системе с поведением SF из множества функций реконструктивного семейства Fps выбрать SF такую функцию поведения f , для которой мера нечеткости (шенноновская энтропия для вероятностных систем или ^-нечет- кость для возможностных) была бы максимальной при условии, что выполняются ограничения на проекции (4.27). Для вероятностных систем эта задача оптимизации фигури- рует под названием «принцип максимума энтропии». Некоторые соображения в пользу разумности использования этого принципа для индуктивного вывода приведены в примечании 4.6. Известно, что несмещенная реконструкция единственна и для вероятностных, и для возможностных систем. Она определяет самое слабое из возможных ограничений на переменные, соответ- ствующие заданной структурированной системе. Для возможност- > SF ных систем f это максимальное распределение из рекопструк- тивного семейства J SF, или, другими словами, это распределе- ние из множества распределений ^gp, которое представляет наибольшее нечеткое подмножество всех полных состояний пере- менных систем. Несмотря на то, что несмещенная реконструкция эпистемоло- гически наиболее существенна, поскольку она опирается на один- единственный хорошо обоснованный принцип индуктивного вывода (примечание 4.6), для других целей могут лучше подойти дру- гие реконструкции. Совершенно естественным и важным приме- ром этого может послужить выбор обобщенной системы, для которой минимизирована наибольшая возможная ошибка. Под ошибкой здесь имеется в виду расстояние между распределени- ем (вероятностным или возможностным) реконструированной обобщенной системы и распределением истинной системы. Тако- го типа реконструкция — это реконструкция с наименьшим рис- ком. Конкретная формулировка полученной оптимизационной за- дачи зависит от того, какой тип расстояния используется. Особую важность из всех возможных типов расстояния имеют те, что оценивают потерю информации. Далее в этой главе, в особенно- сти в разд. 4.7 и 4.9, мы рассмотрим такие типы расстояний. ПРОЦЕДУРЫ СОЕДИНЕНИЯ Одним из важнейших результатов, связанных с задачей иден- тификации, является то, что несмещенная реконструкция может быть определена с помощью относительно простой процедуры, не включающей решение описанной выше задачи оптимизации (за- дачи максимизации шенноновской энтропии или ^-нечеткости при заданных ограничениях). Эта процедура, называемая про- цедурой соединения, основана на вероятностном или возможпост- 16—6923 241
ном варианте операции соединения довольно простым образом комбинирующей функции поведения элементов заданной струк- турированной системы. Д Рассмотрим две функции поведения »/:АХВ-н[0, 1], 7:ВХС->[0, 1], определенные на множествах состояний А, В, С, смысл которых мы поясним ниже. Обратите внимание, что в множество В вхо- дит область определения обеих функций. Соединение и 2f, обо- значаемое как 7>И2А эт0 функция 7*7:АХВХС-Ч0, 1], свойства которой зависят от природы функций 7 и 2/. Если это функции распределения вероятностей, то [7*2f](a> b, c)=min[7(a, b), 2f(cjb), (4.33) где 2f(c|b)—условная вероятность с при заданном Ь; если это функции распределения возможностей, то [7*2f](a, b, c)=min[7(a, b), 2f(b, с)]. (4.34) Обратите внимание, что в отличие от (4.33) в (4.34) не исполь- зуются условные возможности. Дело в том, что тут используется соотношение min[7(a, b), 2/(c|b).]=min[7(a, b), 2f(b, с)], которое легко может быть доказано. Пусть операция соединения применяется к двум элементам структурированной системы с выборочными переменными из мно- жеств ’S и 2S и функциями поведения 7 и 2f. Тогда необходимо преобразовать области определения функций 7 и 2f к виду АХВ и ВХС соответственно, где А — множество совокупных состояний переменных, входящих только в первый элемент, т. е. переменных из множества !S— -(WS); В — множество совокупных состояний переменных, входящих в оба элемента, т. е. переменных из 1Sf]2S; С — множество совокупных состояний переменных, входящих только во второй элемент, т. е. переменных из множества 2S— -(’W Для определения несмещенной реконструкции данной струк- турированной системы операция соединения должна быть выпол- нена для пар элементов этой системы. При каждом ее выполне- нии два элемента сливаются (объединяются) в один больший элемент новой структурированной системы. Пусть операция со- единения всегда выполняется в таком порядке, чтобы результат ранее выполненных операций соединения входил в операцию со- 242
единения в качестве второго элемента. Эта процедура заканчи- вает свою работу тогда, когда все элементы сливаются в одну обобщенную систему. Будем называть эту процедуру базовой процедурой соедине- ния. Прежде чем ее формализовать, нужно рассмотреть два вы- рожденных случая, чтобы все содержательные ситуации были описаны. В первом случае все переменные из первого элемента (соответствующего 7) могут быть включены во второй элемент (соответствующий 7)- Это может быть, поскольку, вообще гово- ря, второй элемент получен в результате выполнения неких опе- раций соединения. В этом случае множество А является пустым, а 7 принимает вырожденный вид 7:В+[0, 1]. Во втором случае элементы не соединены. Это значит, что мно- жество В является пустым, а функции поведения имеют вырож- денный вид 7:А^[0, 1], 7: В^[0, 1]. Обратите внимание на то, что вследствие требования неизбыточ- ности для структурированных систем (см. разд. 4.3) и договорен- ности о том, что результат предшествующих операций соедине- ния всегда выступает как 2f, множество С не может быть пустым. Для вероятностных систем вырожденные операции соедине- ния определяются так: [7*7] (b, с)=7(Ь)-7(с|Ь) (4.35) для А=0 и [7*7] (а, С) =7(a)-7(c) (4.36) для В=0; для возможностных систем они определяются следу- ющим образом: [7*7] (b, c)==min[7(b), 7(Ь, с)], (4.37) [7*7] (a, c)=min[7(a), 7(c)], (4.38) Через 7^7 будем обозначать в зависимости от контекста как обычную, так и вырожденную операцию соединения. Тогда базо- вая процедура соединения описывается следующим алгоритмом. Базовая процедура соединения. Дана локально согласованная структурированная система с поведением SF (вероятностная или возможностная) с функциями поведения 7 (x^Nq). Для опреде- ления соединения 7 для всех x^Nq\ 1) положить 6=2 и f=7* 2) произвести соответствующую группировку аргументов 7 и f и выполнить соответствующий вариант операции соединения 1Л* 243
(операция может быть вероятностной или возможност- ной, обычной или вырожденной); 3) если k<_q, то &-|-1->& и перейти на шаг 2; 4) стоп. Можно доказать следующее утверждение (приложение В): если базовая процедура соединения применяется к согласованной возможностной системе SF, то в результате всегда получается fSF . несмещенная реконструкция [ (максимальное для реконструк- тивного семейства распределение возможностей). Однако если эта процедура применяется к вероятностной системе, то не- смещенная (максимум энтропии) реконструкция получается толь- ко для определенного класса структурированных систем — так называемых ациклических структурированных систем, описывае- мых в разд. 4.7. По полученному результату, не определяя типа данной струк- турированной системы можно определить результат применения базовой процедуры соединения f несмещенную реконструкцию или нет. Если f удовлетворяет условию для проекции для всех x^Nq, то это несмещенная реконструкция, в противном случае f не соответствует данной структурированной системе и должна быть уточнена с помощью следующей итеративной про- цедуры соединения. Итеративная процедура соединения. Дана локально согласо- ванная структурированная система с поведением SF с вероят- ностными функциями поведения if (/eA/o.g-i)- Дана также функ- ция f, полученная с помощью базовой процедуры соединения, примененной к SF, и число Де [0, 1]; требуется с точностью до Д определить функцию поведения несмещенной реконструкции: 1) присвоить j = О, i=l и fo=f-, 2) сделать соответствующее разбиение аргументов if и и выполнить операцию соединения if для вырожденного вида (4.35); 3) если (=#0 (mod q), то t’+1-н, j-j-l (mod <?)->/, и перейти на 2; 4) если |Д(с)—Л-д(с)|>Д для какого-то сеС, то i’+1->i, /+ + 1 (mod ^)->/, и перейти на 2; 5) конец. Если после выполнения итеративной процедуры соединения 2сА(с) = 1, то fSF(c)-A^Mc)<fSF(c) + A для всех сес; в противном случае данная структурированная си- стема SF глобально не согласована (см. разд. 4.11) и реконст- 244
Таблица 4.10. Последовательность функций поведения, полученных с помощью базовой и итеративной процедур соединения, пример 4.16 Базовая процедура соединения Итеративная процедура соединения V, У* У У* (У» Л 1= 1 1 = 2 i = 3 i — 4 1 = 5 ООО 0.25 0.312195 0.294647 0.302908 0.309934 0.304982 0.307696 0 0 1 о.13 0.111628 0.105353 0.099904 O.O9656I 0.095018 0.093371 0 1 0 0.075 0.087805 0.095379 0.088024 0.090066 0.092059 0.089834 0 1 I 0.225 0.188372 0.204621 0.210484 0.203439 0.207941 0.209672 1 0 0 0.13 0.084211 0.094444 0.097092 0.089019 0.091490 0.092304 1 0 1 0.06 0.094118 0.105556 0.100096 0.105580 0.108510 0.106629 I 1 0 0.025 0.015789 0.012977 0.011976 0.010981 0.010418 0.010166 I 1 1 0.075 0.105882 0.087023 0.089516 0.094420 O.C89582 0.090328 i = 6 1 = 7 1 = 8 1 = 9 1 = 10 1=11 1= 12 1 = 13 0.309608 0.308036 0.308915 0.309511 0.309002 0.309289 0.309481 0.309315 0.092433 0.091964 0.091444 0.091148 0.090998 0.090829 0.090734 0.090685 0.090392 0.091011 0.090314 0.090489 0090688 0.090462 0.090519 0.090584 0.207567 0.208989 0.209528 0.208852 0.209312 0.209486 0.209266 0.209416 0.090079 0.090826 0.091085 0.090388 0.090626 0.090711 C 099486 0990563 0.108277 0.109174 0.108556 0.109086 0.109374 0.109171 0109343 0.109437 0.009921 0.009761 0.009686 0.009612 0.009561 0.009538 0.CO95J4 0.009498 0.091723 0.090239 0.090472 0.090914 0.090439 0.090514 0.096057 0.990502 1 = 14 i = 15 1 = 16 1 = 17 i= 18 1= 19 i = 20 1 = 21 0.309409 0.309472 0.3С9417 0.309448 0.309469 0.309451 0.309461 0.309453 0.090630 0.090599 0.090583 0.090565 0.090555 0090549 0090543 0.090540 0.090510 0.090528 0.090550 0.090525 0.090531 0.090538 0.090530 0.090532 0.209473 0.209401 0.209450 0.209469 0.209445 0.209462 0.209468 0.209460 0.090591 0.090518 0.090543 0.090552 0.090528 0.090536 0.090539 0.090531 0.109370 0.109427 0.109457 0.109435 0.109454 0.109464 0.109457 0.109463 0.009490 0.009482 0.009477 0.009476 0.000472 0.009470 0.609470 0.009469 0.090527 Q090573 0.090523 0.090531 0.090546 0.090530 0.090532 0.090537 рукции SF не существует, т. е. ^SF = ®’ и’ слсД°вательН0> SF бессодержательна. Пример 4.16. Рассмотрим структурированную систему из при- мера 4.11, определенную в табл. 4.3. Сначала используем для оп- ределения несмещенной реконструкции вероятностный вариант базовой процедуры соединения. В первых столбцах табл. 4.10 приводятся промежуточный результат 2/ *’/ и окончательный ре- зультат f=3f*(2p '/)• Легко видеть, что окончательный резуль- тат f не соответствует заданной структурированной системе. Так, 245
Таблица 4.11. Проверка на сходимость — шаг 4 итеративной процедуры соединения из примера 4.16 IX<C)-X I = 0 (mod q) 1’1 «’2 ( = 3 i = 6 i = 9 i= 12 i= 15 i = 18 i = 2l 0 0 0 0.002261 0.000326 0.000097 0.000030 0.000009 0.000003 0.000001 0 0 1 0015067 0.004128 0.001285 0.000414 0.000135 0.000044 0.000015 0 1 0 0.002261 0.000326 0.000097 0.000030 0.000009 0.000003 0.000001 0 I I 0.015067 0.004128 O.OOI285 0.000414 0.000135 0.000044 0.000015 I 0 0 0.004808 0.00Ю60 0.000309 0.000098 O.OOOO32 0.000010 0.000003 1 0 1 0.011462 0.002697 0.000809 0.000257 0.000084 0.000027 0.000009 I 1 0 0.004808 0.001060 0.000309 0.000098 O.OOOO32 0.00001Q 0.000003 I 1 I 0.011462 0.002697 0.000809 0.000257 0.000084 0.000027 0.000009 например, [/|{»ь иг}] (О 0) =0.312195+0.111628=0.423823 не равно 7(0 0)=0.4, так что требование для проекций (4.27) не выполняется. Следовательно, необходимо использовать итератив- ную процедуру соединения. Последовательность порождаемых процедурой функций поведения сходится к несмещенной реконст- рукции. Она приводится в табл. 4.10 для i=l, 2,..., 21. Результа- ты проверки на сходимость — шаг 4 — алгоритм процедуры соеди- нения— приведены в табл. 4.11. Отсюда, если Л >>0.15067, то вы- полнение процедуры завершится при i=3; если Д>0.004128, то выполнение завершится при i=6 и т. д. Так как А=0.00002, то процедура завершится при i=21. 4.7. ЗАДАЧА РЕКОНСТРУКЦИИ Разбиение воспринимаемого мира на части удобно и, возможно, необходимо, но неизвестно точно, как оно должно быть сделано. Г. Бейтсон Задача реконструкции может быть сформулирована следую- щим образом: дана система с поведением, рассматриваемая как обобщенная система; требуется определить, какие наборы ее подсистем, а каждый такой набор рассматривается как гипотети- ческая реконструкция, подходят для реконструкции заданной си- стемы с заданной точностью, причем реконструкция должна про- изводиться только по той информации, что содержится в этих под- системах. Укажем, прежде всего, на то, что согласно такой формулиров- ке задачи понятие «реконструкция» становится более конкрет- ным: при реконструкции используется вся информация, получен- 246
ная из подсистем, но только она. Это означает, что требуется, чтобы реконструкция была несмещенной в том смысле, как это определялось в разд. 4.6, и, следовательно, можно использовать для ее получения соответствующую процедуру соединения. В задаче идентификации несмещенная реконструкция пред- ставляет собой хорошо обоснованную гипотезу (оценку) относи- тельно неизвестной обобщенной системы, причем гипотеза эта строится по заданной структурированной системе. Поскольку истинная обобщенная система неизвестна, то невозможно опре- делить, насколько близка к ней эта гипотетическая система. В задаче реконструкции несмещенная реконструкция описывает реконструктивные возможности рассматриваемой гипотезы отно- сительно заданной обобщенной системы. Чем ближе несмещенная реконструкция к истинной (заданной) системе, тем лучше гипо- теза. В общем случае близость двух сопоставимых систем с поведе- нием может быть выражена через метрическое расстояние меж- ду их функциями поведения. Существует много разных типов мет- рических расстояний. Так, например, класс расстояний Минков- ского определяется следующей формулой: М>И = Г S |Нс)-р(с)И1//’ .сеС (4.39) где f, fh — соответственно функция поведения заданной системы и несмещенная реконструкция по гипотезе h, a peN — параметр функций расстояния. При р = 1—это расстояние Хэмминга, при р=2 — Евклида, при р— оо — верхняя граница расстояний. Расстояния по Минковскому вычисляют по точечным разно- стям lf(c)-f/l(c)| распределение вероятностей или возможностей в соответствии с формулой (4.39). Несмотря на то, что поточечное описание близо- сти f и fh полезно для многих приложений, теоретически оно не- достаточно хорошо обосновано. Более обосновано рассматривать близость как разности информации, содержащейся в h относи- тельно f, или, другими словами, как потерю информации при за- мене f на h (на множество проекций f). Меру подобной потери информации будем называть инфор- мационным расстоянием и обозначать D(f, fh). Для вероятност- ных систем она задается хорошо известной формулой D(U‘)=^E'<C)1°&W' (4Л0) cg=C где константа l/loga|C|—нормирующий коэффициент, обеспечи- вающий выполнение соотношения 247
Поскольку, если fh(c) —O, то f(c)=O, вероятностное информаци- онное расстояние определено всегда. Это, однако, не метрическое расстояние, так как оно асимметрично, более того, D (fh, f) может быть не определено для некоторых f и fh [когда fh(c) >0 и f(c) = =0 для некоторого сеС]. При применении вероятностного расстояния к порождающей системе с поведением уравнение (4.40) приобретает следующий вид: = Г f(g I g)log4^4- (4.41) Модификация уравнений (4.40) и (4.41) для направленных систем с поведением очевидна. Д Для возможностных систем информационное расстояние рас- считывается по формуле D(f. Ь = i--TrT f 1о&2 |C(fft,/)l , (4.42) loga I с I J | c(f, /) | ' ’ 0 представляющей собой аналог вероятностного информационного расстояния (4.40) для [/-нечеткости. ▲ Далее в этом разделе, после соответствующего описания свойств реконструктивных гипотез, будет описано применение ин- формационных расстояний для сравнения этих гипотез. Реконструктивная гипотеза для заданной обобщенной систе- мы с поведением представляет собой набор ее подсистем. Если обобщенная система состоит из п переменных, то число ее под- систем, содержащих по крайней мере одну переменную равно 2П—1, а общее число наборов таких подсистем, содержащих не менее одной подсистемы, равно 22Я_1 — 1. С ростом п это число растет очень быстро. Однако без потери общности его можно су- щественно уменьшить, если рассматривать только неизбыточные наборы подсистем (см. разд. 4.3). Для многих системных исследований очень перспективным яв- ляется другой способ сокращения числа реконструктивных гипо- тез. Он состоит в исключении наборов подсистем, не содержащих всех переменных обобщенной системы. Это требование, обычно называемое условием покрытия, формально выглядит так: U kS = S, k где *S — множество переменных из подсистем реконструктивной гипотезы, aS — множество переменных обобщенной системы. Это условие объясняется прежде всего необходимостью использовать в реконструктивной гипотезе информацию обо всех переменных обобщенной системы для того, чтобы реконструкция была логи- 248
г чески возможна. Поскольку вопрос о включении или исключении выборочных переменных из обобщенной системы решается в ре- зультате анализа маски (см. разд. 3.6), выполнение условия по- крытия общности не нарушает. Далее под реконструктивной гипотезой будут пониматься толь- ко такие наборы подсистем заданной обобщенной системы, кото- рые удовлетворяют и требованию неизбыточности, и условию по- крытия. Таким образом, реконструктивная гипотеза — это струк- турированная система с поведением, сравнимая с обобщенной си- стемой с поведением. Однако иногда бывает нужно работать со всеми наборами подсистем, которые удовлетворяют только тре- бованию неизбыточности. Будем такие наборы подсистем назы- вать обобщенными реконструктивными гипотезами. Понятно, что для данной обобщенной системы с поведением множество ее ре- конструктивных гипотез является подмножеством множества ее обобщенных реконструктивных гипотез. Любая реконструктивная гипотеза (равно как и любая обоб- щенная реконструктивная гипотеза) полностью описывается: 1) семейством подмножеств входящих в нее переменных, 2) функциями поведения, соответствующими отдельным под- множествам переменных. Если опустить свойство 2, то свойство 1 определяет класс ин- вариантности реконструктивных гипотез, отличающихся друг от друга только функциями поведения их элементов. Этот класс ин- вариантности для того, чтобы отличать его от отдельных рекон- структивных гипотез класса, будем называть структурой. Напом- ним, что каждая отдельная реконструктивная гипотеза представля- ет собой конкретную структурированную систему. Таким образом, структура — это свойство структурированной системы, инва- риантное относительно изменения функций поведения ее эле- ментов. Для данного множества переменных, скажем множества S, множество структур, представляющих все реконструктивные ги- потезы любой обобщенной системы, определенной на S, состоит из семейств подмножеств S, удовлетворяющих условиям неизбы- точности и покрытия. Будем для удобства представлять все множества переменных одной мощности, скажем мощности п, общим множеством структур, скажем множеством Gn, определен- ным на множестве А'п положительных целых чисел. Формально для любого neN Gn— {GJ Gt удовлетворяет условиям неизбыточности и покрытия}. В этом формальном определении через Gt обозначены элементы Gn, являющиеся наиболее общими структурами, рассматривае- мыми при решении задачи реконструкции (некие специальные ти- пы этих структур будут введены ниже); индекс i идентифицирует 240
структуры из Gn и обычно iGzNiGn\ Множество Gn тривиально интерпретируется на языке любого множества переменных S, та- кого, что |S|=n, заданием взаимно однозначного отображения переменных из S на целые из Nn. Будем для удобства структуры из множеств Gn называть G-структурами. Из некоторых соображений удобно расширить множество Gn до множества G+n всех обобщенных реконструктивных гипотез. Формально для любого neN G+n= {G,|G1c:^’(Mn), Gi удовлетворяет условию неизбыточности}. Несмотря на то, что далее в этой главе основное внимание бу- дет уделяться множествам Gn, все результаты относительно Gn могут быть легко обобщены и на множества G+n- Если множество Gn для некоторого определенного п получа- ет конкретную интерпретацию в контексте некой обобщенной си- стемы с поведением с п переменными, то структуры в Gn пред- ставляют собой однозначные представления реконструктивных гипотез, связанных с этой обобщенной системой. Это непосредст- венно следует из того факта, что функции поведения, соответст- вующие любым подмножествам переменных, определяются одно- значно как соответствующие проекции обобщенной функции по- ведения. Следовательно, реконструктивные гипотезы могут изу- чаться в виде абстрактных структур. Данная структура из Gn становится конкретной реконструктивной гипотезой, когда интер- претируется в контексте сравнимой с ней определенной обобщен- ной системы с поведением (т. е. системы с п переменными). Основным вопросом задачи реконструкции является разработ- ка эффективных вычислительных процедур, допускающих пред- ставление, оценку и сравнение реконструктивных гипотез, пред- ставленных всеми структурами для данного множества перемен- ных. Это очень непростая задача, поскольку, как будет показано ниже в этом разделе, число структур растет очень быстро. Для успешного решения этой задачи необходимо использовать соот- ветствующее упорядочение и классификацию структур. Определим сначала естественное упорядочение структур, называемое уточняющим упорядочениемЛ\устъ даны две структу- ры Gi, Gj^&n- Будем называть G, уточнением G/ (и, соответст- венно, G/ укрупнением G() тогда и только тогда, когда для лю- бого хеб,- существует y^Gj, такое, что xsy; пусть G,s^G; озна- чает, что Gi это уточнение G/. Рассмотрим две структуры G,, G/^Fn, такие, что G,^G,-. Тогда Gj называется непосредственным уточнением G, (a G/— непосредственным укрупнением Gi) тогда и только тогда, когда не существует Gfts$Fn, такого что G,^^a и Gk^G,. Для задан- ной структуры Gi^Gn структурное соседство определяется как множество всех непосредственных уточнений и непосредственных укрупнений Gi в ^п. 250
Легко видеть, что отношение уточнения определяет частичное упорядочение. Более того, пара (jkn, определяет решетку, что подтверждают следующие факты: 1) существует универсальная верхняя граница — множество {jVn}; 2) существует универсальная нижняя граница — множество {{х} |x^Nn}; 3) для любой пары Gi, Gj^Sn наибольшим общим уточнением является неизбыточ- ный эквивалент множества {хрг/1хеGi, y^G,}-, 4) для любой пары Gi, Gj^Gn наименьшим общим укрупнением является не- избыточный эквивалент множества G,f]G/. Будем называть эти ре- шетки решетками уточнения G-структур), (по одной для каждо- го пеУГ). Отметим, что уточняющее упорядочение применимо и к множествам G+n, что дает решетки (^+п, =С)- Понятно, что решетка уточнения или некая нужная ее часть может быть получена с помощью неоднократного выполнения процедуры, порождающей все непосредственные уточнения для любой структуры из решетки. Одна такая процедура определяет- ся следующим образом. Уточняющая процедура для G-структур (или RG-процедура). Заданы G-структуры G,= {hS\k<=Nq}<=$n- Для определения всех их непосредственных уточнений 1) положить k=0; 2) если k<Lq, то иначе перейти на шаг 5; 3) если |ftS|^2, то (Gt—{ftS})(J^->^, где X={x|xc:\S, |x| = |*S| — 1}; иначе перейти на шаг 2; 4) где Q — неизбыточный аналог R, записать Q в ка- честве непосредственного уточнения G,, перейти на 2; 5) конец. Обратите внимание на то, что условие |*S|^2 из шага 3 обеспечивает то, что порождаемые структуры будут удовлетво- рять условию покрытия; замена этого условия на условие [feS| 1 позволяет работать с множествами $F+n обобщенных ре- конструктивных гипотез. Шаг 4 обеспечивает выполнение условия неизбыточности. Тот факт, что наименьшее возможное изме- нение делается па шаге 3, т. е. только один элемент G, изменяет- ся на непосредственно следующие меньшие элементы (подмноже- ства), обспечивает то, что порождаемые структуры являются не- посредственными уточнениями G,-. Пример 4.17. Дано G,= {IS={1, 2, 3}, 2S={2, 3, 4), 3S= = {1, 4}}. Сразу видно, что для всех |ftS| :=г2, и, следовательно, 7?О-процедуры применимы к любо- му элементу. Таким образом, имеются три непосредственных уточнения Gi. Множество ‘S заменяется на множества {1, 2}, {1; 3}, {2, 3}, однако третье множество является подмножеством и будет исключено на шаге 4; это даст следующее непосредствен- ное уточнение: {{1, 2}, {1, 3), {2, 3, 4}, {1, 4}}. 251
Аналогичная замена 2S дает второе непосредственное уточне- ние: {{1, 2, 3}, {2, 4}, {3, 4}, {1, 4}}. Наконец, множество 3S заменяется на множества {1} и {4}, ко- торые являются избыточными и будут исключены на шаге 4; от- сюда имеем третье непосредственное уточнение: {{1, 2, 3}, {2, 3, 4}}. Для сокращения вычислительной сложности порождения ре- конструктивных гипотез полезно разбить решетки уточнения на подходящие классы эквивалентности по уровню вычислений. Тог- да эти классы эквивалентности могут быть представлены соот- ветствующими каноническими структурами, а уточняющие про- цедуры разработаны для этих канонических представлений раз- ных уровней вычислительной сложности. Чтобы продемонстриро- вать этот подход, предположим, что описаны только два уровня вычислений, называемые локальным и глобальным. Локальный уровень вычислений представлен уже описанной /?б-процедурой. Для определения глобального уровня вычисле- ний определим функции rn: Gn->3?n, neN, где 5? — множество симметричных и рефлексивных бинарных от- ношений, определенных на множестве Nn (они также называют- ся отношениями сравнения, отношениями толерантности или не- ориентированными графами с циклами), a rn(G,)—бинарное отношение, выполняемое для целых а и b (a, b^Nn) тогда и только тогда, когда и а, и b принадлежат по крайней мере одно- му из подмножеств Nn, входящих в G,-. Формально rn(Gi) = {(a, b) | (ЯхеО,) (йех и Ь<=х)}. Будем элементы называть графами. Однако мы должны пом- нить, что эти графы не ориентированы (симметричность) и со- держат циклы (рефлексивность). Некоторые примеры функций классов г4 и Гб показаны па рис. 4.15. При изображении этих гра- фов опущены тривиальные циклы в узлах. Рис. 4.15. Примеры функции г 252
Понятно, что функции гп сюръективны, а при п^З прообра- зы могут состоять из более чем одного элемента. Поэтому они индуцируют следующее отношение эквивалентности на соответ- ствующих множествах Gn G-структур: Gt r Gj тогда и только тогда, когда G,, G/sGn и rn(G() =rn(G/) для некоторого neN. Если Gi=Gj, то мы говорим, что структуры G, и Gj г-эквивалент- ны. Для обозначения классов эквивалентности, индуцируемых гп на будем использовать стандартную запись $Fn/rn. Для любого n^Nn множество 5?п и отношение подмножества (или, иначе, операции объединения и пересечения множеств) оп- ределяют булеву решетку. Очевидное взаимнооднозначное соот- ветствие между JFn/fn и 5?п индуцирует изоморфную булеву ре- шетку на множестве Gnlrn- Этот изоморфизм позволяет нам порождать классы эквивалентности на $п1гп с помощью соответст- вующих операций на графах из й?п. При этом, однако, желатель- но, чтобы любой класс эквивалентности из $?п/гп был представ- лен некоей канонической структурой. С этой целью введем для любого nsN следующие подмножества ^п: ^п, в которое входят те G-структуры G, из множества Зп, ко- торые состоят из максимально сочетаемых классов, соответству- ющих графу rn(Gt) или, по в другой терминологии, основанных на кликах этого графа1. Подобные структуры называются также полными покрытиями rn(G,). Будем обозначать структуры С; из и называть С-структурами. Примерами С-структур являются структуры Gi и G2, изображенные на рис. 4.15. &>п, в которое входят те G-структуры из $п, элементы кото- рых состоят из пар, связанных на графе r„(G,) узлов (обозначае- мых целыми числами), или являются отдельными изолирован- ными узлами. Будем структуры из множества &п называть Р- структурами и обозначать через Рк. Примером P-структуры явля- ется структура G4 на рис. 4.15. Из этих определений и из того факта, что множество всех мак- симально сочетаемых классов для любого неориентированного графа единственно, следует, что любой класс эквивалентности из $nlrn содержит в точности одну С-структуру из и одну Р- структуру нз £Рп. Таким образом, С- и P-структуры могут рассмат- риваться как два канонических представления классов г-эквива- лентности G-структур. Каждый класс г-эквивалептности, представ- ленный графом, описывается двумя каноническими структурами— наименее уточненной С-структурой и наиболее уточнен- ной P-структурой. Взаимно однозначное соответствие между и (или ^п) индуцирует булеву решетку па (или на ^п), 1 Клика графа — его максимальный полный подграф. См. Харрари Ф. Тео- рия графов: Пер. с англ.—М.: Мир, 1973.—С. 34.—Прим. ред. 253
Рис. 4.16. Решетка (Зз, и булевы решетки, определенные на Яз, ^3, SP3 иЗз1г3 изоморфную естественной булевой решетке, определенной на 0>п- Например, на рис. 4.16 показаны решетка (З’з^) и взаим- но изоморфные булевы решетки, определенные на 5?з, 'З’з, и $?з/г3. Для описания больших решеток полезно определить отно- шение эквивалентности на множествах $п следующим об- разом: Gi^Gj тогда и только тогда, когда Gt, Gj^3n и Gj, Gj изо- морфны (т. е. когда одна структура может быть получена из дру- гой только перестановкой целых чисел из Nn, напоминаем, что каждое целое число соответствует узлу). Будем = называть i-эквивалентностью и обозначать через &n/i множество классов 254
Рис. 4.17. Решетка (З^Л', и гомоморфное отображение эквивалентности изоморфных структур (или перестановочных классов эквивалентности), определенных на &п. Пример, демонстрирующий смысл i-эквивалентности, приве- ден на рнс. 4.17, где обозначенные полужирным шрифтом G* показывают классы эквивалентности в ^з/i. На рис. 4.17,а показана решетка (JFs/i, ^)- Это та же самая решет- ка, что и на рис. 4.16, но упрощенная, так как на ней не разли- чаются изоморфные структуры. Сделано это за счет удаления меток входов в блоки на схеме и включения только одной схемы для каждого перестановочно эквивалентного класса. Структуры в каждом классе легко определяются перестановкой целых 1, 2, 3 для входов в блоки. Упрощенная решетка па рис. 4.17,е является гомоморфным образом решетки, изображенной на рис. 4.16. Го- моморфное отображение, являющееся основой данного упроще- ния, показано на рис. 4.17,6. На рис. 4.18 показана более сложная решетка ($F4/t, =С)- Пе- рестановочные классы эквивалентности G-структур снова выделе- 255
ны жирным шрифтом, равно как С-структуры и Р-структуры, сгруппированные по классам r-эквивалентности. Каждому такому классу соответствует граф р* и две канонические структуры Ck и Pk (fee./Vii). Для того чтобы более ярко продемонстрировать об- щие свойства этой решетки, на рис. 4.19 перестановочные классы Рис. 4.18. Решетка (&4/1, с указанием классов r-эквивалентности и канони- ческих G- н Р-структур 256
Рис. 4.19. Упрощенная схема решет- ки <О> полностью показанной па рнс. 4.18 Рис. 4.20. Решетка &tli, С-структур обозначены только их идентификаторами и выделены классы г-эквивалентности. На рис. 4.20 изображена решетка (^4/i, ^), являющаяся под- решеткой (^4/t, ^). Число около каждой схемы указывает на число различных С-структур, входящих в перестановочный класс эквивалентности, показанный на этой схеме; числа, помещенные около дуг, указывают на число непосредственных уточнений С-структуры из данного перестановочного класса эквивалентно- сти в другой класс. Как уже объяснялось выше, эта решетка изо- морфна решеткам, определенным на 5?4/i, ^4/i и (Sdi)/г. В то время как полные решетки (!?п, представляют осно- ву для локального уровня вычислений в задаче реконструкции, решетки ($Fn, и их изоморфизмы являются основой для гло- бальных вычислений. Для работы на глобальном уровне вычис- лений необходима процедура, порождающая для любой заданной С-структуры Ck<=&n (/ieN) все непосредственные уточнения 17—6923 257
в решетке (!Fn, ^). Ниже приводится одна такая процедура, ис- пользующая представление С-структур в виде графов. Уточняющая процедура для С-структур (или RC-процедура). Дана С-структура Ck^&n и соответствующий граф г„(С*). Нуж- но определить все непосредственные уточнения на множестве. 1) исключить одно ребро из графа гя(С*), скажем ребро (а. Ь)-, 2) разделить каждый элемент х из Cft, который содержит а и b на два элемента ха=х—{6} и Хь=х—{а} и заменить х из Ck на ха и хь', 3) исключить все избыточные ха и хь, полученные на шаге 2 и записать полученный результат в качестве непосредственного уточнения Ck в решетке (^п, ; 4) выполнить шаги 1—3 для всех ребер графа г„(Сл) и оста- новиться. Данная процедура имеет следующие обоснования: 1) имеется взаимно однозначное соответствие между множествами и ^п, и, следовательно, любое изменение графа приводит к изменению соответствующей С-структуры; 2) чем меньше число ребер гра- фа, тем более уточненной является соответствующая С-структу- ра; 3) поскольку никакой из циклов в вершинах нельзя исключить без нарушения условия покрытия соответствующей С-структуры, то наименьшим допустимым сокращением графа является исклю- чение одного из ребер. Таким образом, число ребер в графе оп- ределяет число непосредственных уточнений соответствующей С-структуры. Пример 4.18. Рассмотрим граф pi и соответствующую С-струк- туру Ci (рис. 4.21,а). Этот граф имеет шесть ребер и, следова- тельно, шесть непосредственных уточнений этой С-структуры. Они изображены на рис. 4.21,6. Например, уточнение получается с помощью PC-процедуры следующим образом: 1) из графа pi исключается ребро (4,5) и получается граф р7; 2) элемент {2, 4, 5} из С] (единственный элемент Сь содержащий и 4 и 5) разбива- ется на элементы {2, 5} и {2, 4}; 3) поскольку элемент {2, 4} является единственным избыточным элементом ({2, 4}сг{2, 3, 4}), он исключается, а полученный результат С7={{1, 2}, {2, 5}, {2, 3, 4}} записывается как непосредственное уточнение Сь Так как элементы P-структур представляют собой просто ребра соответствующих графов, то процедура уточнения Р-струк- тур (или РР-процедура) совершенно тривиальна. Она состоит в исключении отдельных ребер из заданного графа [см. шаг 1 PC-процедуры] и интерпретации результатов как Р-структур. Полезны также процедуры, с помощью которых получаются все непосредственные укрупнения для множеств G-, С- и Р-струк- тур. Они нужны для определения полного структурного соседст- ва заданной структуры. Формулирование этих процедур мы пре- доставляем читателю в качестве упражнения (см. также рис. 258
4.10) . Примеры такого соседства для трех этих типов структур приведены на рис. 4.22—4.24. В этих примерах структуры обозна- чены соответственно как G, С и Р. Их непосредственные уточне- ния помечены нижними индексами, а непосредственные укрупне- 17' б) Рис. 4.21. Пояснение к ЯС-процедуре: а — заданный граф и соответствующая С-структура; о — непосредственные уточнения Ci 259
Рис 4.22. Структурное соседство G-структуры G ния — верхними. На рис. 4.22 показано, что в структурное сосед- ство данной G-структуры могут входить G-структуры, входящие в другой класс r-эквивалентности (на рис. 4.22 это структура G3). Чтобы непосредственные уточнения принадлежали тому же клас- су r-эквивалентности, можно слегка модифицировать PG-npo- цедуру, заменив условие |*S|^2 на шаге 3 условием |feS|>2. При этом запрещается изменять элементы, содержащие только две вершины, и, следовательно, граф данной r-структуры остает- ся неизменным. Представление о непосредственных уточнениях (или укруп- нениях) структур различных типов можно использовать для раз- биения соответствующего множества структур на блоки струк- тур, эквивалентных в смысле уровня уточнения, т. е. таких струк- тур, которые достигаются от универсальной верхней границы {А/п} соответствующей решетки уточнения за одинаковое число шагов уточнения. Будем называть эту эквивалентность эквива- лентностью уровня уточнения и обозначать =. Так, например, структуры G], G2, G3 на рис. 4.22 — /-эквивалентные G-структу- ры из множества $?4; структуры, показанные на рис. 4.21,6,— /-эквивалентные С-структуры из множества ^5; структуры Pi, 260
Рис. 4.23. Структурное соседство С-структуры С Рис. 4.24. Структурное соседство P-структуры Р 261
Таблица 4.12. Число G-структур в ®п+ и $п, С-структур и их классов t-эквивалентности и классов /-эквивалентности для п^7 п 1 2 3 4 5 6 7 i»:i I 4 18 166 7,579 7,828,352 2,414,682,040,996 is.i I 2 9 114 6,894 7,785,062 2,414,627,396.434 i*.i 1 2 8 64 1,024 32,768 2,097.152 нс/и 1 3 8 28 208 I 2 5 20 180 |*./и I 2 4 11 34 156 1,044 1 3 7 15 31 63 127 1*./П 1 2 5 12 27 58 121 !*./<! 1 2 4 7 11 16 22 Р2, Рз, Рд на рис. 4.24 являются /-эквивалентными Р-структура- ми из множества ^4. Для того чтобы можно было составить представление о ско- рости роста числа структур этих трех типов с ростом п, а также числа их классов /- и /-эквивалентности, в табл. 4.12 приведены соответствующие данные для л^7. Понятно, что |«Ч = |Л| = 1&|. где показатель п(п—1)/2— общее число возможных ребер в гра- фе, определенном на Nn. Ясно также, что |^п//|:=л(л—1)/24-1. Вычисление |5?я//| для заданного более сложно, но эта задача уже решена в теории графов (см. 4.11). Приведенные в табл. 4.12 значения |^+п|, |^+п//|, |^+п//|, |^п| |^п//| и |^я//| известны только для л ^7. Полные каталоги решеток (^п//, и ('S'n/i, для л=3, 4, 5 приведены в приложении D. Они получены исключительно с по- мощью PC-процедуры и проверены на изоморфизм на компью- тере. Д Введем упоминавшиеся уже структуры еще одного типа. Это такие структуры, для которых при работе с вероятностными си- стемами для определения несмещенной реконструкции не нужна итеративная процедура соединения. Обычно их называют аци- клическими структурами. Для решения задачи реконструкции наибольший интерес представляют ациклические структуры особого типа, которые можно было бы назвать строго ациклическими структурами или /.-структурами. G-структура G,eGn является A-структурой тог- да и только тогда, когда не существует такой пары (а, &)е№л, что она входит в некий элемент G, и связана через несколько со- 262
единенных элементов. Будем множество L-структур для некоего п обозначать 2?п- Определим множество 2?п формально. Пусть дана G-структу- ра G/e^n- Для любой пары (а, Ь)е№п пусть Ха,ъ^= {x\xf^Git {а, Ь}с=х}. Тогда Gi является L-структурой (G,e^n) тогда и только тогда, когда не существует пары (a, b)^N2n, являющейся элементом транзитивного замыкания rn(G,-—Ха,ь). Очевидно, например, что все структуры из множества (рнс. 4.16), за исключением структуры ^2={{1, 2}, {2, 3}, {3, 1}}, являются /.-структурами. В множестве 3’4 только три структуры пе являются /.-структурами. Они принадлежат к од- ному и тому же классу г-эквивалептности, который можно, на- пример, представить С-структурой С={{1, 2}, {2, 3}, {3, 4}, {4, 1}}. В самом деле, транзитивное замыкание г4(С—Xi>2)—это У4, и, следовательно, пара (1, 2) является ее элементом. /.-структуры отличаются тем, что для них не нужно исполь- зовать итеративную процедуру соединения независимо от поряд- ка, в котором объединяются элементы рассматриваемой /.-струк- туры. Ациклические структуры, пе являющиеся /.-структурами, этим замечательным свойством не обладают. Для таких струк- тур, чтобы избежать применения итеративной процедуры соеди- нения, нужно применять базовую процедуру соединения к эле- ментам, расположенным в определенном порядке. Определение таких порядков требует сложных вычислений и проверок, так что методологическое значение таких структур существенно уступа- ет значению /.-структур. ▲ С помощью различных понятий, введенных в этом разделе, можно более конкретно сформулировать задачу реконструкции. Дана обобщенная система и множество заданных пользователем реконструктивных гипотез (базирующихся па множестве $п, ^п> &п или З’п-структур). Решение задачи реконструкции сводится к выбору подмножества данного множества в соответствии с не- которыми требованиями. Обычно требуется, чтобы: 1) расстоя- ния, соответствующие выбранным гипотезам, были как можно меньше и 2) сами гипотезы были, возможно, более уточненными. Оба эти требования предполагают упорядочение множества ре- конструктивных гипотез. Упорядочение в соответствии с требова- нием 2 фиксировано — это частичное упорядочение по структур- ному уточнению с решеткой, свойства которой описаны выше. Упорядочение согласно требованию 1 — его можно назвать упо- рядочением по расстоянию — пе фиксировано. Оно зависит от данной обобщенной системы и выбранного типа расстояния и оп- ределяется только вычислением несмещенных реконструкций и расстояний отдельных реконструктивных гипотез. 263
Если используется расстояние, определяемое по формуле (4.40) для вероятностных систем [или по формуле (4.42) для возможностных систем], которое является мерой количества ин- формации, потерянной при замене обобщенной системы реконст- руктивной гипотезой, то существует определенное предупорядо- чение' по расстоянию: информационное расстояние монотонно не убывает с увеличением уточнения реконструктивных гипотез. Кроме того, оба варианта информационного расстояния адди- тивны для любого пути на используемой решетке уточнения. Это значит, что D(f*, n=D(f\ fy)+D(fv, р) (4.43) для любых трех реконструктивных гипотез х, у, z одной обоб- щенной системы, таких, что x'^y'^z. Свойства предупорядочеп- ности и аддитивности очень полезны при решении задачи рекон- струкции и придают особую важность информационному расстоя- нию. В дальнейшем при обсуждении задачи реконструкции всегда будет предполагаться, что используется соответствующая вер- сия информационного расстояния (т. е. вероятностная или воз- можностная, базовая или порождающая). Сочетание упорядочения по расстоянию с упорядочением по уточнению образует объединенное упорядочение для задачи ре- конструкции. Теперь множество решений задачи реконструкции характеризуется с помощью этого комбинированного упорядоче- ния следующим образом: это множество представляет собой такое подмножество реконструктивных гипотез, в которое не входят гипотезы, худшие, чем любая другая гипотеза. Слово «худшие» используется здесь в обычном смысле: гипотеза hi хуже гипоте- зы /г2 тогда и только тогда, когда или ht является менее уточ- ненной и ее расстояние не меньше, чем у й2 или у /ц, большее расстояние, чем у /г2, и в то же время она не является более уточненной, чем /г2. Элементы этого множества решений будем называть подходящими реконструктивными гипотезами. Теперь видно совершенное сходство задачи реконструкции с двумя рассмотренными выше задачами — задачей определения подходящих систем с поведением (разд. 3.4 и 3.6) и задачей оп- ределения подходящих упрощений заданной системы с поведе- нием (разд. 3.9). Если упорядочение по нечеткости и упорядоче- ние по сложности из этих задач сопоставить соответственно с упорядочением по расстоянию и упорядочением по уточнению из задачи реконструкции, то сходство этих трех задач станет оче- видным. Предоставляем читателю использовать это сходство для формального определения комбинированного упорядочения и множества решений для задачи реконструкции. 1 В данном случае под предупорядочепием понимается не научный термин, обозначающий рефлексивное и транзитивное отношение, а некое частичное упо- рядочение. 264
Стоп Продолжение работы с множеством реконструктивных гипотез X Рис. 4.25. Общая схема процесса решения задачи реконструкции Мы видим, что задачи, связанные с подъемом по эпистемоло- гической иерархии систем, а также с упрощением систем, обра- зуют важнейшую категорию задач, имеющих следующие общие черты: ДАНО: множество X рассматриваемых систем; а b с множество отношений порядка ... па X. МНОЖЕСТВО РЕШЕНИЙ: Xs= {хеХ| (VyeJ0 (y^x=>xsZCy)}, « где sC— объединенный порядок предпочтения па X, определен- ный для всех х, у^Х следующим образом: « а х^.у тогда и только тогда, когда х < у, Ь с И х<у, и у, и ... В процессе решения задачи реконструкции необходимы три набора процедур: 1) процедуры порождения всех нужных реконструктивных ги- потез; 2) процедуры оценки и сравнения порожденных реконструк- тивных гипотез с точки зрения целей задачи реконструкции; 265
3) процедуры, которые на соответствующих этапах процесса решения задачи принимают решение о том, какие из порожден- ных реконструктивных гипотез должны быть включены в мно- жество решений, какие использованы для дальнейшего порожде- ния реконструктивных гипотез и должен ли процесс решения продолжаться или закончиться. На рис. 4.25 показано, каким образом эти три набора проце- дур объединяются в единый процесс решения. Ядром процесса является порождение всех подходящих реконструктивных гипо- тез. Удобно это делать, порождая соответствующие структуры, которые затем интерпретируются как реконструктивные гипоте- зы для заданной обобщенной системы. Интерпретация эта сво- дится к установлению соответствия между переменными обоб- щенной системы и целыми числами, которыми идентифицированы узлы структур, а также к вычислению, если нужно, проекций обобщенной функции поведения. Порожденные структуры мож- но разными способами сократить, что уменьшает время вычисле- ний и их цепу, а также, возможно, и по другим соображениям. Например, можно выбрать подмножество соответствующих G-, С- или L-структур или ограничиться рассмотрением только тех уровней уточнения (классов /-эквивалентности), для которых по- теря информации не превышает некоторого заданного пользова- телем значения. Таким образом, процесс порождения реконст- руктивных гипотез может быть ограничен либо набором рассмат- риваемых структур, либо ограничениями на способ порождения. Для достижения гибкости в решении задачи реконструкции УРСЗ должен располагать разнообразным набором способов порождения (примечание 4.10), но этот вопрос находится за пределами проблем, связанных с архитектурой УРСЗ. Это спо- собы порождения соответствующих уточнений (или укрупнений) имеющихся реконструктивных гипотез, примерами чему служат RG-процедура и /?С-процедура (и их укрупняющие аналоги). Как уже говорилось выше, порождение структур также мо- жет быть организовано на нескольких уровнях вычислений. Так, например, /?С-процедура может быть использована на глобаль- ном уровне для работы с классами г-эквивалентности G-струк- тур. Модифицированная R G-процедур а, в которой на шаге 3 вме- сто |*S|^2 используется условие |ftS| >2, которое затем на ло- кальном уровне для порождения непосредственных уточнений некоторых важных классов r-эквивалентности, определенных на глобальном уровне. Часто бывает необходимо породить уточнения или укрупне- ния нескольких структур одного уровня уточнения. В этих слу- чаях нужно использовать такие процедуры, которые не порож- дают одинаковых структур. Вход в процедуры для оценки реконструктивных гипотез — второй блок на рис. 4.25 — состоит из порожденных реконструк- 266
тивных гипотез и различных способов оценки и критериев, опре- деленных пользователем. К ним относятся определения расстоя- ния (а также другие необходимые характеристики, такие, как ко- эффициент идентифицируемости, реконструктивная нечеткость или некий уровень доверия) и принцип, на котором основывается реконструкция (несмещенная, минимаксная и т. д.). По умолча- нию следует использовать такие хорошо теоретически обосно- ванные понятия, как информационное расстояние и несмещенная реконструкция. Полученные реконструктивные гипотезы нуж- ным образом оцениваются и сравниваются. Если получены ин- тересующие пользователя результаты, особенно относительно множества решений, то они выдаются на печать. Процедуры принятия решений — третий блок на рис. 4.25 — используют информацию об оценке реконструктивных гипотез и принимают различные решения в соответствии с заданными поль- зователем критериями. Самые важные — это решение о том, про- должать или завершить процесс решения, и, если процесс про- должается, решение о том, какая из реконструктивных гипотез должна использоваться па следующем шаге (множество X на рис. 4.25). Проиллюстрируем некоторые вопросы, связанные с задачей реконструкции и рассматриваемые в этом разделе, на нескольких примерах. Пример 4.19. Рассмотрим возможиостную систему с поведе- нием, определенную на данных, полученных путем наблюдения за четырьмя переменными, характеризующими работу вычисли- тельного комплекса. Целью является нахождение условий, при которых загрузка ЦП (центрального процессора) оказывается высокой. Наблюдаемые значения переменных представляют за- грузку ЦП и трех каналов, скажем каналов KI, К2 и КЗ. Наблю- дение проводилось в течение одного часа типичной рабочей на- грузки комплекса, и загрузка каждого устройства фиксировалась с интервалом в 1 с. Таким образом, было сделано 3600 наблю- дений. Если загрузка, наблюдаемая в течение некоторого интер- вала— в 1 с, была меньше некоторого заданного исследователем порога (определенного на основании предшествующих исследо- ваний), то она считается низкой (Н), а если выше этого порога, то высокой (В). Для определения на этих данных системы с поведением иссле- дователь решил использовать возможиостную методологию без памяти. Из 16 возможных состояний переменных в действитель- ности наблюдались только 6. Поскольку эти состояния наблюда- лись примерно с одинаковыми частотами, исследователь решил, что функция поведения должна только отличать далее наблю- даемое и ненаблюдаемое состояния. Таким образом, он объявил, что единственно возможными состояниями являются наблюдае- мые ранее состояния. Эти состояния имеют возможность, рав- 267
ную 1, остальные состояния (т. е. которые не наблюдались) — равную 0. Полученная функция поведения f приведена в табл. 4.13. Опа дает исследователю понимание важной вещи: при некоторых изменениях в организации работы компьютера загруз- ка ЦП может поддерживаться по высоким уровням, если три канала загружены одним из следующих способов: К1 № КЗ Н В Н В Н Н Н В В Для подтверждения этой идеи исследователь решил изучить ре- конструктивные свойства обобщенной функции поведения f. Его интересовали только реконструктивные гипотезы без потери 'ин- формации. В этом случае переменные оказываются сильно ограниченны- ми (возможны только 6 из 16 состояний переменных). Однако легко определить, что проекции f, соответствующие любой паре из четырех переменных (всего таких пар шесть), совершенно не- ограничены, т. е. любое из четырех состояний, определенных па этой паре переменных, имеет возможность, равную 1. Следова- тельно, эти переменные попарно независимы, и обобщенная функция поведения не может быть реконструирована только по ее двумерным проекциям. Чтобы определить, может ли f вообще быть реконструирова- на по каким-либо проекциям, полезно сначала рассмотреть ре- конструктивные гипотезы, основанные на использовании С-струк- тур. С помощью /?С-процедуры мы получаем шесть реконструк- тивных гипотез на первом уровне уточнения. Их схемы и соот- ветствующие графы изображены на рис. 4.26,а. Каждая гипоте- за помечена номером в левом верхнем углу соответствующей клетки, а ее несмещенные реконструкции fh (h^.N6) приведены в табл. 4.13. Гипотезы 1, 4 и 6 в точности реконструируют f и являются перспективными кандидатами на включение в множе- ство решений. Каждая из оставшихся гипотез дает по четыре не- корректных состояния обобщенной системы. Они также имеют следующее информационное расстояние, вычисленное по форму- ле (4.42): (1 og210—1 og26) /log216= (3.32—2.58) /4=0.185. Несмещенные реконструкции вычисляются, разумеется, с по- мощью возможностного варианта процедуры соединения. Для реконструктивной гипотезы 1 опа показана на рис. 4.27. Связя- ми на диаграмме показаны те состояния отдельных трехмерных проекций, возможности которых равны 1. Результатом процеду- ры соединения, которая выполняется только один раз, являются 268
все четверки нз Н и В, которые лежат на путях на диаграмме, соединяющих левые и правые узлы. При изучении трех удачных реконструктивных гипотез, изо- браженных на рис. 4.26,а, видно, что все они содержат подсисте- му, основанную на переменных ЦП, К1 и К2. На рис. 4.26,а эта подсистема изображена заштрихованным прямоугольником. Та- ким образом, любая потенциально удачная гипотеза па следую- 269
ЦП К1 К2 КЗ Рис. 4.27. Иллюстрация к процедуре соединения для реконструктивной ги- потезы 1, изображенной на рис. 4.26 щем уровне уточнения должна со- держать эту подсистему. Таких гипотез только три (они показа- ны на рис. 4.26,6). Как следует из табл. 4.13, их несмещенные ре- конструкции равны. Происходит это из-за того, что двумерные проекции не содержат никакой ин- формации. Данная реконструкция не является безупречной: вме- сто шести реконструируется во- семь состояний, а их расстояния равны 0,105. Это согласно усло- виям задачи является неприем- лемым. Рассматривать укрупнения этих трех удачных реконструктив- ных гипотез нет необходимости, поскольку они явно хуже: по определению, они являются менее уточненными, а их расстояния не могут быть меньше расстояний успешных гипотез (т. е. не мо- гут быть меньше 0). Следует, однако, рассмотреть укрупнения неудачных гипотез 2, 3 и 5 (см. рис. 4.26,а). Воспользовавшись рис. 4.18, на котором изображена соответствующая решетка G-структур, можно установить, что рассматриваемые структу- ры— это G-структуры, принадлежащие классу изоморфизма G4. Из каждой подсистемы, изображенной на рис. 4.26,а, за исклю- Таблица 4.13. Возможностные функции поведения для обобщенной системы н некоторых несмещенных реконструкций из примера 4.19 ЦП К1 К2 КЗ f /2 г /’ f -Г /,0 н н н н 1 1 1 1 1 1 1 н н н в 1 1 1 1 0 1 1 н н в н 0 0 1 0 0 0 0 н н в в 0 0 1 1 1 0 1 н в н н 0 0 0 1 0 0 0 н в н в 0 0 0 0 1 0 0 н в в н 0 0 0 0 0 1 0 н в в в 1 1 1 1 1 1 1 в н н н 0 0 1 1 1 0 1 в н н в 0 0 1 0 1 0 0 в н в н 1 1 1 1 1 1 1 з н в в 1 1 1 1 1 1 1 в в н н 1 1 1 1 1 1 1 в в н в 0 0 0 0 0 1 0 в в в н 0 0 0 0 1 0 0 В в в в 0 0 0 1 0 0 0 270
чением успешных подсистем, представленных переменными ЦП, К1 и К2 (на рисунке они заштрихованы), выбираются две под- системы с двумя переменными. Однако мы знаем, что эти пары подсистем являются неподходящимХ и что подсистемы из двух переменных информации не добавляют. Следовательно, реконст- руктивные гипотезы из класса изоморфизма G4 могут быть от- брошены без вычисления несмещенных реконструкций и рас- стояний. Остается только рассмотреть реконструктивные гипотезы, ос- нованные на G-стрктурах из класса изоморфизма G3. Поскольку подсистемы, представленные переменными ЦП, К1 и К2, снова должны быть исключены из рассмотрения, то остается только одна гипотеза. Она показана на рис. 4.26,в, а ее функция пове- дения /10 приведена в табл. 4.13. Мы видим, что и эта гипотеза не подходит: ее расстояние равно 0.105, и, следовательно, она долж- на быть отвергнута. Поскольку укрупнением успешных реконструктивных гипотез является только гипотеза, основанная на G2, ее также не следу- ет рассматривать. Таким образом, можно прийти к заключению, что множество решений состоит из изображенных на рис. 4.26,а реконструктивных гипотез 1, 4 и 6. Данный результат подтверждает предположение пользовате- ля о том, что следует обратить внимание на критическую подси- стему, базирующуюся на переменных ЦП, К1 и К2. В соответст- вии с этим загрузка ЦП может поддерживаться на высоком уровне при любой организации вычислительного комплекса, при ко- торой не допускается, чтобы загрузка каналов К1 и К2 была од- новременно или высокой, или низкой. Пример 4.20. Пример основан на данных по использованию противозачаточных средств до замужества (см. 4.13). Состояния следующих двоичных переменных были определены на группе из 414 студенток старших курсов университета: Ui — отношение к внебрачным связям (0 — всегда отрицатель- ное, 1 — не всегда отрицательное); у2— обращение в университетскую клинику для предотвраще- ния беременности (0 — да, 1 — нет); Уз — девственность (0 — да, 1 — нет). Частоты N (с.) отдельных состояний и соответствующая вероятно- стная функция поведения f приведены в табл. 4.14а. Если рассматривать реконструктивные гипотезы, основанные только на С-структурах, то для получения гипотез первого уров- ня уточнения можно использовать 7?С-процедуру. Схемы гипотез, их графы и расстояния (полученные в результате выполнения этой процедуры) приведены на рис. 4.28. С помощью предупоря- дочения по информационному расстоянию по расстояниям для первого уровня уточнения мы можем, как это показано на ри- сунке, определить нижние границы расстояний для всех реконст- 271
Таблица 4.14. Функций поведения из примера 4.20,а и примера 4.21,6 (6) »2 «3 N(c) /(0 *2 «3 /(с) с = 0 0 0 23 0.056 с =0 0 0 0 1/3 0 0 1 127 0.307 0 0 1 0 2/3 0 1 0 23 0.056 0 0 2 0 1/3 0 I 1 18 0.043 0 0 3 0 1/3 1 0 0 29 0.070 0 1 0 0 1 1 0 1 112 0.270 0 0 3 I 1/3 1 1 0 67 0.162 0 1 0 1 2/3 1 1 1 15 0.036 0 1 1 1 1/3 0 1 2 1 I 0 1 3 1 1/3 0 0 2 2 1/3 1 0 1 2 1 1 0 2 2 1/3 1 0 3 2 2/3 1 1 3 2 1/3 0 1 0 3 1/3 1 1 1 3 2/3 1 1 2 3 2/3 1 1 3 3 1/3 руктивных гипотез второго уровня уточнения. Так, например, £>6^г0.0637, поскольку гипотеза 6 является уточнением гипотезы 3 и £>3 = 0.0637. По этим нижним границам расстояний сразу оп- ределяется, что гипотеза 2 входит в множество решений. Оценивая гипотезу 4, имеющую самую маленькую нижнюю границу среди конкурирующих гипотез второго уровня уточнения, получим, что действительное расстояние Z>4=0.0127. Поскольку оно меньше любой нижней границы для других гипотез и ^0.0637, то гипотеза 4 является членом множества решений. Обратите внимание на то, что мы пришли к этому заключению не прибегая к вычислению ни конкурирующих гипотез, ни ее преем- ника. Если нас интересует гипотеза 7, то можно вычислить, что £>7=0.0802, и понятно, ее следует включить в множество реше- ний, поскольку она является самой уточненной гипотезой из этой решетки уточнения. Элементы множества решений выделены на рис. 4.28 заштри- хованными прямоугольниками. В данном случае комбинирован- ное отношение упорядочения упорядочивает их полностью. Как видно, переменные щ (отношение) и и2 (обращения в клинику) 272
Рис. 4.28. Иллюстрация к задаче реконструкции, рассматриваемой в примере 4.20 18—6923 273
больше зависят от переменной из (девственность), чем друг от друга. Особенно сильна связь между v2 и v3. Пример 4.21. На этом примере мы хотим продемонстрировать некоторые проблемы, возникающие при решении задачи рекон- струкции в тех случаях, когда заданная функция поведения зави- сит от памяти. Данная система представлена тремя переменными, описывающими человека (uj — производительность труда, v2— общее состояние здоровья, и3 — стресс). Параметром является время (полностью упорядоченный параметр). Наблюдения дела- ются ежедневно в течение определенного периода времени. Огра- ничения на переменные заданы возможностной функцией пове- дения, приведенной в табл. 4.146. Они определены на множестве состояний следующих выборочных переменных: Sl,t = Vl,t S2lt = V2:t, $3.t=v3,t> Sitt=V3lt—i. Функция поведения получена по данным с помощью метода оцен- ки масок, описанного в разд. 3.6. Не вдаваясь в подробности от- носительно предыдущих этапов исследования, сосредоточим свое внимание на задаче реконструкции данной функции поведения. Пусть стандартная формулировка этой задачи основывается на идеях несмещенной реконструкции и информационного расстоя- ния. Предположим далее, что требуется, чтобы реконструктив- ные гипотезы основывались только на С-структурах, и что мак- симальное приемлемое расстояние равно 0.1. Сначала породим и оценим реконструктивные гипотезы, ос- нованные на С-структурах первого уровня уточнения. Они пока- заны па рис. 4.29 (гипотезы 1—6), причем выборочные перемен- ные Sk представлены их идентификаторами k (k^Nk), а подмно- жества переменных разделяются косой чертой. Оценка этих ги- потез заключается в определении их несмещенных реконструкций (с помощью возможностного варианта процедуры соединения) и вычисления их расстояний [по формуле (4.42)]. Поскольку гипотеза 4 имеет наименьшее расстояние (£>4 = 0), то породим и оценим все ее непосредственные С-уточпепия. Все- го этих уточнений пять, и они помечены номерами 7—11. Наи- меньшее расстояние в этой группе £>10 = 0.021. Из монотонности информационного расстояния следует, что расстояние любой ги- потезы на первом уровне уточнения является также нижней гра- ницей расстояний для всех ее уточнений. Следовательно, единст- венной гипотезой первого уровня уточнения, которая потенциаль- но может быть источником уточнений с расстояниями, меньшими или равными 0.021, является гипотеза 5, чье расстояние D5 = = 0.0179. Однако легко видеть, что любое непосредственное уточ- нение гипотезы 5 является одновременно уточнением какой-то другой гипотезы первого уровня. Отсюда следует, что любое не- 274
1 / В' 23/236 = 0.0776 2 В 23/136 2 =0.058 3 7 В" 23/126 '=0.0952 6 26/236 0^=0 5 В 26/236 5= 0.0179 В Л о6 ’6/136 = 0.0669 7 В 236/13 7~ 0.086 8 В 136/23 ’= 0.0681 9 16/t В 6/13/23 9 =0.122 10 В 36/16 °=0021 // в" 136/26 =0.0677 1=2 12 D'‘ 236/1 = 0.1626 13 / В7 t/26/36 0.065 16 11 О1' /26/23 = 0.1356 15 16 й15 /36/23 = 0.0887 16 12 [)/е /16/36 = 0.1188 1=6 17 Dn 2/13/6 = 0.2381 18 О№ 2/23/6 = 0.1763 19 й19 2/26/3 = 0.2056 20 L В20 ’/36/2 = 0.2381 1 = 6 Рис. 4.29. Реконструктивные гипотезы, оцениваемые в примере 4.21 посредственное уточнение гипотезы 5 либо находится среди гипо- тез 7—11, либо среди гипотез, нижняя граница расстояний кото- рых больше 0.021. Следовательно лучшей на втором уровне явля- ется гипотеза 10. Ее непосредственными уточнениями являются гипотезы 12—15, среди которых гипотеза 13 имеет наименьшее расстояние. Для того чтобы убедиться, что гипотеза 13 является лучшей на третьем уровне, необходимо оценить все остальные гипотезы этого уровня, за исключением уточняющих гипотез 1, 3, 7 и 8, нижние границы которых превышают D13. Поскольку гипотеза 7 является уточнением гипотезы 1, ею можно пренебречь. Графы гипотез 1, 3 и 8 приведены на рис. 4.30,а. Графы гипотез, не яв- ляющихся их уточнением на третьем уровне, должны содержать ребра (1, 4), (3, 4), а также либо ребро (1, 2), либо ребро (2, 4). Имеется всего два таких графа. Они приведены на рис. 4.30,6. Рис. 4.30. Графы некоторых реконструктивных гипотез, рассматриваемые в при- мере 4.21 18' 275
Первый на самом деле является графом гипотезы 13, второй представляет гипотезу 12/14/34, являющуюся единственным по- тенциальным конкурентом гипотезы 13. Оценив этого потенциального конкурента (на рис. 4.29 он по- мечен номером 16), мы получим, что Z)16=/=0.1188>£)13. Следова- тельно, гипотеза 13 является лучшей па третьем уровне уточ- нения. Поскольку наименьшее расстояние на третьем уровне (Di3 = =0.065) меньше, чем наибольшее допустимое расстояние, необ- ходимо исследовать 4-й уровень. На этом уровне 15 гипотез (представленных всеми парами ребер на графе из четырех уз- лов), по только четыре из них не являются уточнениями гипотез 9, 12, 14 и 16, расстояния которых превышают критическое зна- чение 0.1. Это гипотезы 12/13/4, 12/23/4, 12/24/3 и 13/34/2. Их номера и расстояния приведены на рис. 4.29. Поскольку все эти расстояния превышают 0.1, никакая из этих гипотез не входит в множество решений, и дальнейшие уточнения не нужны. Мно- жество решений полностью упорядочено и состоит из гипотез 4, 10 и 13 (а также, возможно, гипотезы 0 — обобщенной системой 1234). Обратите внимание па то, что, используя предупорядочение по информационному расстоянию, нам удалось решить эту задачу (причем совершенно точно), оценив только 20 из 63 возможных реконструктивных гипотез, т. е. только одну треть всех гипотез. Для систем с большим числом переменных применение предупо- рядочепия по информационному расстоянию еще более эффек- тивно. Вообще говоря, чем больше отличаются (по расстоянию) оце- ниваемые реконструктивные гипотезы на отдельных уровнях уточнения, тем эффективнее использование этого предупорядо- чения. Часто бывает полезно посмотреть на приращения минималь- ного расстояния, соответствующие соседним уровням уточнения. Для этого определяется расстояние для наиболее уточненной ги- потезы и вычисляется среднее приращение расстояния, равное этому наибольшему расстоянию, деленному на общее число уров- ней уточнения. В данном примере расстояние для наиболее уточ- ненной гипотезы 1/2/3/4 равно 0.4591, следовательно, среднее приращение расстояния равно 0.4591/6=0.0765. Экстраполируя по известным значениям расстояний, можно получить график за- висимости минимального расстояния Д от уровня уточнения I. Этот график для данного примера приведен на рис. 4.31. График точен для 1=0, 1, 2, 3, 6, приблизителен для 1=4 (нам извест- но, что 0.1188^0.1748) и оценен для 1=5. Остается только решить вопрос относительно однозначности управления для каждого элемента множества решений (разд. 4.4, пример 4.6). Как показано на рис. 4.32,а, переменные 1, 2, 3, оче- 276
Рис. 4.31. Зависимость минимально- го расстояния Di от уровня уточне- ния I (пример 4.21) видно, являются порождаемыми, а единственной порождающей переменной является переменная 4. Каждая порождаемая пере- менная должна управляться (оп- ределяться) в точности одной подсистемой реконструктивной гипотезы. Для гипотезы 134/234 ясно, что переменные 1 и 2 управ- ляются соответственно подсисте- мами 134 и 234, однако перемен- ная 3 может управляться любой из них. Решение о том, какая из подсистем должна быть выбра- на для управления переменной 3, должно быть принято исходя из их порождающих нечеткостей. Для данного примера вычис- ленные (7-нечеткости равны: U(3| 1,4) =0.834 для подсистемы 134 и (7(3|2,4) для подсистемы 234. Так как U (312,4) <(7(311,4), для управления переменной выбирается вторая подсистема. Нужно также принять решение о том, как представить в под- системах порождающую переменную 4. Здесь есть три возмож- ности: переменная может запоминаться в одной из подсистем или в обеих. Если она запоминается только в одной подсистеме, опа должна использоваться как входная переменная другой под- системы. Однако необходимо отметить, что разница между этими возможностями скорее внешняя, чем функциональная, и, следо- вательно, выбор может быть произведен совершенно произволь- но. Пусть в нашем примере переменная 4 будет запоминаться в подсистеме 234 и рассматриваться как входная переменная под- системы 134. Из принятых решений относительно ролей переменных 3 и 4 реконструктивной гипотезы 134/234 будет получена схема, изо- браженная на рис. 4.32,6. На этой схеме также приведены маски, соответствующие отдельным подсистемам, причем указаны по- рождаемые, порождающие и входные переменные. Окончательные схемы остальных элементов множества реше- ний— гипотез 14/234 и 14/24/34 — приведены соответственно на рис. 4.32,в и г. В обоих случаях роли выборочных переменных, как это показано на схемах, определяются единственным об- разом. Важно понимать, что для зависящих от памяти систем осмыс- ленными являются далеко не все реконструктивные гипотезы. В самом деле, понятно, что гипотеза не имеет смысла, если по- рождающая переменная не входит по крайней мере в одну под- систему этой гипотезы, содержащую соответствующую порождае- мую или входную переменную или другую порождающую пере- менную (определенную на той же базовой переменной), по кото- 277
7- Порождаемая и Выходная ' переменная ~^к>Входные —1 переменные порождающая переменная Порождаемые и Выходные переменные Входная переменная Порождаемая и Выходная переменная Рис. 4.32. Подробное изображение элементов множества решений из примера 4. 278
рой она может быть определена с помощью запоминания. Такая порождающая переменная может быть оставлена неопределен- ной, поскольку она не может быть ни порождена (так как она порождающая), ни определена с помощью запоминания другой переменной, которая сама определяется некоторым особым об- разом. Так, например, если обобщенная система описывается маской, изображенной на рис. 4.32,а, то все гипотезы, для кото- рых переменные 3 и 4 не входят по крайней мере в одну общую подсистему, являются бессмысленными. Из этого следует, что в данном случае ровно половина реконструктивных гипотез, ба- зирующихся на С-структурах, являются бессмысленными; это те гипотезы, графы которых не содержат ребра (3, 4), т. е. гипоте- зы 123/124; 14/24/23, 123/4, 13/24 и т. д. Несмотря на то, что мно- жество решений в примере 4.21 не содержит бессмысленных ги- потез, сам процесс решения может быть упрощен за счет того, что оценивались бы только осмысленные гипотезы (не нужнс было оценивать 8 из 20 оцененных гипотез). Если предположить, что используемое параметрическое мно- жество полностью упорядочено, то можно следующим образом определить содержательную реконструктивную гипотезу для за- висящей от памяти обобщенной системы с поведением. Реконст- руктивная гипотеза h является содержательной тогда и только тогда, когда любая порождающая переменная Sk, определяемая уравнением Sk,t — Vi,t+a> входит по крайней мере в одну подсистему h, содержащую пере- менную Sj, которая определяется уравнением si,t—Vi,t+b, где Ь>а, если переменные порождаются по возрастанию t (предсказание), и Ь<2а, если переменные порождаются по убы- ванию t (восстановление). Понятие содержательной реконструк- тивной гипотезы может быть легко обобщено на зависящие от памяти системы, базирующиеся на двух и более полностью упо- рядоченных параметрических множествах (таких, как двух- и трехмерные декартовы пространства), однако для таких систем формализация оказывается существенно более сложной прежде всего из-за значительного роста числа возможных порядков по- рождения.
4.8. АНАЛИЗ РЕКОНСТРУИРУЕМОСТИ Разрозненные факты подавляют не- гибкий ум. Но лишь возникнув, связь Распространяется как по равнине. Тень облака, очерчивая гору. У. Стивенс Анализ реконструируемости — это пакет методологических ин- струментов, входящий в УРСЗ и используемый при решении це- лого класса задач, имеющих следующее общее свойство: в них изучается взаимосвязь между обобщенными системами и раз- личными их подсистемами. В задачах этого класса фигурируют системы двух эпистемологических типов: порождающие системы и структурированные порождающие системы, причем обычно они представляются в виде систем с поведением. Эти задачи естест- венным образом разбиваются на два подкласса в зависимости от эпистемологического уровня исходной (заданной) системы. Зада- чи, в которых исходная система является порождающей структу- рированной, называются задачами идентификации, а задачи, в которых исходная система является структурированной систе- мой,— задачами реконструкции. Самые общие типы задач идентификации и реконструкции, в которых множества состояний переменных не обладают ника- кими особыми свойствами, сформулированы и рассмотрены соот- ветственно в разд. 4.6 и 4.7. Основные вопросы (подзадачи), свя- занные с этими задачами, не зависят от конкретных методологи- ческих отличий и являются предметом общего анализа реконструируемости. Они показаны на рис. 4.33 и приведены в следующем списке: определение реконструктивного семейства для заданной систе- мы с поведением; определение коэффициента идентифицируемости (реконструк- тивной нечеткости) для заданной системы с поведением; определение несмещенной реконструкции для заданной систе- мы с поведением; определение реконструкции наименьшего риска или, возмож- но, реконструкции какого-то другого типа для заданной системы с поведением; разрешение локальных несогласованностей в заданной систе- ме с поведением (разд. 4.11); порождение подходящих реконструктивных гипотез для за- данной системы с поведением; вычисление соответствующих проекций заданной системы с по- ведением; 1 Перевод с английского А. Горлина. — Прим. ред. 280
ЗАДАЧИ ИДЕНТИФИКАЦИИ Запанная структурированная система с поведением Множество функций поведения, сопоставимых с SF: CSF хД‘*^ный ВыВод Несмешенная реконструкция Разрешение локальных несогласованностей решенная реконстрУ^-и<* а"лимер, минимаксная Реконструкция! ;-SF- • Реконструктивное семейства SF: (Rsp. • КОзффициент идентифицируемости SF:/sf ЗАДАЧИ РЕКОНСТРУКЦИИ Множества подходящих реконструктивных^ гипотез для F для отдельных уровней уточнения (множество решении) Рис. 4.33. Основные вопросы, связанные с анализом реконструируемости вычисление расстояния между заданной системой с поведе- нием и системой, реконструированной по реконструктивной гипо- тезе; упорядочение соответствующих реконструктивных гипотез и определение приемлемых реконструктивных гипотез (множества решений задачи реконструкции); 281
Рис. 4.34. Категории задач, рассмат- риваемые при анализе реконструи- руемости определение управления для рассматриваемых переменных. Если посмотреть с точки зре- ния эпистемологической иерар- хии систем, то легко увидеть, что анализ реконструктивности пред- ставляет собой решение последо- вательностей задач, принадле- жащих к четырем категориям, которые на рис. 4.34 изображе- ны помеченными стрелками. При- ведем список подзадач, относя- щихся к каждой категории: 1 — реконструктивное семей- ство, коэффициент идентифици- руемости, несмещенная реконст- рукция или реконструкция наи- меньшего риска; 2 — проекции; 3 — разрешение локальных несогласованностей, порождение и упорядочение реконструктивных гипотез, управление перемен- ными; 4 — расстояние. При других методологических отличиях возникают другие ти- пы задач идентификации и реконструкции. Например, если пере- менные непрерывны, то проекции обобщенной системы с поведе- нием зависят не только от выбранных подмножеств переменных, но и от преобразований координат. Так, трехмерный объект, изо- браженный на рис. 4.35,а, может быть полностью реконструиро- ван по трем своим двумерным (планарным) проекциям (видам), скажем по виду слева, виду спереди и виду снизу (рис. 4.35,6) в соответствии с декартовыми координатами, определенными на этом объекте. Несмотря па то, что реконструируемость сохраня- ется при изменении положения начала системы координат, оче- видно, что это свойство не сохраняется при вращении координат. В действительности существует континуум проекций одного объ- екта, соответствующий континууму вращений системы координат или, иначе, континууму вращений объекта в одной системе коор- динат. Кроме того, дополнительные проекции могут быть полу- чены на любую плоскость, определенную в данной системе ко- ординат. Необходимо отметить, что показанные па рис. 4.35 про- екции являются проекциями специального типа — так называемые ортогональные проекции, получаемые опусканием перпендикуля- ра па плоскость проектирования из каждой точки объекта. Дру- гим типом проекций являются так называемые тени, получаемые соединением каждой точки объекта с некоторой фиксированной точкой (называемой точкой проекции или источником света). По- 282
a) Рис. 4.35. Трехмерное тело, реконструируемое по трем своим двумер- ным ортогональным про- екциям Вид следи Вид спереди Вид снизу 51 лученные пересечения этих прямых с плоскостью проектирования и дают тень. Понятно, что и здесь имеется континуум проекций, соответствующий континууму положений точки проектирования. Далее, пересечения объекта с различными плоскостями,— так называемые сечения,— также могут быть использованы в качест- ве двумерных представлений. Несмотря на огромное разнообразие возможных проекций для систем с непрерывными переменными, основные понятия, связан- ные с отношением целого (скажем, трехмерных объектов) и ча- стей (их различных двумерных и одномерных проекций), такие, как реконструктивное семейство, несмещенная реконструкция, локальная согласованность, расстояние и т. д., остаются теми же самыми, даже если они принимают некие специфические формы. Например, процедура соединения, с помощью которой по дву- мерным ортогональным проекциям определяется несмещенная реконструкция, состоит в восстановлении для каждой из проек- ций бесконечных цилиндров и определении общего объема этих цилиндров (т. е. множества точек, принадлежащих их пересече- нию). Разумеется, существуют некоторые дополнительные проб- лемы, связанные с непрерывными переменными. Они прежде всего связаны с выбором соответствующих проекций. Несмотря на то, что эти проблемы имеют важное значение в таких обла- стях, как оптика, механика, картография или томография, это тем не мепее проблемы, частные, не применимые ко всем системам. Поэтому они не входят в сферу вопросов, рассматриваемых в данной книге, хотя в УРСЗ должны быть включены соответст- 283
вующие методы решения этих задач. Некоторые из этих задач рассматривались в дескриптивной геометрии и в последнее время в системах обработки изображений. Методологический пакет, такой, как пакет анализа реконст- руируемости, должен быть доступен как в интерактивном, так и в автоматическом (пакетном) режиме. При работе в интерактив- ном режиме пользователь может применять соответствующие процедуры в любом порядке и объеме, принимает решения, исхо- дя из промежуточных результатов и собственного опыта. Например, при решении задачи реконструкции он может начать с ис- ходной структурированной системы как возможной реконструк- тивной гипотезы, оценить ее и, если нужно, сравнить с непосред- ственными уточнениями, со всеми реконструктивными гипотезами, в ее структурном соседстве, с другими возможными гипотезами, не находящимися в соседстве, или предпринять какие-либо дру- гие действия. При решении задачи идентификации можно срав- нить несколько вариантов структурированных систем по их ко- эффициентам идентифицируемости. В зависимости от полученных результатов можно определить затем или реконструктивные се- мейства, или только некие типы реконструкций для некоторых из них. То, что интерактивный режим дает возможность пользова- телю сосредоточить внимание на конкретных вопросах и восполь- зоваться своим опытом и знаниями, является большим преиму- ществом интерактивного режима при работе с большими систе- мами, в которых полная обработка практически невозможна из-за неприемлемых запросов иа вычислительные ресурсы. При работе в автоматическом режиме пользователю должен быть предоставлен набор последовательностей различных проце- дур, что позволило бы ему выбирать различные варианты реше- ния задачи. Так, например, при решении задачи реконструкции одна из последовательностей процедур, повторяющаяся на каж- дом уровне уточнения, может состоять из /?С-п,роцедуры, про- цедуры соединения, вычисления расстояния и процедуры приня- тия решения о продолжении. В другой последовательности RC- процедура может быть заменена на /?О-процедуру (ограниченную уточнениями из одного класса r-эквивалентности), за которой следуют три остальные процедуры (процедура соединения и т. д.); другие последовательности могут базироваться на укрупнении, а не на уточнении и т. п. Одна из последовательностей должна выполняться по умолчанию, например простая последователь- ность, основанная на 7?С-процедуре. Помимо своей основной роли при анализе систем естествен- ного происхождения, реконструктивный анализ может быть при- менен также и для решения задач, связанных с искусственными системами. Понятие структурного соседства можно, например, непосредственно использовать для обнаружения дефектов в свя- зях между элементами структурированной системы в тех случа- 284
ях, когда непосредственное наблюдение связей невозможно. Пра- вильно использованное, оно может оказать большую помощь и при проектировании. Его, например, можно применять для опре- деления всего множества структурных уточнений, полностью со- храняющих данную проектируемую систему с поведением. Такие уточнения являются основой для естественного способа проекти- рования по частям, что делает этот процесс более управляемым. Под «естественным» здесь понимается то, что эти уточнения со- держат только входные и выходные переменные, входящие в дан- ную систему с поведением, т. е. не содержат дополнительных (или искусственных) переменных, вводимых на данном этапе. В каж- дом уточнении по крайней мере некоторые из заданных перемен- ных входят в несколько подсистем и, следовательно, играют не- сколько разных ролей. В максимально подробных уточнениях множественность использования любой переменной достигает предела. Далее переменные должны при необходимости вводить- ся с помощью обычных методов декомпозиции или другого под- ходящего метода проектирования. Несмотря на такое использование реконструктивного анализа для искусственных систем, необходимо подчеркнуть, что основ- ным его назначением является исследование естественных систем. Дело в том, что отношение часть-целое в естественных системах куда более неопределенно, чем в естественных. Так, например, любая искусственная система является также определением со- ответствующей обобщенной системы. Это непосредственно сле- дует из того факта, что соединяющие переменные в любой искус- ственной системе являются либо переменными, которые прямо представляют единственную систему с поведением (определен- ную в задаче проектирования), либо искусственными соединяю- щими переменными, введенными только для косвенного пред- ставления этой единственной системы. Следовательно, реконст- руктивное семейство любой искусственной структурированной системы является единственным и представляет собой объедине- ние функций поведения ее элементов. То есть обобщенная систе- ма любой искусственной структурированной системы всегда представляется несмещенной реконструкцией этой структуриро- ванной системы. Это взаимно однозначное соответствие между искусственными структурированными системами и связанными с ними обобщен- ными системами является, без сомнения, доводом, возможно са- мым главным, в пользу того, что связь между сопоставимыми системами с поведением и структурированными системами при исследовании систем (т. е. при исследовании естественных си- стем) часто недостаточно хорошо понимается, особенно людьми с инженерной подготовкой. В самом деле, в литературе описано множество больших систем, которые, как предполагается, описы- вают различные естественные явления и составлены из меньших 285
взаимосвязанных систем (подсистем). На основании полученной конкретной структурированной системы делаются выводы о свой- ствах обобщенной системы так же, как это делается для анало- гичных искусственных систем, т. е. с помощью соединения или композиции функций поведения соответствующих элементов. По- нятно, что подобные выводы основываются на предположении, что структурированные системы представляют эту обобщенную систему точно так же, как для искусственных систем. Это недо- казанное и обычно неверное предположение, которое в подобных исследованиях никогда явно не декларируется, принимается без доказательства из-за неправомерной и сбивающей с толку ана- логии с искусственными системами. Любопытно сопоставить эти наши рассуждения с очень образ- ными рассуждениями, с помощью которых Р. Розен пришел практически к тем же выводам [274]: Под анализом здесь понимается разложение системы на семейство в неко- тором смысле более «простых», чем эта система, подсистем, полученных из нее, и попытки вывести свойства этой системы из свойств ее подсистем. Выделению подсистем формально соответствует процесс абстрагирования, при котором из первоначальной системы исключается ряд степеней свободы (т. е. потенциальных интерактивных возможностей), и Их остается только ограниченное число. Этот процесс может быть реализован физически (когда специалист по молекулярной биологин выделяет из клетки прнмсси, создавая тем самым абстрактную клетку), а может быть чисто формальным (когда эколог представляет популяцию реаль- ных организмов в терминах отношения хищннк-жертва). Такие абстракции долж- ны удовлетворять следующим основным требованиям: 1) полученные подсистемы должны быть «проще» первоначальной системы, из которой оии абстрагированы; 2) эти подсистемы должны быть получены «естественным» образом (т. е. с помощью известных и обоснованных процедур); 3) свойства полученных таким образом процедур должны позволять опреде- лить свойства первоначальной системы. Очевидно, что требование 1 является решающим; ничего не получится, если выделенные системы будут столь же необозримыми, как и первоначальная си- стема. В научных методах анализа это неявно было понято давно. Столь же важно требование 3: всякое свойство отдельных подсистем, не переносимое на свойства первоначальной системы, является артефактом *. Требование 2, однако, является субъективным и связано с тем, как следует работать с первоначальной системой. Таким образом, оио ие равноценно требованиям 1 и 3. Тем не менее во многих эмпирических подходах к системному анализу наи- большее внимание уделяется именно требованию 2. Вероятно, интуитивно пред- полагается, что, если процедуры удовлетворяют требованию 2, то требования 1 и 3 будут выполнены автоматически. По крайней мере, считается, что из 1-J-2 следует 3. Однако, как уже было сказано, в общем случае это совершенно не- 1 В данном случае, искусственно созданным фактом.— Прим. ред. 286
верно. В самом деле, мы знаем, что важнейшие свойства 1 и 3, которые должны быть выполнены с помощью любых средств системного анализа, должны допус- кать определение того, что мы рассматриваем как «естественное». Действительно, «естественность» не должна постулироваться заранее, а должна определяться в контексте рассматриваемых задач. Приведем в пояснение простой пример. Задача трех тел в физике является сложной во вполне определенном смысле: динамические уравнения, описывающие произвольную систему из трех гравитационных масс, не могут быть проинтегри- рованы непосредственно. Можно попробовать подойти к решению подобной за- дачи путем анализа семейства более «простых» подсистем. Интуитивно кажется, что такими системами являются системы из двух тел и из одного тела. Они и в самом деле «проще» первоначальной системы, и получены из нее «естествен- ным» образом. Тем не менее ясно, что таким образом решить задачу трех тел нельзя, поскольку декомпозиция исходной системы на отдельные подсистемы не- обратимо нарушает ее первоначальную динамику, которая нас и интересует (здесь мы снова сталкиваемся с неспособностью физики работать с произволь- ными взаимодействиями). Таким образом, для решения задачи трех тел наши ка- жущиеся «естественными» декомпозиции бесполезны; если какой-то анализ и по- дойдет для решения задачи такого типа, то соответствующие подсистемы (т. е. подсистемы, удовлетворяющие требованию 3 будут совершенно «неестественны- ми» с точки зрения обычного физического разбиения системы иа части. 4.9. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ Эксперименты на компьютере не только возможны, но и могут дать информа- цию, которую невозможно получить иным путем. У. Росс Эшби В этом разделе в качестве примера метаметодологических средств УРСЗ описываются вычислительные эксперименты, с по- мощью которых можно определить некоторые важнейшие харак- теристики анализа реконструируемости (связанные с задачей ре- конструкции). Эти характеристики нужны для более глубокого по- нимания реконструктивного анализа, помощи пользователям УРСЗ по применению реконструктивного анализа при общесистем- ных исследованиях и оценки новых принципов, таких, как прин- цип индуктивного вывода, рассматриваемый в разд. 4.10. В типичном эксперименте реконструктивная гипотеза выбира- ется при заданном числе переменных и мощностях их множеств состояний. Затем процесс порождения данных с помощью этой ги- потезы моделируется на компьютере. В большей части этих экс- периментов порождается последовательность из 2000 элементов данных. В соответствии с описанными выше правилами анализ реконструируемости проводится на 10 разных сегментах этих по- 287
следовательностей, содержащих 10, 20, 40, 80, 160, 320, 640, 1000, 1500 и 2000 элементов данных. Полученные для каждого сегмента результаты затем сравниваются с данной реконструктивной гипо- тезой. Для заданного числа переменных и их множеств состояний по- рождается и анализируется соответствующее число различных по- следовательностей данных. Усредненные результаты этих экспери- ментов затем используются для определения различных характе- ристик. Эксперименты для простоты ограничиваются только С-структурами. Они были проведены для множеств ^3, и ^5; для каждого множества были соответствующим образом представ- лены все уровни уточнения. Аналогичные эксперименты были про- ведены для множеств состояний одинаковой мощности (2, 3, 4 и 5) для всех рассматриваемых переменных, а также для определен- ных смесей разной мощности. Поскольку отличия переменных, описываемых масками и средами, которые для общесистемных ис- следований очень важны, собственно для реконструктивного ана- лиза значения не имеют, эксперименты проводились только для нейтральных систем без памяти. Последовательности данных порождались с помощью генера- тора случайных чисел в соответствии с конкретной вероятностной структурированной системой (представленной С-структурой). За- тем они анализировались вероятностным и возможностным мето- дами. На самом деле одной из целей проведения экспериментов было сравнение этих двух методов и определение их областей применения. На начальном этапе эксперимента было замечено, что возмож- ностный анализ демонстрирует тенденцию к естественной класси- фикации реконструктивных гипотез на каждом уровне уточнения на хорошие и плохие гипотезы, т. е. на гипотезы соответственно с малыми и большими расстояниями. Было также отмечено, что корректные гипотезы (т. е. гипотезы, с помощью которых были порождены анализируемые данные) часто не обладают наимень- шим расстоянием, но почти всегда принадлежат к хорошему кла- стеру. Исходя из этих наблюдений вероятностный и возможност- ный анализы проводились по немного отличающимся правилам. При вероятностном анализе любая порожденная последова- тельность данных анализируется на соответствующей решетке уточнения дважды с помощью двух различных процедур поиска. Согласно первой процедуре на каждом уровне уточнения уточня- ются только структуры с минимальным расстоянием. Согласно второй процедуре уточняются все структуры, чьи расстояния не превышают минимальное более чем на 100%. По каждой из про- цедур характеристики вычисляются отдельно. Д При возможностной анализе структуры на каждом уровне уточнения кластеризуются на плохие и хорошие и далее уточня- ются только хорошие структуры. Любая последовательность дан- 288
ных анализируется дважды с помощью двух разных процедур кластеризации. Для описания этих процедур пусть R={(Ci, di)\i^Nr} обозначает множество всех С-структур С{, оцениваемых на опре- деленном уровне уточнения конкретного эксперимента, с их рас- стояниями di. Пусть di^di+i для всех i^Mr-t и пусть G= {Сь Сг, ..Сс); 5= {Сс+[, Сс+2, . ., С4 — соответственно кластеры хороших и плохих структур, где 1^ (т. е. кластер G всегда непустой, в то время как кластер В в некоторых случаях может быть пустым). В первой процедуре кластеризации с определяется наименьшим значением I, для которого разность di—di-i превышает среднюю разность в R для всех i^Nr-i. То есть г для i^Nc (do=O) и А ____А \ dr—dj ис+1 — ис г Будем называть эту процедуру кластеризацией, по средней разно- сти или AD-кластеризацией (average difference). Во второй процедуре кластеризации с определяется значением k^Nr, для которого выражение —±_<J|d4_ai|+y].j d.-^A 4 = 1 ' достигает минимума, причем = Т Еdh (=1 а‘ = Г-7 Е di' Z=C-rI Эта процедура осиоваиа на естественном кластеризационном тре- бовании о том, что расстояния между кластерами должны быть велики, а расстояния внутри кластеров малы; будем называть это кластеризацией по внутреннему и внешнему расстоянию или IOD- кластеризацией (от англ. Inside and Outside Distance). Теперь можно целиком описать процедуру реализации одного эксперимента (см. диаграмму на рис. 4.36). Она начинается с вы- 19—6923 289
Оцениваемые С-структуры и их расстояния Уровень TSF Рис, 4.36. Схема вычислительного эксперимента бора структурированной системы с поведением rSF (которая рас- сматривается в эксперименте как подлинная). Эта система осно- вывается на С-структуре. Эта структуризованная система, пред- ставляющая обобщенную систему с поведением rF (полученную из системы rSF с помощью процедуры соединения), моделируется на компьютере и используется для порождения данных. После по- рождения данных из соответствующей системы данных D выво- дится обобщенная система с поведением без памяти DF (вероят- ностная или возможностная). Затем для системы DF проводится реконструктивный анализ в соответствии с одной из упомянутых выше процедур поиска (например, для возможностных систем, основанных на одном из двух типов кластеризации). Результатом является последовательность множеств С-структур (и их расстоя- ний), которые оцениваются на отдельных уровнях соответствую- щей решетки уточнения. Это множества, скажем множества = {(с„ для /=1, 2, .... п(п—1)/2, где п — число рассматриваемых пере- менных. Особый интерес представляет множество Ei для того же уровня уточнения, что и система rSF. Система DF также исполь- зуется для определения структурированной системы DSF, основан- ной на такой же С-структуре, что и заданная структурированная система rSF. Эта система (DSF) представляет обобщенную систе- му с поведением *F (реконструированную обобщенную систему). По множеству Ei (/еМп(п_1)/2) и обобщенным системам с по- ведением rF, DF и *F, полученным в результате экспериментов од- ного типа (т. е. для определенного числа переменных, определен- ных множеств состояний, для вероятностного или возможностного варианта и т. д.), можно определить различные характеристики результатов анализа реконструируемости. Опишем эти характери- стики на нескольких примерах систем нз трех переменных; более 290
Рис. 4.37. Некоторые характеристики анализа реконструируемое™ для вероятно- стных систем полные наборы характеристик, полученные с помощью описанных экспериментов для л=3, 4, 5 и несколько мощностей множеств со- стояний, приведены в работе [141]. Некоторые основные характеристики для вероятностных систем (с тремя переменными) представлены на рис. 4.37. Они получены с использованием процедуры поиска, в которой уточняются только структуры с минимальным расстоянием. 291
Графики на рис. 4.37,а описывают влияние числа наблюдений (объем данных |d|) на качество анализа реконструируемости для переменных с двумя и с пятью состояниями. Качество оценивается как для тех экспериментов, для которых процедура поиска полу- чает на соответствующем уровне уточнения корректную структу- ру, являющуюся структурой с наименьшим расстоянием. Как вид- но, 100%-ое качество достигается достаточно быстро для обоих случаев, Несмотря на то, что с ростом числа наблюдений резуль- тативность сходится к 100% во всех исследованных случаях, ско- рость сходимости несколько падает с ростом числа переменных. Это объясняется прежде всего высокой селективностью используе- мой процедуры поиска. Видно также, что переменные с пятью со- стояниями (верхний график) оцениваются лучше, чем переменные с двумя состояниями (нижний график). Это также общая тенден- ция: с ростом мощностей множеств рассматриваемых состояний улучшается и качество. Таким образом, для любого конкретного числа переменных характеристики представленных систем с дво- ичными переменными могут рассматриваться как худший случай. На остальных графиках на рис. 4.37 показаны характеристики анализа реконструируемости только для двоичных переменных. На графике (рис. 4.37,6) показано, насколько отличается корректная структура по информационному расстоянию от других структур на том же уровне уточнения. На нижнем графике представлено расстояние для корректной структуры D(Df, Rf), на среднем — наименьшие расстояния для структур, конкурирующих с коррект- ной на том же уровне уточнения, и на верхнем средние расстояния для всех структур, конкурирующих с корректной (в соответствии с процедурой поиска) на одном уровне уточнения. Несмотря на то, что на вид этих кривых влияет число переменных и мощность множеств их состояний, а также используемый тип расстояния, с ростом числа наблюдений эти расстояния всегда убывают, а рас- стояние для корректной структуры стремится к нулю. На графике (рис. 4.37,в) сравниваются информационные рас- стояния между подлинной системой ZF и соответственно система- ми °F и RF. Поскольку соответствующие пары распределений ве- роятностей rf, Df и rf, Rf являются произвольными, необходима об- щая мера информационного расстояния. Это расстояние, назовем его G, определяется формулой Gff, 2f) = D^’f, (4.44) где *f и 2f — произвольные распределения вероятностей, опреде- ленные на одном и том же конечном множестве состояний; D — специальное информационное расстояние, заданное уравнением (4.40); (*f+2f)/2—распределение вероятностей, полученное взяти- ем среднего для каждой пары соответствующих вероятностей из ’f и 2f. Нижний график на рис. 4.37,в представляет D(Tf, Rf), 292
0.250-. § 0.2251. § 0.200-, § 0.175 \ §. 0.150 i I mi § 0.100 i 5 0.075 i 5 - §• t 0025-. 0.000-|i 11111111111 n 111 и 111111111111111111111— 0 500 1000 1500 2000 Число наблюдений Рнс. 4.38. Некоторые характеристики анализа реконструируемости для возмож- ностиых систем а верхний — D(Tf, Df). Таким образом, реконструированная систе- ма *F оказывается ближе к подлинной системе rF, чем система °F, опирающаяся только на доступные данные. Это довольно не- ожиданный результат, важность которого будет проанализирована в разд. 4.10. На графиках (рис. 4.37,г) показана взаимосвязь множеств со- стояний с ненулевыми вероятностями для трех участвующих в вы- числительном эксперименте систем с поведением rF, DF и *F; бу- 293
дем эти множества состояний обозначать соответственно ТХ, DX и RX. На нижнем графике показана доля тех состояний rF, которые имеются в °F (это происходит из-за недостатка данных), т. е. (DX/TX) • 100; на верхнем графике представлен процент состоя- ний rF, имеющихся в Из этих графиков ясно видно, что DX<=*X^TX. (4.45) Это столь же важное свойство, как и то, что получено из графи- ков на рис. 4.37,г, и оно также будет рассмотрено в разд. 4.10. Д Возможностные аналоги описанных характеристик приведе- ны на рис. 4.38. Они основаны на IOD-кластеризации. Поскольку реконструктивный анализ возможностных систем основывается на работе с кластерами структур, а не с отдельными структурами, то соответствие между вероятностными характеристиками и их возможностными аналогами не является прямым. На рис. 4.38 (а) показано качество возможностного анализа реконструируемости для различных множеств состояний (от двух до пяти для переменной). График в данном случае имеет обоб- щенный вид, поскольку различия для разных множеств состояний малы и никаких особых тенденций выявить не удается. Качество представляется как доля экспериментов, в которых корректные структуры входят в кластер хороших структур. Остальные зави- симости на рис. 4.38 построены только для двоичных переменных На рис. 4.38,г показаны верхнее и нижнее информационные рас- стояния для двух кластеров структур. Они существенно отлича- ются от своих вероятностных аналогов. Напротив, на рис. 4.38,в и г очень похожи на свои вероятностные аналоги. Возможностная версия общего информационного расстояния, использованная при построении графиков на этих рисунках, определяется формулой G('f, 2f)=D(]f, ’fV2f)+£>(2f, ’fV2f), (4.46) где И и 2f — произвольные распределения возможностей, опреде- ленные на одном и том же конечном множестве состояний; D — специальное информационное расстояние, определяемое уравнени- ем (4.42); — распределение возможностей, получаемое взя- тием максимума для каждой пары соответствующих возможно- стей из И и 2f (см. примечание 4.8). ▲ Все эксперименты, для которых определялись данные характе- ристики, проводились в предположении, что данные порождены некой структурированной системой. Целью этих экспериментов было определение того, насколько недостаток данных влияет на качество анализа реконструируемости. Несмотря на то, что эти 294
идеализированные эксперименты достаточно ценны и представля- ют собой естественный первый этап анализа реконструируемости, очень желательно было бы расширить их для более общих и более реальных ситуаций. Позвольте мне в качестве примера описать обобщенные эксперименты, подготавливаемые в настоящее время. Подобно идеализированным вычислительным экспериментам, обобщенные эксперименты будут также разбиты на группы по числу переменных и по мощностям их множеств состояний. Для каждого эксперимента будет выбрано определенное распределе- ние, где для каждого обобщенного состояния рассматриваемых переменных будет определено число его наблюдений. Одни распре- деления будут выбраны из различных архивов данных и из лите- ратуры, а другие — порождены случайными процессами. Эти два класса экспериментов будут анализироваться по отдельности для того, чтобы понять, обладают ли распределения, основанные на реальных данных, некими особыми реконструктивными свойства- ми по сравнению с порожденными случайно распределениями. Каждое отобранное распределение будет использовано двояко. Во-первых, его реконструктивные свойства будут анализироваться как вероятностным, так и возможностным методами. Во-вторых, оно будет использовано для порождения данных, обычно для 2000 наблюдений’. Затем распределения, полученные для различных сег- ментов данных, будут анализироваться точно так же, как и ис- ходные (истинные) распределения, и с помощью тех же методов (вероятностного и возможностного). Наконец, результаты соответ- ствующих экспериментов, полученные для различных сегментов данных, будут сравниваться с теоретическими свойствами, опреде- ленными для исходного распределения. Это сравнение будет про- водиться для того, чтобы определить, насколько хорошо эти тео- ретические (истинные) свойства согласуются с экспериментальны- ми. Для каждого свойства, считающегося существенным, в резуль- тате выполнения каждой группы экспериментов будет определена зависимость средней сохранности этого свойства (а также вариа- ции этой сохранности) от размера анализируемого сегмента дан- ных и используемого метода. Вычислительные эксперименты так, как они описаны в этом разделе для анализа реконструируемости, являются важнейшим инструментом для метаметодологических исследований в науке о системах. УРСЗ должен не только предоставлять в распоряже- ние пользователя метод решения разных типов задач, но и да- вать метаметодологическое описание этих методов. Характеристи- ки анализа реконструируемости, описанные в данном разделе,— это простой пример такого метаметодологического описания. 295
4.10. ИНДУКТИВНОЕ РАССУЖДЕНИЕ Откуда берутся гипотезы, если они не рождаются прямо из головы Зевса? Ча- стично ответ состоит в том, что они воз- никают в процессе порождения гипотез. Герберт А. Саймон Хотя индуктивное рассуждение неявно применялось только при решении задач идентификации и реконструкции, оно используется практически в любой задаче, связанной с применением метода от- крытия в исследовании систем. Поэтому желательно дать обзор вопросов, связанных с индуктивными рассуждениями, и это—одна из задач данного раздела; вторая задача — введение нового прин- ципа индуктивного вывода, основанного на некоторых особенностях анализа реконструируемости. Понятие индуктивного рассуждения мы будем рассматривать не в традиционном узком смысле — как выведение общего заклю- чения из частных примеров, а более широко — как «охват всех не- доказуемых случаев, в которых истинность предпосылок хотя и не определяет инстинность заключения, но показывает, что есть серь- езные основания доверять истинности этого заключения» (Фило- софская энциклопедия). Понятие индуктивного рассуждения в течение столетий явля- лось предметом философских споров, особенно после опубликова- ния в 1739 г. Дейвидом Хьюмом классического анализа этого по- нятия (David Hume, A. Treatise of Human Nature, William Collins, Glasgow, 1962). Несмотря на то, что было выдвинуто множество доказательств, опровергающих скептическое отношение Хьюма к возможности обоснования индуктивного вывода, в конечном сче- те оказалось, что все эти доказательства имеют слабые места. В одних случаях доказательства оказывались несостоятельными из-за скрытой цикличности (т. е. из-за попыток обоснования ин- дукции с помощью индукции), в других — зависели от неких мета- физических допущений (типа единообразия природы). Основной недостаток этих доказательств заключается в том, что они всерьез рассматривают тезис Хьюма как содержательную проблему. Альтернативный подход состоит в том, чтобы отказать- ся от попыток обоснования индуктивного вывода дедуктивными методами, что неявно присутствует в анализе Хьюма, и рассма- тривать индуктивное рассуждение как процесс правильного суж- дения на основе неполной информации. Одним из самых много- обещающих способов обоснования индуктивного рассуждения при таком подходе является методологический прагматизм, предло- женный недавно Решером [263J. Согласно этому способу ключом к обоснованию индуктивного рассуждения являются методы; по- нятно, что методологический прагматизм хорошо согласуется с те- 296
мой данной книги. Дадим краткий обзор основных особенностей этого способа. Решер рассматривает индуктивное рассуждение как метод «правильного суждения с помощью систематизации на основе опыта, представляющего собой оптимально правдоподобное соче- тание догадки и имеющейся информации» [266]. Он утверждает, что информацию о природе можно получить, только взаимодей- ствуя с ней, и если мы не готовы довериться такому взаимодей- ствию, то остается только отказаться от всего проекта исследования. Несмотря на то, что цели такого проекта являются как науч- ными, так и практическими, окончательная проверка должна осно- вываться на том, насколько полученные знания оказываются по- лезны для деятельности человека. Происходит это из-за того, что в отличие от теоретических построений на практике для достиже- ния целей (например, чтобы избежать гибели, травмы, болезни, страданий, огорчений и т. д.) нужно принимать неотложные реше- ния. В книге [260] подробно рассматривается вопрос о том, на- сколько необходимы индуктивные рассуждения для успеха рабо- ты лица, принимающего решения. Поскольку индуктивное рассуждение рассматривается как ме- тод решения задач при неполной информации, его обоснование — это обоснование с точки зрения практический пригодности; отсю- да и название «методологический прагматизм». Обоснование метода индуктивных рассуждений, по Решеру, разбивается на два этапа, называемые соответственно начальным и окончательным обоснованием. При начальном обосновании, ко- торое является неиндуктивным, требуется показать, что метод яв- ляется потенциально более пригодным по сравнению с другими сопоставимыми методами. Окончательное обоснование — это про- верка реальной эффективности метода, т. е. проверка того, на- сколько его эффективность выше, чем у альтернативных методов. Существенной стороной начального обоснования метода индук- тивного распределения, по Решеру, является учет того, в какой степени полученные с помощью этого метода результаты могут быть включены в систему, основанную на предшествующем опыте. Все остальное остается таким же. В качестве критериев для на- чального обоснования метода используются различные параметры систематичности (полнота, связанность, совместимость, простота и т. д.). Такой подход является следствием согласованной теории истинности [261], подробно излагаемой в книге Решера «Когни- тивная систематизация» [265]. Решер утверждает также, что индуктивное рассуждение «лежит в самой основе использования человеком языка для коммуника- ций. Именно естественный язык служит для согласования явного расхождения между полученными утверждениями и реальными свидетельствами; это делается с помощью завуалирования фактов, причем этот процесс имеет индуктивную природу» [266]. 297
Взаимосвязанность индуктивного рассуждения и естественного языка, хорошо согласующаяся с основными идеями методологи- ческого прагматизма, отмечается и в работах некоторых совре- менных философов. Одно из самых ясных высказываний на этот счет принадлежит Блэку. Он утверждает [45]: Мне представляется естественным считать, что индукция — это система, управляемая правилами. Индукция как система человеческой деятельности использует соответствующую терминологию, а также определенные правила вы- вода суждений. При индуктивном рассуждении требуется соответствующим обра- зом помечать определенные ситуации, определенными способами делать выводы и, что важно, принять определенный способ мышлении, прежде чем предпринять соответствующие действия... Грубо говоря, индуктивные правила определяют: как говорить, как думать и как действовать в определенных рамках... У этих правил есть априорная и есть практическая стороны, определяющие правильное исполь- зование этих правил; при пашем языке и включающей его системе поиятий не- возможно представить себе, как можно вообще отказаться от них. Однако это опытом. Большая часть этого опыта воплощена в структуре нашего языка, не означает, что мы находимся в плену у догмы: устанавливающие правила индукции дают значительную свободу для различных суждений относительно индуктивных заключений, достоверности правил и т. п. При этом можно обра- титься к прошлому опыту как основе для повышения мощности вывода или при разумных ограничениях для модификации системы индукции и ее компонентов. Однако обращение к предшествующему опыту — это, пользуясь политической тер- минологией, ревизионизм: для революций в способах мышления нужно искать другие пути. Индуктивное рассуждение хорошо формулируется на языке теории информации. Большой вклад в эту область внесли работы Кристенсена [75—79]. Он определил индуцированное суждение как суждение, представляющее всю доступную информацию, но только ее. Несмотря на то, что индуцированные суждения получа- ются не обязательно с помощью дедукции из имеющейся инфор- мации, случаи, в которых применима дедукция, также рассматри- ваются как особые (экстремальные) случаи индуцированных суж- дений. Из определения индуцированного суждения следуют два общих принципа индуктивного рассуждения: 1) наши суждения не должны быть отражением большего объ- ема информации, чем тот, которым мы располагаем; 2) наши суждения должны отражать всю доступную нам ин- формацию. Поразительно, что эти чрезвычайно фундаментальные принци- пы были прекрасно известны китайскому философу Лао-цзы уже в V в. до н. э. Оии блестяще сформулированы в его книге Дао Дэ Цзин: 298
Кто имея знания, делает вид, что не знает, тот выше всех. Кто имея знания, делает вид, что не знает, тот болен *. Для создания определенной методологии индуктивного рас- суждения, основанного на этих общих принципах, нужно принять какое-то определение термина «информация». В разных контек- стах этот термин понимается по-разному. В контексте исследова- ния систем, когда информация понимается как мера ограничений на рассматриваемые переменные, смысл этого термина определя- ется способом представления этих ограничений. В рамках теории вероятностей два общих принципа индуктивного рассуждения ста- новятся соответственно принципами минимума и максимума эн- тропии. В альтернативных теориях есть соответствующие аналоги этих принципов. Например, в теории возможностей это принципы максимума и минимума ^/-нечеткости. Принцип максимума энтропии используется для оценки неиз- вестных вероятностей (которые нельзя определить дедуктивно) по имеющейся информации. Согласно этому принципу оцененное рас- пределение вероятностей должно быть таким, чтобы его энтропия была максимальной при имеющихся ограничениях, т. е. ограниче- ниях, представляющих имеющуюся информацию. Таким образом, этот принцип обеспечивает то, что не будет использована никакая информация, кроме имеющейся. Принцип минимума энтропии применяется при формировании разрешающих форм и в связанных с этим процессом задачах. Со- гласно этому принципу энтропия оцениваемого распределения ве- роятностей, обусловленного определенной классификацией задан- ных событий (например, состояний рассматриваемой переменной), является минимальной основой для ограничений, накладываемых на ситуацию. Таким образом, этот принцип гарантирует, что при оценке неизвестных вероятностей используется вся имеющаяся ин- формация, насколько это возможно при заданных ограничениях (например, при требуемом числе состояний) и по существу со- гласно Ватанабе [331], это является основным принципом распо- знавания образов: Распознавание образов — это способность интеллекта, направленная на то, чтобы в ряде событий выделить некую «форму». На языке математики самым подходящим было бы такое определение: распознавание образов — это формиро- вание, переформирование и модификация нашей системы отсчета с тем, чтобы соответствующим образом минимизировать с учетом неизбежных ограничений определенную для этой системы отсчета энтропию. 1 Дао Дэ Цзнн. Древнекитайская философия: Пер. с кит. — М.: Мир, 1972.— Т. 1. — С. 136. — Прим. ред. 299
Соответствующее применение обоих методологических принци- пов— максимума и минимума энтропии н дает методологию ин- дуктивного рассуждения по Кристенсену. Она называется методо- логией минимакса энтропии. Для обоснования этой методологии Кристенсен анализирует грамматические структуры и морфемы естественного языка. Он утверждает следующее: Так же как в физике, где измерения зависят от физической системы отсчета, наши индуктивные суждения зависят от системы понятий, выработанной нашим опытом. Большая часть этого опыта воплощена в структуре нашего языка, в смысле используемых нами слов, фраз, предложений. Искать твердый «прин- цип индукции», иа котором основывались бы наши обобщения, сголь же тщетно, как искать окончательную систему отсчета для ньютоновской механики... [75]. Любое сделанное человеком обобщение зависит не только от конкретных данных, непосредственно из которых оно получено, но и (только косвенно) от всего опыта истории эволюции языка, на котором получено это обобщение. В конечном счете нее суждения людей используются при принятии решений того или иного рода или при выборе последовательности действий. Решение зависит от оценок и суждений лица, принимающего решение, причем эти оценки относятся н к природе окружающего его мира. На систему ценностей н убеждения влияет как внешний мир, так и сама личность... Предположим, что индуктивное рассуждение широко используется всеми членами некоего общества, говорящими иа одном языке. Тогда, приняв первую часть определения индуцированного суждения, а именно, что оно представляет не больше информации, чем нам доступно, мы видим справедливость термодина- мического закона неубывания энтропии. Из этого закона следует, что будущий опыт стремится быть представленным так же просто на существующем в настоя- щее время языке, как и опыт прошлый. Принимая вторую часть определения индуцированного суждения, а именно, что оно представляет всю доступную нам информацию, и считая, что индуктив- ное рассуждение используется всем обществом, мы приходим к принципу эво- люции языка: [Язык эволюционирует в направлении, ведущем к более простому описанию опыта всех членов общества, использующих этот язык]. Из чего сле- дует, что прошлый опыт может быть легко выражен на языке современности. Однако это также означает, что индуктивное рассуждение порождает представ- ление физической действительности. Таким образом, мы показали условную обо- снованность индуктивного рассуждения, условную, поскольку она зависит от применения индуктивного рассуждения в обществе. Другими словами, обоснован- ность индуктивного рассуждения зависит от того, поддерживается оно «живым» языком или нет. Однако, и это очень важно, такая условность находится под контролем людей, принимающих решение о том, доверять или нет этим индуци- рованным суждениям. Основывая свои решения иа результатах индуктивных рассуждений, они оценивают все, от чего зависит обоснование индуктивного рас- суждения. В этом смысле принятие решений иа основе индуктивного рассужде- ния, реализуемое в «живом» языке, представляет собой процесс, обосновывающий сам себя [79]. 300
Рассматривая все доводы в обоснование метода минимакса энтропии как методологии индуктивного рассуждения (в приме- чании 4.6 приводятся четыре разных довода в пользу принципа минимакса энтропии и его обоснования как принципа эволюции языка), можно прийти к выводу, что эта методология обоснована достаточно хорошо. Будут, вероятно, разработаны и соответству- ющим образом обоснованы аналоги этой методологии для других классов нечетких множеств (например, методология минимакса (/-нечеткости). После этого краткого обзора некоторых важнейших вопросов индуктивного рассуждения позвольте мне описать некий новый принцип индуктивного вывода. Поскольку этот принцип связан с задачей реконструкции, назовем его реконструктивным принци- пом индуктивного вывода. Предположим, что некое ограничение для заданной обобщен- ной системы с поведением было определено по эмпирическим дан- ным с помощью индуктивных рассуждений, скажем с помощью методологии минимакса энтропии. Поскольку количество данных ограничено, это ограничение представляет собой только оценку того, как рассматриваемые переменные ограничены в действитель- ности; если эта оценка основана на всей информации относитель- но действительного ограничения, содержащейся в базе данных, то она является несмещенной. Теперь допустим, что действительное ограничение таково, что оно может быть реконструировано по определенному набору сво- их проекций. Из-за ограниченности данных оцененное ограничение может этим свойством не обладать. Тем не менее реконструктив- ная гипотеза, основанная на подсистемах, будет, вероятно, лучше подходить для оценки обобщенного ограничения, чем другие гипо- тезы на том же уровне решетки уточнения. Затем это превосход- ство будет проявляться на любом более низком уровне этой решет- ки при всех уточнениях такой удачной реконструктивной гипоте- зы. Теперь можно привести решающий довод. Если корректная реконструктивная гипотеза и/или ее уточнения на различных уров- нях уточнения в самом деле определяются как лучшие, то с помо- щью любой из них потенциально возможно реконструировать не- которые обобщенные состояния, которые переменные могут иметь, но которые не входят в имеющиеся данные и, следовательно, в ограничения для заданной обобщенной системы. Это хорошо со- гласуется с масштабными экспериментами, результаты которых приведены на рис. 4.37,г и 4.38,г. Более того, поскольку с любой подсистемой связано меньшее множество состояний обобщенной системы, то в общем случае его ограничения лучше описываются данными, чем ограничения обобщенной системы (например, боль- ше отношение числа наблюдений к числу потенциальных состоя- ний). То есть с помощью лучших реконструктивных гипотез мож- 301
Таблица 4.15. Пример экспериментального подтверждения реконструктивного принципа индуктивного вывода Ml 10 20 40 80 160 320 640 1,000 1,500 2,000 0.0132 0.0111 а) Вероятностная система 0.0086 0.0063 0.0044 00031 00023 00018 0.0015 00012 0.0106 0.0073 00052 00036 00025 00018 00014 OOOll 00009 00008 G(»T, Df) 00952 0.0741 00526 0.0328 0.0174 0.0084 0.0042 00025 00017 0.0012 G(rf, *f) 0.0697 0.0404 0.0213 0.0104 0.0045 0.0024 0.0013 00008 0.0005 00004 б) Возможностная система 0.2779 0.2479 0.2188 01859 01508 0.1100 0.0883 0.0746 0.0627 00565 «i(rt *f) 0.2645 0.1999 0.1470 01216 01021 0.0764 0.0648 00544 00457 00403 G(rf, Df) 0.0999 0.0894 0.1002 00872 00776 0.0599 0.0526 0.0450 00379 00369 G(rf, *f) 0.0972 0.0742 0.0691 0.0647 00568 00450 0.0383 00334 0.0260 0.0261 но улучшить нашу исходную оценку обобщенного ограничения. Это также подтверждается результатами экспериментов, приве- денными на рис. 4.37,в и 4.38,в. Полученные результаты ясно ука- зывают на то, что неравенство G(4, *f)<G(4, °f) для конечных данных выполняется всегда независимо от объема данных. Это значит, что обобщенная система, реконструированная на основе корректной реконструктивной гипотезы, информационно всегда ближе к истинной обобщенной системе, чем система, выве- денная только из заданных данных. Свидетельством того, что ре- конструированное ограничение оценивает истинное ограничение rf, лучшее, чем полученное из данных (Df), является неравенство б! (Ч, Л!)<б1(Ч, Df), где 61 — расстояние Хемминга. Выполнение этого неравенства под- тверждается также результатами вычислительных экспериментов. Так, например, результаты реальных экспериментов для трех пе- ременных с пятью состояниями каждая приведена в табл. 4.15 со- ответственно для вероятностной и возможностной систем. Для сравнения в этих таблицах приведены результаты, полученные с помощью информационного расстояния. Будем ли мы получать реконструкцию с помощью лучшей ре- конструктивной гипотезы на некотором уровне уточнения как улучшенную оценку обобщенного ограничения, зависит от того, влияет ли, по нашему мнению, рассматриваемая гипотеза на не- которые фундаментальные реконструктивные свойства переменных или нет. Что может помочь исследователю принять то илн иное решение? Предлагаю следующее: с помощью вычислительных экс- 302
периментов на компьютере, как это описано в разд. 4.9, ему сле- дует определить некоторые реконструктивные характеристики. Эти характеристики позволят исследователю оценить конкретную ситу- ацию и сформировать соответствующее мнение. Такие характери- стики могут быть использованы даже в соответствующих руковод- ствах по формированию этого мнения, и, в конечном счете, могут быть разработаны некие обоснованные функции формирования мнения и одна из них использоваться в УРСЗ по умолчанию. Оче- видно, что эти функции должны быть определены реконструктив- ными характеристиками типа изображенных на рис. 4.37,а, б или 4.38,а, б. Умение решать задачу реконструкции позволяет нетрадицион- но подойти к процессу индуктивного рассуждения. Он осуществ- ляется в два этапа. На первом обобщенное ограничение определя- ется по имеющимся данным с помощью обычных принципов ин- дуктивного рассуждения (например, с помощью принципа мини- макса энтропии). Второй этап состоит из трех шагов: 1) на различных уровнях уточнения определяются лучшие ре- конструктивные гипотезы для обобщенной системы; 2) формируются мнения о том, насколько эти гипотезы влияют на реальные реконструктивные свойства рассматриваемых пере- менных; эти мнения формируются на основе соответствующих экс- периментальных характеристик, руководств и конкретных функ- ций; 3) заданное обобщенное ограничение дополняется (или заме- няется) ограничениями, реконструированными с помощью лучших реконструктивных гипотез, причем с каждой связывается опреде- ленная степень доверия. При использовании только той информации, что содержится в данных, этот двухэтапный метод позволяет включать в оцененное обобщенное ограничение некоторые характеристики (например, обобщенные состояния), которые нельзя непосредственно опреде- лить по имеющимся данным. Следовательно, такой метод позво- ляет нам предсказывать или восстанавливать с определенной сте- пенью достоверности некоторые состояния исследуемых перемен- ных, которые не входят в момент предсказания или восстановле- ния в данные, которыми мы располагаем. 303
4.11. НЕСОГЛАСОВАННЫЕ СТРУКТУРИРОВАННЫЕ СИСТЕМЫ ...различие между обоснованным и необоснованным может быть отде- лено от согласованного и несогла- сованного... уверенно провести грань между рациональным и ир- рациональным можно, только учи- тывая несогласованность... Мыслен- ные конструкции или утверждения могут быть несогласованными, од- нако в конечном счете на некото- ром метауровне нашего мышления мы можем и должны ими опериро- вать согласованно. Николас Решер и Роберт Брандом Возможно, согласованность является самым фундаментальным критерием для классификации структурированных систем. Для структурированных систем согласованность тесно связана с зада- чей идентификации (разд. 4.6): если структурированная система с поведением согласованная, то ее реконструктивное семейство не- пусто, если несогласованная, то пусто В структурированных системах с поведением возможна несо- гласованность двух типов-—локальная и глобальная. Структури- рованная система локально несогласованная, если она не удовлет- воряет требованиям локальной согласованности, задаваемым урав- нением (4.20), и глобально несогласованная, если она локально несогласована и ее реконструктивное семейство пусто. Пример 4.22. Рассмотрим структурированную систему с пове- дением, элементы которой описываются вероятностными функци- ями поведения, приведенными в табл. 4.16а. Вычислив проекции этих функций относительно соединяющей переменной V2, имеем а — 0 0.6 1 0,4 М2Н{р2}](«) а = 0 0,55 1 0,45 Эта система локально не согласована, так как Пример 4.23. Понятно, что структурированная система с пове- дением, вероятностные функции поведения которой приведены в табл. 4.166, локально согласованная. Однако несложная проверка 304
Таблица 4.16. Пример несогласованных структурированных систем с поведением а) Локально несогласованная структурированная система »1 »2 УСс) »2 «2 У(ас) 'с = 0 0 0.5 2с = 0 0 0.4 0 1 0.2 0 1 0.25 1 0 0.1 1 0 0.15 1 1 0.2 1 1 0.2 б) Глобально несогласованная структурированная система «1 »2 »2 »2 У(2С) vt V, 7(’с) *с = 0 1 0.7 2с = 0 1 0.3 »с = 0 0 0.4 1 0 0.3 I 0 0.7 0 1 0.3 1 0 0.3 уравнений, определяющих реконструктивное семейство, показыва- ет, что реконструктивное семейство является пустым. Например, требуется, чтобы вероятности состояний 001 и ОН согласно функ- циям 7 и 2f были равны 0, и в то же время требуется, чтобы их сумма согласно функции 3f была равна 0.3. Таким образом, эта система глобально несогласованная. Локальные несогласованности в структурированных системах обычно возникают из-за того, что соответствующие их элементам функции поведения являются всего лишь оценками, полученными по ограниченным экспериментальным данным. Из таких несогла- сованностей (в отличие от глобальных) не следует, что сами ис- следуемые переменные являются несогласованными. Это просто отражение того факта, что информация о каждом подмножестве входящих в структурированную систему переменных неполная. Эта неполнота (т. е. наше незнание) и порождает локальные не- согласованности, и, следовательно, можно и нужно работать с ло- кально несогласованными структурированными системами. Иначе обстоит дело с глобальной несогласованностью. Гло- бальная несогласованность означает, что структурированная систе- ма плохо задумана; это математическая конструкция, не имеющая реального смысла. Превосходные примеры глобальной несогласо- ванности целого прн локальной согласованности можно найти в живописи. Например, это некоторые рисунки М. Эшера (ска- жем, его литография «Бельведер») и многие рисунки шведского художника О. Ретерсвярда, которые называют невозможными ри- сунками или японской перспективой. Понятно, что к локально несогласованным структурированным системам неприменимы обычные логические процедуры. Относить- 20—6923 305
Таблица 4.17. Решение задачи оптимального разрешения локальных несогласованностей для функций поведения, приведенных в табл. 4.16а ₽1 «2 *Х(*с) «2 г/А2О *с = 0 0 0.5208 2с = 0 0 0.3846 0 1 0.1875 0 I 0.2404 1 0 0.1042 1 0 0.1732 1 1 0.1875 1 1 0.2018 ся к ним можно двояко: либо вообще отбросить такие структури- рованные системы, поскольку они не представляют никакую обоб- щенную систему, либо разрешить эти локальные несогласованно- сти с помощью такой модификации заданных функций поведения, чтобы новые функции поведения были согласованными и в неко- тором смысле как можно более близки к исходным. Обычно бли- зость определяется через информационное расстояние. Получен- ная в результате структурированная система используется затем вместо исходной. Пусть дана локально несогласованная структурированная си- стема с поведением SF= {(*£, *F)|x6=JV?} с вероятностными функциями поведения * * * * * * * * * xf (x^Nq). Тогда задачу разрешения несогласованностей можно сформулировать следую- щим образом. Требуется определить функции поведения xfc того же вида, что и функции xf (x^Nq), так, чтобы функция 2 D(Xf> Xfc) (4-47) x^Nq достигала минимума при ограничениях PMWSJ = (4.48) для всех X, y^Nq и xf(xc)^=O=^xfc(xc)^O (4.49) для всех состояний хс (x^Nq). Назовем ее задачей оптимального разрешения локальных несогласованностей. Согласно уравнению (4.48) полученная структурированная си- стема должна быть локально согласованная. Из утверждений (4.49) следует, что любое состояние, возможное при исходной фор- мулировке, не будет отброшено при модифицированной локально согласованной формулировке; это требование делает возможным использование простого информационного расстояния D (см. урав- нение (4.40) или (4.42) для функции (4.47). 306
Пример 4.24. Рассмотрим локально несогласованную структу- рированную систему с поведением, состоящую из двух элементов, чьи функции поведения приведены в табл. 4.16а. Решение задачи оптимального разрешения локальных несогласованностей для этих функций поведения дают функции поведения 7с и 2fo приведенные в табл. 4.17. Легко убедиться в том, что эти функции локально согласованы и что D(7, 7с)+^(2/> 2М=0.0245. Интерес к задаче разрешения локальных несогласованностей был проявлен сравнительно недавно. Методологически эта пробле- ма пока не разработана и является объектом активных исследо- ваний. ПРИМЕЧАНИЯ 4.1. Проблема взаимосвязи между целым и частями получила широкое отра- жение в научной литературе. Подробное освещение основных вопросов читатель может иайти в книгах [31, 127, 203, 207, 312]. 4.2. Идеи холизма можно найти в работах древнегреческих философов, осо- бенно у Аристотеля, а также в китайской Книге перемен (И Цзин). Однако как методологическая доктрина холизм обычно приписывается Смутсу [294]. Уже с XVI в. редукционизм обычно ассоциируется с наукой, однако его корни можно найти также в работах древнегреческих философов. Холистический подход и критика редукционизма достаточно полно излагаются в книге «По ту сторону редукционизма» [194] и в книге «Дух в машине» [193]. Критический анализ не- которых идей холизма, особенно его крайних течений, дается в книге [248]. 4.3. Общий метод декомпозиции для проектирования систем, изложенный в разд. 4.5, хорошо описан в литературе по переключательным схемам, т. е. си- стемам с двоичными переменными [69, 70, 180]. Обобщение на произвольные дискретные системы описано у Гивона [126]. Нетривиальный метод декомпозиции систем с двоичными переменными предложен Брауном [56]. Метод для непре- рывных систем, функциональных уравнений изложен в обширной монографии [3]. Исчерпывающая методология, описывающая весь процесс проектирования систем, разработана и успешно использована Уеймором [343]. Кстати, эту ме- тодологию было бы полезно включить в УРСЗ для решения задач проектирова- ния систем. 4.4. Задачи определения реконструктивных семейств по структурированным системам с поведением рассматривались н для вероятностных, и для возмож- ности ых систем. Для вероятностных систем было предложено два метода, осно- ванных иа матричной алгебре. Один был разработан Р. Кавалло и мной [65], другой — Б. Джонсом [167]. Для возможностных систем эффективный метод, основанный иа уравнениях для нечетких отношений, был разработай М. Хигаши, М. Питарелли и мной [159]. 4.5. Теоретическое обоснование понятия реконструктивной нечеткости, опи- сываемого уравнением (4.31), и связанного с ним понятия коэффициента иден- тифицируемости приводится в упомянутой в примечании 4.4 к статье [159]. Для 307
вероятностных систем мера реконструктивной нечеткости должна отражать не- сколько особенностей реконструктивного семейства, включая такие характеристи- ки, как число обобщенных состояний, вероятности которых неоднозначны, число степеней свободы, их диапазоны и мера их взаимной независимости. Существуют различные способы отражения этих характеристик с помощью единой меры, однако ии один из них не является безусловно лучшим. Если такой универсаль- ной меры ие появится, то лучше, чтобы УРСЗ предлагал самому пользователю определять этн меры, а одну из них задать в качестве меры, выбираемой по умолчанию. 4.6. В пользу принципа максимума энтропии можно привести по крайней мере три разных довода. 1. Распределение вероятностей с максимумом энтропии янляется единствен- ным несмещенным распределением, т. е. распределением, учитывающим всю имеющуюся информацию, и только ее. Это непосредственно следут из того, что вся имеющаяся информация (и только она) необходима дли формировании огра- ничений для задачи оптимизации, н от выбранного распределения вероятностей требуется, чтобы оио представляло максимум нечеткости (энтропии) при выпол- нении множества ограничений, которым должны удовлетворять распределения вероятностей. В самом деле, любому сокращению нечеткости соответствует рав- ное увеличение информации. Следовательно, при выборе любого распределения вроятиостей, за исключением распределения с максимальной энтропией, имеет место сокращение нечеткости по сравнению с ее максимальным значением, t зна- чит, неявно добавляется некая дополнительная информация. Это соображение в пользу принципа максимума энтропии очень хорошо освещено в литературе. Его иаилучшее и наиболее подробное изложение дается в статье [166], в которой приводится и превосходный исторический обзор соот- ветствующих исследований в теории вероятностей. Принцип максимума энтропии излагается также в книге [75]. В обоих публикациях имеется обширная библио- графия, включающая практически всю литературу по принципу максимума энтропии. 2. В работе [165] строго из комбинаторных соображений было показано, что распределение вероятностей с максимальной энтропией является наиболее правдоподобным. Для данной реконструктивной гипотезы любой элемент рекон- структивного семейства этой гипотезы может быть порожден по некоторому чис- лу наборов реальных данных. Наибольшее число возможных наборов данных, являющихся взаимно сравнимыми и совместимыми с дайной реконструктивной гипотезой, требуется для обобщенного распределения вероятностей с максималь- ной энтропией. 3. Дж. Шор и Р. Джонсои показали, что принцип максимума энтропии де- дуктивно выводим из следующих аксиом непротиворечивости для индуктивного рассуждения [285]: единственность: результат должен быть единственным; инвариантность: результат ие должен зависеть от выбора системы координат (от перестановки переменных); системная независимость: не должно иметь значения то, как учитывается информация — по отдельности для независимых систем через маргинальные вероятности или совместно через совместные вероятности; 308
независимость подмножества-, не должно иметь значения, исследуется неза- висимое подмножество состояний системы иа основе отдельных условных ве- роятностей или иа основе полных системных вероятностей. Шор и Джоисон следующим образом обосновывают выбор этих аксиом. Ме- тод вывода должен быть таким, чтобы результаты, полученные исходя из одной н той же информации, но разными способами, были непротиворечивы. На основе этих аксиом они выдвинули следующее предположение: для заданной информа- ции, представляющей собой ограничения иа оцениваемые вероятности, сущест- вует только одно распределение вероятностей, удовлетворяющее этим ограниче- ниям, которое может быть определено методом, не нарушающим аксиом непро- тиворечивости; это единственное распределение может быть получено максими- зацией энтропии (или любой другой функции имеющей те же максимумы, что и функция энтропии) при соблюдении заданных ограничений. Кроме этих классических доводов в пользу принципа максимума энтропии существует и относительно новый довод, впервые предложенный в 1981 г. [65], который основан на свойствах искусственных структурированных систем. Как утверждалось в конце разд. 4.8, любой искусственной структурированной системе соответствует единственная обобщенная система, та, что представлена своей не- смещенной реконструкцией. То есть, если дана вероятностная структурированная система и известно, что эта система искусственная, то единственно возможной реконструкцией является реконструкция с максимальной энтропией. Или, другими словами, невозможно создать реальную вероятностную структурированную си- стему, действительная реконструкция которой отличается от реконструкции с ма- ксимальной энтропией. При этом, разумеется, предполагается, что система спро- ектирована для того, чтобы функционировать в любой среде. Одиако для си- стем, спроектированных для функционирования в некой определенной среде, этот аргумент также верен. Только в этом случае процедура соединения охваты- вает не только элементы проектируемой структурированной системы, но и ее среду. Для возможиостиых систем аналогом принципа, максимума энтропии являет- ся принцип максимума //-нечеткости. Несмотря на то, что пока не показана его выводимость из соответствующих аксиом непротиворечивости, возможные аналоги других аргументов обоснованы. Известно, в частности, что возможност- иая процедура соединения дает максимальную нечеткость, т. е. несмещенную реконструкцию [68]. 4.7. В двух моих статьях, написанных совместно с Роджером Кавалло, при- ведены основные результаты, связанные с отношением между результатами ра- боты процедур соединения и реконструкцией с максимальной энтропией [65] или с реконструкцией с максимальной //-нечеткостью [68]. В действительности Р. Левис [208] первым показал, что вероятностный вариант базовой процедуры соединения дает реконструкцию С максимальной энтропией, если эта процедура применяется к согласованным вероятностным структурированным системам, пред- ставленным L-структурами. Сходимость итеративной процедуры соедиения к ре- конструкции с максимальной энтропией доказана Д. Брауном [55], хорошо изложена также в книге [44]. Доказательство того, что итеративная процедура соединения необходима для возможиостиых систем, приводится в одной из моих статей, упомянутых в предыдущем примечании [68]. 309
4.8. Понятие общего симметричного расстояния, характеризующего инфор- мационное расстояние между произвольными распределениями возможностей или вероятностей, введено М. Хигаши и мной [158]. В общем виде оно существенно используется в вычислительных экспериментах, описанных в разд. 4.9. Специаль- ные виды информационного расстояния (формулы (4.40) н (4.42)) используются для оценки потери (или недостатка) информации при сравнении соответственно двух распределений вероятностей нли возможностей. 4.9. В математике G-структуры называются несократимыми гиперграфами. Гиперграф определяется как семейство подмножеств заданного множества (ска- жем, множества Уп), удовлетворяющее требованию покрытия и не содержащее пустого множества [39]. 4.10. Более подробно процедуры уточнения или укрупнения для различных классов структур, а также процедуры исключения дублирующих структур опи- саны в двух моих статьях [54, 191]. 4.11. Процедура вычисления |Яя/«| = l^n/t’l предложена Пойя [251]. Все изоморфные классы неориентированных графов для л<6 перечислены в книге Харрари [148]; Слоан [292] приводит значения [Яп/1] для л<15. 4.12. Значения |^n+1 (см. табл. 4.12) для п^7 (последовательность 1439), а также соответствующие ссылки, приведены в книге [298]. В настоящее время получены только эти значения; формула для вычисления |^п+| не найдена. Однако известно, что |^n+1 равно числу монотонных булевых функций с пере- менными. Значения |^п| можно вычислить по формуле л—1 ^1 -£<->• k=0 основанной иа комбинаторном принципе включения и исключения. Известно так- же. что ]&„+/1]=2п—1 и ^П/1|2П—п. 4.13. Функция поведения из примера 4.20 (табл. 4.14а) получена иа основа- нии данных по добрачному примеиению противозачаточных средств; они анали- зируются в книге Файнберга [106], где и дается ссылка иа источник. 4.14. Впервые общая задача реконструкции была поставлена У. Росс Эшби [19]. Он ввел понятие цилнидричности для многомерных отношений (в нашей терминологии это четкие возможиостные системы) и предложил алгоритм опре- деления того, можно ли реконструировать данное отношение размерности п по его проекциям определенной размерности (k<n). Если возможна такая рекон- струкция, то она получается пересечением расширений (цилиндров) всех ft-мер- ных проекций данного отношения. Легко показать, что процедура Эшби является частным случаем процедуры соединения [65]. У. Росс Эшби (совместно с Р. Мад- деном) первым сформулировал также общую задачу идентификации, описанную в разд. 4.6 [224]. Главное, Эшби оценил всю важность задач реконструкции и идентификации для исследования систем. До него таким задачам ие придавалось особого значе- ния. Его работы, с методологической точки зрения узкоспециальные, явились толчком для моих исследований в этой области. Первые идеи относительно более общего подхода к задаче реконструкции появились у меня в 70-х гг. во время моего пребывания в Нидерландском институте перспективных исследований 310
в Вассенааре [182]. Я продолжаю исследования задачи реконструкции, а также задачи идентификации до настоящего времени. Результаты этой работы, получен- ные в сотрудничестве с некоторыми моими коллегами и ассистентами, опублико- ваны в серин статей [64—66, 68, 185, 187, 189—191]. Задача реконструкции рас- сматривалась в работах [51—53, 87—89, 198, 98], а задача идентификации — в работе [167]. Наилучший источник информации о состоянии исследований по анализу ре- конструируемости к началу 80-х гг. нашего столетия — издание Special Issue on Reconstructability Analisis of the International lournal of General Systems (Vol. 7, N 1, 1981, p. 1—107), содержащее также обширную библиографию. 4.15. X. Юттенхов в 1976—1977 гг. провел первые вычислительные экспери- менты по анализу реконструируемости [189, 190]. Более масштабные экспери- менты, описанные в разд. 4.9, проводились с конца 1981 г. [141]. Эти экспери- менты продолжаются, причем особый упор делается на обобщенные эксперимен- ты, подобные тем, что описаны в конце разд. 4.9. 4.16. Реконструктивный принцип индуктивного вывода (разд. 4.10) был впервые сформулирован в моем президентском обращении к 27-й ежегодной конференции Общества по общесистемным исследованиям, Вашингтон, 5—9 яив., 1982 г. [188]. 4.17. Задача разрешения локальных несогласованностей в системах (разд. 4.11) исследовалась Н. Решером [259, 262, 267], но методы ее решения еще недостаточно хорошо разработаны. 4.18. Вопрос о влиянии степени квантификации данных на результаты анали- за реконструируемости вероятностных систем исследовался в работе [319]. Авто- ры пришли к следующим выводам. Если говорить об исследовании системы, описываемой вероятностными харак- теристиками, то несмотря на улучшение результатов при квантификации данных, в конечном счете с относительным ростом объема исходной информации это улуч- шение становится все менее заметным при Q (числе состояний переменной), большем 4 или 5. С другой стороны, с ростом квантификации данных растет объем памяти ЭВМ и время счета необходимые для анализа реконструируемости. Таким образом, можно утверждать, что тернарная квантификация лучше бинар- ной, однако при Q, большем 3 или 4, резко увеличивается объем работы ЭВМ, а результаты улучшаются лишь незначительно. Эти выводы, полученные в результате математического анализа, практически совпадают с выводами, полученными на основе вычислительных экспериментов, описанных в разд. 4, 9. УПРАЖНЕНИЯ 4.1. Рассмотрим обобщенную систему с п переменными (л>3), каждая из которых имеет k состояний. Определите, прн каких небольших значениях k, ска- жем fe=2, 3, 4, значение п при котором оказывается менее экономичным (в смыс- ле объема памяти ЭВМ) хранить обобщенную систему, чем хранить все ее под- системы: а) из двух переменных; б) из трех переменных. 311
4.2. Пусть обозначения, введенные в табл. 4.4, используются для обозначе- ния вероятностей обобщенных состояний систем с поведением с тремя двоичны- ми переменными. Для заданного распределения вероятностей {pi\i^No,j} пока- жите, что оно полностью реконструировано по подсистемам: a) {oi, и {оа, пз} тогда и только тогда, когда PoPs=PiP4 и ргРг=РзРе; б) {»!, Па} и {оа, пз} тогда и только тогда, когда роРв = РаР4 и Р1Р7=РзРз; в) {ni, па} и {Hi, из} тогда и только тогда, когда рорз=р1Ра и р^рт—РзРв. 4.3. Определите реконструктивные семейства и значения их коэффициентов реконструируемости для: а) всех членов множества решений из примера 4.19; б) реконструктивных гипотез 2, 7 и 10 из примера 4.19; в) всех реконструктивных гипотез возможностей обобщенной системы с по- ведением, чья функция поведения приведена в табл. 4.18а. 4.4. Придумайте некий разумный коэффициент идентифицируемости для ве- роятностных систем с поведением. 4.5. Определите реконструктивные семейства и коэффициенты идентифицируе- мости согласно вашей формуле (упражнение 4.4) для: а) всех членов множества решений из примера 4.20; б) гипотезы 3 из примерз 4.20; в) гипотезы 18 из примера 4.21; г) структурированных систем с теми же элементами, что приведены в табл. 4.3, за исключением ((*’с) =0.25 для всех йеМз. 4.6. Докажите, что min [‘/(a, b), 2f(c|b)]=min [‘f(a, b), 2f(b, с)], где */ и 2/—функции распределения возможностей, определенные соответственно иа де- картовых произведениях АХВ и ВХС. 4.7. Пусть f и fh обозначают соответственно функции поведения обобщенной системы и ее несмещенной реконструкции по реконструктивной гипотезе Л. а) докажите, что из f*(c)=O следует }(с)=0 для всех csC, если системы вероятностные; б) придумайте численный пример, показывающий, что для вероятностных си- стем из }(с)=0 не следует, что /Л=0; в) докажите, что для возможиостиых систем /Л(с)>/(с) для всех сеС. 4.8. Разработайте процедуры определения всех непосредственных укруп- нений: а) заданной G-структуры; б) заданной С-структуры при соответствующем множестве ^п; в) заданной P-структуры при соответствующем множестве Фп. 4.9. Используя подобие комбинированных упорядочений, определяемых урав- нениями (3.72) и (3.106), дайте формальное определение комбинированного упо- рядочения, связаииого с задачей реконструкции. Сравните свойства отдельных упорядочений, переупорядочений и комбинированных упорядочений для этих трех типов задач. 4.10. Используя подобие множеств решений, определяемых уравнениями (3.73) н (3.107), формально определите множество решений (множество подхо- дящих реконструктивных гипотез) для задачи реконструкции. 4.11. Пусть #С-процедура применяется к нескольким С-структурам одного уточнения. Разработайте процедуру, которая совместно с этой ЯС-процедурой 312
будет предупреждать порождение одинаковых С-структур. Покажите также, как эти процедуры должны работать совместно. 4.12. Вычислите несмещенные реконструкции и расстояния для: а) реконструктивных гипотез 1, 2, 3, 5 и 6 из примера 4.20; б) реконструктивной гипотезы со всеми системами двух переменных из при- мера 4.20 (пусть Д = 0,0005); в) всех членов множества решений и реконструктивной гипотезы 9 из приме- ра 4.21. 4.13. Используя результат упражнения 4.12 (б), нарисуйте график зависимо- сти Di от I для обобщенной системы из примера 4.20. 4.14. Для модификации примера 4.19, при которой рассматриваются только С-структуры, ио не требуется, чтобы эта реконструкция была совершенно точной, а) определите множество решений; б) нарисуйте график зависимости от I. 4.15. Определите все G-структуры (а ие только изоморфные классы эквива- лентности) в нескольких классах r-эквивалентности в G4, скажем те, что пред- ставляются полносвязным графом и графом без одного ребра. 4.16. Используя результаты управления 4.8, определите соседство структур а) С-структур 123/234/456, 12/23/34/14, 123/234/345/456/156 и 123/234/345/456/ 156/135/246; б) Р-структур 14/15/45/24/13/35/25/12 и 12/13/15/24/25/45; в) G-структур 13/14/125/245/345, 12/24/25/135/145 и 1234/35/45/346; г) G-структур из упражнения 4.16,в, ио при условии, что соседство структур ограничено тем же классом г-эквивалентности. 4.17. Определите число структур, изоморфных каждой из структур, опреде- ленных в упражнении 4.16. Сравните также некоторые из этих чисел с числами изоморфных структур, приведенными в таблицах решеток уточнения в прило- жении Д. 4.18. Используя уравнение (Д.1) из приложения Д, определите: а) число непосредственных предшественников в классах i-эквивалентности, изображенных на рис. 4.20, и других классов i-эквивалеитности (пометьте связи на диаграмме числом предшественников соответствующего типа); б) число непосредственных предшественников каждой структуры в классах «-эквивалентности §=79—82 из (приложение 7) и классов «-эквивалентности §=73—78. 4.19. Дополните таблицы решеток (,%/1, ^=) и (<g’4/i, <) из приложения Г соответствующей информацией относительно их предшественников. 4.20. Определите все подходящие реконструктивные гипотезы для возмож- иостных систем с поведением, чьи функции поведения приведены в табл. 4.18а, б. Нарисуйте график зависимости £>< от I для этих систем. 4.21. Определите реконструктивные семейства и коэффициенты идентифици- руемости для всех членов множества решений из уравнения 4.20 и сравните по- лученные результаты с соответствующими результатами для какой-нибудь не- подходящей реконструктивной гипотезы. 4.22. У. Росс Эшби предложил процедуру определения несмещенной рекон- струкции многомерных отношений (в нашей терминологии это четкие возмож- ностные системы) по их проекциям. Его процедура основана на концепции цилин- 313
Таблица 4.18. Иллюстрации к упражнениям а) б) »1 •» /(0 »i Чг »э /(О с«0 0 0 0.8 с»0 0 0 1 0 0 2 1 0 0 1 1 0 1 1 0.6 0 0 I 1 0 1 2 1 1 0 1 1 I 0 0 0.7 1 1 0 0.8 1 1 1 0.6 д 1 2 1 в> г) «ч чг lj /(с> »i vz /(С) с = 0 0 0 0.1 с = 0 0 0 0 0.1 0 0 1 0.4 0 I 1 0 0.2 1 0 0 0.05 0 1 I 1 0.1 1 0 1 0.2 1 0 0 0 0.1 1 1 0 0.25 1 0 1 0 0.1 1 0 1 1 0.1 1 I 1 0 0.2 1 1 1 1 01 дрического расширения проекции относительно ие входящих в нее переменных обобщенной системы. Пусть [4ffS—4S] — расширение проекции, представленной возможиостной (четкой) функцией поведения kf. Тогда это расширение является функцией, заданной на множестве С обобщенных состояний, принимающей значе- ния {0, 1}: р j s—*sj (с) = <Р’ если kf = 1 для иеК0Т0Р°Г0 *с < с> (О в противном случае. Для заданной реконструктивной гипотезы h с проекциями 4/ (беМ,) процедуру Эшби можно представить формулой f'(c) = min[*ftS — *SJ (с) k или fA(c)= max [ftf t S — *S] (с), k где V(‘c) = 1—*f(4c). Воспользовавшись любой из этих формул, определите не- смещенные реконструкции для всех реконструктивных гипотез систем, описанных в табл. 4.18, и сравните полученные результаты с реконструкциями, полученны- ми с помощью процедуры соединения. 4.23. Определите: а) все подходящие реконструктивные гипотезы для возможиостной системы с поведением, определенной иа табл. 4.18в и нарисуйте график зависимости А от /; 314
продемонстрировать то, как разные системные задачи влияют на выбор определенного класса мер, в данной книге в контексте раз- личных системных задач рассматриваются два класса нечетких мер. Первый — классический и хорошо разработанный класс ве- роятностных мер, второй—это класс возможностных мер. Необ- ходимо отметить, что возможные меры приложимы только к ко- нечным множествам и к некоторым частным случаям бесконечных множеств; в общем случае эти меры не удовлетворяют требова- нию непрерывности. Таким образом, они наверняка применимы к дискретным, но не к непрерывным системам. ▲ Предполагается, что читатель знаком с основами теории веро- ятностей, центральным понятием которой является вероятностная мера. Из теории вероятностей хорошо известно, что любая веро- ятностная мера, скажем мера р, однозначно определяется функ- цией распределения /в : С->[0, 1], (3.18) которая должна удовлетворять соответствующим требованиям согласно формуле PW= 2 (3-19) сел где Xe^(C). Мы применили в обозначении функции распределе- ния тот же индекс В, что и в описании функции поведения, опре- деленной в (3.9), так как она также будет использоваться в ка- честве функции поведения. Функции (3.9) и (3.18), по существу, играют ту же самую роль при определении системы с поведени- ем (3.10), хотя они методологически отличны и пи одна из них пе является частным случаем другой. Поэтому мы и обозначим их одинаково. То, какая из двух функций используется в каждом конкретном случае, должно следовать из методологических отли- чий конкретной постановки задачи. Д Мера возможности — это функция л :^(С)^[0, 1], (3.20) удовлетворяющая следующим требованиям: (т. 1) it (0) = 0; it (С) = 1; (it2) 7t^(J X,) = max г (Xt). Очевидно, что из (л2) следует монотонность нечетких мер. Как уже отмечалось выше, л не всегда удовлетворяет требованию не- прерывности и, следовательно, не подходит для систем с непре- рывными переменными. ▲ Хорошо известно, что мера возможности л однозначно опреде- ляется функцией распределения возможностей fe, имеющей вид 114
Таблица 4.19. Распределения частот для систем из упражнений 4.24 и 4.25 Упражнение 4.24 1’1 1'2 ‘Л а) б) в) г) б) е) ж) 0 0 0 120 6 84 I II 86 2 0 0 I 4 2 8 4 2209 35 16 0 I 0 22 2 22 2 48 32 I 0 I 0 0 6 2 6 239 II 6 1 0 0 80 16 25 12 0 73 48 1 0 1 31 4 12 I 111 70 8 I I 0 24 4 7 3 72 61 36 I I I 23 6 14 I 2074 41 6 Упражнение 4.25 Г| Г 2 1'4 а) б) в) г) б) е) 0 0 0 0 12 187 350 554 387 20 0 0 0 I 16 256 150 281 36 2 0 0 1 0 27 15 60 87 876 9 0 0 I I 32 42 112 49 250 2 0 I 0 0 8 42 26 338 383 6 0 I 0 I 22 34 23 531 270 I 0 I I 0 22 40 19 56 381 4 0 I I I 30 62 80 ПО 1712 1 I 0 0 0 47 177 1,878 97 955 38 I 0 0 I 14 194 1.022 75 162 7 I 0 I 0 46 14 148 182 874 24 I 0 I I 9 27 404 140 510 6 I I 0 0 14 30 III 85 104 25 I I 0 I 23 52 161 184 176 6 I I 1 0 25 63 22 171 91 23 I I I 1 15 121 265 458 869 42 б) все подходящие реконструктивные гипотезы, основанные только на С-структурах, с расстоянием не больше 0,1 для вероятностной системы с пове- дением, определенной табл. 4.18г. 4.24. Используя только вероятностные или возможностные отличия, опреде- лите все подходящие реконструктивные гипотезы для систем без памяти с тремя двоичными переменными, заданными иа различных группах, распределения частот которых приведены в первой части табл. 4.19а. Эти системы построены на опуб- ликованных данных об определенных исследованиях. Кратко опишем эти иссле- дования и приведем соответствующие ссылки иа источники, в которых они опи- саны более подробно. Состояния переменных приводятся в следующем порядке: 0, 1; переменные перечисляются в порядке Vi, v2, Vi- а) Эпидемиологическое исследование пишевых отравлений [43]. Параметри- ческое множество: 304 человека, принимавших участие в пикнике; переменные: заболевание (имеет место или не имеет места), крабы (ел или не ел), карто- фельный салат (ел или не ел). 315
б) Реакция (положительная или отрицательная) на три различных лекар- ства; наблюдалось 46 пациентов [43]- в) Факторы, влияющие на тромбоэмболию [43]. Параметрическое множество: 116 женщин; переменные: тромбоэмболия (наличие или отсутствие), курение (да или нет), использование противозачаточных таблеток (да илн нет). г) Реакция пациентов, больных липомой, иа химиотерапию в зависимости от пола и типа клеток [43]. Параметрическое множество: 30 пациентов; перемен- ные: тнп заболевания (модульное, диффузионное), пол (мужской, женский), реакция (есть, нет). д) Исследование наказаний за убийство во Флориде в 1973—1979 гг. [198]. Параметрическое множество: 4764 убийства; переменные: убийца (негр, белый), жертва (негр, белый), наказание (смертная казнь и т. п.). е) Структура жилища ящериц иа о-ве Бимини [106]. Параметрическое мно- жество: 409 ящериц; переменные: вид (одиночные взрослые мужские особи, пар- ные взрослые и детеныши), высота насеста (^4,75 фут, >4,75 фут), диаметр насеста (^4 дюйма. >4 дюйма). ж) Исследование пациентов, больных диабетом [106]. Параметрическое мно- жество 123 пациента; переменные: возраст (<45, ^45), заболевание диабетом в семье (есть, нет) реакция на инъекции инсулина (положительная, отрица- тельная). 4.25. Повторите упражнение 4.24 для систем с четырьмя переменными, чьи распределения частот приведены во второй части табл. 4.19. Переменные перечис- лены в следующем порядке: сч, &з, vt. а) Исследование пациентов, получающих психиатрическое лечение [106]. Параметрическое множество: 362 пациента; переменные: тип (психостетический. энергетический), характер (истеричный, ригидный), ориентация (экстраверт, интраверт), острая депрессия (есть, нет). б) Исследование природы сексуальной символики [106]. Параметрическое множество: 1356 мужчин; переменные: реальное значение признака (мужской, женский), ответы, основанные иа времени экспозиции в 0,001 и 1/5 с (муж- ской, женский), назначение эксперимента (не объяснено, объяснено). в) Исследование автомобильных аварий [106]. Параметрическое множество: 4831 автомобильная авария; переменные: масса автомобиля (маленькая, стан- дартная), выброс водителя (да, нет), тяжесть аварии (легкая, тяжелая), тип аварии (столкновение, переворот). г) Исследование отношений к «лидирующей группе» среди школьников [129]. Параметрическое множество: 3398 школьников; переменные: членство в «лиди- рующей группе» (да, нет) и отношение к ней (благосклонное, иеблагосклоииое) согласие первому и второму опросу. д) Предпочтение относительно местоположения тренировочного лагеря у сол- дат во время второй мировой войиы [43]. Параметрическое множество: 8036 сол- дат; переменные: цвет кожи (черный, белый), откуда родом (север, юг), место- положение лагеря (север, юг). е) Партикулярнстские н универсалистские ценности в ролевом конфликте [129]. Параметрическое множество: 216 человек; переменные представляют четы- ре различные ситуации в ролевом конфликте; их состояния представляют наклон- ности к партикуляристскпм или универсалистским ценностям. 316
ГЛАВА 5. МЕТАСИСТЕМЫ По кадру невозможно предсказать, О чем весь фильм, И с гусеницей кадр Нам не сулит рожденья мотылька, А бабочки полет не показать Единственным ее изображеньем *. Р. Бакминстер Фуллер 5.1. ИЗМЕНЕНИЕ И ИНВАРИАНТНОСТЬ Ученый стремится не столько описать неизменное, сколько найти неизменяю- щиеся описания меняющегося. Г. Спеисер Браун Одной из основных способностей человека, и возможно самой существенной, является способность распознавать отличия. Наи- более элементарные проявления этой способности описываются в книге [127]: Отличие расщепляет мир надвое: иа «это» и «то», «среду» и «систему», иа «мы» и «они» и т. д. В человеческой деятельности различение занимает одно из самых важиых мест и является, разумеется, одним из самых важных действий в науке о системах, поскольку любое определение системы есть различение соб- ственно системы и ее среды. Отличия неразрывно связаны с намерениями. В частности, наиболее распро- страненным является случай, когда система определяет свои границы и пытается их поддерживать; это, видимо, соответствует тому, что мы называем самоосозиа- нием. Подобное наблюдается и у отдельных личностей (самосохранение), и у со- циальных групп (клубы, субкультуры, нации). В этих случаях имеет место не только отличне, но и индикация, т. е. выделение одного из двух различаемых состояний как более важного («это», «я», «мы» и т. д.). В самом деле, целью различения является, как правило, именно такая индикация. Менее важным типом отличия является отличне, которое делается при само- стоятельном определении цели: в основном при научных исследованиях, например тогда, когда какая-то дисциплина «определяет область своих интересов» или когда ученый определяет систему, которую он будет изучать. В любом случае установление границ системы неизбежно связано с тем, что мы называем когнитивной точкой зрения;... в частности, оио связано с понятием ценности или пользы, а также с мыслительными способностями (чувствитель- ностью, знаниями) того, кто определяет отличия. И наоборот, выделенные отли- чия обнаруживают уровень мыслительных способностей того, кто их сделал. * Пер. с англ. А. Горина. — Прим. ред. 317
Именно таким способом биологические и социальные структуры проявляют свою связность и позволяют убедиться в том, что они обладают мыслительными спо- собностями или что они до некоторой степени «ощущают». Таким образом, распознавание различий, близкие (по смыслу) к отличиям, может быть двух типов. Можно распознать либо то, что две вещи являются различными, либо то, что одна и та же вещь меняется во времени (в терминологии УРСЗ, с точки зрения соответствующей базы или соответствующего параметра). Эти два понимания отличия теснейшим образом связаны и дополняют друг друга. Первое охватывает неизменные (инвариантные, постоян- ные) свойства вещей, а второе — те свойства, которые рассматри- ваются как временные (варьирующиеся, изменяющиеся). Важность понятия изменение, являющегося одним из производ- ных от понятия отличие, выражена в литературе многими спо- собами. Например, древнегреческому философу Гераклиту принад- лежит знаменитое высказывание о том, что Ничто ие постоянно, кроме изменений. Джон Вильмонт, английский поэт XVII в., в одном из своих стихотворений выражает ту же мысль: Так как закон Природы—измененье, Лишь постоянство вызывает изумленье ', а Эдмунд Берк, английский государственный деятель, в 1774 г. в своей «Речи об американском налогообложении» высказал эту мысль на политическом языке: Государство, которое ие может измениться, ие может и сохранить себя. Независимо от того, разделяем мы точку зрения Гераклита или нет, хотя бы из практических соображений необходимо считать, что некоторые характеристики среды являются неизменными. Если это невозможно, то невозможно также и передавать сообщения, поскольку отсутствуют идентифицируемые единицы, и на самом деле нельзя действовать осмысленным образом, поскольку ничто в среде нельзя считать истинным. Имеется несколько соображений, по которым можно опреде- лить инварианты в среде. Одно из таких очевидных соображений состоит в том, что изменения в среде происходят значительно мед- леннее, чем мы воспринимаем, думаем или действуем. Таким об- разом, на практике можно или пренебречь этими изменениями, или вообще их не замечать. Другое соображение заключается в том, что эти изменения происходят на таком уровне разрешения, что человек не может их наблюдать. Поэтому эти изменения, если Пер. с англ. А. Горлина. — Прим. ред. 318
они только не проявляются каким-то образом в диапазоне нашего восприятия, являются для нас несущественными. Можно выделить инвариантность другого типа, которая связа- на с процессом изменений, а не с тем, что меняется. В схеме УРСЗ этот тип инвариантности нашел свое отражение в понятии порож- дающей системы. Ее переменные изменяются, однако способ из- менения, описываемый функцией поведения системы (или ее ST- функцией), параметрически инвариантен, т. е. постоянен (неизме- нен) относительно параметрического множества. Поиск инвариантностей составляет самую суть науки, о чем очень хорошо пишет Г. Спенсер Браун [57]: Наука занимается определением констант: это изучение неизменного. Если я брошу бомбу из окна верхнего этажа, то она будет падать вниз со все воз- растающей скоростью. Это изменение скорости — проклятие для ученого. Он ие успокоится до тех пор, пока не придумает, как описать это изменение неизмен- ным образом. В данном случае долго искать решение не нужно. Скорость этой бомбы может меняться, но иеизмеииой остается скорость ее измеиеиия (называе- мая ускорением). Функция 32 фут/с’ — это константа, описывающая поведение не только этой бомбы, но и всех других бомб, сброшенных поблизости. Мы говорим о фуикции 32 фут/сг как об абсолютной константе, ио если вдуматься, то это не так. Масса Земли понемногу увеличивается за счет захвата метеоритов и космической пыли. Следовательно, можно ожидать, что гравита- ционное ускорение будет со временем увеличиваться. Можно считать это увели- чение «константой», но нет оснований считать, что и эта «константа» будет оста- ваться неизменной. Наша попытка исчерпывающего описания гравитационного ускорения оказалась неудачной. Может показаться, что положение можно испра- вить следующим образом Мы можем утверждать, что g зависит от заданных масс, расстояний и других факторов, которые называются соответствующими. Если соответствующие факторы определены, то мы в состоянии определить не- меияющуюся константу. Однако теперь эта задача представляется чисто лингви- стической: либо изменение этой константы, сделанное исходя из наблюдений И экспериментов, может быть объяснено нашим ошибочным определением соответ- ствующих условий, прн которых следует наблюдать эту константу. Другими сло- вами, всегда существует «действительная» константа, к которой сходятся наши наблюдения; если нам даже покажется, что мы ее определили, впоследствии обнаружится, что мы нашли только некоторое ее приближение. Это похоже иа философское понятие «вещь в себе» или «реальности вне проявления». Его можно было бы назвать «константой вне аппроксимации». По- добное предположение является частью научного подхода, и для определенных целей этот подход, иесомненио, удобен. Его плодотворность мы обсудим позже, а сейчас необходимо подчеркнуть, что законы природы — это всего лишь сде- ланные нами описания таких структур, относительно которых было выяснено, что они меняются, ио только очень медленно. По существу, мы не располагаем сви- детельствами того, что какая-то структура вообще не меняется... То, что мы замечаем, зависит от того, как и особенно как быстро меняемся мы сами. Например, замечаем вещи, которые меняются также медленно, как мы, 319
или еще медленнее, ио в общем случае ие те, что меняются значительно быстрее. Таким образом, чем быстрее мы меняемся, тем больше мы замечаем. Если мы снимем иа кинопленку растение со скоростью один кадр в минуту и прокрутим эту пленку со скоростью 30 кадров в секунду, то иам покажется, что это растение ведет себя как животное. Если поместить что-то рядом с ним, то растение явно ощутит это и отреагирует. Это, безусловно, чувствующее су- щество. Тогда почему в обычных условиях не кажется, что оно обладает чувстви- тельностью? Возможно, дело в том, что оно слишком медленно думает. Для су- ществ, которые реагируют в 1800 раз быстрее нас, мы тоже выглядим как ли- шенные чувств растения. В самом деле, существа, двигающиеся так быстро, бу- дут уверены в том, что мы лишены чувств, поскольку, как правило мы ие будем ощущать их поведение. Их мимолетные появления не будут для нас ни- чего значить. Дерево не может почувствовать, что я прошел мимо, так же как я не могут почувствовать пролетевшую мимо меня пулю. Я должен ощутить определенные события, связанные с полетом пули, например простреленную руку. Точно так же, если моя прогулка была достаточно «разрушительной», то дерево ощутит определенные события, связанные с моей прогулкой, скажем сломанную ветку. Но то, что для дерева быстро, для меня медленно н скучно, а то, что про- исходит с обычной для меня скоростью, вообще находится за пределами мира дерева ... Тот, кто сможет двигаться бесконечно быстро, будет способен знать все, поскольку для него все будет находиться в состоянии покоя. Он будет рас- полагать бесконечным временем для узнавания. А если ему будет позволено и самому перемещать частицы вселенной, то он станет не только всезнающим, ио и всесильным, поскольку сможет сколь угодно долго изменять положение вещей. Мы видели, что наука всегда стремится описать изменение в виде неизмен- ной формулы. Такая формула всегда может быть найдена, если изменение уже произошло, однако она не всегда применима к будущему. Если же изменяется само изменение, то нужна новая формула. Теперь мы в состоянии разделить задачу историка н задачу ученого. Мы видели, что ученый стремится зафиксиро- вать неизменным образом меняющиеся явления, в то время как историк зани- мается только фиксированием изменений, которые уже произошли. Историк не занимается поиском формулы, которая была бы истинной на все времена. Если бы им когда-нибудь была обнаружена такая формула, то больше не потребова- лось бы никаких новых записей, и он потерял бы работу. Повторяется не исто- рия, а наука. Ученый начинает с того, что вглядывается в сумбур изменений и что может фиксирует в виде формул. История — это то, что остается после того, как ученый уже отобрал свое. Таким образом, история важнее науки, поскольку она дает первоначальное понимание вещей. Но изучать ее ие обязательно. То, что не изменяется (напри- мер, прошлое), ие опасно. Оно не может нам повредить. Остерегаться следует того, что изменяется. А для того, чтобы приспособиться к изменениям и суметь их почувствовать, нужно быстро ощущать. Понятно, что поиск инвариантностей, столь важный для науки, должен быть одним из главных компонентов УРСЗ. Некоторые виды параметрической инвариантности связаны с порождающими системами и структурированными порождающими системами. Они 320
рассматриваются соответственно в гл. 3, 4. Однако они представ- ляют собой только частные случаи общего понятия параметриче- ской инвариантности, рассматриваемого в следующем разделе. 5.2. ПЕРВИЧНЫЕ И ВТОРИЧНЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ Закон тождественности не позволя- ет иметь пирог и есть его. Эйн Рэнд Существовать—-значит быть тождественным самому себе, что, в свою очередь, значит быть идентифицированным. Система обла- дает тождественностью, если определены какие-то ее характери- стики. Характеристики, совокупность которых идентифицирует си- стему, будем называть первичными характеристиками. Любые дру- гие характеристики системы, не участвующие в ее идентификации, назовем ее вторичными характеристиками. Таким образом, множество всех характеристик системы обра- зует ее определение. Общим свойством эпистемологической иерар- хии систем является то, что множество первичных характеристик определенного уровня является подмножеством множества первич- ных характеристик всех более высоких уровней. На рис. 5.1 эти включения для нейтральных систем показаны вплоть до уровня структурированных систем с поведением. Аналогично можно пред- ставить эти включения для структурированных систем данных или структурированных исходных систем. Для этого нужно только ис- ключить те характеристики, которые не входят в определения со- ответствующих систем (маски, функции поведения и функции дан- ных); модификация этого рисунка для направленных систем три- виальна. Необходимым условием оперирования с системой при решении задачи является сохранение ее тождественности. Это значит, что первичные характеристики (но, разумеется, не вторичные) должны оставаться неизменными. Так, например, заданная система дан- ных может быть дополнена функцией поведения, определенной по ее данным. Очевидно, что она является характеристикой данной системы данных. Однако, так как существует множество разных функций поведения, которые можно определить для одной и той же системы данных при разных масках и способах представления ограничений на переменные, эта функция не может быть исполь- зована для идентификации системы. Она является вторичной ха- рактеристикой системы, и, следовательно, ее можно изменять. Можно заменить одну функцию поведения другой, не изменив тож- дественности системы данных. Можно привести и обратный при- мер. Заданная система с поведением при разных начальных усло- виях может порождать разные наборы данных. Любой такой на- 21—6923 321
Рис. 5.1. Отношение включения первичных характеристик для эпистемологической иерархии систем бор данных является вто- ричной характеристикой этой системы с поведением. Она остается неизменной не- зависимо от того, какой на- бор данных рассматри- вается. На определенном этапе процесса решения задачи система обычно переопреде- ляется в том смысле, что ее вторичные характеристики принимаются как первич- ные. Например, при эмпири- ческом исследовании систе- ма первоначально определя- ется как исходная, и это определение сохраняется на этапе сбора данных. После того как исследователь при- дет к заключению, что по- лученных данных достаточ- но, чтобы соответствующим образом описать переменные исходной системы, он мо- жет принять полученный массив данных в качестве первичной характеристики. Это означает, что он пере- определил исходную систему в систему данных. Такое переопределение представляет собой шаг индукции, поскольку оно является следствием индуктивного действия, основанного, например, на предположении, что любой экземпляр возможного для переменных состояния имеется среди собранных данных или может быть выведен из них. Решение о переопределении исходной системы в систему данных в этом случае отражает уверенность исследователя в том, что имеющих- ся данных достаточно для целей исследования. Эта уверенность основывается не только на самих данных, но и на цели исследо- вания, на представлении о том, как будут обрабатываться такие данные, на сравнении с аналогичными исследованиями, проведен- ными ранее, а также зависит от субъективных качеств самого исследователя (от его опыта в данной области, интуиции и т. п.). После переопределения исходной системы в систему данных исследование приобретает теоретический характер. Первой зада- чей такого исследования является поиск такой порождающей си- стемы, которая адекватно представляла бы систему данных. Лю- 322
бая функция поведения или ST-функция, полученная по данным при различных масках, представляет собой вторичную характери- стику этой системы данных. Если исследователь достаточно уве- рен в какой-то из этих функций, то может принять ее за первич- ную характеристику и, таким образом, переопределить систему данных в порождающую систему. Это переопределение также со- держит элемент индукции, поскольку принятая функция поведения или ST-функция по природе своей параметрически инвариантна, а следовательно, определение порождающей системы выходит за пределы заданного параметрического множества и различных на- чальных условий. С помощью другого шага индукции порождаю- щую систему можно аналогичным образом переопределить в струк- турированную порождающую систему при условии, что реконст- руктивные свойства этой системы проанализированы. Переопределяются системы и в процессе проектирования. Пред- положим, что задача состоит в том, что заданную систему с пове- дением нужно реализовать в виде структурированной системы, со- стоящей из элементов определенных типов и удовлетворяющей определенным требованиям (целям, ограничениям). Характеристи- ки структурированных систем, определяемых в процессе проекти- рования, рассматриваются как вторичные. Эти характеристики не изменяют тождественности заданной системы с поведением; их ис- ходная система, маски и функция поведения остаются единствен- ными первичными характеристиками в течение всего процесса про- ектирования. В результате обычно получается несколько структу- рированных систем. Если одна из них принимается в качестве решения, то ее можно переопределить как структурированную си- стему с поведением; она и будет служить основой при реализации проекта. Первичные характеристики как средства идентификации систе- мы должны быть известны и параметрически инвариантны. К вто- ричным характеристикам подобные требования не предъявляются. Они могут быть или полностью неизвестны, или известны только частично и при этом не должны быть параметрически инвариант- ны. Если первичные характеристики системы каким-либо образом изменяются, то, по определению, система перестает быть тожде- ственной самой себе и появляется новая система. С другой сторо- ны, изменения вторичных характеристик не влияют на тождест- венность системы. Так, например, объем имеющихся данных не влияет на исходную систему, в то время как конкретная система данных меняется при добавлении или исключении данных. Анало- гичным образом ST-система не меняется при замене ее текущего состояния другим состоянием или реализующей ее структуриро- ванной системы на другую, также реализующую ее структуриро- ванную систему. Параметрическая инвариантность является одним из свойств функций поведения и ST-функций. Здесь понятие инвариантности 323
строго связано с конкретным параметрическим множеством, опре- деленным как часть рассматриваемой исходной системы. Однако иногда бывает нужно использовать это понятие в локальном смы- сле— для некоторого подмножества, заданного параметрического множества. Такую инвариантность можно назвать локальной ин- вариантностью или субинвариантностью. Теперь рассмотрим множество функций поведения, определен- ных на одной исходной системе, причем эти функции только ло- кально инвариантны и, следовательно, не полностью характеризу- ют переменные (и порождают их состояния) на всем параметри- ческом множестве исходной системы. Таким образом, эти функции не могут рассматриваться как первичные характеристики одной системы с поведением. Однако они в принципе могут быть интег- рированы в большую систему. Для этого требуется описать про- цедуру замены одной функции поведения другой на параметриче- ском множестве. Назовем эту процедуру процедурой замены. Если некие функции поведения, которые являются параметри- чески инвариантными только локально, интегрируются с помощью соответствующей процедуры в одну систему, то для удобства их параметрическая инвариантность может быть распространена на все параметрическое множество. Подобное распространение не по- влияет на интегрированную систему, так как процедура замены не позволяет использовать функцию поведения вне области ее локаль- ной инвариантности. Таким образом, интегрированную систему удобно рассматривать как множество функций поведения и про- цедуру замены. Предложенный метод интегрирования систем с поведением под- ходит и для других типов систем. В следующем разделе мы вве- дем, формализуем и рассмотрим различные категории интегриро- ванных систем. 5.3. МЕТАСИСТЕМЫ Естественные явления представляются нам осмысленными не только тогда, ко- гда нам удается найти связь между их кратковременными существованиями, но и тогда, когда мы, руководствуясь опре- деленным подходом, синтезируем их из- менения во времени. Амос И Цао Чжан Один из способов интегрирования нескольких сопоставимых си- стем в большую систему состоит в образовании структурирован- ной системы, как это описано в гл. 4. Другой способ интегрирова- ния систем состоит в определении соответствующей процедуры, как 324
это предлагается в данном разделе. Интегрированные таким обра- зом системы будем называть метасистемами. В термине «метасистема» используется греческий префикс мета. По гречески он имеет три значения: 1. «Мета X» называется то, что наблюдается (имеет место) по- сле X, т. е. X является предпосылкой мета X. 2. Выражение «мета X» показывает, что X меняется и служит общим названием этого изменения. 3. «Мета X» используется в качестве названия того, что выше X в том смысле, что оно более высоко организовано, имеет более высокий логический тип или рассматривается в более широком смысле. Мы видим, что термин «метасистема» в приложении к систе- мам, соединяющим с помощью соответствующей процедуры за- мены несколько систем, включает все три смысла этого понятия. Понятно, что: 1) метасистема может быть определена только после того, как определены другие типы систем; 2) эта система описывает изменение — замену одной системы другой; 3) она выше отдельных систем — процедура замены делает ее чем-то большим, чем набор отдельных процедур. Таким образом, название «метасистема» вполне обоснованно. Метасистемы вводятся в основном для описания изменений при заданном параметрическом множестве тех системных характери- стик, которые определяются как параметрически инвариантные. Такими характеристиками являются множества переменных и со- ответствующие множества состояний и каналов, функций поведе- ния и ST-функций и соединения структурированных систем. Мета- системы могут быть определены через системы любого из трех оп- ределенных ранее типов. Включенные в метасистему системы бу- дем называть элементами. Они должны быть сопоставимы в том смысле, что должны иметь один тип базы (время, пространство, группа). Для обозначения метасистем будем использовать (подобно опе- ратору S для структурированных систем) оператор М следующим образом: помещенный перед обозначением системы определенного типа, он означает метасистему, элементами которой являются си- стемы данного типа. Например, MFb, MFb и MSD— это метаси- стемы, элементами которых являются соответственно нейтральные системы с поведением, направленные ST-системы и структуриро- ванные системы данных (нейтральные). Для формального определения метасистем рассмотрим сначала метасистемы, элементами которых являются нейтральные системы с поведением, т. е. метасистемы MFb. Всякая метасистема этого 325
типа определяется как тройка: MFS=(W, в, г), (5.1) где W — параметрическое множество; ЯГв — множество нейтраль- ных систем с поведением, чьи параметрические множества явля- ются подмножествами W (но не обязательно точными); г — про- цедура замены, реализующая определенную функцию вида г: (5.2) Назовем функцию (5.2) функцией замены. Важно понимать, что эта функция не обязательно должна быть явно включена в метасистему. Требуется только, чтобы была задана процедура, представляющая определенную функцию вида (5.2), даже если невозможно или трудно определить, какую функцию она реализу- ет. Можно, разумеется, определить функцию замены и явно. В этом случае процедура замены идентична функции замены или ею опре- деляется. Этот подход будет продемонстрирован в этом разделе на нескольких примерах. Можно легко модифицировать уравнение (5.1), определяющее метасистему нейтральных систем с поведением так, чтобы оно под- ходило и для других систем. Для этого нужно заменить обозначе- ния MFS и ЯГв на обозначения, представляющие другие системы. Для удобства договоримся, что множество систем определенного типа обозначается прописной рукописной буквой, соответствующей системам этого типа. Тогда, например, MSFs=(W, 9WS, г), MD= (W, £>, г) является соответственно определением метасистемы структуриро- ванных (нейтральных) ST-систем и определением метасистемы на- правленных систем данных. Нетрудно дать определения и осталь- ных типов метасистем. Вообще говоря, можно определить метасистему и для множе- ства систем разных типов. Обозначим MX подобный общий тип метасистем. Тогда MX=(W, ЗВ, г), (5.3) где ЗВ — произвольное множество систем, чьи параметрические множества являются подмножествами W; г — снова процедура за- мены, которая должна реализовывать определенную функцию за- мены (5.4) В общей формулировке метасистемы (5.4), элементами кото- рой являются системы одного типа, могут рассматриваться как частные случаи системы (5.3), где Ф, ST в, SFs, 9>Ф, &ЗГв, PWs}; #£{9, S, Fb, fs, %%), $&в, 326
Рис. 5.2. Метасистема управления движением (пример 5.1) 6ч 7ч; 16ч 23 ч 9ч;18ч Процедуры замены соответственно для нейтральных и направленных систем. Такие метасистемы будем называть гомогенными метасистемами. Процедуры замены, являющиеся, очевидно, первичными харак- теристиками метасистемы, могут быть определены различными способами. Они допускают даже случайный выбор. Единственное условие состоит в том, что процедура замены должна реализовы- вать определенную функцию замены общего вида (5.4). Приведем несколько примеров, показывающих типичные способы определе- ния функций замены. Пример 5.1. В этом примере описывается работа светофоров на перекрестке в течение суток. Описание представляет собой гомо- генную метасистему, состоящую из трех элементов, определенных как системы данных. Все три элемента содержат одни и те же переменные и множества состояний. Переменные описывают сиг- налы светофоров для транспортных потоков с севера на юг, с юга на север, с востока на запад, с запада на восток, обозначенные соот- ветственно СЮ, ЮС, ВЗ и ЗВ, а также сигналы для левых пово- ротов с севера на восток, с юга на запад, с востока на юг, с запада на север, обозначенные соответственно СВ, ЮЗ, ВЮ и ЗС. Пара- метром является время; единицей измерения времени — секунда, соответствующие интервалы времени измеряются в секундах. На рис. 5.2 приведены матрицы данных db d2, d3 для трех эле- ментов Db D2, D3; их временные множества определены непосред- ственно соответствующими интервалами времени. Матрицы дан- ных периодические и задаются одним периодом. Как показано в табл. 5.1, системы Db D2 и D3 определяют управление движени- ем ночью, днем и в часы пик. Эти системы, рассматриваемые как элементы метасистемы, заменяют одна другую в определенные моменты времени в течение суток. Функцию замены в данном слу- чае удобно представить в виде помеченной диаграммы, изображен- ной на рис. 5.2. Ее узлами являются элементы данной метасисте- мы, стрелка из Dj в Dj (i, /=1, 2, 3) показывает, что Di заменя- ется на Dj, а метка стрелки указывает на момент времени, в кото- рый происходит эта замена. Таким образом, данная метасистема представляет собой тройку MD=(T, 0={Db D2, D3}, г), где S) и г полностью определены в табл. 5.1, а Т состоит из 5760 определенных интервалов времени суток (420 периодов db 390 пе- риодов d2 н 240 периодов d3). 327
Таблица 5.1. Метасистема управления движением Элемент управление движением ночью [0, 20) [20. 30) [30, 50) [50. €0) св-ЮЗ 3 Ж К К СЮ-ЮС 3 ж к к вю-зс к к 3 ж вз-зв к к 3 ж Элемент D2: управление движением в нормальных условиях [0, 15) [15. 25) [25. 55) [55. 65) [65. ео) [80, 90) [10, НО) (110, 120) св-юз 3 Ж К К К К к К СЮ-ЮС к к 3 ж к к к к вю-зс к к к к 3 ж к к вз-зв к к к к к к 3 ж Элемент D3: управление движением в часы пик [0, 30) [30, 40) [40, 50) [50, 60) св-юз к К К К СЮ-ЮС 3 ж к к вю-зс к к к к вз-зв к к 3 ж Пример 5.2. Рассмотрим больного, у которого время от времени почки перестают функционировать соответствующим образом. На- блюдение за состоянием больного ведется по нескольким перемен- ным. При необходимости работу почек берет на себя искусствен- ная почка или устройство для гемодиализа. При работе искусст- венной почки контроль осуществляется по нескольким дополни- тельным переменным. Таким образом, при наблюдении за боль- ным имеются две исходные системы, скажем Si и S2. Одна из них связана с теми периодами, когда почки работают нормально, а другая — с периодами, когда больному подключают искусственную почку. Система S| состоит из четырех переменных: th — вода в урине (измеряется с точностью 0,1 л в диапазоне 0—1 л); V2 — глюкоза в урине (измеряется с точностью 20 г в диапазо- не 0—200 г); из — мочевина в урине (измеряется с точностью 5 г в диапазо- не 0—50 г); 328
t>4 — содержание азота в крови (канал наблюдения дает только два состояния 1 и 0 в зависимости от того, достигает ли содержание азота 150 мг на 100 мл крови или нет). В систему S2 входят все перечисленные выше переменные, а также две дополнительные: г?5 — температура крови (измеряется с точностью 0,2° F в диа- пазоне 97—100° F); ие — кровяное давление (измеряется с точностью 2 мм ртутного столба в диапазоне 110—130 мм). Значения этих переменных искусственная почка должна под- держивать в определенном узком диапазоне. Все введенные пере- менные наблюдаются во времени. Реально моменты времени опре- деляются тяжестью состояния пациента и другими факторами, ко- торые нет необходимости рассматривать в данном примере. Эти две исходные системы можно рассматривать как метасисте- му со следующей процедурой замены г: если ^4=1, заменить Si на S2; если ^4=0, заменить S2 на Sb Таким образом, данная метаси- стема представляет собой тройку MS=(T, ^={St, S2}, г), где Т — объединение временных наборов S[ и S2. Пример 5.3. Рассмотрим структурированную систему, элемен- ты которой образуют массив «Хи. Пусть каждый из ее элемен- тов, часто называемых ячейками, соединен только с соседними ячейками из массива. Пример такого массива 5X5 приведен на рис. 5.3. Ячейки массива удобно идентифицировать двумя целы- ми числами I, /еЛ/о, п-ь указывающими номера соответственно строки и столбца. На рис. 5.3 также показано, что ячейку можно идентифицировать и одним целым числом c=ni-^j. Будем называть с идентификатором ячейки. Допустим, что внутренняя среда ячейки (за исключением по- граничных ячеек) состоит из четырех ее соседних ячеек, как это показано на рис. 5.4. Такая ячейка имеет четыре входные пере- менные t'c-n, vc-1, Uc+i, vc+n — по одной на каждую соседнюю ячейку и одну выходную переменную, соединенную со всеми сосед- ними ячейками. Понятно также, как определяется внутренняя сре- да для пограничных ячеек, т. е. ячеек из строк 0, п—1 н столбцов 0, и—1. Предположим, что все ячейки нз массива, скажем изображен- ного на рис. 5.3, представляют собой детерминированные направ- ленные ST-системы, определенные на одном и том же полностью упорядоченном временном множестве Т с ST-функцией v'c = fc(Vc-n, Vc-i, Vc+i, Vc+n)t (5.5) 329
j=0 1 2 3 4 Рис. 5.3. Массив ячеек 5X5 (пример 5.3) где v'c — следующее состояние переменной ис; c^NQAe, разумеет- ся, для пограничных ячеек определение этой функции должно быть уточнено, поскольку у этих ячеек отсутствуют некоторые входные переменные. Допустим далее, что каждая из переменных имеет только два состояния 0 или 1. Если ис=1, будем называть ячейку с активной (если ис=0, пассивной). Для заданного массива ячеек можно определить множество структурированных систем, где каждая система описывается под- множеством ячеек этого массива. Так, например, для массива яче- ек, изображенного на рис. 5.3, существует 225 (т. е. более 3,3-107) структурированных систем. Иногда нужно объединить структури- рованные системы из этого множества, назовем его множеством SPSFs, в метасистему MSFs=(T, ^s, г). (5.6) с помощью соответствующей процедуры замены. В качестве про- стого примера процедуры г из определения (5.6) можно предло- жить следующий: ячейка с (сеМ0,24) включается в структуриро- ванную систему тогда и только тогда, когда или она сама являет- ся активной, или активна по крайней мере одна ячейка из ее внут- реннего окружения, т. е. тогда и только тогда, когда oc_n4-Oc-i+vc-|-Vc+n>l. Для демонстрации конкретной процедуры типа (5.6) восполь- зуемся предложенной процедурой замены и ST-функцией для мас- сива 5X5, имеющей вид v'c= [ (Uc-b+uc-i+uc-h) (mod 2) -H'c+t'c+s] (mod 2). 330
Рис. 5.4. Внутренняя среда ячей- ки в массиве ячеек (пример 5.3) Если какие-то переменные недо- ступны для определенной ячейки, то они просто исключаются из этой формулы. Для каждой на- чальной структурированной си- стемы данная метасистема порож- дает последовательность структу- рированных систем. Короткие фрагменты трех таких последова- тельностей показаны на рис. 5.5. Черные и серые клетки—это ячей- ки, входящие в структурирован- ную систему, причем черные клет- ки— активные ячейки, а серые— пассивные; белыми клетками обо- значены ячейки, не входящие в структурированную систему. Разнообразие введенных в данном примере метасистем объяс- няется использованием различных ST-функций и процедур замены. Еще большего разнообразия можно достигнуть за счет использо- вания разных массивов, в общем случае ^-мерных, где k~^\. Эле- менты этого класса метасистем известны в литературе как клеточ- ные автоматы. Рис. 5.5. Фрагменты трех последовательностей структурированных систем, кото- рые могут быть порождены метасистемой, описанной в примере 5.3 331
Пример 5.4. Рассмотрим систему, состоящую из одной пере- менной v с множеством состояний V и одного параметра t, пред- ставляющего собой индекс, определяющий позицию в строках со- стояний V. Полностью упорядоченное параметрическое множество Т—это множество неотрицательных целых чисел. Для этой системы может быть определен класс метасистем типа MD=(7’, Ф, г) таким образом, чтобы: 3) представляла собой множество всех систем данных, ко- торые могут быть образованы переменной v для всех возмож- ных подмножеств Nn из множества Т (л=1, 2, ...); г представляло процедуру замены, в общем случае опреде- ленную следующим образом: задана система данных с массивом данных d; массив d просматривается в порядке возрастания параметра (обычно слева направо) и заменяется на d' с помощью подстановки вместо каждого состояния а из d строки состояний р(а), определяемой функцией p:V->VUV2U UVft (5.7) для некоторого конечного k\ d' определяет новую систему дан- ных О'^Ф. В литературе такие метасистемы называются развивающимися OL-системами (или системами без взаимодействий Линденмайе- ра). Пары а, р(а) обычно называются продукционными правила- ми и обозначаются а-*р(а). В качестве конкретного примера детерминированной OL-систе- мы (или в нашей терминологии метасистемы) положим V=Nq,9 и пусть функция продукционного правила р: определяется таблицей « 0 123456789 р(а) 12 93 49 61 25 87 78 34 9 9 Тогда, например, для начальной системы данных с массивом дан- ных [0] эта метасистема порождает последовательность систем данных со следующими массивами данных: Для недетерминированных OL-систем продукционные правила 332
[0] [12] [9 3 4 9] [96 1 2 5 9] [9 78934987 9] [9 349961259934 9] [9 61259978934987996125 9] [9 78934987993499612599349978934987 9] определяются не функцией вида (5.7), а множеством пар (а, 0) из декартового произведения VX(W2U ••• UV*). Выбор определенных продукционных правил может быть основан на условных вероятностях 0 при заданном а. 5.4. МЕТАСИСТЕМЫ И СТРУКТУРИРОВАННЫЕ СИСТЕМЫ Бабочка-однодневка не знает ни начала, ни конца лунного месяца; пятнистая ци- када не знает ни весны, ни осени... Чжуан-цзы1 Структурированные системы и метасистемы-—это две схемы интегрирования других систем (исходных систем, систем данных и порождающих систем). Это разные схемы, они независимы и ни одна из них не имеет преимущества перед другой. Более того, их можно комбинировать, т. е. применять одну к другой. В структурированных системах интегрирование осуществляет- ся по множествам переменных в предположении, что все они име- ют одно и то же параметрическое множество. Таким образом, эле- ментами структурированных систем являются системы с разными множествами переменных, но с одинаковыми параметрическими множествами. В метасистемах, напротив, интегрирование систем осуществля- ется по параметрическим множествам независимо от того, имеют эти системы одно множество переменных или нет. Следовательно, элементами метасистем являются системы с разными локальными параметрическими инвариантами, определенными на обобщенном Чжуан-цзы. Древнекитайская философия: Пер. с кит. — Т. 1. — М.: Мир, 1972. — С. 250. — Прим. ред. 333
параметрическом множестве; они могут быть определены и для одного обобщенного множества переменных. Как было показано в разд. 5.3, метасистемы можно использо- вать для интегрирования структурированных систем, которые в свою очередь, используются для интегрирования других систем. Примером тому служит класс метасистем из структурированных ST-систем (клеточных автоматов), рассмотренный в примере 5.3. Такие системы обозначаются как системы типа MSFs, причем в этом обозначении используются оба символа интегрирования М и S. Структурированные системы можно также использовать для интегрирования метасистем, определенных для различных мно- жеств. В обозначении таких систем оператор S предшествует опе- ратору М. Так, например, SMFb обозначается структурированная метасистема, элементами которой (т. е. элементами метасистем, объединенных в структурированную систему) являются нейтраль- ные системы с поведением, a MSFs обозначается метасистема, элементами которой являются структурированные системы с пове- дением. Следовательно, эти операторы некоммутативны. Системы MSX и SMX (для любого X) не только различны, но и не сопо- ставимы в смысле упорядочения в соответствии с эпистемологиче- ской иерархией систем. Пример 5.5. Рассмотрим направленную структурированную си- стему, состоящую из двух метасистем, элементами которых явля- ются направленные системы с поведением. Эти метасистемы 'MFob и 2MFgb соединены так, как это показано на схеме на рис. 5.6,а Каждая метасистема состоит из двух направленных систем с по- ведением, переменные которых имеют два состояния 0 и 1 с одним и тем же полностью упорядоченным параметрическим множест- вом. Системы с поведением для каждой метасистемы имеют оди- наковую маску, но разные функции поведения. Маски Ш и 2Л1 приведены на рис. 5.6,6. Выборочные перемен- ные, наблюдаемые в обеих системах, имеют, как это требуется для структурированных систем, одинаковые идентификаторы. Соответ- ствующая маска используется в обеих системах, входящих в одну метасистему. Функции поведения (порождающие функции) являются детер- минированными, т. е. порождающие переменные в обеих системах с поведением являются функциями порождающих и входных вы- борочных переменных. Эти функции приведены на рис. 5.6,в. Функции поведения для первой метасистемы обозначены и?ов, i2fcB, а для второй метасистемы — 27gb, 22/gb. В обеих метасистемах используются процедуры замены одного типа: если все входные и порождающие переменные имеют со- стояние 0, то первая система с поведением заменяется второй; если 334
s2 S4 |\ \ ss ss р=-7 О v, v2 ='м -1 о V2 V3 6) о о о о 1 1 1 1 S2 о о о о 1 1 1 1 о о 1 1 о о 1 1 2. о о о о 1 1 о 1 о 1 о 1 о 1 Рис. 5.6. Структурированная метасистема (пример 5.5) д) о 1 1 о 1 о о 1 1 О о 1 о 1 1 о о 1 1 1 Ss 1 о 1 1 о о 1 о о о 1 2 5 3 6 о о о Номер функции поведения для метасистемы 'MF t- vt Ъ 1 122222111 12222 1_ 2 3 4 5 6 7 8 9 10 11 12 13 /4 15 16 ? 1 О 1 О 1 О О о о о 1 1 о о 1 1 о 1 о о о I о 1 о 1 о V3 1 1 1 о 1 1 о о о о о о о 1 1 1 1 | 1 1 2 2 2 1 1 1 Начальное условие 1 2 2 2 2 Номер функции подедения метасистемы Рис. 5.7. Пример данных, порождаемых структурироваииой метасистемой, изобра- женной на рис. 5.6 (пример 5.5) 335
все входные и порождающие переменные имеют состояние 1, то вторая система заменяется первой. Если этот алгоритм применить к соответствующим переменным, то будут получены процедуры !г и г2, показанные на рис. 5.6,г. На рис. 5.7 показан образец данных, порожденных этой струк- турированной метасистемой при начальном условии $1=$2=$з=0 и определенной входной последовательности (последовательности состояний переменной Ui). На рис. 5.7 также указано, какая из двух функций поведения каждой из метасистем используется при соответствующем значении параметра t. 5.5. МНОГОУРОВНЕВЫЕ МЕТАСИСТЕМЫ До тех пор, пока тождества сохраняют- ся, они представляют собой правильные законы. Если же они нарушаются, то эти законы следует модифицировать. Одна- ко сама такая модификация может быть закономерной. Частное изменение может выявить закон изменения и даже подоб- ные законы изменения сами могут ме- няться. Альфред Норт Уайтхед Теперь мы можем определить многоуровневые метасистемы точ- но так же, как были определены многоуровневые структурирован- ные системы (разд. 4,4): это метасистемы, элементами которых являются метасистемы, элементами которых... и т. д. Такая рекур- сия заканчивается на элементах, которые не являются метасисте- мами. Продолжая аналогию со структурированными системами, бу- дем обозначать многоуровневые метасистемы обобщенным опера- тором, где AV— число уровней метасистемы. Так, например, M3D обозначает трехуровневую метасистему, конечными элементами которой являются системы данных; это метасистема, элементами которой являются метасистемы, элементами которых снова явля- ются метасистемы, элементами которых являются нейтральные си- стемы данных. Двухуровневые метасистемы можно для удобства называть мета-метасистемами. Формально &-уровневая метасистема определяется как тройка M*X=(W*. ЛГ-'Я?, rk), (5.8) где Wft — ее параметрическое множество; rk — процедура замены; — множество ее элементов (метасистем уровня k—1) чьи- ми конечными элементами являются системы из множества 35, не являющиеся метасистемами. 336
Для многоуровневой метасистемы МАХ первичной характери- стикой, по которой определяется тождественность системы, явля- ется процедура замены только самого высокого уровня (г*). Про- цедуры замены более низких уровней представляют собой вторич- ные характеристики, так как с точки зрения метасистемы MftX они определяют только локальную параметрическую инвариантность. Пример 5.6. Рассмотрим двухуровневую метасистему (или ме- та-метасистему) M2SFs= (Т, jr^s={'MSFs, 2MSFs}, г2), с параметрическим множеством Т; первый элемент этой метаси- стемы 'MSFs — метасистема, описанная в примере 5.3 (клеточный автомат). Второй элемент (вторая метасистема) имеет вид 2MSFs=(7’, ^s, 2r), причем Т и 33~s те же, что и в метасистеме ’MSFs, а 2г представ- ляет собой следующую процедуру замены: выбирается случайным образом активная ячейка, затем она делается пассивной и из структурированной системы исключаются те ячейки внутренней среды этой ячейки (включая и саму эту ячейку), которые явля- ются пассивными и у которых все соседи пассивны. Эти метасистемы интегрируются в мета-метасистему с помо- щью следующей процедуры второго уровня (или метапроцедуры) г2: если структурированная система при значении параметра t—1 отличается от структурированной системы при значении t—2, то использовать метасистему 'MSFs; в противном случае использо- вать метасистему 2MSFs- Пример 5.7. Рассмотрим развивающуюся OL-систему (пример 5.4), определенную как метасистему. Она состоит из двух метаси- стем MD=(7', 3>, 'г), 2MD=(7’, 3), 2г), отличающихся только процедурами замены 'г и 2г. Их компонен- ты Т и 3) те же, что и в примере 5.4, только V={0, 1, 2, 3}. Про- цедуры замены 'г, 2г определяются следующими функциями 'р и 2р: а 0 1 2 3 а 0 1 2 3 ’р(а) 01 2! 30 32 2р(а) 01 20 30 32 Тогда мета-метасистема M2D определяется как M2D=(T, {'MD, 2MD), г2), 22—6923 337
причем метапроцедура г2 определяется следующим образом: про- сматривается последний полученный массив данных; если не мень- ше половины элементов массива равно 0, то используется метаси- стема ’MD (функция *р); в противном случае — метасистема 2MD (функция 2р). Например, для начального массива данных [0] метасистема ’MD порождает следующую последовательность массивов: [0] [0 1] [0 12 0] [0 1 20300 1] [0 12030013201012 0] [0 120300132010120323001200120300 1] Метасистема 2MD порождает другую последовательность мас- сивов [0] [0 1] [0 12 1] [0 1 2 1 3 02 1] [0 12130213201302 1] [0 121302132013021323001213201302 1] Мета-метасистема M2D порождает другую последовательность массивов (в каждом случае показано, какое продукционное пра- вило было использовано: [0], ’р [0 1], ’р [0 1 2 1], 2р [0 1 2 0 3 0 2 0], *р [0 1 2 1 3 0 0 1 3 2 0 1 3 0 0 1], 2р [0 120302032010120323001203201012 0], гр Многоуровневые метасистемы можно комбинировать с много- уровневыми структурированными системами в любой последова- тельности. Единственное требование состоит в том, чтобы элемен- тами метасистем или структурированных систем нижнего уровня 338
были системы одного из трех основных типов — исходные системы, системы данных и порождающие системы. На языке УРСЗ вполне адекватно можно описать систему MSMSFB, M2S2SD или M2S2MSS. 5.6. ИДЕНТИФИКАЦИЯ ИЗМЕНЕНИЯ Мы понимаем, что происходит изменение только потому, что что-то остается неиз- менным, а неизменность определяется только на фоне преобразования. Джеральд Уейнберг Многообразие способов, которыми можно определить метаси- стемы с разными типами элементов и различным числом уровней продемонстрировано в разд. 5.3—5.5 на нескольких показательных примерах. Однако задача получения соответствующего метаси- стемного описания исследуемых переменных по имеющимся дан- ным является одной из наиболее сложных и наименее разработан- ных системных задач. Своим возникновением эта задача обязана одному из фунда- ментальных вопросов исследования систем: должны ли ограниче- ния на исследуемые переменные рассматриваться как параметри- чески инвариантные или только как меняющиеся в соответствии с некими параметрически инвариантными правилами изменения (процедуры замены)? Трудность состоит в том, что на этот вопрос нет однозначного ответа. Выбор той или иной точки зрения зави- сит не только от природы самих переменных, но и от целей иссле- дования, от того, каким образом заданы ограничения (в виде мас- ки, степени ограничения), являются данные полными или нет, и от других факторов, в частности связанных с контекстом исследова- ния. Если выбран определенный способ представления ограничений (например, вероятностные меры и наибольшая приемлемая мас- ка) и используются обычные целевые критерии порождающей не- четкости и сложности, то эта задача сводится к определению из- менения функции поведения или ST-функции. Другими словами, она становится задачей определения существенных локальных ог- раничений на переменные на рассматриваемом параметрическом множестве. Если функция поведения, представляющая все параметричес- кое множество (глобальная функция), несильно отличается от функций поведения, соответствующих различным подмножествам параметрического множества, то нет необходимости в использо- вании формализма метасистем. Но если между этими функциями имеются существенные различия, то следует рассмотреть вопрос 339
об использовании такого формализма. Однако применение этого подхода встречает некоторые трудности. Прежде всего следует неким конструктивным образом опреде- лить, что понимается под «существенным различием функций по- ведения». То есть для придания понятию «разница» конкретного смысла необходимо выбрать функцию расстояния для функций поведения. Кроме того, нужно задаться каким-то пороговым зна- чением расстояния для определения того, что это расстояние «су- щественно». Несмотря на то, что принятие этих решений предо- ставляется пользователю, УРСЗ должен располагать неким вари- антом решений, которые используются по умолчанию (при нали- чии соответствующего запроса). Во-вторых, разница (расстояние) между локальной и глобаль- ной функциями поведения может считаться существенной только в том случае, когда локальная функция определена на достаточно большом подмножестве параметрического множества. И снова должно быть принято решение, какой наименьший размер подмно- жества параметрического множества может считаться достаточ- ным, чтобы на нем можно было бы определить содержательную локальную функцию поведения. Размер этот зависит от числа со- стояний переменных, от меры, с помощью которой задаются огра- ничения на переменные, от используемой маски и, возможно, от каких-то других факторов. Помимо отмеченных теоретических проблем, в задаче опреде- ления существенных локальных ограничений имеются и трудности практического характера. Они связаны прежде всего с тем, что число подмножеств параметрического множества, рассматривае- мых в процессе определения существенных программных ограни- чений, с ростом параметрического множества растет экспоненци- ально. Как следствие с ростом параметрического множества ла- винообразно растет число необходимых вычислений, так что эта задача становится неразрешимой даже для параметрических мно- жеств относительно небольшого размера. В заключение этого раздела опишем простую процедуру опре- деления локальных ограничений. Будем называть ее процедурой идентификации метасистемы. Эта процедура использует предполо- жение о том, что параметрическое множество Т полностью упоря- дочено и что переменные описываются системой данных. Эта про- цедура или не определяет никакой метасистемы (если не нахо- дится существенных локальных ограничений), или определяет ме- тасистему, состоящую нз последовательности определенных на параметрическом множестве систем с поведением. Замена одной системы на другую происходит при определенных значениях па- раметра, которые вычисляются этой процедурой. Даны: система данных с полностью упорядоченным параметри- ческим множеством T=Nn, маска (обычно наибольшая допусти- мая) и определенный способ представления ограничений на пере- 340
менные (со своей мерой порождающей нечеткости). Процесс идеи* тификации метасистемы состоит в следующем. Шаг 1. Пусть дано целое число т, рациональное число А и из- вестно, что /=1, &=1. Шаг 2. Необходимо определить функцию поведения для под- множества данных, соответствующих отрезку [/, t-j-m] парамет- рического множества, и вычислить ее порождающую нечеткость t/.. Шаг 3. Затем надо увеличить k на 1; если то пе- рейти на шаг 6. Шаг 4. Определить функцию поведения для подмножества дан- ных, соответствующего отрезку [/, параметрического мно- жества, и вычислить ее порождающую нечеткость Uk. Шаг 5. Если \lh—Uk-\ |/max (Uk, то перейти на шаг 3; иначе записать —1)т в качестве аппроксимированной точ- ки замены элементов метасистемы, t=(k—1)т, k присвоить зна- чение 1 и перейти на шаг 2. Шаг 6. Стоп. В основе этой процедуры лежит следующее наблюдение: если данные не имеют существенных локальных ограничений, то порож- дающие нечеткости локальных функций поведения для отрезков [1, Z] с ростом t быстро сходятся (после некоторых начальных возмущений) к значениям, лежащим в малом интервале А; на- против, если данные содержат существенное локальное ограниче- ние, например, на отрезке параметрического множества [/ь /г]» то порождающие нечеткости обычно демонстрируют значительно пре- восходящие А колебания около значений параметра Л и tn, а вну- три отрезка [/ь снова находятся внутри небольшого интерва- ла. Таким образом, существенные вариации порождающей нечет- кости после того, как она колебалась в небольшом интервале, позволяют считать данную систему метасистемой, каждый элемент которой соответствует некоему подмножеству параметрического множества. Чувствительность и вычислительная сложность данной про- цедуры существенным образом зависят от выбранных значений т и А. Для оказания помощи пользователю в выборе этих значений УРСЗ должен располагать соответствующими характеристиками, полученными в результате вычислительных экспериментов, подоб- ных тем, что описаны в гл. 4 для анализа реконструируемости. Можно также выполнить эту процедуру несколько раз при разных значениях т, А и усреднить полученные результаты. Как бы то ни было, эта процедура определяет возможные точки замены только приблизительно. Для более точного определения и оценки их существенности необходимо провести более общее исследование. Пример 5.8. В данном примере описывается применение про- цедуры идентификации метасистемы при оценке работы пилотов в процессе их тренировки на летных тренажерах. Исходная систе- 341
Таблица 5.2. Описание системы, рассматриваемой в примере 5.8 Каналы наблюдения Характеристика: Переменная: Единицы: Скорость Узлы Высота над уров* нем моря а Футы Курс Г Градусы отно- сительно магнитного севера Расстояние d Морские мили 1 150, 170) [1700—1840) [0—93) [0-2,6) Интерпретация 2 170, 220) [1840—2400) [93-113) [2,6-14) состояний 3 220, 250) [2400—2700) [113—122) [14-21) 4 250—270) [2700—4900) [122—360) >21 5 >270 [4900—6900) — — 6 — [6900—22800) — — 7 — >22800 — — Матрица данных а 444455555555555555555555555555555555555555555554444444333 а 777666666666666666666666666666666666666666666666666655555 г 21 11 11 1 I 11 1 I 1 I I I 11 I I I I 1 I 1 I I I I I I I I I I 1 I I 1 1 I I I I 1 1 I I I I I I I 1222 d 444444444444444444444444444444444444433333333333333333333 s 333333333333332222222222222 I I I I I 1 1 I I 1 1 11 I I I 1 1 1 I I I I 11 1 11 I 1 а 555555555555444444444444444444333333333333333333333333333 г 222333333333333333333333333333333333333333333333333333333 d 333333333333333322222222222222222222222222222222222222222- s 1111I1I111III1I2222233333333333333333333333333333 а 32222221 1 I 1 1 1 1 12222223334444444444444444444444444 г 3333333333333333333344444444444444444444444444444 4 22222222221 I I I 1 I 11II1 I I I I I 11222222222222222222222 ма состоит из четырех переменных, описывающих соответствую- щие характеристики реактивного самолета; параметром является время. Не вдаваясь в технические подробности, будем каждую пе- ременную описывать ее идентификатором, соответствующей харак- теристикой и множеством состояний: з — скорость, множество состояний N$; а — высота, множество состояний У?; г — курс, множество состояний ЛГ4; d — расстояние, множество состояний Л/4. Каналы наблюдения и матрица данных для этих переменных приведены в табл. 5.2. Матрица, в которой данные представлены в порядке возрастания времени, описывает типичный (идеальный, правильный) способ захода на посадку реактивного самолета. Весь период захода на посадку разделен на 163 равных времен- ных интервала, и для каждого определены соответствующие со- стояния переменных. 342
Матрица данных, приведенная в табл. 6.2, является своего ро- да эталоном, по которому оцени- вается работа тренирующихся летчиков. И для курсантов, и для инструкторов желательно, чтобы вся задача была естественным образом разбита на подзадачи так, чтобы было легче локализо- вать ошибки. Процедура модификации ме- тасистемы была применена к ма- трице данных, приведенной в табл. 5.2 для вероятностной функ- ции поведения, маски из двух столбцов и А=0.1. Процедура выполнена для нескольких зна- чений т. Полученные для разных значений т точки замены были затем усреднены. В результате S S а г d S S а г d S а а • г d Рис. 5.8. Метасистема для типичного захода иа посадку реактивного само- лета (пример 5.8) получена метасистема, состоящая из трех элементов, определенных соответственно на следующих отрезках времени: 1—70, 71—122, 123—163. На самом деле, три этих элемента являются естествен- ными этапами выполнения посадки. Они соответствуют снижению высоты, полету по дуге с заходом на посадочный курс и собствен- но посадке. Для каждого элемента метасистемы была проведена оценка маски (разд. 3.6) и выполнена процедура реконструкции (разд. 4.7). Полученные результаты приведены на рис. 5.8. Это система типа MSFb. Понятно, что по сравнению с обобщенной системой с поведением данная система позволяет более точно оценивать работу курсантов. ПРИМЕЧАНИЯ 5.1. Клеточные автоматы (примеры 5.3, 5.6) были предложены Ямадой и Амброзио [346] в 1969 г. После этой статьи появились исследования по матема- тическим свойствам клеточных автоматов [12, 345, 347, 348] и их примеиеииям [144, 241]. 5.2. Развивающиеся системы были введены Линденмайером [210] первона- чально как удобный математический аппарат для описания явлений роста в био- логин. В настоящее время они являются объектом интенсивных математических и прикладных исследований [211—214, 154, 277]. 5.3. Процедура идентификации метасистемы, описанная в разд. 5.6, была предложена в работе [316]. Были также проведены вычислительные эксперимен- ты по определению подходящих значений т и Д. Более подробно пример 5.6 описан в статье [83]. 343
УПРАЖНЕНИЯ 5.1. Составьте список характеристик систем типов S, D, Fb, Fb, SS, SD, SFB, MS, MD, MFs, SMFs, MSFs и определите, какие из этих характеристик являются первичными, а какие вторичными. 5.2. Найдите пример реальной метасистемы в той области, которой вы за- нимаетесь. 5.3. Проведите дополнительные исследования примера 5.3: а) сгенерируйте последовательность структурированных систем для началь- ной системы, отличной от той, что приведена иа рис. 5.5; б) воспроизведите этот пример для другой ST-функции; в) воспроизведите этот пример для другой функции замены. 5.4. Рассмотрим вероятностную метасистему, представляющую собой разви- вающуюся OL-систему (пример 5.4). Ее продукционные правила а->Р связаны с условными вероятностями р(а| р) следующим образом: Сгенерируйте последовательность систем данных при разных начальных си- стемах, каждый раз определяя выбор подбрасыванием двух монет. 5.6. Определите, сколько всего существует эпистемологических типов систем, считая, что максимальное число комбинируемых уровней структурированных си- стем и метасистем равно п. (Считайте только порождающие системы, а не си- стемы с поведением и ST-системы, и только исходные системы, а не системы объекта и представляющие системы.) ГЛАВА 6. СЛОЖНОСТЬ ...Ученый, как пилигрим, должен следо- вать по верной и узкой тропе между ло- вушками всеупрощения и болотом все- упрощения. Ричард Беллман 6.1. СЛОЖНОСТЬ ПРИ РЕШЕНИИ СИСТЕМНЫХ ЗАДАЧ ...плоды науки—это простые плоды, точ- нее, плоды упрощения. Джеральд Уейнберг В этой книге множество раз говорилось о сложности, причем в самых разных контекстах. Упоминались и разные формы этого понятия, зависящие в первую очередь от типа системы и от зада- 344
чи. Из этого видно, что сложность играет важную роль при реше- нии системных задач. По сути дела, она является столь же фун-' даментальным понятием науки о системах, сколь фундаментально понятие энергии в естественных науках. Сложность многогранна. В толковом словаре написано, что сложность означает «иметь сложное качество или состояние», т. е. «иметь много различных взаимосвязанных частей, структур или элементов и, следовательно, быть трудно понимаемым полностью», или «включать множество частей, аспектов, деталей, понятий, тре- бующих для понимания или овладения серьезного исследования или рассмотрения». В этом общем описании отсутствует характе- ристика объектов, к которым применимо это понятие. Поэтому оно потенциально применимо к любым типам объектов—материальным и абстрактным, естественным и искусственным, к творениям науки или искусства, а также к системам, задачам, методам, теориям, законам, играм, языкам, машинам, организмам, организациям и к любым другим объектам. Независимо от того, что рассматрива- ется как сложное или простое, в общем случае степень сложности связана с числом различаемых частей и мерой их взаимосвязан- ности. Кроме того, понятие сложности имеет субъективную обус- ловленность, поскольку оно связано со способностью понимания или использования рассматриваемого объекта. Таким образом, то, что сложно для одного, может оказаться простым для другого. Для УРСЗ общепринятое понятие сложности выражается через взаимодействие исследователя с объектом исследования, резуль- татом которого является исходная система. В этом смысле слож- ность не является неотъемлемым свойством исследуемого объек- та, а, скорее, представляется следствием способа, которым иссле- дователь взаимодействует с ним. Другими словами, мы имеем дело не со сложностью объектов, а со сложностью систем, опреде- ленных на объектах. Об этом хорошо сказано у Росса Эшби в од- ной из его последних работ [27]: Слово «сложность» в применении к системам имеет много смыслов, поэтому нужно пояснить, как его понимаю я. У этого слова иет очевидного или основного (доминирующего) понимания, поскольку хотя все и согласятся, что мозг сложен, а велосипед прост, для мясника мозг овцы прост, а велосипед, если его тщатель- но исследовать (как, скажем, единственную улику преступления), может иметь множество важных деталей. Не прибегая к более глубокой аргументации, я в данной статье буду пони- мать «сложность» так, как я понимал ее в течение более чем десяти последних лет. Я буду оценивать степень сложности количеством информации, необходимой для описания реальной системы. Для нейрофизиолога мозг как сплетение воло- кон и бульон из энзимов сложен, и, соответственно, адекватная передача его по- дробного описания требует много времени. Для мясника мозг прост, так как ему нужно только отличать его примерно от тридцати других сортов «мяса», для чего он использует не более чем log430, т. е. 5 бит. Прн данном подходе 345
сложность системы сознательно ставится в прямую зависимость от наблюдателя; оценить абсолютную сложность при этом невозможно; однако, иа мой взгляд, единственным конструктивным способом оценки сложности является именно по- нимание сложности как точки зрения наблюдателя. У других авторов этот подход описывается иначе, но смысл остается тем же. Приведем еще две цитаты в подтверждение на- шей точки зрения: Можно рассчитывать только на ясные модели, но не на реальную действи- тельность и даже не на малую ее часть (П. Сьюпс [300]). Одной из задач экспериментального метода является замена сложных при- родных систем на простые искусственные (Г. Саймон [289]). На уровне исходных систем системная сложность определяет- ся тривиально. Она выражается только через мощности рассма- триваемых множеств — множества переменных, множества пара- метров, множеств состояний и параметрических множеств, по- скольку между этими множествами нет взаимосвязей. На более высоких эпистемологических уровнях понятие системной сложно- сти становится более содержательным. Оно, конечно, разное для разных типов систем. В гл. 2—5 говорилось о том, что одна и та же исходная систе- ма на различных более высоких эпистемологических уровнях мо- жет быть описана самыми разными способами. Обычно один из критериев, по которым проводится обобщенное упорядочение на множестве таких альтернативных систем, является сложность. В некоторых случаях сложность желательна, т. е. ищется при заданных ограничениях система, обладающая высокой степенью сложности. Типичными примерами таких случаев являются шиф- рование и разработка датчиков случайных чисел. В некоторых случаях определенная степень сложности — необходимое условие получения определенных системных свойств, которые обычно на- зываются выявляющимися свойствами. Примерами таких свойств является самовоспроизведение, обучение и развитие. В других случаях, которые, по-видимому, более распростране- ны при решении системных задач, либо ищется простая система, либо делается попытка упростить уже существующую. Важность того, чтобы системы были простыми, и важность методов их упро- щения, прекрасно сформулирована Г. Саймоном [289]: Своему сохранению и процветанию в этом мире, который может быть и про- стым, и сложным, человечество обязано не мощности и скорости вычислений, а тому, что интересующие его системы представляют собой весьма частные слу- чаи, которые поддаются анализу относительно простыми средствами, позволяю- щими определить их глубинную структуру. Таким образом, нужна стратегия поиска такой структуры, стратегия структурной индукции (эта способность весь- 346
ма развита в животном мире) плюс конкретный анализ и эвристические методы решения задач, а ие прямолинейный анализ очень общих классов сильно свя- занных сложных систем ... То же говорит физик Э. Теллер [309]: Олицетворением простоты для меня служит один эпизод из истории музы- ки— искусства, традиционно любимого математиками и другими учеными. Четыр- надцатилетний Моцарт услышал в Риме на тайной мессе «Мизерере» Аллегри. Сочинение это сохранялось в тайне; певцам запрещалось записывать его под страхом отлучения от церкви. Моцарт слышал его только раз и смог воспроизве- сти его целиком. Не следует думать, что он смог это сделать только благодаря своей изуми- тельной памяти. Данная месса была произведением искусства, а следовательно, тяготела к простоте. Сутью искусства является структура. Мальчик, ставший потом одним из величайших композиторов мира, мог и не запомнить в подроб- ностях это сложное произведение, но он определил основные моменты и запомнил нх, а затем смог по ним восстановить и детали. Нелегко обнаружить эти основ- ные моменты в музыке или науке. Для того чтобы их разглядеть, нужны труд и опыт. Однако глубинная простота сушествует, и если ее иайтн, то можно открыть новые и более мощные взаимосвязи. Еще дальше идет Дж. Уейнберг, когда предлагает определить науку о системах как науку об упрощении [334]. Описав замеча- тельное упрощение, с успехом примененное Ньютоном в механике, Уейнберг подводит итоги своим рассуждениям о простоте: Гений Ньютона не в исключительной вычислительной силе его мозга. Напро- тив, гениальной является его способность упрощать, идеализировать н выделять главное так, чтобы мир до некоторой степени становился обозримым и для обык- новенного человека. Изучая методы упрощения, удачно или неудачно применяв- шиеся, специалист по теории систем надеется сделать развитие человеческих зна- ний несколько менее зависящим от гениальности. Сложность и ее противоположность, простота, — понятия, свя- занные с многими фундаментальными философскими, математиче- скими, вычислительными и психологическими проблемами. В сле- дующих разделах этой главы мы затронем некоторые наиболее общие проблемы, имеющие отношение к решению системных за- дач.
6.2. ТРИ СТЕПЕНИ СЛОЖНОСТИ Иногда за кажущейся сложностью от- крывается простота, иногда, наоборот, простота скрывает исключительно слож- ные явления... С развитием средств ис- следования мы, несомненно, за простым будем открывать сложное, затем за сложным простое, затем снова сложное и так далее, и никогда не сможем пред- сказать, что же будет в конце концов. Где-то нужно остановиться, и наука тре- бует, чтобы мы остановились на прос- том. Только на этом фундаменте можно воздвигнуть здание обобщений. Анри Пуанкаре Перед тем как обсуждать вопросы оценки сложности, различ- ные ее формы и то, как она представляется в схеме УРСЗ, необ- ходимо несколько расширить общепринятое понимание этого по- нятия и дать обзор разных интерпретаций сложности. Наиболее подходящим представляется исторический подход к определению различных методов трактовки понятия сложности, а именно, трак- товка сложности в науке, технике и других областях человеческой деятельности. История современной науки (с XVII в.) свидетельствует о том, что до XX в. наука занималась в основном очень простыми систе- мами, обычно из двух переменных. Перечень основных событий в науке с XVII по XIX в. по большой части состоит из вариаций одной и той же темы: выявление скрытой простоты в ситуации, представляющейся сложной. Подобные ситуации характерны тем, что выделяются несколько существенных факторов, а множество других считаются несущественными. Это позволяет исследователю ввести сильные, экспериментально оправданные упрощения и, следовательно, рассматривать исследуемые характеристики «изо- лированно» от всех остальных. Множество ситуаций, в которых из большого числа факторов удается выделить несколько существенных, имеется в физике, че- го нельзя сказать о других областях науки. Именно этим объяс- няются значительные успехи физики, далеко обогнавшей другие науки. Именно Ньютон положил начало этому развитию, показав, что в физике возможны существенные упрощения. Его закон все- мирного тяготения, считающийся одним из высочайших достиже- ний человеческого ума, является следствием очень сильных упро- щений. Тем не менее при правильных вычислениях он позволяет очень точно вычислить орбиты планет. 348
Для проведения расчетов по закону Ньютона необходим, разу- меется, соответствующий математический аппарат. Этот аппарат (также предложенный Ньютоном, возможно Лейбницем) —диффе- ренциальное исчисление. Ньютон разработал его как инструмент для решения задач, связанных с простыми физическими система- ми, подобными тем, что подчиняются его закону. Он, можно ска- зать, приспособил этот аппарат к физической простоте, им самим открытой. Наука почти до 1900 г. находилась под исключительным влия- нием достижений Ньютона. Его мощные упрощения применялись в самых разных областях, что при исследовании некоторых физи- ческих явлений, таких, как электричество, магнетизм, гидромеха- ника, дало отличные результаты, однако в других науках, особен- но в биологии и медицине, этот подход не сработал. Задачи, кото- рыми занималась наука и которые она умела решать, были в основ- ном задачами на детерминированных системах с двумя или тремя переменными. Они представлялись аналитически, обычно в виде систем дифференциальных уравнений. Подобные задачи — с ма- лым числом переменных, высокой степенью детерминизма, решение которых ищется в аналитической форме, — обычно называют за- дачами организованной простоты. В конце XIX в. некоторые физики занялись исследованием си- стем, описывающих движение молекул газа в замкнутом объеме. Такие системы обычно состояли примерно из 1023 молекул. Эти мо- лекулы обладают огромными скоростями, а их траектории из-за постоянных столкновений имеют причудливый вид. Нельзя отри- цать, что это очень сложная система. Очевидно, что из-за сильных упрощений закон Ньютона при изучении таких систем неприме- ним. Совершенно безнадежно пытаться решить задачу анализа дви- жения молекул газа в замкнутом объеме (т. е. задачу анализа исключительно сложной и неорганизованной системы) с помощью средств и методов решения задач в условиях организованной про- стоты. В этом случае нужен совершенно новый подход. И группа ученых, прежде всего Л. Больцман и Дж. Гиббс, создала мощные статистические методы решения задач для систем с большим чис- лом переменных, проявляющихся весьма случайным образом. По- добные задачи получили название задач неорганизованной слож- ности. Статистические методы не описывают отдельные переменные (например, движение отдельной молекулы). Они предназначены для определения небольшого числа общих характеристик. Поясним это, приведя отрывок из знаменитой статьи У. Уивера [332]: Классическая динамика XIX в. позволяла хорошо описывать движение шара из слоновой кости по бильярду. Типичной упрощенной задачей этого периода является определение моментов времени, в которые шар будет иаходиться в опре- 349
деленных положениях. Можно, хотя это много сложнее, анализировать движение двух и даже трех шаров по бильярду. Одиако. если мы попытаемся проанализи- ровать одновременное движение 10 или 15 шаров, то окажется, что задача стала иерешаемой, причем не потому, что возникают какие-то теоретические проблемы, а из-за объема вычислений. Представим теперь огромный бильярд и миллионы сталкивающихся друг с другом и с бортиками шаров. Как ни странно, эта задача оказывается проще, поскольку к ней применимы методы статистической механики. При этом, разу- меется, нельзя описать траекторию какого-то отдельного шара, но зато можно достаточно точно ответить на такие важные вопросы, как: сколько шаров в сред- нем ударится за 1 с в данный бортик; каков средний пробег шара до его столк- новения с другим шаром; сколько в среднем столкновений происходит с шаром за 1 с? Выше говорилось, что новые статистические методы применимы к задачам неорганизованной сложности. Применимо ли слово «неорганизованная» к бил- лиарду с множеством шаров? Применимо, поскольку методы статистической ме- ханики обоснованно использовать, когда как по положению, так и по скоростям и направлениям шары распределены беспорядочным образом, т. е. неорганизован- но. Эти методы будут неприменимы, если расположить шары в один ряд парал- лельно одному из бортиков и заставить их двигаться строго параллельно друг другу и перпендикулярно этому бортику. Тогда шары будут сталкиваться только с двумя бортиками и никогда друг с другом и ситуации неорганизованной слож- ности не возникнет. Разработанные в начале этого столетия статистические методы успешно применялись для решения многих задач неорганизован- ной сложности, возникающих как в науке, так и в других облас- тях. Хорошо известны такие примеры успешного применения этих методов в статистической механике, термодинамике и статистиче- ской (или количественная) генетике. В технике эти методы играют важную роль при создании больших телефонных сетей и компью- терных систем с разделением времени, при решении задач обеспе- чения технической надежности и т. д. В деловой сфере эти методы широко используются при решении задач маркетинга, страхования и т. п. В отличие от используемых при организованной простоте ана- литических методов, которые оказываются неприменимы уже при относительно небольшом числе переменных (например, при пяти), точность и уместность использования статистических методов воз- растает с ростом числа переменных. Таким образом, эти два метода являются взаимодополняющими. Они соответствуют двум проти- воположным концам спектра сложностей и, несмотря на взаимо- дополняемость, покрывают только небольшую часть всего спектра сложностей. В свою очередь, это означает, что, за исключением двух концов спектра сложностей, он остается не обеспеченным методологически в том смысле, что для него не годятся ни анали- тические, ни статистические методы. Задачи, связанные со средней 350
частью спектра сложностей, называют задачами организованной сложности. Происхождение этого названия хорошо описано У. Уивером [332]: Этот метод решения задач неорганизованной сложности, столь мощный по сравнению со случаем двух переменных, для очень большой части спектра слож- ностей оказывается неприменимым. Ои имеет тенденцию к всеупрощению и . в смысле научной методологии представляет собой переход из одной крайности в другую — от двух переменных к астрономическому числу переменных, оставляя нетронутой все промежуточные значения переменных. Более того, важность этого класса задач не зависит напрямую от того, что число рассматриваемых перемен- ных является средним или большим по сравнению с двумя и очень малым по сравнению с числом атомов в щепотке соли. На самом деле задачи из этого класса области часто имеют довольно значительное число переменных. По-настоя- щему важной характеристикой задач из данной области, задач, которые так мало изучены, является то, что в отличие от неорганизованных ситуаций, к которым применимы статистические методы, в этих задачах существенно такое свойство как организованность... Такую группу задач можно назвать задачами организо- ванной сложности. Это новые задачи, их будущее во многом зависит от их реше- ния. Наука должна совершить третий рывок, может быть, более великий, чем споколение» в XIX в. задач типа организованной простоты и победа в XX в. над задачами неорганизованной сложности. В течение ближайших 50 лет наука долж- на научиться решать задачи первого типа. Примеров задач со свойствами организованной сложности ве- ликое множество, особенно в науках, изучающих жизнь, поведе- ние, общество и окружающую среду, а также в таких прикладных областях, как современная технология и медицина. Некоторые из этих задач имеют фундаментальное значение, например проблема рака, изучение старения или такая обширная область, как слож- ные и разнообразные задачи, возникающие в современной техно- логии. Последняя область хорошо описана в лекции Дж. Данцига, прочитанной им в 1979 г. в Международном институте приклад- ного системного анализа в Лаксенбурге (Австрия), сыгравшем важную роль в прорыве науки в новую для нее область организо- ванной сложности: Совсем ие просто описать нею сложность современной технологви. Можно, например, начать с перечисления того, чем занято население небольшого города. С помощью телефонного справочника я составил такой список для г. Ричмонд, шт. Калифорния. Приведу пример занятий, начинающихся с букв BR: строитель- ство мостон, столы для бриджа, радиостанции, брошюры, маклеры, бронза, щет- ки, броши, тормоза, коньяки, пайка, кирпичи, окраска зданий, безделушки. Всего я насчитал 6000 занятий. Другой способ ощутить разнообразие материальной стороны жизни — по- смотреть каталог электронных изделий. В нем перечислены тысячи и тысячи раз- ного рода резисторов, конденсаторов, вакуумных трубок, транзисторов, кабелей, панелей, кнопок, переключателей, шкал, печатных схем, шкафов. Посмотрите ка- талог химических продуктов фирмы Sears Roebuck — в нем также предлагаются 351
тысячи изделий. В современном университете может быть 100 разных кафедр. Правительство Соединенных Штатов только в Сан-Фраициско имеет около. 2000 контор, которые, как предполагается, выполняют различные функции на. благо общества. Это мы говорим только о разнообразии, но у категории «слож- ность» есть и другие измерения. В модели затраты-выход Леонтьева для национальной экономики Соединен- ных Штатов вся промышленность разбита на 400 основных отраслей, и для каж- дой отрасли необходимо указать, сколько данных оиа получает от всех других отраслей. Полученная таблица 400X400 содержит 160 000 чисел. Каждый регион страны имеет свою таблицу затраты-выход, а таких регионов много. Число в таб- лице затраты-выход выражает зависимость одной отрасли от другой; другими зависимостями представлены сделки между регионами и отраслями, причем таких комбинаций может быть тоже очень много. Точно так же связаны друг с другом- и страны. Есть еще и временные зависимости: оборудование создается и содержится для использования в будущем, материалы накапливаются для использования в будущем; люди обучаются для работы в будущем. Есть также зависимости, связанные с местоположением: люди, материалы и оборудование перемещаются на новые места, причем не только по поверхности Земли, но и под землей, и по воздуху. Хотя можно достаточно легко определить «входы» и «выходы» для любой локальной области этой огромной и сложной деятельности, но задача заключает- ся в том, чтобы одновременно отслеживать все эти взаимодействия. Нам извест- но, что такие мощные силы, как рост населения, недостаток сырья, продоволь- ствия, энергии, концентрации накоплений и т. д., стремительно видоизменяют сложность этой задачи. Существует опасение, что структура взаимосвязей этих деятельностей может не выдержать подобных нагрузок. Если мы оставим эту систему без управления, может так случиться, что в ней возникнут разного рода отказы н провалы. По определению системы с организованной сложностью обла- дают многими свойствами, которыми, в принципе, нельзя прене- бречь. По той же причине эти системы недостаточно сложны и’ случайны, чтобы для них можно было получить содержательные статистические оценки. Следовательно, к ним неприменима ни- одна из двух стратегий упрощения, которыми располагает наука. И тем не менее упрощений в большинстве случаев избежать нель- зя. Даже если задача, связанная с какой-то очень сложной систе- мой, может быть успешно решена с помощью вычислительной тех- ники без всяких упрощений, полученное решение должно быть в конечном счете упрощено настолько, чтобы человек, принимающий решение, мог им воспользоваться. Так как ни ньютонова, ни ста- тистическая стратегия упрощения неприменимы, необходимо най- ти новые пути. В общем случае при хорошем упрощении для до- стигнутого сокращения сложности должна минимизироваться по- теря нужной информации. Некоторые способы упрощения уже рассматривались в гл. 3 и 4. 352
Одним из способов работы с очень сложными системами, воз- можно самым важным, является допущение неточности при описа- нии данных. В этом случае неточность имеет не статистическую, а более общую природу, хотя бы потому, что она включает воз- можность статистических описаний. Математический аппарат для этого подхода, разрабатываемый с середины 60-х годов, известен как «теория нечетких множеств». Суть и важность этой новой тео- рии прекрасно описаны ее создателем Л. А. Заде [352J: Согласно глубоко укоренившейся традиции научного мышления, отожде- ствляющего понимание явления со способностью анализировать его количествен- но, все чаще проводятся попытки анализировать поведение «гуманитарных» си- стем так, будто это механические системы, описываемые разностными, дифферен- циальными или интегральными уравнениями. Мы, по существу, утверждаем, что обычные количественные методы систем- ного анализа совершенно ие подходят для гуманитарных систем и вообще для любых систем, сложность которых сравнима с гуманитарными. Это утверждение основано на принципе, который можно назвать принципом, несовместимости. Го- воря неформально, суть этого принципа состоит в том, что с ростом сложности систем наша способность делать точные и содержательные утверждения об их поведении падает до определенного предела, за которым такие характеристики, как точность и содержательность (или реальность), становятся взаимоисключаю- щими. (Отсюда следует принцип «чем детальнее рассматривается реальная за- дача. тем более иечеткнм оказывается ее решение».) В этом смысле точный ко- личественный анализ поведения гуманитарных систем не слишком подходит для решения реальных социальных, политических, экономических и других задач. Альтернативный подход ... заключается в том, что ключевыми элементами мышления являются не числа, а метки нечетких множеств, т. е. классов объектов, для элементов которых переход от принадлежности к непринадлежности классу является не резким, а постепенным. В самом деле, «вездесущая» нечеткость чело- веческого мышления наводит иа мысль, что логика рассуждений человека не является обычной двухзначной или даже многозначной логикой, но это — логика с нечеткими истинами, нечеткими отношениями и нечеткими правилами вывода. На наш взгляд, такая нечеткая и не вполне понятая логика является важней- шим компонентом одной из главных особенностей человеческого мышления, а именно способности обобщать информацию—выделять из огромных масс дан- ных, обрушивающихся на мозг, только те, что нужны для решения конкретной задачи. По природе своей обобщение является аппроксимацией обобщаемого. Во многих случаях для удовлетворительного описания данных оказывается доста- точно весьма приблизительного описания, поскольку большинство выполняемых человеком работ не требует большой точности. Используя эту терпимость к не- четкости, мозг кодирует соответствующую информацию в терминах нечетких множеств, приближенно связанных с исходными данными. Таким образом, поток информации, поступающий в мозг через зрение, слух, осязание и другие органы чувств, сокращается до тоненькой струйки информации, необходимой для очень приближенного решения определенной задачи. А значит, возможность манипу- лировать нечеткими множествами (и, как следствие, способность обобщать) 23-6923 353
является важнейшим достижением человеческого интеллекта, отличающим его от машинного интеллекта, реализованного на современных цифровых компьютерах. С этой точки зрения традиционные методы анализа систем не подходят для работы с «гуманитарными» системами, поскольку им ие удается выявить реаль- ную нечеткость мышления и поведения человека Таким образом, для радикаль- ного изменения работы с системами необходимы подходы, не фетишизирующие такие понятия, как точность, строгость, математический формализм, а исполь- зующие методологические схемы, содержащие неточность и неполную истин- ность. Методологические средства для решения системных задач, принадлежащих к категориям организованной простоты и неор- ганизованной сложности, достигли достаточно высокого уровня развития, и в прикладное математическое обеспечение компьюте- ров входят многочисленные пакеты статистического анализа, вы- числительных методов и символьных преобразований. Иначе об- стоит дело со средствами решения системных задач из категории организованной сложности. Они разработаны совершенно недо- статочно, и главной задачей создания УРСЗ является исправле- ние этого положения. 6.3. МЕРЫ СЛОЖНОСТИ СИСТЕМ Наши интерпретации понятия «слож- ность» почти столь же разнообразны, как и сами сложность. Роберт Розен При решении системных задач сложность понимается двояко. Во-первых, сложность является свойством систем; во-вторых, она является свойством системных задач. Будем называть эти два типа сложности соответственно сложностью систем и сложностью задач. В этом разделе мы будем говорить о сложности систем. Не- которые проблемы, связанные со сложностью задач, в литерату- ре их часто называют проблемами вычислительной сложности, обсуждаются в разд. 6.4 и 6.5. В схеме УРСЗ системы имеют много граней, причем каждая грань соответствует одному из эпистемологических типов систем, введенных в гл. 2—5. Следовательно, и сложность для этих ти- пов систем столь же многогранна. Иначе говоря, для разных ти- пов систем из эпистемологической иерархии сложность понима- ется по-разному и по-разному должна исследоваться. Вне зависимости от типа системы можно выделить два общих принципа оценки сложности систем-, они применимы к системам любого типа и могут служить основой для сравнительного изуче- ния сложности систем. 354
Согласно первому принципу сложность системы (любого ти- па) должна быть пропорциональна объему информации, необхо- димой для описания этой системы. В данном случае слово «ин- формация» понимается чисто синтаксически, а не семантически и не прагматически. Одним из способов описания такой дескрип- тивной сложности (и, возможно, самым простым) является оцен- ка числа элементов, входящих в систему (переменных, состояний, компонентов), и разнообразия взаимозависимостей между ними. В самом деле, при прочих равных условиях с ростом числа эле- ментов или разнообразия взаимосвязей возрастают и трудности работы с системой. Есть, разумеется, множество других способов для выражения дескриптивной сложности, однако все они долж- ны удовлетворять следующим требованиям. Пусть X — множество всех систем определенного эпистемоло- гическою уровня, &(Х)—мощность множества X, а Сх— мера дескриптивной сложности на множестве X. Тогда Сх — это функция Cx-.&(X)-+R, обладающая следующими свойствами: С1) Сх(0)=О; С2) если AczB, то СХ(А) ^СХ(В); СЗ) если А — гомоморфный образ В, то Сх(Л) sCх(В); С4) если А изоморфно В, то СХ(А) =СХ(В); С5) если 1) А(]В = 0, 2) Л и В не взаимодействуют друг с дру- гом, 3) Л и В не являются гомоморфными образами друг друга, то Сх(ЛиВ) = СХ(А) + СХ(В). Из свойств С1 и С2 следует, что сложность любой системы ха- рактеризуется неотрицательным числом. Свойства С2 и СЗ связа- ны с таким фундаментальным свойством, как монотонность: сложность не должна возрастать, если множество систем сокра- щается или они рассматриваются менее детально. Условие С4 очевидно: если переобозначить некоторые (произвольнее) эле- менты заданных систем, а все остальное оставить без изменений, то сложность измениться не должна. Свойство С5 — свойство ад- дитивности: если объединяются два множества систем, не имею- щих никаких общих компонентов (общих систем, взаимосвязей, морфизмов), то суммарная сложность должна быть равна сумме сложностей. В соответствии со вторым общим принципом сложность си- стем должна быть пропорциональна объему информации, необ- ходимому для разрешения любой нечеткости, связанной с рас- сматриваемой нечеткостью. В данном случае также имеется в ви- ду синтаксическая информация, однако эта информация основывается на соответствующей мере нечеткости (разд. 3.5). Сложность систем изучается прежде всего для создания ме- тодов, с помощью которых она может быть снижена до прием- 23* 355
лемого уровня. Упрощая систему, мы хотим упростить ее в обо- их смыслах— и в смысле сложности, основанной на дескриптив- ной информации, и в смысле сложности, основанной на нечеткой информации. К сожалению, эти два типа сложности друг с дру- гом не согласуются. Уменьшая в общем случае одну сложность, мы, как правило, увеличиваем вторую. Исходя из этих соображе- ний, можно следующим образом сформулировать общую задачу упрощения. Дана система некоторого эпистемологического уровня; обозна- чим через 36 множество всех ее содержательных упрощений. d и Обозначим и соответственно упорядочения множества 36, основанные на дескриптовой информации и на нечеткой инфор- мации. Эти упорядочения, вообще говоря, являются слабыми (т. е. рефлексивными и транзитивными отношениями на 36}. а 3 Обозначим ... другие (дополнительные) упорядочения (слабые, частичные или полные), которые представляют собой некоторые предпочтения, определенные пользователем на данной системе. Определим объединенное упорядочение по предпочте- нию для всех имеющихся упорядочений следующей фор- мулой: • rf и/ а Р (V*. <у<^^х<у и х<у и х<у и х^у и ...) Множество решений 36 s задачи упрощения состоит из тех си- стем множества 36, которые либо являются эквивалентными, ли- бо несравнимы в смысле объединенного упорядочения по пред- почтению Формально 3Cs = {x^itD\(^y^X}{ykx^x<y}}. (6.1) Читателю, знакомому с предыдущими главами этой книги, эта общая формулировка задачи упрощения напомнит три частных случая этой задачи: задачу определения подходящих систем с поведением (разд. 3.6); задачу упрощения порождающих систем с помощью разре- шающего укрупнения (разд. 3.9); задачу реконструкции (разд. 4.7). Все эти задачи соответствуют формулировке общей задачи упрощения, отличаясь друг от друга множеством 36 и математи- d и ческими свойствами порядков предпочтения и определен- ных на 36. Одним из основных принципов УРСЗ является то, что пользо- вателю позволяется определить собственное упорядочение по предпочтению для рассматриваемых систем. Если пользователь 356
в качестве одного из критериев указывает сложность, но не оп- ределяет меру сложности, УРСЗ должен предложить ему вы- брать меру из списка возможных вариантов. Если пользователь не желает выбирать сам, УРСЗ должен использовать некоторую меру сложности, выбираемую им по умолчанию. Предлагаемые пользователю меры сложности должны быть соответствующим образом обоснованы и, разумеется, применимы к рассматриваемым задачам. В примечаниях к данной главе при- веден обзор литературы по различным мерам сложности. 6.4. ПРЕДЕЛ БРЕММЕРМАННА Не существует системы обработки дан- ных, искусственной или естественной, которая могла бы обрабатывать более чем 2-10*7 бит в секунду на грамм сво- ей массы. Ханс Бреммерманн Это главный вывод статьи Бреммерманна [49], опубликован- ной в 1962 г. Под «обработкой N бит» понимается пересылка N бит по одному или нескольким каналам вычислительной си- стемы. Бреммерманн пришел к своему выводу, исходя из следу- ющих соображений. Д Понятно, что для работы информация должна быть каким- то образом физически закодирована. Предположим, что она за- кодирована в виде энергетических уровней определенного типа энергии в интервале [О, EJ, где Е — количество энергии, которым мы располагаем для этой цели. Предположим далее, что энерге- тические уровни измеряются с точностью до АЕ. При этом весь интервал можно разделить максимум на N=E/AE равных подын- тервалов, причем каждому будет соответствовать энергия, рав- ная ДЕ. Если всегда будет занято не более одного уровня (зада- ваемого маркером подынтервала), то максимальное число битов, представимых с помощью энергии Е, будет равно log2^+l) (в формуле поскольку следует учесть случай, когда не занят ни один уровень). Если вместо одного маркера с энерге- тическими уровнями из интервала [О, Е] использовать одновре- менно К маркеров (2^E^yV), то можно представить Elog2(l+WE) бит. Оптимальное использование имеющейся энергии Е полу- чается при использовании N маркеров. В этом оптимальном слу- чае можно представить N бит информации. 357
Для того чтобы представить больший объем информации при том же количестве энергии, необходимо сократить АЕ. Это воз- можно только до некоторого предела, так как нужно различать полученные уровни с помощью какой-то измерительной процеду- ры, которая независимо от ее сути всегда имеет ограниченную точность. Максимальная точность определяется принципом неоп- ределенности Гейзенберга: энергия может быть измерена с точ- ностью до ДЕ, если выполняется неравенство АЕА/>Л, где А/ — длительность времени измерения, h=6.625Х 10~27 эрг/с— постоянная Планка, а ДЕ определяется как среднее отклонение от ожидаемого значения энергии. Это значит, что N^EM/h. (6.2) Представим теперь имеющуюся энергию Е соответствующим количеством массы согласно формуле Эйнштейна Е—тс2, где с=ЗХ1010 см/с — скорость света в вакууме. Таким образом, верхняя, наиболее оптимистическая граница для N согласно не- равенству (6.2) N=mc2btlh. (6.3) Подставив значения для с и h, имеем М= 1.36/иА/ХЮ47. (6.4) Для массы 1 г (т = 1) и времени 1 с (А/=1) получаем указан- ное значение М=1.36ХЮ47. ▲ Используя полученный предел для обработки информации граммом массы за 1 с процессорного времени, Бреммерманн за- тем вычислил число бит, которые могла бы обработать гипотети- ческая компьютерная система, имеющая массу, равную массе Земли, за период, равный примерному возрасту Земли. Посколь- ку масса Земли оценивается примерно в 6Х1027 г, а возраст в 1010 лет, причем год состоит приблизительно из 3,14Х107 с, этот воображаемый компьютер смог бы обработать порядка 2,56Х1097 бит или, округляя до степени 10, порядка 1093 бит. Это число (1093 бит) обычно называют пределом Бреммерманна, а задачи, требующие обработки более чем 1093 бит информации, называются транс вычислите льны ми задачами. Сразу видно, что предел Бреммерманна является весьма стро- гим ограничением, несмотря на то, что это число получено при весьма слабых условиях (более обоснованные предпосылки дают число значительно меньше 1093). В самом деле, решение многих задач для систем даже относительно небольшого размера требу- 358
ет большего, чем указанный предел, объема обработки информа- ции. Рассмотрим, например, систему из п переменных с k разны- ми состояниями каждая. Понятно, что эта система, в принципе, имеет kn состояний. Множество обобщенных состояний конкрет- ной системы является подмножеством этого множества. Всего kn таких подмножеств 2 . Предположим, что нам нужно отобрать, выделить или классифицировать систему из множества всех си- стем этого типа. Тогда при условии, что используется самый эф- фективный метод поиска, при котором каждый бит информации (как ответ на дихотомический вопрос) позволяет разбить остав- шееся множество вариантов пополам, необходимо обработать log2 2* = й" бит информации. Задача является трансвычислительной, когда £"> 1093. Это происходит, например, при следующих значениях k и п: k 234567.8 9 10 /z. 308 194 154 133 119 ПО 102 97 93 Проблема травсвычислительности возникает в самых разнооб- разных контекстах, например при распознавании образов. Рас- смотрим, скажем, массив <?Х<7 типа шахматной доски, причем каж- дая клетка может быть одного из k цветов. Всего может быть kn шаблонов раскраски, где n — q2. Предположим, что нам нужно определить наилучшую (с точки зрения определенного критерия) классификацию этих шаблонов. Для этого необходимо провести поиск среди всех возможных классификаций этих шаблонов. Ес- ли классов всего два, то эга задача изоморфна предшествующей. Например, для массива 18X18 задача становится трансвычисли- тельной при двух цветах, для массива 10ХЮ — при девяти. Проб- лема распознавания образов непосредственно связана с психоло- гическими исследованиями сетчатки, но сложность этих иссле- дований огромна. Сетчатка состоит приблизительно из миллиона светочувствительных колбочек. Если даже (для простоты) счи- тать, что колбочки имеют только два состояния (активное и пас- сивное), то исследование сетчатки в целом потребует обработки 21 ОСО ООО- Ю'зоо ооо бит информации. Это число находится далеко за пределом Брем- мерманна. Та же проблема возникает и в такой области, как тестирова- ние больших интегральных микросхем (БИС). Они представляют собой сложные электронные платы с большим числом входов и выходов. Для соответствующих электрических сигналов (каждый сигнал имеет два идеальных состояния) каждый выход представ 35У
Рис. 6.1. Время, необходимое для выбора или идентификации логической функции от п переменных при скорости обработки информации, равной 10, 1О‘°..............................1010° бит/с ляет определенную логическую функцию от логических перемен- ных, соответствующих входам. Тестирование определенной инте- гральной микросхемы представляет собой анализ «черного ящи- ка»: определение реализуемых ею логических функций осущест- вляется только с помощью задания значений входных переменных и наблюдения значений выходных переменных. Для каждой вы- ходной переменной тестирование, по существу, сводится к рас- смотренной выше задаче при k — 2 (если только не используется многозначная логика). Отсюда следует, например, что тестирова- ние схем с 308 входами и 1 выходом представляет собой транс- вычислительпую задачу. Однако хорошо известно, что для задачи тестирования на практике пределы сложности существенно ни- же. На самом деле, некоторые выпускаемые уже сейчас БИС пол- ностью проверить нельзя. Проблема состоит в разработке прак- тически реализуемых методов тестирования, гарантирующих поч- ти полное тестирование, например проверку более чем 90% воз- можных состояний. Подробнее сложность этой задачи рассмотрена на рис. 6.1. На рисунке показана зависимость времени (в годах), необходи- мого для выбора (идентификации, классификации и т. д.) логи- ческой функции, от числа п переменных при различных скоростях обработки информации, варьирующихся от 10 до 10100 бит/с. На 360
рисунке также указаны два важных периода времени: L — это приблизительный возраст жизни на Земле, а М— примерное вре- мя появления человека. Пример с тестированием схем ни в коем случае не является исключением. Настоящие системные задачи требуют, к сожале- нию, огромных мощностей по обработке информации. В нашей книге приводится много конкретных примеров таких задач. Об этом же пишет Бреммерманн в заключении своей статьи [49]: Опыт ученых, решающих системные задачи, занимающихся доказательством теорем и распознаванием образов, говорит об одном — это очень сложные задачи. Вероятно, не существует столбовой дороги или какого-то простого метода, кото- рый позволил бы одним махом решить все наши задачи. Вывод, который можно сделать из данной статьи о пределах скорости и объема обработки данных, сво- дится к следующему: задачи, имеющие очень большое число вариантов, нельзя решить даже за счет абсолютного увеличения объема обрабатываемых данных. Необходимо разрабатывать всевозможные качественные приемы. Разумеется, более быстрые компьютеры будут очень нужны. Однако, если говорить о прин- ципиальных задачах, то уже нынешние компьютеры имеют почти такое же бы- стродействие, каким оии будут обладать когда-нибудь. Если задача является трансвычислителыюй, то, чтобы ее мож- но было решить, она должна быть переформулирована. Наиболее естественный способ состоит в ослаблении условий. Например, вместо лучшего решения можно искать просто хорошее, вместо точного — приближенное и т. д. Ослабление условий позволяет применять или эвристические методы, позволяющие отбрасывать множество неперспективных вариантов, или приближенные (не- четкие) методы, позволяющие работать с совокупностями вари- антов. В оценке сложности задачи пользователю должен помочь УРСЗ и, если задача не решается с помощью имеющихся вычис- лительных средств, предложить ему подходящие способы моди- фикации его задачи. Предел Бреммерманна дает слишком про- стое разбиение системных задач по сложности. Реальных, прак- тических вычислительных ограничений он не отражает. Тем пе менее, согласно Эшби [27], он является полезной вехой при пред- варительной оценке ситуации: Одно из наиболее очевидных следствий, которым сейчас практически пренеб- регают, заключается в том, что, прежде чем начать исследование какой-то слож- ной системы, необходимо хотя бы приблизительно оценить информационные за- просы. Если нужно 2000 бит, то все в порядке, но если оценка равна 10300 бит, то необходимо стратегически поменять метод. Конкретные вычислительные средства определяют, разумеет- ся, более строгие ограничения на сложность задач, чем предел Бреммерманна— 1093. 361
Выше неоднократно подчеркивалось, что одной из главных задач УРСЗ является создание человеко-машинного симбиоза (симбиоза пользователь-компьютер), в котором способности обо- их симбионтов взаимно дополняют друг друга, позволяя эффек- тивно решать задачи. И хотя такой симбиоз представляется наи- лучшим методом решения сложных задач, он также не позволяет обойти предел Бреммерманна. По сути, этот предел говорит о фундаментальных пределах наших знаний. Эшби пишет [22]; Очевидно, что наш мозг и мы сами материальны, а следовательно, ограниче- ны. Ограничена и вся мировая наука, поскольку она также материальна. Вся информация, которой располагаю лично я, и вся информация, используемая мировой наукой, не превосходи! 1080 бит1 *. Какой бы ни стала паука в будущем, этот потолок достигнут не будет. Мы не можем претендовать па какие-то особые преимущества в силу выдаю- щегося положения в живой природе. Такие, как мы есть, получились в процессе естественного отбора. Являясь отбором, этот процесс может быть оценен через некую информационную меру, и, следовательно, он имеет свои пределы. При любом отборе на любой плапегс поверхность планеты материальна, и приспособ- ление не может идти быстрее этого предела. Как бы хорошо мы ии мыслили, предела в 1080 бит мы не достигнем. Разум науки будущего не сможет использо- вать более чем 108П бит информации, и сама наука будет только стремиться к этому пределу. Это наша информационная вселенная, и все, что находится за ее пределами, непознаваемо. 6.5. ВЫЧИСЛИТЕЛЬНАЯ СЛОЖНОСТЬ Сведения о том, что может и что не мо- жет быть эффективно вычислено или математически формализовано, должны иметь глубочайшее влияние на матема- тику и, более того, на наше понимание математических методов. Джурис Хартманне Рассмотренный в предыдущем разделе предел Бреммерманна подходит для оценки задач с точки зрения объема информации, которую нужно обработать, однако есть и другие критерии оцен- ки задач. Задача может укладываться в предел Бреммерманна и тем не менее быть практически нерешаемой. Следовательно, необходимо уточнить понятие сложности задачи. Вычислительные характеристики задач исследуются общей теорией алгоритмов. В эту общую теорию входят три раздела: теория вычислимости, проектирование алгоритмов и теория вы- 1 Эшби получает значение 1080 из предела Бреммерманна, определенного для I с и 1 г, рассматривая «столетия и тонны компьютеров> (примерно 10 тыс. сто- летий и 10'6 т). В данном случае разница между 1080 и 10’3 * несущественна. 362
числительной сложности. Подробный разбор этих разделов вы- ходит за рамки данной книги. Однако было бы полезно дать чи- тателю краткий обзор этой теории, прежде всего результатов и подходов, используемых при решении системных задач. Доказа- тельств мы приводить не будем, однако в примечаниях даются комментированные ссылки на литературу, в которой можно най- ти как доказательства, так и подробности. Интуитивно алгоритм представляет собой набор команд на неком языке, описывающих выполнение действий по решению за- дачи определенного типа. Требуется, чтобы алгоритм был финит- ным (конечным), т. е. чтобы он завершался после конечного чис- ла шагов (действий). Есть несколько формализаций интуитивного понятия алгорит- ма, включая машины Тьюринга, алгоритмы Маркова и рекурсив- ные функции. Доказано, что эти определения эквивалентны. Ма- шина Тьюринга, например, представляет собой простое устрой- ство, состоящее из автомата1 с конечным числом состояний и ленты. Автомат обладает памятью, что позволяет ему находиться в одном из состояний, принадлежащих конечному множеству со- стояний, скажем множеству Z={z}, Z2,...,zn}- Потенциально бес- конечная в обоих направлениях лента разбита на отрезки оди- наковой длины — ячейки. В каждой ячейке записана буква из конечного набора букв Х={хо, xi,...,xm} алфавита. Одна из букв, например х0, всегда интерпретируется как пробел (пустая ячей- ка). Связь между автоматом и лентой осуществляется с помощью читающей-пишущей головки, которая может считать букву с лен- ты или записать букву на ленту. Одновременно головке доступна только одна ячейка. Автомат машины Тьюринга на каждом шаге изменяет свое состояние и выполняет действие одного из следующих трех типов: I. Записывает на ленту вместо текущей буквы новую. II. Сдвигается по ленте на одну ячейку влево или вправо. III. Прекращает вычисление (операция остановки). Новое состояние и выполняемое действие однозначно опреде- ляются текущим состоянием и считываемой с ленты буквой. Пусть zc и z„ соответственно текущее и следующее состояния машины Тьюринга, хг — буква, читаемая с ленты, а ур— выпол- няемая операция. Тогда при заданной на ленте начальной строке букв (эта строка не должна содержать пробелов) и определен- ном начальном состоянии работа машины Тьюринга определяет- ся упорядоченным множеством четверок (zc, Xr, Zn, Ур). ' В оригинале control unit — управляющее устройство. Мы используем при- нятый в отечественной литературе термин «автомат». — Прим. ред. 363
Машина Тьюринга называется детерминированной, если запре- щается, чтобы любые две четверки из этого множества начина- лись с одной и той же пары zc, хг; в противном случае машина Тьюринга называется недетерминированной. Общепринятая гипотеза, известная как тезис Черча (нли те- зис Черча —Тьюринга), утверждает, что если функцию можно вычислить на детерминированной машине Тьюринга, то эта функ- ция считается вычислимой. Согласно этой гипотезе машина Тью- ринга является точным формальным эквивалентом интуитивного понятия алгоритма. Математически эта гипотеза недосказуема, однако опыт и неформальные соображения ее подтверждают. Опровергнуть эту гипотезу можно, предложив альтернативное оп- ределение вычисления, полностью соответствующее интуитивным представлениям и допускающее описание таких вычислений, ко- торые недоступны машине Тьюринга. Маловероятно, что такой формализм существует. В общем случае задача считается неразрешимой, если не су- ществует алгоритма, с помощью которого можно получить реше- ние. Детерминированные машины Тьюринга совместно с тезисом Черча дают аппарат для формального определения существова- ния алгоритмов решения различных задач. Для доказательства неразрешимости задачи достаточно доказать, что ее нельзя ре- шить на машине Тьюринга. Подобное доказательство неразреши- мости уже получено для ряда задач. Сведения о неразрешимости задач должны включаться в УРСЗ только в том случае, если схема УРСЗ позволяет иденти- фицировать такие задачи. Если пользователь попросит решить за- дачу, про которую известно, что она неразрешима, УРСЗ должен не только отказаться от ее решения, но и дать пользователю со- ответствующее объяснение причин отказа, включая ссылки на нужную литературу. Неразрешимые задачи образуют один из трех классов задач. Во второй класс входят задачи, про которые не доказано, что они являются неразрешимыми, но для которых не найдены решающие алгоритмы. Таким образом, это задачи, про которые неизвестно, разрешимы они или нет. Если пользователь потребует, чтобы УРСЗ решил такую задачу, ему нужно выдать сообщение, что статус этой задачи неизвестен и что, к сожалению, ничего больше сделать нельзя. Остальные задачи являются разрешимыми, т. е. они в прин- ципе разрешимы. Однако на практике многие из них решить нельзя, поскольку их решение требует слишком больших вычисли- тельных ресурсов, таких, как время вычисления или память. По- скольку необходимое время вычислений обычно является единст- венным фактором, определяющим практическую разрешимость за- дачи, то и вычислительная сложность в основном изучается с точки зрения именно этого ресурса. 364
На практике разрешимость задачи зависит от применяемого алгоритма решения задачи; конкретной системы, рассматриваемой в задаче; имеющихся вычислительных мощностей. При заданном конкретном алгоритме решения задачи, время ее решения удобно представлять переменной, зависящей от размера рассматриваемых систем. Эта переменная, которую часто назы- вают размерностью варианта задачи, задает объем входной ин- формации, необходимой для описания этих систем. Пусть п — размерность конкретных систем для некоторого ва- рианта задачи. Тогда время выполнения алгоритма решения этой задачи задается функцией f: R->R (6.5) такой, что f(n)—наибольшее количество времени, необходимое для выполнения алгоритма, решающего вариант задачи, размер- ность которого равна и. Функцию f обычно называют временной функцией сложности. Считается, что можно выделить два класса алгоритмов, отли- чающихся скоростью роста их временных функций сложности. К первому классу принадлежат алгоритмы с полиномиальными временными функциями сложности. Они называются полиноми- ально-временными алгоритмами. Поскольку степень полинома имеет существенно большее значение, особенно при больших п, чем его коэффициенты и члены меньших порядков, то полиноми- альные временные функции сложности можно характеризовать их порядком. Функция f имеет сложность O(nk), где k — положи- тельное целое число, тогда и только тогда, когда существует кон- станта с>0 такая, что f(n) для всех п^Ио, где ло— наименьшая размерность рассматривае- мой задачи. Например, функция /(п)=25л2+18пН-31 имеет сложность О (л2), поскольку /(л)^74л2 при Ло = 1 ИЛИ f (л) =^42л2 при л=2 и т. д. Ко второму классу алгоритмов относятся алгоритмы, времен- ные функции сложности которых превосходят сложность O(nk) при любом k. Они обычно называются экспоненциально-времен- ными алгоритмами. Различие между полиномиальными и экспоненциальными вре- менными алгоритмами, особенно для больших задач, очень вели- ки. Это показано в табл. 6.1, в которой приведены скорости роста 365
Таблица 6.1. Скорости роста некоторых полииомиальио- и эксплуатационно-временных функций сложности Времен- Размерность варианта задачи п ная______________________________________________________________________ функция сложно- I Ю 20 30 40 50 100 сти п 0.000001 с 0.000001 с 0.00002 с 0.00003 с 0.00004 с 0.00005 с 0.0001 с п2 0.000001 с 0.0001 с 0.0004 с 0.0009 с 0.0016 с 0.0025 с 0.01 с п6 0.000001 с 0.1с 3.2 с 24.3с 1.7 мин 5.2 мин 2.8 ч л1» 0.000001 с 2.8ч 118.5 дней 18.7 лет 3.3 в 31.0 в 3.2-104 в 24 0.000002 с 0.001 с 1.0с 17,9 мин 12.7 дней 35.7 лет 4-1014 в 3” 0.000003С 0.059 с 58 мин 6.5 лет 3855 в 2-108 в 1.6-1032 в КГ 0.000001 с 2.8ч 3.2-104 в 3.21014в 3.2-1024 в 3.2-1034 в 3,2-1024 в 22" 0.000004 с 5.7-I0292 в 1О310’ в IO3'10* в Ю310” в 10310“ в =-1031°”в пп 0.000001 с 2.8ч 3.3.10'° В 6-5-1028 в 3-8.1048 в ^2,8- 1089в =ь3.2-10,8,1 л! 0.000001 с 3.6с 771.5 в 8-4-)0,в в 2.6 103=в = >.9.6- 1048в :5з2 9-10’4-1 нескольких временных функций сложности. Времена вычислений приведены для скорости вычислений, равной 1 млн. операций в се- кунду. Если сравнить, например, л2 и п10, то сразу видно, что практическая применимость алгоритмов сильно зависит от сте- пени полиномиально-временной функции сложности. Однако (за исключением небольших значений п) полиномиально-временные алгоритмы существенно лучше «реагируют» на увеличение мощ- ности вычислительных средств. Это отличие хорошо видно при сравнении графиков некоторых полиномиальных и экспоненци- альных функций, изображенных на рис. 6.2, а также по тому, как в действительности растет диапазон решаемых задач с ростом скорости вычислений ЭВМ (см. формулы, приведенные в табл. 6.2). Таблица 6.2. Влияние роста скорости вычислений ЭВМ на диапазон решаемых задач для некоторых временных функций сложности Размерность наибольшего варианта задачи, решаемого за единицу времени с помощью Временная функция СЛОЖНОСТИ имеющейся вычислитель- ной техники в 10* раз более производи- тельной вычи- слительной техники в 10° раз более производи- тельной вычи- слительной техники в 10е ргн более производи- тельной вы- числительно.! техники в X ра< более производи гел1.п.)й вычисли тель- ной техники п «1 100л, 1000 л, 1 000 000л, Л'л, п2 «2 Юл2 31.6л2 1000л2 /Ул, п* "з 2.5л3 З.98л3 15.8л3 Хпа п'2 «4 1.58п4 2л4 3.98л4 21 «5 «ь+6.64 «5-1-9,97 л5+ 19.93 «s+log Д’/log 2 З4 «в лв+4.19 «в+6,29 Ла-!- 12-58 «в-т-log Д’/log 3 10" «7 л,+2 Лу+З л, 4-6 п7 j- log X 366
Рис. 6.2. Графики некоторых типичных временных функций сложности; а) поли- номиальных; с) экспоненциальных Поскольку полиномиально- и экспоненциально-временные функции сложности отличаются весьма существенно, полиноми- ально-временные алгоритмы считаются эффективными, а экспо- ненциально-временные неэффективными. Как следствие, задачи, которые нельзя доказать, что они решаются с помощью по- линомиально-временных алгоритмов, рассматриваются как не поддающиеся решению, а задачи, для которых известны полино- миальные алгоритмы,— как поддающиеся решению. Эти задачи обычно называют P-задачами (т. е. задачами, решаемыми за по- линомиальное время); множество таких задач называется клас- сом Р-задач. Известно, что различия в системах кодирования, используе- мых для записи алгоритмов (как и отличия типов ЭВМ) не влия- ют на то, считается задача поддающейся решению или пет. Стан- дартные системы программирования и типы компьютеров отли- чаются друг от друга в лучшем случае полиномиально. Поэтому практическая разрешимость задачи зависит от системы програм- мирования и типа ЭВМ, а поддается она решению в принципе или нет, не зависит. Поэтому для большинства практических задач неизвестно, су- ществует ли полиномиально-временной алгоритм их решения, и не доказано, что они не поддаются решению. Общим для этих задач является то, что они могут быть «решены» за полиноми- альное время на недетерминированных компьютерах, например на машинах Тьюринга. Такие задачи называются NP-задачами (недетерминированными полиномиально-временными задачами); они образуют класс NP-задач. Под решением здесь понимается следующее: машина может проверить правильность предложен- ного решения за полиномиальное время. Следовательно, в данном 367
Неразрешимые задачи Задачи, разрешимость которых не определена Задачи, Возможно, не поддающиеся решению Рнс. 6.3. Классификация задач с точки зрения их принципиальной раз' решимости и того, поддаются ли они решению случае понятие недетерминиро- ванный полиномиально-времен- ной алгоритм служит лишь обо- значением того, что предложен- ное решение реальной задачи может быть проверено за поли- номиальное время. Известно, что любая WP-задача решается с по- мощью детерминированного ал- горитма сложности О(2р(п)), где р — полиномиальная функция. Класс WP-задач содержит класс Р, так как любая задача, решаемая за полиномиальное время на детерминированной ма- шине Тьюринга, решается (т. е. проверяется) за полиномиальное время на недетерминированной машине Тьюринга. Для значи- тельного числа WP-задач доказа- но, что любая другая WP-задача может быть сведена к такой за- даче за полиномиальное время. Эти задачи называются NP-пол- ными задачами. Поскольку в класс WP-задач входит много практически важ- ных задач, чрезвычайно существенно определить его статус. Во- прос о том, поддаются WP-задачи решению или нет, является одним из самых важных вопросов математики, информатики и пау- ки о системах. Он имеет огромное значение для решения систем- ных задач. Этот вопрос обычно формулируется следующим обра- зом: «верно ли, что WP=P?>. Ответить на него можно, доказав, что любая NP-задача либо является P-задачей (т. е. решается за полиномиальное время), либо принципиально не поддается реше- нию (т. е. решается за экспоненциальное время). Если про какую- то WP-полную задачу будет доказано, что она не поддается ре- шению, то NP^P. С другой стороны, если будет доказано, что такая задача решаема, то WP=P. Поскольку имеются сильные доводы в пользу того, что NP^P при обычных правилах вывода, вопрос состоит прежде всего в том, чтобы найти некие нетрадици- онные правила вывода, при которых можно было бы доказать, что какая-то WP-полная задача поддается решению. На рис. 6.3 приведена классификация задач с точки зрения их разрешимости и вычислительной сложности. Класс KoWP-задач состоит из задач, дополнительных к WP-задачам, т. е. задач, от- веты на которые являются дополнением к ответам для соответст- вующих WP-задач. Неизвестно, верно ли, что WP=koWP, однако 368
известно, что пересечение NP(]koNP непусто и содержит все P-задачи, а также некоторые другие. Несмотря на то, что вычислительная сложность в основном выражается через время, необходимое для выполнения вычисле- ний, бывает важно оценить и необходимый объем памяти компь- ютера. Это условие называется пространственным. Его можно оценить с помощью пространственной функции сложности, ана- логичной временной. Однако известно, что любая задача, кото- рую можно решить за полиномиальное время, решается в полино- миальном пространстве. В самом деле, число ячеек, с которыми оперирует автомат машины Тьюринга при конкретном вычисле- нии (это число определяет необходимое для решения пространст- во), не может быть больше числа шагов вычисления (что опре- деляет время решения). Однако из этого не следует, что все за- дачи, разрешимые в полиномиальном пространстве, разрешимы за полиномиальное время. Именно поэтому для разбиения задач на поддающиеся и не поддающиеся решению используется времен- ная сложность. Однако на практике важны оба эти условия. 6.6. СЛОЖНОСТЬ В УРСЗ С процессом обучения связана слож- ность описания (о-сложность). Ее мож- но оценить по тому, насколько трудно выделить описание системы... с процес- сом интерпретации связана сложность интерпретации (и-сложность). Ее можно оценить по тому, насколько трудно вы- делить из описания интерпретацию (смысл). Ларс Лофгрен При разработке архитектуры УРСЗ вопросы, связанные со сложностью систем и задач, возникают в нескольких случаях. Сложность систем играет в УРСЗ двоякую роль: во-первых, оп- ределяет тип условия для некоторых системных задач, которые идентифицируются в схеме УРСЗ; во-вторых, используется для представления размерности систем, рассматриваемых в различ- ных задачах и для оценки вычислительной сложности конкретных вариантов задач. Системную сложность как условие для системных задач мож- но рассматривать, вообще говоря, как отношение предпочтения на множестве рассматриваемых систем. В таком смысле это по- нятие ориентировано прежде всего на пользователя. Поэтому желательно, чтобы и меру для оценки сложности систем опреде- лял сам пользователь. Однако в некоторых случаях пользователь 24-6923 ' 369
может и не иметь своей меры сложности, и тогда УРСЗ должен предложить ему на выбор собственные меры. Более того, если пользователь затрудняется в выборе или ему безразлично, какая из мер будет использована, УРСЗ должен для данной задачи сам выбрать меру сложности систем по умолчанию. Вообще говоря, для систем разных эпистемологических типов нужны разные меры сложности. Могут понадобиться и разные меры сложности для систем одного эпистемологического типа, но имеющие другие методологические отличия. В гл. 3—5 при опи- сании неких «представительных» задач уже были введены неко- торые очевидные меры сложности, которые можно использовать как меры по умолчанию (или как меры, предлагаемые в виде «меню»). Мера сложности как способ представления размерности вари- анта задачи, по которой определяется временная функция слож- ности этой задачи, обычно определяется длиной описания рас- сматриваемой системы. Поскольку длина описания зависит от используемой системы кодирования, то в каждом случае она должна основываться на системе кодирования, примененной в кон- кретной реализации УРСЗ для описания систем этого типа. Сложность задач рассматривается как при создании, так и при использовании УРСЗ. При создании УРСЗ проблемы, связан- ные со сложностью задач, учитываются при исследовании методо- логических средств. К ним относится, например, определение временных и пространственных функций сложности конкретных алгоритмов и программ, определение пределов практической раз- решимости отдельных задач, сравнение конкурирующих алгорит- мов с точки зрения их вычислительной сложности, поиск новых алгоритмов решения задач, для которых имеющиеся алгоритмы неудовлетворительны из-за их сложности, разработка эффектив- ных эвристических алгоритмов для не поддающихся решению за- дач и поиск для таких задач упрощений, которые позволят их решить. Одной из функций УРСЗ должен быть непременный анализ каждой предлагаемой задачи на сложность. Перед тем как про- должить работу, УРСЗ должен представить пользователю крат- кий отчет о результатах этого анализа и, если нужно, список предлагаемых опций. Исходя из этого отчета, пользователь может подтвердить свой первоначальный запрос, выбрать одну из пред- ложенных опций, как-то: изменить свою задачу или совсем отка- заться от ее решения. Несмотря на то, что анализ сложности может быть реализо- ван самыми разными способами, он должен давать ответ на сле- дующие фундаментальные вопросы. Во-первых, о разрешимости. Если задача неразрешима, приходится отказаться от ее решения, предложив, если возможно, пользователю модификации постанов- ки задачи, делающие ее разрешимой. Во-вторых, следует опреде- 370
Предел для Предел для конкретной имеющейся Предел реализации урсз Вычислительной техники бреммерманна Задачи, поддающиеся решению Задачи, не поддающиеся решению для имеющейся реализации УРСЗ Задачи, не поддающиеся решению для имеющейся дычисшпельней техники Задачи, принципиален', не поддающиеся решению Рис. 6.4. Приблизительная классификация системных задач по сложности лить, к какому классу сложности принадлежит данная задача. Эти классы определяются тремя фиксированными значениями вы- числительной сложности: пределом Бреммерманна (или его ме- нее строгим аналогом), пределом для существующей вычисли- тельной техники (это значение должно периодически корректиро- ваться в соответствии с достижениями компьютерной техники) и пределом сложности для конкретно используемой реализации УРСЗ. Таким образом, системные задачи разбиваются, как это показано на рис. 6.4, на четыре больших класса. Они введены для того, чтобы пользователь мог попять, поддается его задача реше- нию или нет. Если задача принципиально неразрешима, ему сле- дует отказаться от данной задачи и искать вычислительно менее сложную формулировку. Если задача потенциально решается, ио нужные для этого ресурсы превосходят возможности современной вычислительной техники, то также нужно искать другую форму- лировку. Однако в этом случае остается возможность вернуться к первоначальной задаче в будущем Если поставленная задача не выходит за рамки возможностей! современной техники, то необходимо провести более тщательный анализ ее сложности. Если задача может быть решена с помощью имеющейся реализации УРСЗ, то пользователю следует дать приблизительную оценку стоимости вычислений. Если задачу ре шить нельзя, то нужно выдать пользователю сведения о необхо- димых для ее решения вычислительных ресурсах (скорости, па мяти), и приблизительной стоимости вычислений. В некоторых областях, таких, как предсказание погоды, конт- роль продукции, тестирование техники или принятие решений в управлении, в условия решения системной задачи входит мак- симально допустимое время решения задачи. В других с о.чаях указана максимально допустимая стоимость вычислений. Подоб- ные ограничения должны учитываться при анализе сложит: и п отражаться в отчете, предоставляемом пользователю. Необходимо отметить, что вычислительная сложность опреде- ляется не только размерностью задачи, т. е. задачи одного типа 24* 371
и размерности могут очень отличаться по сложности. В большин- стве случаев в исследованиях по вычислительной сложности ос- новное внимание уделяется оценке наихудших вариантов задач. Несмотря на то, что теоретически это вполне обоснованно, такие оценки редко выполняются на практике и, следовательно, явля- ются слишком пессимистическими. Чтобы как-то исправить это положение, в некоторых случаях помимо наихудших оценок при- водятся также усредненные оценки. Однако такие оценки полу- чаются в предположении о равновероятности всех вариантов задачи, что не всегда отражает действительное распределение ве- роятностей вариантов, встречающееся на практике. Проблема оп- ределения таких реальных распределений для разных типов за- дач является преимущественно эмпирической. Есть надежда, что анализ вариантов задач, предлагаемых пользователями УРСЗ и другим пакетом для решения системных задач, дает возможность изучить эту проблему. ПРИМЕЧАНИЯ 6.1. Сформулированные в разд. 6.3 аксиомы для сложности систем пред- ставляются достаточно общими. Их еще более можно обобщить, если заменить в аксиоме С5 функцию суммирования на обобщенную агрегирующую функцию, но подобное обобщение интуитивно не представляется достаточно обоснованным. Во всяком случае имеющиеся в литературе аксиоматические формулировки слож- ности систем гораздо менее общие, чем та, что дана в разд. 6.3 [60, 130]. Исключением являются лишь три аксиомы, предложенные Конантом [84], ко- торые похожи на аксиомы СЗ—С5. 6.2. Сложность систем исследовалась с самых разных точек зрения. Одной из областей, где это понятие было хорошо проработано, является теория конеч- ных автоматов (или в более общем случае теория конечных полугрупп). Укажем, в частности, на теорему Крона — Родеса о декомпозиции [15, 200, 201]. Другим особым типом сложности, хорошо описанным в литературе, является сложность последовательностей букв из неких конечных алфавитов. В УРСЗ такое понима- ние сложности применимо для систем данных с полностью упорядоченным пара- метрическим множеством. Сложность такой последовательности обычно опреде- ляется числом бит, необходимых для описания минимальной программы (для некоторого определенного компьютера, например для машины Тьюринга), кото- рая могла бы воспроизвести эту последовательность. Различные подходы к опре- делению сложности последовательностей описаны в работах [71, 72, 196, 217, 223, 287]. Во всех этих подходах понятие сложности тесно связывается с таки- ми понятиями, как информация и случайность. Хороший обзор основных вопро- сов, связанных со сложностью этого типа, дается в гл. 5 книги [107]. Но это не единственная область, в которой существует связь между слож- ностью и информацией. В некоторых исследованиях по сложности систем рас- сматриваются так называемые максимально энтропические меры сложно- сти, использующие информации Шеииона. Они были предложены Фердинандом [105], который использовал принцип максимума энтропии для определения 372
априорного распределения вероятностей ожидаемого числа отказов в системе при заданном уровне знаний об этой системе. Он также исследовал влияние Модуляризации систем (т. е. уточнения систем в том смысле, как это рас- сматривалось в гл. 4) на число отказов в системе [104] и применил полученные результаты к программному обеспечению. Исходя из разумных соображений и соответствующих эмпирических сведений, он показал, что число ошибок в про- грамме минимально, если программа имеет иерархическую структуру и размер подсистем (подпрограмм) иа каждом уровне иерархии равен (2л)1/3, где п — размерность всей системы. Подобный подход рассматривался в работах [93, 122, 168]. Существуют и другие подходы к использованию эитропин Шеиноиа для опре- деления сложности систем. Так, например, Ван Эмден использует ее при опре- делении сложности как «то, каким образом целое отличается от композиции своих частей» [320]. Удобным средством описания систем определенных типов (например, ST-си- стем нли G-структур) являются графы. Некоторые попытки определения сложно- сти графов делались в работах [6, 232], но эта предметная область, видимо, раз- работана еще недостаточно. Сложность систем исследовалась и при проектировании технических систем, особенно таких больших, как телефонные сети и цифровые компьютеры. Если точно определены конструктивные элементы и задача, которую должна выпол- нять система, то одинм из вопросов, связанных со сложностью, является опреде- ление минимального числа необходимых элементов. Эти вопросы хорошо описаны в работе [249]. Несмотря на то, что в данном кратком обзоре упомянуты важнейшие работы, связанные со сложностью систем, он далеко не полой. Более подробную библио- графию по сложности систем можно найти в работе [94]. 6.3. Первоначально вопросы вычислимости были поставлены в работах Тью- ринга [315], Клннн [176], Поста [254] н Черча [80]. В настоящее время в лите- ратуре используются обычно два формализма — машина Тьюринга и рекурсивные функции. Реже используются алгоритмы Маркова [222]. Вопросы вычислимости рассматриваются во многих книгах, например в [95, 270]. Несмотря на то, что существенные отличия полиномиально- и экспоненциально- временных алгоритмов были обнаружены еще в середине 60-х годов, основания современной теории MP-полноты были заложены в работах Кука [92] и Карпа [169], появившихся в начале 70-х годов. Подробно теория вычислительной слож- ности изложена в книге [129] ; кроме описания собственно теории книга содержит обширную библиографию, каталог более чем 300 МР-полный задач и некоторые нерешенные задачи. 6.4. Глубокое исследование понятия сложности (как систем, так и задач) было проведено Лофгреном [215]. Он ввел два типа сложности — сложность опи- сания и сложность интерпретации — и показал, что некоторые известные меры сложности соответствуют одному из этих двух типов. В схеме УРСЗ подобная классификация отражает упорядочение систем по эпистемологическим типам. С поиском более высокого эпистемологического типа связано понятие описатель- ной сложности. С другой стороны, в задаче определения более низкого эпистемо- логического типа фигурирует сложность интерпретации. 373
УПРАЖНЕНИЯ 6.1. Придумайте собственные меры сложности для систем с поведением, ST-систем и структурированных систем и проверьте, выполняются ли для этих мер аксиомы С1—С5 из разд. 6.3. 6.2. Посмотрите, какие задачи из вашей предметной области являются транс- вычислительными, а какие нет. 6.3. Вычислите некоторые значения из табл. 6.1. 6.4. Проверьте математические выражения из последнего столбца табл. 6.2. 6.5. Дополните табл. 6.2 временными функциями сложности для пп, п! и 22п. 6.6. Покажите, что для любого положительного N существует число п0, такое что л!>ЛГп для всех 6.7. Какие из следующих соотношений истинны, а какие нет: а) Згг5—J-1 Огг3—|-«2—{-25 имеет сложность О(л)5; б) 2п-[-Зп имеет сложность О(2п); в) 2"-|-Зп имеет сложность 0(3”); г) п! имеет сложность 0(пп); д) пп имеет сложность 0(п!); е) 103” имеет сложность q(22”) . ГЛАВА 7. ЦЕЛЕНАПРАВЛЕННЫЕ СИСТЕМЫ Вся жизнь — это борьба за достижение целей, и нам представлен только один выбор — выбор цели. Эйн Рэнд 7.1. ПРИМИТИВНЫЕ, БАЗОВЫЕ И ДОПОЛНИТЕЛЬНЫЕ ПОНЯТИЯ Единственным обоснованием наших по- нятий является то, что они используются для представления всей совокупности нашего опыта; вне его они не имеют права на существование Альберт Эйнштейн Для полного понимания концептуальной схемы УРСЗ жела- тельно взглянуть на нее со стороны, чтобы определить некоторые важные категории понятий. Такой подход позволяет выделить три основные категории. Назовем понятия в соответствии с эти- ми категориями примитивными, основными и дополнительными. Отличительным признаком примитивных системных понятий является их независимость от других понятий данной схемы. Од- нажды выбранные, они в основном определяют диапазон концеп- туальных схем, которые можно на них построить. Можно сказать, 374
что богатство выбранных примитивных понятий определяет бо- гатство получаемых из них концептуальных схем. Исключение из рассмотрения каких-либо примитивных понятии может привести к значительному сужению диапазона получаемых концептуаль- ных схем или даже сделать их практически 'исгю.щзпы чи. В схеме УРСЗ к примшивным относятся понятия, связанные с исходными системами: атрибуты (входные и выходные) мно- жества проявлений, базы и множества баз, конкретные и общие параметры и их параметрические множества, каналы наблюдения (четкие или нечеткие) и конкретизации (абстрагирования). Сюда также следует отнести всевозможные методологические отличия, связанные с этими понятиями. В схеме УРСЗ все дру: не понятия <щр. „сляюи я в терминах перечисленных понятий. При тщательном анализе можно естест- венным образом выделить две категории этих производных поня- тий. К одной из них относятся понятия, связанные со всевозмож- ными видами описаний связей между переменными. Эти понятия используются при определении всех эпистемологических типов систем, кроме исходной системы, а именно: при определении дан- ных, правил сдвига на параметрических множествах, выборочных переменных (порождаемых, порождающих и входных), масок, поведения и ST-функций (основных и порожденных), среды (внут- ренней и внешней), подсистем и суперсистем, элементов структу- рированных систем, соединяющих переменных, связей (нейтраль- ных или направленных), элементов метасистем и процедур заме- ны. Поскольку все эти понятия связаны с основной проблемой решения системных задач — описанием, определением и исполь- зованием связей между различными типами понятий — термино- логически удобно называть их базовыми системными понятиями. Остальные понятия УРСЗ будем называть дополнительными системными понятиями. Эти понятя, не являющиеся пи прими- тивными, ни базовыми понятиями J РСЗ, можно тем не менее оп- ределить через примитивные и базовые, а в некоторых случаях и через другие дополнительные понятия. Обычно они имеют раз- личный смысл в зависимости от того, к каким типам систем от- носятся. Системная сложность, рассмотренная в гл. 6, одно из них. Это общее понятие, определенное своими общими аксиома- ми, которое относится к широкому спектру более конкретных по- нятий системной сложности. Их можно упорядочить по степени конкретности. Чтобы в решении сшге.мных задач понятие систем- ной сложности имело практический смысл, оно должно быть до- статочно конкретным, по крайней мере должно определяться в терминах контактных типов систем, К категории дополнительных системных понятий относятся два важных класса понятий — цель и характеристика системы. Это такие же общие понятия, как системная сложность, имеющие 375
множество приложений. Цель настоящей главы — введение этих понятий на общем уровне, обсуждение их некоторых конкретных интерпретаций и определение роли при решении системных задач. 7.2. ЦЕЛЬ И ХАРАКТЕРИСТИКА В мире нет ничего незначительного. Все зависит от точки зрения. Иоган Вольфганг Гете Цель системы можно определить различными способами. В соответствии с принятым в УРСЗ общим подходом цель систе- мы находится «в руках» пользователя. Это значит, что для задан- ной системы произвольного эпистемологического уровня, опреде- ленной ее первичными свойствами, ассоциируемая с системой цель — это конкретное ограничение ее первичных или вторичных свойств, которое при данных обстоятельствах пользователь счи- тает предпочтительным. Таким образом, данная система может рассматриваться с точ- ки зрения различных целей. В некоторой степени система удо- влетворяет любой цели. Эта степень, называющаяся характери- стикой системы относительно цели, может быть измерена (в некотором смысле) близостью действительных и желаемых прояв- лений тех свойств системы, которые предусмотрены целью. Обыч- но она определяется в терминах соответствующей функции, назы- ваемой характеристической функцией. Обозначим через 3? множество систем, отличающихся свойст- вами, которые в данном случае определяют понятие цели (осталь- ные свойства совпадают). Тогда характеристическая функция, обозначим ее о, имеет вид w:^X^->[0, 1], (7.1) где ю(х, х*) представляет степень соответствия данной системы хей? целевой системе (хорошей, идеальной) х*ей?. Характери- стическую функцию удобно определять соответствующей цией расстояния d: ' с помощью формулы (О(х х*) М*. у) —г(х, х*) = | __ 8(х, X’) ««(х. у) Мх. где 8CT(x, у) = max 6(х, у). х.уей? Пример 7.1. Предположим, что цель определена с помощью подходящей функции поведения на множестве систем с пове- дением, характеризующихся одной и той же исходной системой 376 зунк- (7-2) (7.3)
и маской М. Тогда множество Зв в этом примере представляется множеством систем с поведением Fb=(S, М, fB), отличающихся только функциями поведения fe. Возможным и, по-видимому, подходящим в данном случае способом определе- ния расстояния между системами является расстояние Хэмминга б(х, у)= 2 |Ъ(с)-^н(с)| . (7.4) сес Для вероятностных функций поведения 6т(х, у) =2 и <в(х, х*) = 1—6(х, х*)/2; (7.5) для возможностных Мх, У*) = |С|, (7.6) <о(х, х*) —1—б(х, х*)/|С|. Очевидно, что разные цели и характеристические функции применимы к разным типам систем. Тем пе менее разные типы целей, требующих определенных характеристических функций, можно определить и для одних и тех же типов систем. Напри- мер, для систем с поведением цели можно определить через под- ходящую функцию поведения, множество функций поведения, множество локальных функций поведения для определенных под- множеств параметрического множества, множество функций по- ведения, представляющих подходящие подсистемы, и т. д. Оче- видно, что для каждого из этих типов целей необходима конкрет- ная характеристическая функция. Понятия цели и характеристики являются базовыми для оп- ределения понятия целенаправленных систем, которым посвяще- на оставшаяся часть главы. 7.3. ЦЕЛЕНАПРАВЛЕННЫЕ СИСТЕМЫ Система, которая стремится улучшить характеристики своей работы при дости- жении заданной цели и осуществляет это без помощи извне, называется само- организующейся. Ханс Бреммерманн Предположим, что тип цели и соответствующая характеристи- ческая функция определены для множества систем некоторого эпистемологического типа. Как отмечалось в разд. 7.2, с каждой системой из этого множества связано значение характеристиче- ской функции, определяющее степень соответствия системы дан- 377
ной цели. Этот факт подсказывает тривиальный способ определе- ния целенаправленных систем: система рассматривается как це- ленаправленная тогда и только тогда, когда ее характеристика относительно заданной цели больше некоторого заданного поро- га — обычно 0.5 или более. Другой способ определения целенаправленных систем, пред- ставляющийся операциоино более содержательным, заключается в рассмотрении понятия целенаправленных систем в относитель- ных терминах. Это значит, что одна система рассматривается как более целенаправленная опюсительно другой системы того же типа и определенной цели тогда и только тогда, когда ее харак- теристики лучше (в смысле некоторой характеристической функ- ции) огиосиюлыю данной цели. Формально для двух заданных систем х. уег^ одного и того же типа, определенной цели х’е^1 и соответствующей харакгерпетической функции со система х яв- ляется целенаправленной относительно системы у и цели х* при характеристической функции w тогда и только тогда, когда со(х, х*) ><о(у, X*). Назовем разность Дш(х, yjx*)-- о’Х. х*)- ci)(y, х*) (7.7) степенью целенаправленности х относительно у при заданной це- ли х*. Система с положительной степенью целенаправленности отно- сительно другой системы должна обладать некоторыми свойства- ми, отличными от свойств последней, свойствами, связанными с целью и определяющими улучшение характеристики этой систе- мы. Будем называть их свойствами выбора цели. Такими свойст- вами, например, являются некоторые дополнительные перемен- ные или состояния в порождающих системах, дополнительные элементы или соединения в структурированных системах, допол- нительные элементы или процедур.1: заметил в метасистемах и др. В оставшейся части этиго раздела для иллюстрации общих положений, связанных с цсленаиравлениостыо, применим их к системам определенного эпистемологического уровня — ней- тральным системам с поведением. В этом случае свойствами вы- бора цели являются также переменные, включение которых в си- стему улучшает ее характеристику. Назовем такие переменные переменными выбора цели Рассмотрим множество иентральны.х систем с поведением-' обычного вида Ffi=(S, М, fB), отличающихся только своими функциями поведения fB. Посколь- ку далее в этом разделе рассматриваются системы только этого 378
типа, то, не вызывая путаницы, упростим запись, опустив ин- декс В. Кроме того, нам удобно отождествлять любую систему из этого множества с ее функцией поведения f или соответствующим распределением f. Предположим, что рассматриваемые системы вероятностные. В соответствии с обозначениями, введенными в гл. 3, обозначим через с обобщенные состояния выборочных переменных, соответ- ствующих маске М, и пусть сеС. Предположим, что система, идентифицируемая распределением вероятностей f*= (Г(с) |сеС), рассматривается как цель. Тогда для каждой системы, идентифи- цируемой распределением вероятностей f= (f(c) |се=С), расстояние до цели можно, например, определить по формуле (7.4). Тогда характеристику каждой системы рассматриваемого множества можно определить, подставив соответствующее рас- стояние в формулу (7.5). Рассмотрим теперь систему с поведением F'=(S', ЛГ, Г), исходная система которой содержит все элементы, входящие в си- стему S', и, кроме того, некоторые переменные, благодаря кото- рым маска М расширяется до маски М'. Обозначим через z со- стояния выборочных переменных, соответствующих разности мно- жеств М'—М\ пусть zeZ, а f'= (f(c, z)|ceC, zeZ) обозначает распределение вероятностей системы F'. Для определения расстояния между системами, идентифици- руемыми распределениями Г и f*, необходимо преобразовать рас- ширенное распределение f' к виду, сравнимому с распределени- ем f'. Это можно сделать с помощью формулы Г(с)= 2 Г (с, Z). (7.8) z Пусть распределение f"(f"(c)|c<=C) используется для идентификации системы F'. Тогда формулы (7.4) и (7.5) применимы для вычисления соответственно расстоя- ния 6(f", f*) и характеристики o(f", f*). Если вычисленная по 379
формуле (7.7) функция Дш(Г', f|f*) больше 0, то система F' яв- ляется целенаправленной относительно системы F при заданной цели f*; тогда переменные, соответствующие разности М'—М, называются переменными выбора цели. Важно понять, что необходимое условие целенаправленности системы F' относительно системы F заключается в том, что f не является проекцией f'. Действительно, если f является проекцией f', тогда f"=f и, следовательно, Дш(Г, f[f*)=O. Это условие означает, что переменные S', не содержащиеся в S, должны определять признаки, не свойственные объекту, для которого определена система F. Пример 7.2, Рассмотрим задачу о максимальном использова- нии трех дорогостоящих устройств, входящих в вычислительную систему. Три переменные и2, оз описывают состояние соответ- ствующего устройства в зависимости от времени. Каждая из пе- ременных имеет два значения: 0 — в момент наблюдения устрой- ство неактивно и 1 — устройство активно. Предположим, что с помощью аппаратуры было выполнено наблюдение (см. пример 3.8) и получено распределение вероят- ностей f, приведенное в табл. 7.1а, для маски без памяти. Здесь также приведено распределение вероятностей f*, представляющее цель. Используя формулы (7.4) и (7.5), получаем б (f, f*) = 1.4 и <o(f, f*)=0.3. Предположим теперь, что вычислительная система дополнена новым устройством (например, каналом связи) таким образом, что оно влияет на работу трех рассматриваемых устройств. Пред- положим далее, что по сравнению с этими устройствами новое устройство относительно дешевле и степень его использования не так важна. Это устройство добавлено только с целью более эф- фективного использования трех других устройств. Цель, таким образом, остается прежней. Таблица 7.1. Целенаправленная система и переменная выбора цели из примера 7.2 а) ”1 »2 б) в) «1 ”3 f f* «3 У4 г 14 v2 ^3 г 0 0 1 0.15 0 0 1 1 1 0.10 0 1 1 0.10 0 1 0 0.20 0 1 0 0 0 0.02 1 0 0 0.02 1 0 0 0.10 0 1 0 1 0 0.03 1 0 1 0.03 1 1 0 0.25 0 1 I 0 0 0.04 1 1 0 0.05 1 1 I 0.30 1 1 1 0 1 0.01 1 1 1 0.80 1 1 I 0 0.25 1 1 1 1 0.55 380
Пусть переменная и4 определена для нового устройства так же, как и другие переменные для соответствующих устройств. Предположим, что для новой системы, включающей переменную ц4, вновь выполнено аппаратное наблюдение, и результаты рас- пределения вероятностей приведены в табл. 7.16. Воспользуемся формулой (7.8) для вычисления распределения f", чтобы срав- нить f" с f* (табл. 7.1в). Тогда 6(f", f*)=0.4 и w(f", f*)=0.8. Следовательно, Aw (Г, f|f*)=0.8—0.3=0.5, т. е. в данном случае расширенная система является целенаправ- ленной, а переменная и4— это переменная выбора цели; степень целенаправленности (улучшение характеристики благодаря до- полнительному устройству) равна 0.5. Рассмотрим другую цель, у которой f*(c)=0.5 для двух по- следних состояний, приведенных в табл. 7.1а. Тогда 6(f, f*)=d(f", f*) =0.9, w(f, f*)=w(f", f*)=0.55. Таким образом, в этом случае новая система не будет целе- направленной. Хотя новое устройство, представленное перемен- ной и4, существенно влияет на работу остальных устройств, оно не приближает систему к цели. Это значит, что переменная v4 не является переменной выбора цели относительно альтернативной цели. Рассмотрим еще одну цель, у которой f*(c)=0.2 для каждого состояния, приведенного в табл. 7.1в. Тогда w(f, f*)=0.85, w(f", f*)=0.27 и Aw (Г, f|f*)= — 0.58. Переменная u4 в этом случае является нежелательной и мо- жет быть названа переменной уклонения от цели — она отклоня- ет систему от цели, и таким образом, «понижает» ее характери- стику. 381
7.4. СТРУКТУРИРОВАННЫЕ СИСТЕМЫ КАК ПАРАДИГМЫ ЦЕЛЕНАПРАВЛЕННЫХ СИСТЕМ С ПОВЕДЕНИЕМ ...современный ученый не пытается во что бы то ни стало сконструировать еди- ную глобальную модель действительно- сти. С течением времени он понимает, что может быть предпочтительнее скон- струировать сеть локальных моделей, возможно и сравнимых по сложности, но почти наверняка с совершенно раз- ными структурами. Ричард Боллман и Ч. Пол Смит Целенаправленные системы, определенные в предыдущем разделе, характеризуются отделением переменных выбора цели от остальных переменных и требованием того, чтобы переменные выбора цели способствовали достижению поставленной цели. Очевидно, что исследование различных способов порождения со- стояний переменных выбора цели чрезвычайно важно для пони- мания целенаправленных систем, и в частности для развития ме- тодов проектирования соответствующих целенаправленных си- стем. При таком исследовании с необходимостью получаются некоторые структурированные системы определенных типов. Каж- дую из них можно рассматривать как парадигму, описывающую принцип (схему, форму) в терминах порождаемых состояний переменных поиска цели. Назовем эти парадигмы структурными парадигмами целенаправленных систем. Во-первых, рассмотрим целенаправленные системы с поведе- нием нейтрального типа. Как показано в предыдущем разделе, их переменные можно разделить на переменные выбора цели и остальные переменные. Поскольку цель определена в терминах по- следних переменных, то резонно назвать их переменными, реали- зующими цель. Переменные выбора цели воздействуют на переменные, реа- лизующие цель, и в то же время подвергаются обратному воз- действию. Поэтому естественно рассматривать целенаправленные снсюмы как структурированные системы с двумя элементами. О чин из них порождает состояния переменных, реализующих цель, а другой—состояния переменных выбора цели. Назовем их л.ментом, реализующим цель, и элементом выбора цели и бу- м формально описывать их как системы с поведением. Итак, »F=(«S, 'Af, 7), 2F=(2S, 2М, 2f) вчственно. Поскольку недоразумения исключены, то и здесь Н опущен.
Обозначим ’V, 2V множества переменных в исходных системах 1S, 2S соответственно. В общем случае 2И£1У, поскольку пере- менные выбора цели воздействуют на переменные, реализующие цель (это требование следует из определения), тогда как обрат- ное воздействие не требуется. Для описания способа порождения отдельных переменных необходимо рассматривать два элемента как направленные (это показано в разд. 4.3 и 4.4), даже если не рассматривается внешняя среда. Обозначим направленные соеди- нения между элементами C2,I==2V И C1,2 = 1V', где Естественно различать три структурные парадигмы, отличающиеся друг от друга соединением Clt2: Ci, 2 = 0; С..2СИ; CI,2 = 'V. Эти парадигмы, отличающиеся объемом информации о перемен- ных, реализующих цель, используются для порождения перемен- ных выбора цели. Назовем их соответственно парадигмой без ин- формации, парадигмой частичной информации и парадигмой пол- ной информации. На рис. 7.1 показана схема этих трех парадигм. Рассмотрим теперь структурные парадигмы целенаправленных систем с поведением направленного типа. Помимо множеств пе- ременных, содержащихся в их нейтральных аналогах, они содер- жат множество входных переменных, которое обозначим X. Воз- можные направленные соединения между элементами, реализую- щими цель, элементом выбора цели и средой (обозначенной как элемент 0) сведены в таблицу: 0 1 2 0 X X' V 0 'V1 0 V 0 где Х'^Х и !Е'=ЧЛ Для X' можно выделить три характерных со- стояния: Х'=0; Х'сХ; Х'=Х. Аналогично может быть выделено трн состояния *V': Г=0; 'Е'с’Е; 383
Парадигма дез информации Парадигма частичной информации Парадигма полной информации Рис. 7.1. Структурные парадигмы це- ленаправленной системы с поведе- нием нейтрального типа (без выход- ных переменных) Каждое из состояний X' мож- но скомбинировать с любым из выделенных состояний lV'. Это приводит к девяти парадигмам. Они показаны на рис. 7.2 и разде- лены на четыре класса, каждый из которых представлен одной из схем и соответствующим назва- нием, принятым в литературе. Понятие целенаправленной си- стемы с поведением в целом и ее различные структурные пара- дигмы, перечисленные, в частно- сти, на рис. 7.1 и 7.2, имеют ши- рокий диапазон применений н множество различных интерпре- таций. Одной из наиболее широ- ко изучаемых интерпретаций яв- ляется регулирование. Любая це- ленаправленная система, осуще- ствляющая какое-либо регулиро- вание, называется регулятором. се цель заключается в сохране- нии особого состояния или особо- го подмножества состояний пере- менных ’V несмотря на возмуще- ния, представленные входными переменными. Переменные выбо- ра цели выполняют функции ре- гулирующих переменных; элементы 1F, 2F являются регулируе- мыми и регулирующими элементами соответственно. Регулятор можно также определить в терминах ST-системы. В этом случае цель заключается в сохранении системы в подмножестве состоя- ний, включающем регулируемые переменные. Другая интерпретация целенаправленной системы с поведени- ем заключается в рассмотрении ее как обучающейся. Элементы *F и 2F являются соответственно обучающимся и обучающим. Цель заключается в получении реакций (состояний переменных в множестве ’У) на отдельные раздражители (состояния перемен- ных в множестве X), которые рассматриваются (определены) как «правильные». Состояния переменных выбора цели в этом случае представляются как своего рода усиление. Еще одна интерпретация заключается в рассмотрении целена- правленной системы с поведением как системы, принимающей ре- шения. Элементы ’F и 2F становятся элементами реализаций ре- шения и элементами принятия решения соответственно. Состояния входных переменных представляют так называемые «естест- 384
Общая парадигма номер Со>2 7 ил 1 0 0 без информации 2 Л'с X 0 Частичная информация 3 Х'=Х 0 Полная информация 4 0 'V'c'v Частичная выходная информация 5 0 ,у/>= 'у Полная выходная информация х'сх 'v'c'v Частичная входная/выходная информация Паяная входная/частичная выходная информация 8 х'сх 'v'='v Частичная входная/паяная выходная информация 6 х'-х'v'='v Полная входная/выходная информация Рис. 7.2. Структурные парадигмы целенаправленной системы с поведением на- правленного типа венные состояния» (т. е. соответствующие внешние обстоятельст- ва, возможные перемещения противника, определенные характе- ристики некоторого вида и т. п.). Состояния переменных в мно- жестве lV представляют выходы, на которых определена функция выгоды. Цель системы заключается в максимизации функции выгоды. С помощью переменных выбора цели выбираются вари- анты из множества решений, положительно воздействующие на выходы. В соответствии с их ролью эти переменные можно, на- 25-6923 385
пример, назвать переменными принятия решения, переменными выбора или утилитарными переменными. Можно описать и некоторые другие интерпретации целенап- равленной системы с поведением, например системы, корректи- рующие ошибки или самоорганизующиеся системы. Однако цель .этой книги заключается не во всестороннем и детальном описа- нии целенаправленных систем, а только в определении их роли в решении системных задач. Более подробное описание приведено в примечаниях к гл. 7. 7.5. ПРОЕКТИРОВАНИЕ ЦЕЛЕНАПРАВЛЕННЫХ СИСТЕМ Любой хороший регулятор системы дол- жен быть моделью этой системы Роджер Конант и У. Росс Эшби В системных исследованиях понятие структурных парадигм целенаправленных систем с поведением дает исследователю по- лезное описание систем, в соответствии с которым некоторые из исследуемых переменных рассматриваются как способствующие достижению выбранной цели. Основная проблема заключается в определении того, какие из переменных в данном исследовании в наибольшей степени влияют на достижение цели. С другой стороны, при проектировании целенаправленных си- стем каждая структурная парадигма определяет структуру, в пре- делах которой должен действовать проектировщик. Другими сло- вами, каждая структурная парадигма представляет множество предположений (ограничений) относительно проектируемой си- стемы, которые проектировщик не должен нарушать. Поскольку проектируемые системы всегда направленные, то при обсуждении различных вопросов, возникающих при проекти- ровании целенаправленных систем, допустимы только показанные на рис. 7.2 структурные парадигмы. Эти парадигмы могут быть частично упорядочены по строгости их ограничений. Чем строже ограничение, тем меньше свободы остается у проектировщика при решении его задачи и, следовательно, менее общей является па- радигма. Будем называть структурную парадигму менее общей по сравнению с другой структурной парадигмой тогда и только тогда, когда опа включает больше ограничений (предположе- ний), чем последняя. Применительно к множеству структурных парадигм, определенных на рис. 7.2, это упорядочение по уровню общности образует решетку, которая описывается диаграммой Хассе на рис. 7.3. Для конкретных множеств X' и 'V' более уточ- ненную решетку можно определить, допустив, что X' и !V' пред- ставляют произвольные подмножества X и 1V соответственно. В типичной задаче проектирования целенаправленных систем имеются следующие составляющие: 386
1) направленная система с поведением °F=(°S, °2И, °f), которая представляет элемент, реализующий цель, без пере- менных выбора цели; 2) цель или характеристи- ческая функция, совместимая с системой °F; 3) список имеющихся эле- ментов; 4) целевой критерий (функ- ция); 5) структурная парадигма целенаправленных систем и, возможно, некоторые ограни- чения относительно проекти- руемой системы. Проектирование целена- правленных систем включает следующие основные действия. 1. Необходимо явно задать 7.3. Решетка структурных парадигм, Рис. показанных на рис. 7.2, упорядоченных по общности то естествен- функцией по- цель и характеристическую функцию. Если при постанов- ке задачи задана только цель, то проектировщику предстоит выбрать соответствующую характеристическую функцию. Если задана только характеристическая функция, но предположить, что цель представлена ведения, для которой характеристическая функция достигает своего максимума. Этот подход, конечно, может привести к не- скольким функциям поведения. Проектировщик может либо вы- брать одну из них в качестве цели, либо в качестве альтернативного варианта выбрать больше, чем одну цель, и рассматривать про- ектируемую систему как целенаправленную метасистему. 2. Необходимо выбрать соответствующее множество перемен- ных выбора цели. Эти переменные не могут быть произвольными, они должны оказывать некоторое воздействие на выходные пере- менные данной системы °F и, таким образом, приводить к нетри- виальному расширению системы °F в новую систему с поведе- нием 'F=('S, Ш, ’f). Расширенная система представляет собой элемент, реализую- щий цель, для любой из структурированных парадигм целена- правленных систем с поведением. Выбор соответствующих пере- менных выбора цели является решающим. Однажды определен- ные, они задают наилучшую характеристику, которую с их по- 25* 387
мощью можно получить. Если она не соответствует требованиям, то необходимо исследовать другие возможные переменные выбо- ра цели. 3. Основная трудность в выборе соответствующих переменных выбора цели заключается в том, что воздействия различных мно- жеств при рассмотрении их как целевых переменных (функции поведения 7) обычно неизвестны. Следовательно, они должны быть определены как часть задачи проектирования. Описанные в гл. 3 процедуры можно использовать при решении этой задачи. 4. Как только множество переменных выбора цели оговорено и соответствующая система *F, реализующая цель, определена, следующий шаг состоит в определении какого-либо конкретного способа порождения переменных выбора цели, т. е. в определе- нии системы выбора цели 2F. Цель заключается в определении функции поведения 2f системы 2F, для которой характеристиче- ская функция достигает своего максимума при ограничениях тре- буемой структурной парадигмы. При решении этой проблемы можно использовать различные методы оптимизации. Их выбор зависит главным образом от методологического типа используе- мых систем, а также от типа характеристической функции. 5. Необходимо спроектировать из элементов имеющихся типов структурированную систему, реализующую систему выбора цели, с поведением 2F. Эта стандартная задача системного проектиро- вания рассмотрена в разд. 4.5. 7.6. АДАПТИВНЫЕ СИСТЕМЫ ...все системы адаптивны, и в действи- тельности вопрос заключается в том, че- му и в какой степени они адаптивны. Лофти А. Заде Спроектированная по процедуре, описанной в предыдущем разделе, целенаправленная система оптимальна (или близка к оптимальной) только при условии, что не меняются ни функ- ция поведения 7 элемента, реализующего цель, ни цель f*. Если это условие не выполняется, то действительный рост характери- стики системы относительно цели при воздействии элемента вы- бора цели может быть существенно меньше расчетного значения. Может даже возникнуть обратное влияние элемента выбора цели на элемент, реализующий цель, приводящее к уменьшению этой характеристики. Для сохранения высокого уровня характеристи- ки вне зависимости от изменений функции 7 или f* необходимо, чтобы целенаправленная система была способна к адаптации. Существует много причин, по которым функции 7 и f* могут изменяться. В общем случае изменение функции 7 означает, что 388
Рис. 7.4. Схема общей структурной парадигмы многоцелевой системы на этапе проектирования система lf, реализующая цель, не была соответствующим образом определена с учетом этого изменения. В конечном счете отсюда следует, что на переменные, реализую- щие цель, влияют некоторые входные переменные, которые не были выделены в функции lf. Как только целенаправленная си- стема спроектирована и реализована для конкретной функции lf, пользователь уже не может управлять изменениями lf. С другой стороны, изменения цели полностью определены пользователем. В общем случае он может считать желательным изменение цели в связи с изменением обстоятельств, для которых была спроекти- рована система. Чтобы обеспечить возможность адаптации целенаправленной системы при изменении цели, необходимо спроектировать ее эле- мент выбора цели для множества альтернативных целей и допол- нить его специальной входной переменной, значение которой оп- ределяет цели. Назовем этот вид целенаправленной системы, адаптация которой ограничена конкретным множеством целей, многоцелевой направленной системой. Схема соответствующей структурной парадигмы (общего типа) показана на рис. 7.4, где v* обозначает переменную, определяющую текущую цель (и*е eV*), а система выбора цели, дополненная входной переменной V*, обозначена 2F+. В рассматриваемом случае цель определена либо пользователем, либо другой системой, связанной с входной переменной ц*. Изменения цели могут определяться целепорождающей си- стемой, которая сама является элементом многоцелевой направ- ленной системы. Эта возможность показана на рис. 7.5,а. Эле- менты ’F и 2F+ образуют основную многоцелевую направленную систему (как на рис. 7.4), a 3F — целепорождающий элемент. Об- 389
Рнс. 7.5. Общая структурная парадигма целенаправленной системы, рассматри- ваемой как автономная многоцелевая система (а) или многоцелевая система с двухуровневым элементом выбора цели (б) щая цель в данном случае заменяется последовательностями под- целей, представленными значениями переменной v*. Эти после- довательности определяются функцией поведения 3f в терминах переменных из множеств X, 'V, 2V или в зависимости от исполь- зуемой структурной парадигмы некоторыми их подмножествами. Будем называть целенаправленные системы этого типа автоном- ными многоцелевыми направленными системами. Одно очевидное соображение в пользу рассмотрения автоном- ных многоцелевых направленных систем состоит в том, что упро- щается общая задача оптимизации, решение которой является 390
частью процесса проектирования элемента выбора цели. Задача оптимизации распадается на несколько более простых оптимиза- ционных задач, каждая из которых ограничена конкретными ус- ловиями, выраженными в терминах используемых переменных. С этой точки зрения более удобно рассматривать систему как обычную целенаправленную систему с двухуровневым элементом выбора цели (рис. 7.5,6). Обе схемы на рис. 7.5 будут выглядеть одинаково, если речь идет о связях между тремя элементами. Они отличаются только способом, которым элементы концептуально скомбинированы в более крупные. Это тонкое отличие иллюстрирует основной фе- номен, связанный с системами всех видов: одну и ту же систему можно рассматривать с различных точек зрения в зависимости от того, применяется к ней операция укрупнения или уточнения. Целенаправленные системы с &-уровневым элементом выбора (£>2) цели можно рекурсивно определить исходя из схемы, по- казанной на рис. 7.5,6. Любая такая система представляет собой иерархическую декомпозицию общей цели на подцели и содержит k уровней декомпозиции. Рассмотрим теперь целенаправленные системы, которые адап- тируются к изменениям функции поведения 7- Элемент выбора цели любой такой системы должен реализовывать следующие две функции: 1) обрабатывать данные, связанные с переменными множеств X, ’V, 2V, и образовывать модель системы 'F; 2) применять модель ’F для порождения переменных выбора цели таким образом, чтобы их положительный эффект в смысле достижения цели был максимален или по край- ней мере близок к максимуму. Задача п. 1 решается многими способами. Можно непосредст- венно использовать методы, рассмотренные в гл. 3. Но удобнее рассматривать элемент, реализующий цель, и его модель как ме- тасистему. Тогда элемент выбора цели должен отождествлять изменение так, как в разд. 5.6. Пример 7.3. Для пояснения понятия целенаправленных си- стем, адаптирующихся к изменениям в системе, реализующей цель, рассмотрим в этом примере сложную адаптивную систему. Объектом, для которого определена эта система, является компь- ютер, оборудованный устройством, позволяющим ему передви- гаться внутри квадратной области, разделенной в шахматном по- рядке на более мелкие квадраты. Эта область называется рабо- чей (операционной) областью компьютера. Предположим, что в рабочей области выделено 10 рядов и 10 столбцов, помеченных соответственно идентификаторами х и у (х, т/е/Уо.э). Предполо- жим далее, что каждый квадрат, определяющий местонахождение компьютера, помечен отдельным идентификатором / = lOx-j-Т/ (/G=A/o,9s) • 391
Рис. 7.6. Общая схема аддитивной целенаправленной системы, описанной в при- мере 7.3 Компьютер также обладает широкими потенциа.и.нчми воз- можностями для исправления ошибок. Их реализация при работе компьютера позволяет отождествлять неправильные действия в управлении вне зависимости от вида вызвавших их возмущений в окружающей среде. В определенных пределах это позволяет исключить эффект от сбоев в работе компьютера. Когда число сбоев в оборудовании становится слишком большим, превышаю- щим возможности компьютера по исправлению ошибок, нормаль- ная работа компьютера оказывается под угрозой. Поэтому жела- тельно противостоять Рис. 7.7. Маскн систем с поведением, описанных в примере 7.3 неизвестным возмущениям, превратив компьютер в адаптивную целенаправлен- ную систему, цель которой заключается в минимизации числа сбоев оборудова- ния при длительной работе. Поскольку компьютер может перемещаться, то есте- ственный путь борьбы с внешними воз- мущениями состоит в избирательном пе- ремещении внутри рабочей области в со- ответствии со стратегией, ориентирован- ной на достижение этой цели. Общая схема предполагаемой целе- направленной системы показана на рис. 7.6. На этом уровне во времени рас- сматриваются две переменные: m—переменная, реализующая цель, она определяет количество сбоев компь- ютера в течение определенного проме- жутка времени (meNo); 392
с — переменная выбора цели, она определяет положение компьютера (сеЛ^о.эээ). Поскольку природа возмущений и их изменчивость неизвест- ны, то элемент, реализующий цель, должен рассматриваться толь- ко как исходная система S. В каждый момент времени принимает- ся состояние переменной с и порождается состояние перемен- ной т. Способ порождения переменной т неизвестен и может меняться. Элемент выбора цели «следит» за переменной т и порожда- ет переменную выбора цели с, управляющую передвижением компьютера. Он рассматривается как метасистема MF=(T, г), где ^-={T=('S, W, 7)j/G^,99}. Т определено в регулярных интервалах времени, в течение каж- дого из которых компьютер не перемещается, а г указывает, что каждое состояние I переменной с однозначно определяет конкрет- ный элемент поведения Ф метасистемы. Таким образом, элемент ZF метасистемы MF замещается в соответствии с заменой состоя- ний переменной выбора цели с. Отдельный элемент Ф метасистемы MF основан на маске, по- казанной на рис. 7.7. Она определяет входную переменную т, вы- ходную переменную с и шесть внутренних переменных. Перемен- ная vi соответствует суммарному числу переходов через позицию (квадрат) /, переменная mi определяет среднее число сбоев компьютера по всем переходам через позицию I, остальные пере- менные определяют те же средние числа для четырех квадратов, соседних с квадратом I; переменные с', v'i, m'i представляют со- ответственно следующие состояния переменных с, vi, mi и явля- ются порождаемыми переменными. Переменные m'i и v'i порождаются детерминирование по фор- мулам , vint’ + m nil , 17+ ! (7.9) vl = t-’l + 1 будем считать, что m'i вычисляется с точностью 0.01. Переменная с' в системе Ф может принимать значения только из множества L = {/_Ю, /—1, I, 1+1, /+10}. Она порождается случайным образом, так что вероятности от- дельных состояний обратно пропорциональны среднему числу сбоев в соответствующем квадрате. Тем не менее, чтобы сделать систему адаптивной к неожиданным изменениям пространствен- но-распределенных неисправностей, необходимо присвоить всем 393
состояниям ненулевую вероятность. Следовательно, если тс (се eL) настолько велико, что 1//пс<0.01, то 1/тс полагается рав- ным а, где а>0 — некоторая постоянная величина; положим а= =0.01. Функция поведения ’f системы Т определяется следующим об- разом. Сначала определим __ I Яс== (0.01, если тс>0.01, если тс< 0.01, при c^L—{/} и ( \1т{, если тп/ >0.01, ~ (0.01, если mi < 0.01. Тогда mz-io, т(-ь "iz+i, mi+io)=qc-k, где c'^L, a k — нормализующая константа, вычисленная по фор- муле k= М (<7z-io+<7z-i+<7i+<7/+i-|-z7<+io) • Для клеток на границе рабочей области при вычислении ве- роятностей необходимо внести очевидные изменения. На рис. 7.8 приведена схема, на которой показаны основные компоненты, входящие в целенаправленную метасистему MF. Блок 1—это память, в которой хранятся состояния выборочных переменных всех систем с поведением в F. Вход I представляет процедуру замещения: из памяти считываются состояния выбо- рочных переменных, связанных с системой Ф и обеспечивающих сохранение состояния переменных m’i и v'i в соответствующей ячейке памяти. Блок 2 представляет уравнение (7.9), определяю- щее вычисление переменных tn'i и v'i. Блок 3 определяет вспомо- гательные переменные qc (c^L), исходя из которых вероятности рс' = lfic' I mi', ^z-ю. mt j, mz+10), вычисляются в блоке 4. Блок 5 — это генератор случайных чисел, с помощью которого в соответствии с распределением вероятно- стей определяется состояние переменной с' (c'^L). Блок 6 — ин- тервал времени, в течение которого компьютер не перемещается. До начала работы описанной целенаправленной системы в па- мяти (блок 1) может содержаться любая имеющаяся в этот мо- мент времени информация о конкретном распределении отказов. Если никакой информации нет, то в памяти значения всех пере- менных полагаются равными нулю. Однажды запущенная целе- направленная система управляет перемещениями компьютера в соответствии с моделью окружающей компьютер среды (рабо- чей области). Модель определяется содержанием памяти целена- 394
Рис. 7.8. Схема элемента выбора цели адаптивной системы, рассмотренной в при- мере 7.3 правленной метасистемы MF (блок 1 на рис. 7.8). Благодаря из- менению переменных I и т модель постоянно обновляется. Систе- ма работает в соответствии с ее ожиданием реакции среды на соответствующее действие компьютера. Системы этого типа, спо- собные приспосабливать модель к окружающей среде и использу- ющие эту способность заранее, являются наиболее сложными адаптивными целенаправленными системами. Они обычно назы- ваются упреждающими системами. 395
Рассмотрим теперь некоторые свойства описанной адаптивной системы. Во-первых, можно выделить трн типа сбоев оборудо- вания: сбои, связанные непосредственно с оборудованием; сбои, обусловленные возмущениями, равномерно распределен- ными в рабочей области; сбои, обусловленные локальными возмущениями в рабочей области. Очевидно, что переменная выбора цели (положение в рабочей области) может влиять только на ошибки третьего типа. Во-вторых, необходимо отметить, что описанная система реа- гирует на произвольное событие, угрожающее ее нормальной ра- боте (коррекция выполнения требуемых действий компьютера). Нет необходимости в том, чтобы природа таких событий была за- ранее оговорена; все, что угрожает способности к нормальной ра- боте, вызывает реакцию, направленную на сохранение этой спо- собности. Поэтому естественно назвать эту систему самосохраня- ющейся системой (т. е. системой, стремящейся сохранить свою способность к нормальной работе). В-третьих, а — минимальное значение qc (c^L), постоянное для конкретной системы, существенно влияет на способ адапта- ции системы к изменениям в окружающей среде. Если а слишком мало по сравнению с обычными значениями qc, как в сбоях вто- рого и третьего типа, то система медленно распознает изменения в окружающей среде. Если а слишком велико, то система быстро распознает изменения, но ее модель окружающей среды становит- ся непригодной, когда изменения происходят с меньшей скоро- стью, чем скорость, с которой компьютер может перемещаться. 396
7.7. САМОВОСПРОИЗВОДЯЩИЕСЯ СИСТЕМЫ Самовоспроизводящаяся система (опре- деленная как единое целое) представля- ет собой сеть процессов создания (пре- образования и разрушения) компонент, производящих компоненты так, что: (1) при их взаимодействиях и преобразова- ниях непрерывно восстанавливается и осуществляется сеть процессов (отноше- ний), которые их производят и (2) она составляет единое целое (машину) в пространстве, в котором она сущест- вует благодаря определенной топологи- ческой области ее реализации, представ- ляющей собой подобную сеть. Франсиско Дж. Варела Цель настоящего раздела состоит в формулировании на языке УРСЗ наиболее неортодоксального класса целенаправленных си- стем, обычно называемых в литературе самовоспроиэводящимися системами. Слово autopoiesis — греческое и буквально переводит- ся как «самовоспроизведение». Однако самовоспроизведение в самовоспроизводящихся системах не произвольно, а должно удовлетворять определенным требованиям. В общем случае самовоспроизводящиеся системы функциони- руют на конечном и дискретном пространственно-временном па- раметрическом множестве. Пространство обычно имеет размер- ность 2 или 3, но бывает и ^-мерное (£^1). Полное описание са- мовоспроизводящихся систем состоит в том, что эти системы посредством набора правил перемещения и производства элемен- тов нескольких различных типов, распределенных в пространстве, образуют и сохраняют во времени пространственно различимое целое. Следовательно, самовоспроизводящиеся системы являются це- ленаправленными. Целью здесь является какой-либо тип грани- цы, называемой обычно топологической границей, позволяющей наблюдателю выделить часть пространства как единое целое. Некоторые из правил перемещения и производства, связанные с достижением цели в конкретной самовоспроизводящейся систе- ме можно, таким образом, рассматривать как свойства выбора цели данной системы. Понятие самовоспроизводящихся систем впервые возникло в биологии, где можно найти множество примеров таких систем. К наиболее простым биологическим объектам, образование и со- хранение которых как пространственных агрегатов можно опи- 397
сать в терминах самовоспроизводящихся систем, относятся, как отметил М. Зелены [360], биологические клетки: Мы интуитивно наблюдаем феномен самовоспроизведения в живых системах. Например, клетка — это сложная система, синтезирующая и производящая среди прочих макромолекул макромолекулы белков, липидов, ферментов; она состоит в среднем из 105 макромолекул. За полное время жизни данной клетки все макромолекулы возобновляются приблизительно 104 раз. Но в течение всего про- цесса клетка сохраняет свои отличительные свойства, связность и относительную иезавнсимость. Она производит мириады компонент, но все же не производит ничего, кроме самой себя. Хотя за время жизин клетка объединяет по меньшей мере 10’ различных составных молекул, она сохраняет свою индивидуальность и отличительные свойства. Сохранение единства и целостности в то время, как сами компоненты непрерывно или периодически распадаются и возникают, соз- даются и уничтожаются, производятся и потребляются, и называется самовос- произведением. Самовоспроизводящаяся система обычно описывается в тер- минах определенных типов, которым часто присваиваются такие названия, как субстраты, катализаторы, дырки, звенья и т. п. В каждый момент времени из определенного временного множе- ства в любой выделенной области заданного пространства может находиться только один из компонентов определенного типа. Компоненты претерпевают пространственные преобразования во времени в соответствии с определенными правилами (правила перемещения и производства). При тщательном выборе этих пра- вил система в состоянии образовывать и сохранять топологиче- скую границу определенного типа (цель системы), и, следова- тельно, ее можно рассматривать как самовоспроизводящуюся си- стему. Один из способов описания самовоспроизводящихся систем на языке УРСЗ состоит в представлении их как метасистем вида MD=(T, Ф, г). Множество 2) в конкретной самовоспроизводящейся системе состоит из всех систем данных, которые можно определить в тер- минах определенного пространства (как параметра) и единствен- ной переменной, состояния которой представляют компоненты са- мовоспроизводящейся системы. Так, например, состояния 0, 1,2, 3 и т. д. могут соответственно представлять дырки, катализато- ры, субстраты и т. д. Параметрическое множество Т метасисте- мы— это временное множество самовоспроизводящейся системы; оно полностью упорядочено, и ее элементы представляют соответ- ствующие интервалы времени. Процедура замещения состоит из всех правил перемещения и производства самовоспроизводящейся системы. Замещение одной системы данных другой происходит каждый раз, когда одно время в множестве Т заменяется следу- ющим. 398
Пример 7.4. Опишем простую самовоспроизводящуюся систе- му, как метасистему. Она состоит из временного множества Т, которое удобно представить мно- жеством неотрицательных чисел; множества систем данных D, основанного на той же пред- ставляющей системе, параметром которой является двумерное пространство, определяемое двумя декартовыми координата- ми х, и содержащее единственную переменную, имею- щую пять состояний, которым присвоены следующие содержа- тельные имена: О — дырка, 3—-звено, I — катализатор, 4 — связующее звено; 2 — субстрат, процедуры замещения, определенной следующими правила- ми (см. примечание 7.6): 1. Два соседних субстрата, один из которых граничит с ка- тализатором, соединяются с образованием звена. 2. Соседние звенья соединяются с образованием связных звеньев (замкнутое связное звено образует границу, сохране- ние которой является целью самосохраняющейся метаси- стемы). 3. Произвольно выбранные свободные или связные звенья распадаются с образованием двух субстратов или двух звень- ев соответственно. (В дальнейшем полученные компоненты могут вновь соединяться.) 4. Субстраты могут передвигаться в любую соседнюю пу- стую подобласть, пересекая при необходимости отдельное зве- но или связные звенья. Звенья могут перемещаться в пустые подобласти, а также замещать субстраты, либо вытесняя их в соседние дырки, либо меняясь с ними местами. У катализа- торов такая же, как и у звеньев, свобода в перемещении, и они могут замещать звенья. Тем не менее в отличие от субст- ратов ни звенья, ни катализаторы не могут пересекать сегмен- ты связных звеньев. Связные звенья не перемещаются. Таким образом, в каждый момент времени однозначно опре- деляется система данных De®. Системы данных замещают друг друга во времени в соответствии с правилами процедуры заме- щения. Процедура начинается с начального состояния (система данных), в котором в каждой позиции находится либо субстрат, либо катализатор. На рис. 7.9 показаны семь последовательных моментов времени из одной серии применений процедуры г. Целью этой системы является образование замкнутого простран- ства, ограниченного связными звеньями (топологическая грани- ца). На рис. 7.9 видно, что система действительно является целе- направленной. Топологическая граница начинает образовываться в момент времени t—2 и полностью завершается при t=G. 399
2222222222 2222222222 2222222222 2222222222 2222222222 2222122222 2222222222 2222222222 2222222222 2222222222 2222222222 2222222222 2233322222 2230003222 2230102222 2220002222 2222220222 2222222222 22222222 22 2222222222 t - 0 1" 1 2232222222 2022422222 2232444222 2240303222 2240104222 2244444222 2222223222 2222222222 2222222222 2222222222 2232222222 2022422222 2232444222 2240303222 2240104222 2244444222 2222223222 2222222222 2222222222 2222222222 t-2 t"3 2232222220 2222422222 2243444222 2240304222 2242134222 2244444222 2222220222 2222222222 2222222222 2222222222 2222022222 2234422222 2240444222 2240324222 2243134222 2244444222 2222223222 2222222222 2222222222 2222222222 2 2 2 2 2 0 2 2 2 2 2 2 4 4 4 2 2 2 2 2 2 2 4 2 4 4 4 2 2 2 2 2 4 3 3 2 4 2 2 2 2 2 4 0 1 3 4 2 2 2 Рис. 7.9. Самосохраняющаяся 2 2 2 2 4 2 4 2 4 2 4 2 4 3 2 2 2 2 2 2 ма (пример 7.4) 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 0 2 2 2 2 2 2 2 систе- 400
ПРИМЕЧАНИЯ 7.1. Наиболее подробно изученными целенаправленными системами являются регуляторы. Основные принципы регулирования сформулировали У. Росс Эшби и Р. Конаит [16, 17, 84, 85, 91]. Очень важен закон Эшби о необходимом много- образии. Закон утверждает, что производительность любого физического устрой- ства как регулятора не превышает его производительности как канала связи. Из этого закона следует, что многообразие регулирующих переменных можно пони- зить до желаемого уровня (что и является целью регулятора), только увеличив ряд регулирующих переменных по меньшей мере до соответствующего минимума. Закон этот часто формулируют следующим образом: только многообразие может уменьшить многообразие. Иерархически организованные многоуровневые регуляторы изучены в работах [29, 30]. В наиболее общем виде результаты этих работ формулируются так: чем слабее в среднем возможности регулирования и чем больше неопределенность имеющихся регуляторов, тем более высокая иерархия необходима при регули- ровании и управлении, чтобы достичь, если это возможно, тех же результатов регулирования. Данное утверждение часто называют законом необходимой иерар- хии. Из этого закона следует, что недостаточные возможности регулирования можно до некоторой степени компенсировать с помощью представления регуля- тора как иерархической многоцелевой структурированной системы. Кроме этих общих принципов регулирования, много результатов, связанных с регулированием, было опубликовано под рубрикой «Теория управления» [97, 163, 279, 280]. Они, в первую очередь, относятся к регуляторам с обратной связью и посвящены конкретным классам систем (непрерывным, линейным). 7.2. Прекрасный обзор различных пониманий термина адаптивные системы приведен в статье Б. Гейнса [113]. Для дальнейшего изучения адаптивных си- стем можно порекомендовать три следующие книги [37, 162, 314]. Предупреж- дающие системы подробно рассмотрены в обширной монографии Р. Розена [270]. 7.3. Понятие самовоспроизводящихся систем было предложено в начале 70-х годов тремя чилийскими биологами: Умберто Матурана, Франсиско Дж. Варела и Рнкардо Урибе. Первое описание на английском языке появилось в 1974 г. [323]. Для дальнейшего изучения самовоспроизводящихся систем можно пореко- мендовать книгу [359], где читатель найдет дополнительную библиографию. 7.4. Самосохраняющуюся предупреждающую систему, описанную в приме- ре 7,3, предложил Антонии Свобода в 1960 г. [303]. В дальнейшем эта идея по- лучила свое развитие, главным образом с помощью компьютерного моделирова- ния, в работах его сотрудников; основные выводы содержатся в работе [340]. 7.5. Самовоспроизводящая система, рассмотренная в примере 7.4. описана в статье М. Варела и Р. Урибе (примечание 7.3). Более точную формулировку процедуры замены читатель может найти в этой статье, 7.6. Литература по самоорганизующимся системам весьма обширна. Обзор этой тематики содержится в одной из моих статей [181]. В работе [338] приня- тие решений рассматривается как целенаправленная система. 401
УПРАЖНЕНИЯ 7.1. Рассмотрите какую-либо представляющую интерес систему с поведением как целенаправленную, т. е. определите цель и характеристическую функцию и выделите возможные переменные выбора цели. 7.2. Повторите пример 7.1 для других целей и других характеристических функций. 7.3. Сравните преимущества и недостатки структурных парадигм целенаправ- ленных систем с обратной и прямой связью (рис. 7.2). При таких условиях каж- дая из них более предпочтительна. 7.4. Промоделируйте па компьютере предупреждающую самосохраняющуюся систему, описанную в примере 7.3, и проиграйте несколько сценариев ее работы. 7.5. Промоделируйте па компьютере самовоспроизводящуюся систему, опи- санную в примере 7.4, и рассмотрите различные начальные системы данных (обратитесь также к работам [324] и [360]). ГЛАВА 8. ПОДОБИЕ СИСТЕМ Кто учит нас истинным аналогиям, глу- боким аналогиям, невидимым глазом, но которые разум может понять? Это ма- тематический ум, презирающий содер- жание и стремящийся к чистой форме. Анри Пуанкаре 8.1. ПОДОБИЕ Если части, составляющие объект, ста- нут больше или меньше, но в таком от- ношении, что сохранят начальные взаи- моотношения движения и покоя, то объ- ект сохранит свою первоначальную при- роду и его реальность не изменится. Бенедикт Спиноза В толковых словарях понятие подобия обычно определяется как «наличие общих свойств» или «сходство по сути или по не- отъемлемым признакам». В соответствии с этим определением два объекта рассматриваются как подобные, если они одинако- вы или, по крайней мере, сопоставимы по некоторым, но не обя- зательно по всем свойствам. Кроме того, предполагается, что свойства, по которым они сравниваются в данном контексте, яв- ляются существенными. Таким образом, для заданного набора объектов можно определить множество различных видов подобия 402
в зависимости от свойств, которые счи- таются существенными в каждом кон- кретном случае. По-видимому, геометрическое подо- бие— это первый вид строго сформу- лированного и разработанного подо- бия. Оно было определено Евклидом («Начала», т. 6) следующим образом: «Подобными называются такие пря- молинейные геометрические фигуры, у которых углы одинаковы, а стороны, противолежащие одинаковым углам, пропорциональны». В соответствии с этим определением фигуры, показан- ные на рис. 8.1, подобны потому, что 1) их углы равны, т. е. а' = а, р' = р, у'=у, 6' = д; 2) их стороны, противолежащие равным углам, пропорциональны, т. е. a'—ka, b'=kb, ...,е'=ke, Рис. 8.1. Простое геометриче- ское подобие, основанное на группе линейных преобразо- ваний где k — коэффициент пропорциональности. Одна фигура может быть получена из другой простым линейным преобразованием, ко- торое увеличивает или уменьшает фигуру, но не искажает ее формы. Такое преобразование обычно называется конформным линейным преобразованием. Понятие геометрического подобия плоских фигур можно зна- чительно расширить, если рассматривать углы фигур как объек- ты линейного преобразования. При этом удобно представлять плоские фигуры как совокупности точек в двумерном декартовом пространстве с координатами х и у. Обобщенное геометрическое подобие плоских фигур, основанное на общем линейном преобра- зовании координат, может быть представлено уравнениями х'=k I ,хх -]- k 2 ,ху+k з 1Ж, (8.1) у' ~ki,yX-\-k2,vy-{-k3,y, где индексированные величины k являются постоянными коэффи- циентами; эти коэффициенты должны быть такими, чтобы урав- нения (8.1) единственным образом определяли решения х и у при заданных х' и у'. Преобразование (8.1), естественным обра- зом обобщающееся на случай трехмерного декартова простран- ства, обычно называют общим аффинным преобразованием. Оно включает различные виды преобразований (и подобия), такие, как преобразование, сохраняющее форму, симметричное отобра- 26* 403
У' = У у> =6 -У у'=Х + 1 а) I) И) у' = 2у У'=2у+! У'~2Х г) д) е) Рис. 8.2. Примеры плоских фигур, подобных относительно группы общих аффин- ных преобразований жение, одномерное растяжение или сжатие, вращение и т. д. Пример 8.1. Рассмотрим дискретное декартово пространство Ntr. На рис. 8.2 показано несколько фигур, которые являются подобными, т. е. переводятся друг в друга с помощью общих аф- финных преобразований. Они представляют разные характерные частные случаи: а) тождественное преобразование (исходная фигура); б) сим- метричное отображение относительно оси у и сдвиг; в) поворот и сдвиг; г) растяжение вдоль оси у, д) растяжение и сдвиг (гео- метрическое подобие); е) общий случай. Примером уравнений вида (8.1), не задающих аффинного преобразования, являются уравнения х'=х+у, у'-х-\-у. Действительно, эти уравнения не обеспечивают единственного решения х и у: существует множество решений для х и у при ус- ловии х'=у'. Геометрическое преобразование (равнопропорцио- нальное по всем направлениям) полностью сохраняет геометри- ческий объект, если не считать его увеличения или сжатия. По- этому можно говорить о том, что оно определяет строгое подобие для таких геометрических объектов, как плоские фигуры и твер- дые тела. Общее аффинное преобразование сохраняет геометри- 404
ческие объекты только приблизительно, так как допускает изме- нение формы в широком диапазоне; можно сказать, что этим пре- образованием определяется слабое подобие геометрических объектов. Нарушения формы, допустимые при общем аффинном пре- образовании, могут быть ограничены различными способами. На- пример, мы можем потребовать, чтобы все коэффициенты в урав- нении (8.1), кроме k},x и k2,v, были равны нулю. Такое преобра- зование обобщает понятие геометрического подобия, так как допускает различные коэффициенты пропорциональности в разных направлениях, но определяет менее общий тип подобия, чем при общем аффинном преобразовании. При замене одного элемента множества другим элементом по- добие между этими элементами должно рассматриваться как отношение эквивалентности, определенное на этом множестве. Поэтому оно может быть представлено как разбиение этого мно- жества определенной на нем функцией или группой отображений (взаимно однозначных и сюръективных) этого множества на себя (автоморфизмов). Например, в случае геометрического подобия (сохраняющего форму) множество всех равносторонних треуголь- ников, всех квадратов, всех окружностей или всех прямоугольни- ков, соответствующие стороны которых находятся в определен- ном отношении, являются примерами классов эквивалентности плоских фигур и в то же время блоками разбиения для данного вида подобия. С другой стороны, каждая определенная констан- та пропорциональности представляет один элемент преобразова- ний, характеризующий подобие. Хотя в этом и нет особой необходимости, интуитивное пред- ставление о подобии на заданном множестве элементов сначала формализуется с помощью группы преобразований. После того как эта группа определена, обычно делается попытка задать удобное для операций множество, элементы которого представ- ляют собой классы эквивалентности, т. е. отдельные блоки отно- шения эквивалентности, определенного на множестве группой преобразований. Такое множество обычно называется множест- вом инвариантов группы. В этом случае отношение эквивалентно- сти может быть представлено соответствующей функцией из мно- жества элементов, на котором подобие определяется на множест- ве инвариантов. Рассмотрим, например, множество всех структурированных си- стем, которое может быть определено для заданного множества переменных в том смысле, как это рассматривалось в разд. 4.7. Группа перестановок переменных определяет на множестве отно- шение эквивалентности. Примером множества инвариантов этой группы является множество всех непомеченных схем, число вхо- дов которых равно числу рассматриваемых переменных. Различ- ные виды подобия, определенные на одном и том же множестве, можно упорядочить по их общности. Один вид подобия является 405
обобщением другого тогда и только тогда, когда множество раз- биений, соответствующих первому виду, является укрупнением множества разбиений второго. Например, геометрическое подобие с различными коэффициентами пропорциональности является ме- нее общим, чем подобие, основанное на группе общих аффинных преобразований, и в то же время более общим по сравнению с геометрическим подобием, основанным на группе преобразо- ваний, сохраняющих фигуру. Если некоторый объект считается подобным другому, то каждый из них сохраняет определенные свойства при определенных преобразованиях. В действительности свойства, которые при заданной цели желательно сохранить, яв- ляются обычно основой при определении подходящей группы пре- образований. Например, если мы хотим сохранить вес геометри- чески подобных тел, сделанных из различных материалов, то кон- станта пропорциональности с должна удовлетворять уравнению с= (w/w')1/3, где w и w' — удельные веса материалов, из которых сделаны те- ла, рассматриваемые как подобные. 8.2. ПОДОБИЕ И МОДЕЛИ СИСТЕМ ...не существует неизменного и единст- венного отношения между моделью и мо- делируемым, символом и символизируе- мым, каждый может быть и тем, и дру- гим... Нет необходимости и в букваль- ном совпадении модели и моделируемо- го объекта. Г. Спенсер Браун Определенное на множестве систем отношение подобия обыч- но называют отношением моделирования. Две системы подобны, если они сохраняют некоторые общие характеристики и могут быть преобразованы друг в друга соответствующими преобразо- ваниями, примененными к другим характеристикам. При решении системных задач часто удобно (а иногда и не- обходимо) решать задачу для системы-заменителя, а не реаль- ной системы, для которой была сформулирована эта задача. Ис- пользование подходящих систем-заменителей дешевле, быстрее, безопаснее, удобней, проще для понимания и контроля, точнее, более непротиворечиво и лучше приспособлено к человеческому восприятию. Две системы (реальная и ее заменитель) должны быть подобны в достаточно строгом смысле применительно к рас- сматриваемой задаче. 406
Рассмотрим две системы х и у, которые подобны относитель- но множества преобразований, применимых к некоторым их ха- рактеристикам. Будем считать, что х— изучаемая система, а у — ее желаемое представление. Тогда х называется подлинной си- стемой (или просто подлинником), у — моделирующей системой, а у вместе с соответствующими преобразованиями называется мо- делью х. Поскольку отношение подобия симметрично (как и лю- бое отношение эквивалентности), то можно и систему у рассмат- ривать как подлинную. Какая из двух систем рассматривается как подлинная, зависит от обстоятельств. Вопрос о том, является ли какая-то система подходящей моделью для подлинной систе- мы, решается исключительно из прагматических соображений. Это решение принимается пользователем. Пользователь обычно выбирает нужную модель как заменитель подлинной, если, по его мнению, она имеет явные преимущества по сравнению с подлин- ником и в то же время не хуже любой другой из имеющихся в его распоряжении моделей. Таким образом, в этой книге термин «модель» используется в связи с определенным отношением между двумя системами. Он означает, что две системы в некотором смысле подобны и одна из них с определенной целью может быть заменена другой с по- мощью соответствующих преобразований. Моделирующая систе- ма становится моделью, если ее дополнить-преобразованиями, ко- торые соответствующим образом связывают ее с подлинником. Другими словами, каждой модели необходим подлинник. Для од- ного и того же подлинника можно построить различные модели. Помимо обычного, всем привычного значения термин «модель» в литературе используется для определения некоторых других по- нятий. К сожалению, этим термином злоупотребляют и небрежно с ним обращаются. Помимо обычного значения этот термин при решении системных задач имеет по меньшей мере три различных значения. Во-первых, термин «модель» часто используется для всех объ- ектов, которые в настоящей книге называются системами, а тер- мин «система» используется для обозначения того, что мы пони- маем как «объект». Следовательно, в соответствии с данной терминологией система — это часть мира, являющаяся предметом неких исследований, и всякое ее представление (образ) рассматри- вается как модель. Терминологически оправдано назвать процесс исследования систем моделированием. В нашей терминологии все системы рассматриваются как абстракции; некоторые из них яв- ляются описанием (образами) реальных явлений, и мы сохраним термин ‘«моделирование» для отношения подобия между систе- мами. Во втором значении термин «модель» употребляется как на- звание множества предположений, при которых решается задача. Такими предположениями являются, например, аксиомы в мате- 407.
магических теориях, используемые при решении некоторых за- дач. В этой книге для обозначения этого множества используется термин «парадигма». В литературе термин «модель» используется также для обоз- начения системы, являющейся упрощенной модификацией другой системы. Поскольку отношение упрощения антисимметрично, а отношение подобия симметрично, то, разумеется, терминологи- чески следует различать эти два понятия. Если отличать чисто абстрактные системы, не имеющие физи- ческих аналогов (без каналов наблюдения), от интерпретирован- ных систем (будем называть их физическими системами), то можно выделить четыре типа моделирующих отношений в зави- симости от природы подлинной и моделирующей системы: Подлинная система Моделирующая система Тип Физическая Абстрактная 1 Абстрактная Физическая П Физическая Физическая 111 Абстрактная Абстрактная IV К первому типу относятся все виды математических моделей. Эти модели основываются на известных физических и других за- конах природы. Они позволяют решать задачи, связанные с фи- зическими системами, с помощью математических рассуждений (алгебраических преобразований или вычислительных методов) лучше, чем с помощью экспериментов с подлинными физически- ми объектами. Можно, например, ответить на многие вопросы, связанные с искусственными физическими системами до их соз- дания. Вообще, модели этого типа позволяют воспроизвести мыс- ленный эксперимент (gedanken-эксперимент) на математических моделях гипотетического физического объекта. Например, опре- деление электрического тока и напряжения в гипотетической элек- трической цепи с помощью решения соответствующей системы алгебраических или дифференциальных уравнений предпочтитель- нее создания реальной цепи и выполнения соответствующих из- мерений. Прекрасным примером моделей второго типа являются всевоз- можные компьютеры: цифровые, аналоговые или смешанного типа. Сюда относятся также различные специальные физические системы, сконструированные как универсальные модели для ма- тематической системы определенного вида. В качестве примеров можно привести линейные анализаторы (для решения линейных алгебраических уравнений), полиномиальные анализаторы (для работы со степенными функциями), электролические ванны (для решения уравнений в частных производных). Использование мо- делей этого класса состоит в изменении некоторых параметров физической системы и измерении значений других параметров, 408
что позволяет описать решения соответствующих математических уравнений или ответить на некоторые математические вопросы. Третий тип моделей играет важную роль в технике. Наиболее простым примером этого типа являются масштабные модели, представляющие собой системы, просто увеличенные или умень- шенные в определенном масштабе по отношению к подлиннику. Они используются, например, для изучения динамических свойств новых моделей самолетов, вертолетов или ракет в аэродинамиче- ских трубах, для испытаний новых типов кораблей в специальных водных бассейнах, для проверки плотин, мостов и других строи* тельных проектов. Хотя все эти случаи сводятся к простому гео- метрическому подобию, результаты, полученные с помощью таких масштабных моделей, необходимо преобразовать соответствую- щим образом, чтобы они были применимы к подлинной системе. Действительно, при уменьшении (или увеличении) по отношению к подлиннику линейных размеров в с раз площади (т. е. площадь поперечного или продольного сечения крыла самолета) уменьша- ются (или увеличиваются) в с2 раз, а объемы в с3 раз. Задачи, возникающие в связи с изучением свойств преобразований для моделей этого типа, и их различные обобщения изучаются в тео- рии подобия или размерности. Другими примерами этого типа являются компьютеры, моделируемые на других компьютерах, авиационные тренажеры для обучения пилотов, медицинские приборы, такие, как искусственное сердце или почка. К четвертому типу относятся очень важные для прикладной математики модели. Они связаны с различными видами матема- тических преобразований (преобразования Лапласа, Фурье и т. п.), используемых для моделирования математических систем одного типа (например, дифференциальных уравнений) система- ми другого типа (например, алгебраическими уравнениями). Вме- сто того чтобы работать с подлинной системой, мы можем ис- пользовать моделирующую систему, которая значительно проще, а затем применить полученные результаты к подлиннику. Для не- которых случаев (например, для преобразования Лапласа) име- ются справочники, устанавливающие соответствие между подлин- ными и моделирующими системами. Таково в общих чертах наше понимание отношения моделиро- вания для систем; оставшаяся часть главы будет посвящена по- строению основных типов моделей в рамках концептуальной схе- мы УРСЗ. 409
8.3. МОДЕЛИ ИСХОДНЫХ СИСТЕМ Поэтические метафоры и научные абст- ракции используют при описании объек- тов несвойственные им понятия. Выбор аналогии определяется преимуществами текущего момента. Кеннет Берк Исходные системы просты в том смысле, что в них нет инфор- мации об отношениях между их переменными. Для двух заданных нейтральных исходных систем, скажем систем S и S', единствен- ный разумный способ определения их подобия заключается в том, чтобы потребовать сохранение существенных свойств каж- дого определенного множества состояний и параметрического множества при преобразованиях, являющихся взаимно однознач- ным соответствием между 1) множествами переменных этих двух систем; 2) множествами параметров этих двух систем; 3) множествами состояний переменных из п. 1; 4) параметрическими множествами из п. 2. Это, по существу, означает, что системы S и S' изоморфны в смысле их обобщенных систем, по при этом могут быть семан- тически совершенно различны (в смысле каналов конкретизации и наблюдения). Д Формально две нейтральные системы = (О, I, I, С?, #), = (О', г, г, а', ё'}, где 1=({уд V,)|teA;„}, {(wh Vi')\i<=Nn}, {(щ/, подобны тогда и только тогда, когда о, соответствует vlKi} где р обозначает перестанов- ку Nn, т. е. р: Nn-^Nn; Wj соответствует wq{j} где q обозначает переста- новку ;Vm, т. е. q: для любого Vi+-+V!:(il существует взаимно однознач- ное соответствие, при котором все существенные свойства множества У, сохраняются в множестве Ур(0; для любого Wj-*—существует взаимно одно- значное соответствие, при котором все существенные свойст- ва Wj сохраняются в Wq(j}. ▲ Если две нейтральные системы S и S' подобны в том смысле, что их обобщенные системы изоморфны, то любую из них можно 410
рассматривать как подлинную систему, а другую как моделирую- щую. Моделирующую систему вместе с преобразованием, опреде- ленным взаимно однозначными соответствиями 1—4, можно рас- сматривать как модель другой системы (подлинника). Тем не ме- нее необходимо подчеркнуть, что отношение моделирования не имеет практического смысла для исходных систем, так как не ин- дуцирует никакого подобия между подлинником и моделирующей системой, поскольку возможности их варьирования весьма огра- ничены. Оно имеет практическое значение только в случае, когда рассматриваемые исходные системы являются компонентами си- стем эпистемологически более высокого типа. Понятие подобия в этом случае уточняется с помощью дополнительных требований. Подобие исходных систем в ряде случаев может возникать как необходимое условие подобия эпистемологически более сложных систем, в которые они входят, но никогда не является достаточ- ным для такого подобия. Пример 8.2. Примером подобия исходных систем в музыке яв- ляется транспонирование из одной тональности в другую. Рас- смотрим, например, исходную систему S, определенную в приме- ре 2.6 (рис. 2.8,6) и другую исходную систему S', в которой каж- дая нота из множества понижена на один тон, а все остальное в точности так же, как в системе S. Будем далее считать, что пе- ременные, описывающие высоту тона, ритм и тональность, в од- ной системе соответствуют переменным, описывающим те же свойства в другой системе, и что все взаимно однозначные со- ответствия между множествами состояний и параметрическими множествами одинаковы. Тогда системы S и S' можно рассмат- ривать как подобные относительно преобразования их исходных систем. Произвольная партитура, описываемая в терминах си- стемы S, однозначным преобразованием транспонируется в ана- логичную запись, описываемую в терминах системы S'. Эти со- ответствия имеют смысл для исходных систем, поскольку музы- кальные записи являются их вторичными характеристиками. Но, если система S является частью некоторой системы данных D, а система S'—-частью другой системы данных D', то подобия си- стем S и S' недостаточно для определения имеющего смысл по- добия систем данных D и D'. Действительно, данные d, d' систем D, D' могут быть произвольными записями, описываемыми в со- ответствующей исходной системе, но никоим образом не связан- ными отношением подобия. Рассмотрим теперь две направленные исходные системы, ска- жем S и S', как подлинную и моделирующую. Поскольку каждая переменная этих двух систем объявлена как входная или выход- ная, исходное управление (как самой системы, так и внешней среды) однозначно определено. Как следствие, взаимно однознач- ные соответствия между множествами переменных и множества- 411
ми состояний S и S', которые требуются для подобия нейтраль- ных исходных систем, могут быть заменены входными и выход- ными соответствиями (не обязательно взаимно однозначными) так, чтобы обеспечить управление каждой переменной только из одного источника. При условии однозначности контроля (анало- гичное рассмотренному в гл. 4 требованию для структурирован- ных систем) предполагается, что входные соответствия между множествами переменных направлены из S' к S, а выходные со- ответствия между множествами переменных—из S к S'. Соот- ветствия между множествами состояний направлены в точности наоборот. Поскольку не требуется взаимно однозначного соответствия между элементами систем S .и S', то отношение моделирования между направленными исходными системами не обязательно сим- метрично; оно является квазиупорядочением (рефлексивное и транзитивное отношение), определенным на произвольном мно- жестве направленных исходных систем. Это означает, что из воз- можности использования системы S' для моделирования систе- мы S не следует, что последняя может использоваться для моде- лирования первой. Это, в свою очередь, означает, что, не являясь изоморфными, подобные системы S и S' связаны друг с другом двумя гомоморфными отношениями, одно из которых связано с входными переменными, а другое с выходными, и изоморфным отношением между их параметрами. Система S — гомоморфный образ S' для входных переменных, когда S' — гомоморфный об- раз S для выходных переменных; они изоморфны относительно их параметров. Д Формально направленная исходная система S' = (О. £ Г, О', Е') является моделирующей для другой направленной исходной си- стемы S = (6, I, Г, О, Е), где 1=({(щ, V^Nn}, и, {(wh 1'=({(u/, Vk)\kt=Km}, и', {(^', Wf')\j(=Nm}), тогда и только тогда, когда 1) для всех k^Nn, таких, что ы'(&)=0, переменная v'k пред- ставляет переменную </>, где Ро: 412
— функция входных переменных S и S', определенная на мно- жествах ЛГ0 = {/ | i(=Nn, u(i) = O}, Y0={k | k^Nn,, u'(£) = 0} соответственно; 2) для всех k^Nn отображение гомоморфно относи- тельно существенных, свойств t»Po(ft); 3) для всех i^Nn, таких что u(i) = l, переменная Vi представ- ляет переменную иРо(г), где Pi : — функция выходных переменных S и S' соответственно, опреде- ленная на множествах Х, = {i\i<=Nn, u(i) = l}, Y^ {k | kGNn,u'(k)= 1} 4) для всех iEr^a отображение Vp н>—*V| гомоморфно относи- тельно существенных свойств множества V,-; 5) Wj соответствует twg(y) где q обозначает переста- новку Nm‘, 6) для каждого j^'Nm взаимно однозначное соответствие Wj^-Wq(j} изоморфно относительно существенных свойств Wj. Система S' совместно с отображениями 1—6 является моделью системы S. Введем следующие названия для пар отображений: входные отображения: 1, 2; выходные отображения: 3, 4; параметрические отображения: 5, 6. Некоторые примеры этих отображений будут рассмотрены для моделей направленных систем более высокого эпистемологи- ческого уровня. ▲ 8.4. МОДЕЛИ СИСТЕМ ДАННЫХ Суть моделирования заключается в ус- тановлении соответствия между парами систем. Бернард Зейглер Легко обобщить понятие моделей исходных систем на модели систем данных. Рассмотрим две нейтральные системы данных D=(S, d), D'=(S', d'), 413
tilt It tit tt It ftl It If to. 1,2,3, 4,5. 6,7,8, 9,10, 11,12, 13,14,15, 1617,18,19} 6) Рис. 8.3. Моделирование системы данных (пример 8.3) и пусть D рассматривается как подлинная система. Тогда D' можно считать системой, моделирующей систему D, если существует преобразование (множество взаимно однознач- ных соответствий) между S и S', при котором S' является мо- делирующей системой S (разд. 8.3); отношение моделирования между S и S' сохраняет данные d в системе D'. Таким образом, модель системы данных — это такая модель исходной системы, которая сохраняет и ее данные. Другими сло- вами, если D — подлинная система данных и D' — моделирую- щая система данных, то они изоморфны (при соответствующих взаимно однозначных соответствиях) в смысле подобных систем и относительно данных. Пример 8.3. Рассмотрим мелодию, партитура которой приве- дена на рис. 8.3. Пусть, как и в примере 2.6 (рис. 2.8), мелодия описывается системой данных D'. Будем считать, что временное множество и переменная, соответствующая ритму, например пе- 414
ременная и/, определены так же, как и в примере 2.6. Положим далее, что переменная и2', соответствующая высоте тона, опреде- лена так, как показано на рис. 8.3,6. Обозначим через D систему данных, определенную в примере 2.6, но без переменной из (то- нальности). Тогда легко убедиться, что D'— моделирующая си- стема для D (и наоборот) при следующих взаимно однозначных соответствиях: 1) и/ соответствует и2, у/ соответствует щ; 2) время t' соответствует времени t\ 3) V/-f-+V2 — тождественное отображение, а опреде- ляется уравнениями ( 19 —+ 1 при £>!=£(), — 10 при Cj 4) 7v-<-»-7' — взаимно однозначное отображение двух времен- ных множеств. Принятая в музыке терминология описывает связь этих двух мелодий как комбинацию инверсии и транспозиции. Мелодия, опи- сываемая системой данных D', получена из мелодии, описывае- мой системой данных D, в результате инверсии и понижения на один тон; аналогично мелодия, описываемая системой данных D, получена из мелодии, описываемой системой данных D', в ре- зультате инверсии и повышения на один тон. Иногда достаточно определить модель системы данных менее строго, отказавшись от требования выполнения отношения моде- лирования между S и S'. В этих случаях отношение моделирова- ния между системами данных D и D' представляется в терминах взаимно однозначных соответствий ¥-<-»-¥' и W-<->W' между мно- жествами обобщенных состояний и обобщенных состояний пара- метров двух систем данных, при которых данные сохраняются. Необходимо подчеркнуть, что применимость моделей такого типа несколько ограничена до тех пор, пока в них не учитываются конкретные отношения между отдельными переменными и пара- метрами двух систем. Используемые для описания глобальных связей системы назовем глобальными моделями данных. Пример 8.4. Рассмотрим мозаику, показанную на рис. 8.4,а. Ее можно описать как систему данных со следующими компо- нентами: параметр, являющийся двумерным пространством х, у (хеЛ^ол, г/еЛ^о.з), которое представляет собой прямоуголь- ную область, разбитую в шахматном порядке на квадраты; восемь переменных и, каждая из которых описы- вает цвет определенной подобласти каждого квадрата, как это показано на рис. 8.4,6; множества состояний всех переменных одинаковы и со- стоят из трех цветов: черного — Ч, белого — Б, серого — С; 415
V1 v2 v5 иб v7 v8 ч .5 ч с С 6 ч 5 0 0 6 Ч Б С С ч 5 ч 0 7 б с Б Ч ч с 5 с / 1 с б С ч Рис. 8.4. Глоба V льное Б С г) ^моделирование 6 данных 1 (пример 8.4) 0 416
данные d, формально описывающие мозаику: матрица 4Х Х5, элементами которой являются восьмерки букв Ч, Б, С, представляющие комбинации цветов в определенных обла- стях параметрического множества. Рассмотрим другую систему данных (назовем ее D'), состоя- щую из меняющихся во времени t переменных и/, и2', каждая из которых может принимать два значения. Значения d' меняются периодически; один период показан на рис. 8.4,в. Читатель мо- жет легко убедиться, что данные d сохраняются в данных d' при преобразовании t~x-\-by (/^19) между множествами параметров, а также при преобразовании, показанном на рис. 8.4,г, для множества состояний двух систем. 8.5. МОДЕЛИ ПОРОЖДАЮЩИХ СИСТЕМ Наибольшая опасность аналогии заклю- чается в том, что подобие принимается за доказательство тождественности. Кеннет Берк Если в моделях систем требуется, чтобы данные сохранялись, то в моделях порождающих систем требуется сохранение свойств ST-функций. Тем не менее нет оснований требовать сохранения масок систем с поведением в их моделях. В самом деле, те же результаты можно получить или с помощью параметрических по- следовательностей состояний одной переменной или совместных состояний нескольких переменных. Это утверждение лучше всего пояснить на примере разных устройств последовательных и па- раллельных компьютеров (например сумматоров). Если допускаются преобразования масок подлинной и модели- рующей порождающих систем, то это заменяет преобразования их исходных систем, причем предполагается, что исходные си- стемы подлинной и моделирующей порождающих систем связаны только через параметры и параметрические множества. Сущест- вуют особые случаи, когда преобразования между масками яв- ляются на самом деле преобразованиями между переменными исходных систем (например, систем с поведением без памяти). Как было показано в гл. 3, каждая ST-система может быть единственным образом преобразована в изоморфную систему с поведением. Таким образом, при обсуждении моделей порож- дающих систем можно без потери общности ограничиться систе- мами с поведением. Это также позволит нам упростить запись, исключив индексы В и S, используемые обычно для различения систем с поведением и ST-систем. 27—6923 417
sb - 2-Si О 2 1 0,1 1 2 1 0,1 2 0 2 0,2 О 1 0 0,2 1 2 0 0,1 2 О 0 0,1 О 2 2 0,2 0,2 000 0,1 1 2 1 0,1 1 2 2 0,1 2 О .0 0,2 2 12 0,1 2 2 1 0,2 2 2 2 Входные переменные: shs3 Выходные переменные: Входные переменные^, Выходные переменные: sj, Рис. 8.5. Отношение моделирования двух систем с поведением (пример 8.5) Рассмотрим две нейтральные системы с поведением F=(S, М, f), F'=(S', М', f'), и пусть F рассматривается как подлинная система. Тогда F' яв- ляется моделирующей F системой, если 1) существуют взаимно однозначные соответствия между параметрами и параметрическими множествами в S и S', при которых свойственные параметрам особенности сохраняются, как это требуется при подобии исходных систем (разд. 8.3); 2) существует взаимно однозначное соответствие между масками двух систем; 3) для любых выборочных переменных Si из системы F, определяющих выборочные переменные из системы F' (i, в соответствии с п. 2, существует взаимно одно- значное соответствие между множествами их состоя- ний, при котором существенные особенности S, сохраняются в S*; 4) при преобразованиях (взаимно однозначных соответст- виях) 1—3 функция сохраняется в системе F'. 418
Назовем систему F' вместе с взаимно однозначными соот- ветствиями 1—3, сохраняющи- ми функцию f, моделью систе- мы F со строго определенным поведением. Как показано ни- же, в ряде случаев это понятие можно различными способами обобщить. Пример 8.5. На рис. 8.5 при- веден пример отношения моде- Рис. 8.6. Гидравлическая модель мате- лирования между двумя систе- матнческой системы с поведением мами с поведением (направ- ленными, вероятностными). Предполагается, что параметрические множества обеих систем полностью упорядочены, а множества состояний никаких особых свойств не имеют. Исходные системы этих систем не описаны, по- скольку для описания отношения моделирования они не нужны. Взаимно однозначные соответствия между выборочными пере- менными двух систем с поведением показаны стрелками сверху таблиц функций поведения. Преобразования между множествами состояний соответствующих переменных описаны уравнениями, помечающими связи. На рисунке показано также предполагаемое преобразование между обобщенными состояниями двух систем. Очевидно, что необходимое (но не достаточное) условие для от- ношения моделирования между двумя системами с поведением состоит в том, что распределение f'(c') (распределение вероятно- стей, возможностей или какое-либо иное) является перестановкой распределения f(c). Предполагается также, что обе системы яв- ляются системами без памяти и что их направленные функции поведения получены из их нейтральных аналогов (см. рис. 8.3). Пример 8.6. Рассмотрим цилиндрический и конический объ- емы, соединенные трубкой с пренебрежимо малым объемом (рис. 8.6). На этой гидравлической системе можно определить детерминированную систему без памяти, состоящую из двух пе- ременных и отношения между ними, определяемого объемами со- судов, где х — объем воды, содержащейся в сосудах, измеряется в куби- ческих сантиметрах с точностью до 1 см3; у — высота уровня воды, измеряется в сантиметрах с точно- стью до 0,1 см. Очевидно, что значения переменных меняются во времени. Рассмотрим теперь математическую систему с поведением, состоящую из двух переменных х' и у', функция поведения кото- рой y'—f'(x) определяется действительными решениями урав- 419
нения ру'3+яу'=х', где р и q — постоянные коэффициенты. При соответствующих объемах гидравлическая система может быть использована для решения кубического уравнения. Получим выражения для отношения моделирования между этими двумя системами; обозначим радиус цилиндра (см) и от- ношение радиуса к высоте конуса соответственно а и Ь. Тогда объем воды в цилиндре равен па2у. Объем воды в конусе равен 1/Злг%г/, где Гу — радиус плоского сечения конуса, соответствующего высо- те у (см). Поскольку b = rvly, то выражение для объема воды в конусе можно переписать в следующем виде: 1/ЗлЬ2г/3. Полный объем воды в двух емкостях обозначим через х и тогда ла2г/+ l/3nb2y3=x. Чтобы преобразовать это уравнение в уравнение математиче- ской системы, задаваемой переменными х' и у', значения вели- чин а и b должны быть выбраны таким образом, чтобы удовлет- ворять соотношения ла2=<7; 1/ЗлЬ2=р. Отсюда сразу следует, что гидравлическую систему с парамет- рами a=(q/n)'/2, Ь=(3р/л)1/2 можно использовать для решения кубического уравнения, по- скольку отношение между х и у описывается тем же уравнением, что и отношение между х' и у'. Для направленных систем с поведением отношение моделиро- вания не предполагает существования обязательных взаимно од- нозначных соответствий между множествами переменных и мно- жествами состояний подлинной и моделирующей систем. Вместо этого при желании можно использовать входные и выходные ото- бражения, как это обсуждалось в разд. 8.3 для направленных ис- ходных систем. Пример 8.7. В качестве простого примера отношения модели- рования между двумя направленными системами с поведением можно привести принцип действия, использующийся в логариф- 420
(числа) х 1У Подлинник А X * Z - ху (число) Рис. 8.7. Правило сдвига иа логарифмической линейке как модель поведения f.Z-xy (число) мической линейке: произведения двух действительных чисел оп- ределяются сложением соответствующих отрезков на двух линей- ках. Соответствие входных и выходных данных этого хорошо из- вестного примера приведено на рис. 8.7. Пример 8.8. Чтобы проиллюстрировать отношение моделиро- вания между направленными системами с поведением, для кото- рого входные соответствия не взаимно однозначны, рассмотрим подлинную систему, содержащую входные переменные х и у, выходную переменную z и функцию поведения (детерми- нированную без памяти) z=3sin(x-|-i/); 421
Рис. 8.8. Отношение моделирования между двумя направленными системами с поведением, у которых входные данные ие взаимно однозначны (пример 8.7) моделирующую систему, содержащую входные переменные Xi, xs, yi, у2, выходную переменную г' и функцию поведения Х' = Х1Х2+У1У2. Положим, далее, что эти системы основываются на одном и том же параметре. Хотя эти две функции поведения выглядят совершенно раз- лично, вторая система может быть использована как моделирую- щая при соответствиях входных и выходных данных. Такие соответствия показаны на рис. 8.8. Рассмотрите обратные отобра- жения между множествами переменных и соответствующими мно- жествами состояний. 422
б) х у Z L L L Н Н L И И L L L И б) i у z Логические функции 7 7 7 ИЛИ 112 НЕ ИЛИ 12 1 Импликация 122 Ингибиция 2. 1 1 Импликация 212 Ингибиция 2 2 1 НЕ И 2 2 2 И г) Рнс. 8.9. Физическая система, которую можно использовать для моделирования некоторых абстрактных систем (пример 8.9) Пример 8.9. Рассмотрим простую электрическую цепь с двумя полупроводниковыми диодами, схема которой показана на рис. 8.9. Она содержит две входные переменные х и у и одну вы- ходную z, которые определяют напряжения. Предположим, что на вход подаются два различных значения напряжений, одно из которых меньше, а другое больше постоянного значения V. Обо- значим эти две величины (состояния переменных) L и Н соот- ветственно. Подавая на вход различные комбинации этих двух напряжений н измеряя выходную переменную, можно построить функцию поведения f, приведенную на рис. 8.9, где буквы L и Н для выходной переменной имеют тот же смысл. Предположим теперь, что мы хотим использовать систему с поведением, определенную иа дайной электрической схеме, для моделирования логических функций. Это можно сделать с по- мощью соответствующих предположений относительно данных трех физических переменных и использования функции f для оп- ределения истинности каждого предположения. Они здесь могут быть двух типов: либо «переменная х (или у, или z) находится 423
в состоянии £», либо «переменная х (или у, или г) находится в состоянии Я». Эта физическая система может использоваться для моделирования различных логических функций в зависимо- сти от комбинаций двух типов предположения для трех пере- менных. Например, если первый тип предположения относится ко всем трем переменным, то состояния L или Н делают соответст- вующее предположение истинным или ложным. Обозначим истин- ность и ложность для данного предположения соответственно Т и F. Подобное использование физической системы для моделиро- вания логической функции ИЛИ (дизъюнкции) показано на рис. 8.9,в. Все логические функции, которые могут быть смодели- рованы рассматриваемой физической системой сведены в таблицу на рис. 8.9,г, цифрами 1 и 2 обозначены предположения соответ- ственно первого и второго типа. Также можно ввести понятие глобального моделирования по- ведения, аналогичное понятию глобального моделирования дан- ных. Оно определяется через взаимно однозначное соответствие между обобщенными состояниями выборочных переменных двух систем с поведением, при котором их функции поведения сохра- няются. Таким образом, глобальное моделирование поведения есть изоморфное отношение между двумя множествами обобщен- ных состояний. Пример 8.10. Отношение глобального моделирования данных, рассмотренное в примере 8.4 (мозаика), можно легко переформу- лировать как отношение глобального моделирования поведения. Рассмотрим маску из двух столбцов, и пусть и/' и и2" определя- ются уравнениями = 1’1.« + 1 И V2,t ~Г2.? + Г Тогда с/ V2' U1 ' v2" 0 0 0 1 0 1 1 1 1 1 1 0 1 0 0 0 есть множество всех состояний выборочных переменных (в со- ответствии с данными, определенными на рис. 8.4,в). Эта система детерминирована: состояния порождаемых выборочных перемен- ных u"i, v"2 однозначно определяются состоянием порождающих переменных и'ь и'2. При взаимно однозначном соответствии, по- казанном на рис. 8.4,2, она изоморс^1а системе, представляющей мозаику, при условии, что последняя переформулирована анало- гичным образом в виде системы с поведением. Отношение моделирования между системами с поведением может быть обобщено с помощью замены преобразования меж- 424
Рис. 8.10. Отношение моделирования между последовательным и парал- лельным сумматорами (пример 8.10) c=(x+y + C-t -(i+y+c.,)(mod 2)1/2 a) ^L У, c, xt6 У/в hs C15 S) Zi = Zi + yi + Ci_1(tTlod2l c^l^+y^c^/-(ii+yi + Ci_i)(mod2)]/2 (i£N!S, Cg-01 ду масками преобразованием между участками (ячейками) выделенных сегментов масси- вов данных, при котором по- рожденные данные при тех же начальных условиях сохраня- ются. Пример 8.11. Рассмотрим отношение моделирования между последовательным (см. пример 4.9) и параллельным двоичными сумматорами. Бу- дем считать, что эти суммато- ры предназначены для сложения пар двоичных чисел, содержа- щих по 16 цифр. Эти маски и функции поведения последова- тельного и параллельного сум- маторов показаны на рис. 8.10,а, б соответственно. Перемен- ные х, у (или х', у') представляют цифры в складываемых чис- лах; z (или z')—сумму цифр; с (или с') —то, что следует пере- нести в следующий разряд. В обоих случаях параметром является время. У параллельного сумматора нет памяти. Он содержит 64 пере- менные и складывает два двоичных числа, в каждом из которых 16 цифр. Для выполнения того же сложения последовательному сумматору потребуется 16 последовательных тактов. В последова- тельном сумматоре два числа представляются временной после- довательностью из 16 состояний входных переменных х, у, а результат представляется временной последовательностью выход- 425
ной переменной z и последним состоянием переменной с, как по- казано на рис. 8.10,в; последнее состояние с — это наибольшая значащая цифра суммы. Предположим, что сразу после завер- шения одной операции сложения начинается другая с соответст- вующими начальными условиями (переносимая часть вновь при- равнивается к нулю). Для описания отношения моделирования между двумя сум- маторами, очевидно, недостаточно определить его только в тер- минах взаимно однозначных соответствий между их выборочны- ми переменными, множествами состояний и параметрическими множествами. Необходимо ввести комбинированное преобразова- ние, включающее выборочные переменные и параметрические множества. Таким преобразованием в данном случае является взаимно однозначное соответствие между состояниями перемен- ных xi, yt, Zi, Ci в моменты времени tp и состояниями переменных х, у, z, с в моменты времени k=i-|-16(/p—1) соответственно (ieA/is), где tp и ts — времена для параллельного и последова- тельного сумматоров. Видно, что если для всех то Z, t = Z/ исг/— с, 1,1 Р rs 1,1 р S для всех при комбинированном преобразовании, т. е. сум- маторы взаимозаменяемы. На самом деле достаточно, чтобы вто- рое уравнение выполнялось только при i=16 (последний пере- нос). В комбинированном преобразовании, проиллюстрированном на примере последовательного и параллельного сумматоров, предпо- лагается сдвиг в параметрическом множестве одной из систем, отношение моделирования которого рассматривается. При этом вводятся новые переменные, в некотором смысле аналогичные выборочным переменным. Поскольку эти переменные вводятся для установления отношения моделирования с другой системой, их можно назвать моделирующими переменными. Существует много различных способов, с помощью которых общая модель поведения может быть строго определена с по- мощью комбинированных преобразований между моделирующи- ми переменными, так же, как в примере 8.11. 426
8.6. МОДЕЛИ СТРУКТУРИРОВАННЫХ СИСТЕМ ...несмотря на то, что отношение модели- рования представляется бинарным, на самом деле это триада; нечто может считаться моделью чего-то другого тог- да и только тогда, когда можно выде- лить некие аспекты, в смысле которых одна сущность похожа на другую, а со- ответствующие их свойства являются общими. Маркс Вартофски Как отмечалось ранее, целью замены одной системы (подлин- ной) другой (моделирующей) является получение определенных преимуществ при решении какой-то задачи, связанной с подлин- ной системой. При использовании одной структурированной си- стемы для моделирования другой структурированной системы до- статочно, чтобы сохранялись связи между некоторыми множест- вами переменных (при определенных отображениях переменных, параметров, множеств состояний и параметрических множеств) и совершенно не важно, сохраняется ли в модели структура под- линной системы (ее элементы и связи между ними). Представля- ющие интерес ограничения получаются как для подлинной струк- турированной системы, так и для ее модели с помощью опреде- ленной композиционной процедуры, как объяснено в гл. 4. Модели этого вида в действительности являются моделями порож- дающих систем, хотя рассматриваемые порожденные системы по- лучаются из соответствующих структурированных систем. Примерами отношения моделирования этого вида являются любые две структурированные системы, имеющие одну и ту же несмещенную реконструкцию (см. задачу реконструкции в разд. 4.7). Настоящая модель структурированной системы должна сохра- нять не только связи между входящими переменными, но и струк- туру (т. е. элементы и связи) подлинника. При этом важно пони- мать, что элементы моделирующей системы не обязательно должны быть в точности такими, как в подлинной системе. Требуется толь- ко, чтобы они удовлетворяли отношению моделирования, соответ- ствующему эпистемологическому уровню, на котором они опре- делены. Рассмотрим две структурированные системы SX={(iV', ’X)|ie^}, SX'={(/V", /Х')|/е^}, 427
a) Система^?' Ху S) Рис. 8.11. Структурированная система из примера 8.12 где ’X, 'X' —это исходные системы, системы данных или порож- дающие системы, нейтральные или направленные, а X, X' — обо- значения системных типов. Пусть SX рассматривается как под- линная система. Тогда SX' определяется как система, моделиру- ющая систему SX, если существует взаимно однозначное соответ- ствие между элементами SX и SX', например, z-.Nq~Nq, при котором 428
Модель SF V1 V2 V3 V7 = V1V2+V1V3 + V2V3 Рис. 8.12. Модель структурированной системы, показанной иа рис. 8.11,а (при- мер 8.12) 429
1) если /=z(i), то ;Х' вместе с соответствующими отобра- жениями является моделью элемента ;'Х; 2) все связи из системы SX сохраняются в системе SX' при включенных в отношение моделирования связях между элемен- тами ’X и /X' (i, /еЛ^). Пример 8.12. Рассмотрим структурированную систему SF, опи- сываемую блок-схемой рис. 8.11,а. Переменные V2, ..., Vi пред- ставляют утверждения. Каждая из них может иметь два значения: истинное (Т) и ложное (F). Система реализует функцию боль- шинства (см. пример 4.8): ее выходная переменная принимает значение Т тогда и только тогда, когда две из трех входных пере- менных ui, V2, »з принимают значение Т. Рассмотрим теперь структурированную систему SF', описывае- мую блок-схемой на рис. 8.11,6. Ее элементами являются электри- ческие цепи с полупроводниковыми диодами, поведение которых описано в примере 8.9. Эту систему можно использовать для моде- лирования структурированной системы при однозначном отобра- жении z:j=i в предположении, что введены соответствующие отображения между переменными и множествами состояний двух систем, при которых элементы системы SF' становятся моделями соответству- ющих элементов системы SF, полная модель системы SF, осно- ванная на системе SF', показана на рис. 8.12; Г обозначает функ- цию поведения, определенную на рис. 8.9,6, a f — расширение той же функции для трех входных переменных (т. е. выходная пере- менная находится в состоянии Н только при условии, что все входные переменные находятся в состоянии Н). Легко видеть, что 1) каждый элемент системы SF представляется моделью в полной модели структурированной системы SF; 2) все соединения между элементами SF сохраняются в полной модели SF как соединения между их моделями. 8.7. МОДЕЛИ МЕТАСИСТЕМ ...использование в науке моделей и так называемых «аналогий» — просто смена языка: одна система используется для представления другой. Аарон Сломан Хотя для целей моделирования в некоторых случаях удобно использовать метасистемы, обычно достаточно, чтобы моделирую- щая метасистема сохраняла только ограничения между некоторы- 430
ми переменными (при соответствующих отображениях перемен- ных, параметров, множества состояний и параметрических мно- жеств), представленными подлинной метасистемой. Как правило, не важно, сохраняются или нет в модели элементы и процедура замены подлинной метасистемы. Если они не сохраняются, то в действительности модель не является моделью метасистемы, да- же в том случае, когда используются метасистемы. Настоящая модель метасистемы должна сохранять не только ограничения на рассматриваемые переменные, но также элементы и процедуру замены подлинника. Рассмотрим две метасистемы MX=(W, Я?, г), MX'=(W', Я?', г'), где 36, 36' — множества их элементов, и пусть MX рассматривает- ся как подлинная метасистема. Тогда MX' считается моделирую- щей MX метасистемой, если существует взаимно однозначное со- ответствие между множествами 36 и 36', например z-.Зб' — Зб, при котором 1) если x=z(x), то х' вместе с соответствующими отобра- жениями является моделью х; 2) процедура замены г сохраняется в метасистеме MX' при взаимно однозначном соответствии между W и W', и отобра- жения, входящие в отношения моделировния между элемен- тами множеств 36 и 36', связаны друг с другом с помощью функции г. Предоставим читателю возможность в качестве упражнения обобщить это определение на метасистемы более высокого поряд- ка и построить несколько примеров моделей метасистем. ПРИМЕЧАНИЯ 8.1. В качестве введения в теорию подобия можио порекомеидовать книгу [139]. Более подробное изложение с приложениями к теплопередаче и диффузии, гидродинамике, упругим деформациям и химическим реакциям можно иайти в кни- ге [35]. Могут также оказаться полезными некоторые другие источники, напри- мер [204, 290]. 8.2. По-видимому, наиболее естественная математическая формализация для различных видов подобий систем предложена в теории категорий [14, 128, 155]. В этой главе такой формализм ие рассматривается, поскольку, пока теория кате- горий не включена в общеобразовательные курсы, неразумно считать, что чита- тель с ией знаком. Заинтересованный читатель может обратиться к книге [274], в которой используется теоретике категорийная формулировка подобия систем. 431
УПРАЖНЕНИЯ 8.1. Определите аффинное преобразование между а) двумя окружностями с различными радиусами; б) окружностью и эллипсом; в) квадратом и прямоугольником. 8.2. Положение центра металлического шара, висящего на пружине в резуль- тате воздействия внешней силы (рис. 8.13) описывается функцией от времени x(t), удовлетворяющей дифференциальному уравнению mx-\-rx-}-ex=f (t), где т, г, е обозначают соответственно массу шара, коэффициент механического сопротивления и упругость пружины, a f(t)—входная (приложенная извне) вертикальная сила, действующая иа шар и меняющаяся во времени. Электриче- ский ток в цепи, показанной на рис. 8.13,6, описывается функцией от времени »(/), удовлетворяющей уравнению Li’4-Rl-}-i/C=v(t), где L, R, С — соответственно индуктивность, сопротивление и емкость цепи; v(t)—идеальный источник напряжения. Рассмотрите подобие двух систем, при котором f, v и х, I рассматриваются соответственно как входные и выходные переменные. 8.3. Объясните принцип преобразования Лапласа в терминах модели с по- ведением. 8.4. Сформулируйте отношение моделирования между соответствующей исходной системой, описывающей некоторый тип мозаики (см. пример 8.4), и исходной системой, описывающей музыкальную композицию (см. пример 2.8). Используйте отношение моделирования для преобразования определенной мозаи- ки в соответствующую музыкальную композицию и наоборот. 8.5. Предположим, что функции поведения двух направленных детерминиро- ванных систем с поведением без памяти Fa и F'a определены соответственно таб- лицами V1 V2 v3 *1 *2 Х 3 0 0 1 0 0 0 0 1 0 0 1 1 1 0 0 1 0 1 1 1 1 1 1 0 Определите входные и выходные отображения, при которых а) система F'a моделирует систему Fe; б) система Fa моделирует систему F'a. 8.6. Измените значения х3 в упражнении 8.5 так, чтобы получить систему, которую нельзя использовать как систему, моделирующую F'a. Сколько может быть таких изменений? 432
8.7. Пусть каждая из следующих пар уравнений описывает функции поведе- ния двух направленных систем с поведением (детерминированных и без памяти). Предположим, что выходные переменные находятся в левых частях уравнений. Для каждой из пар найдите отображения, при которых вторая система вместе с отображениями может быть использована как модель первой: а) Оз=О1Р2, хз=(*Н-*2),—(*'“Хг)2.’ б) а2 = 2cos2 Vi, х2= l/fl-l-Xi); в) Цз = ащ4^у2> •*з=«14-^*г. 8.8. Множество ST-функций определено направленными графами, изображен- ными на рис. 8.14. Стрелками в каждом случае показаны все возможные пере- Рис. 8.14. К упражнению 8.8 433
Источник тока Источник напряжения Рис. 8.15. К упражнению 8.9 мещеиия. Найдите пары таких ST-функций, которые могут использоваться для моделирования друг друга. 8.9. Две направленные системы с поведением Fs и F'b определены на про- стых электрических схемах, показанных на рис. 8.15: а) рассматривая резисторы как элементы, преобразуйте системы с поведе- нием в соответствующие структурированные системы SFB и SF'b; б) покажите, что система SF'b может моделировать систему SFb и наоборот.
ГЛАВА 9. УРСЗ: АРХИТЕКТУРА, ПРИМЕНЕНИЕ, ЭВОЛЮЦИЯ По-видимому, ничему стоящему научить нельзя — учитель может только указать возможные пути. Ричард Олдингтоп 9.1. ЭПИСТЕМОЛОГИЧЕСКАЯ ИЕРАРХИЯ СИСТЕМ: ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ Философию можно не замечать, но уйти от нее нельзя, и те, кто ее игнорирует, больше всего от нее зависят. Дейвид Хокинс Эпистемологические типы систем, рассматриваемые в схеме УРСЗ, включают исходные системы и их компоненты (объектные системы, конкретные и общие представляющие системы), системы данных, порождающие системы (системы с поведением или ST-си- стемы), структурированные системы различных типов и уровней. Кроме того, каждый из этих системных типов может быть как на- правленным, так и нейтральным. Эпистемологические типы систем в УРСЗ можно частично упо- рядочить. Рассмотрим два типа систем, например х и х', и будем считать, что системный тип х эпистемологи чески ниже системного типа х' тогда и только тогда, когда: 1) для любой заданной системы типа х' существует единствен- ная процедура, основанная исключительно на этой системе и ис- пользующая всю имеющуюся в ней информацию, с помощью кото- рой при подходящих начальных и других соответствующих усло- виях получается хотя бы одна система типа х; 2) не существует процедуры, с помощью которой только из за- данной системы типа х можно получить единственную систему ти- па х', т. е. всегда есть некоторая неопределенность и, следователь- но, некоторая степень произвола при определении системы типа х' из системы типа х. Пусть для двух данных эпистемологических системных типов х и х' х < х' означает, что тип х эпистемологически ниже типа х'. Тогда пара ^ = (<3(<, 435
Таблица 9.1. Эпистемологическая иерархия, полурешетка типов систем в УРСЗ: Л?/ = ('/<) Тип системы Непосредственный преемник в полурешетке S Нет D S F D (ssiM'”o/ s (S' М ')'S для определенного 1 (S 'М 1 )'S для определенного i (Ss«Mm‘)/ D (S ‘ ’лЛ)/ D для определенного 1 (S ‘М 1 )' D для определенного i S. ш. • (S ‘М *)' S (Ssi!Ami)l F (Ss< F для определенного i (Ss‘fAm‘ F для определенного i s. m. (S 'M ')' D (M"Ws (Mm« '(Ss‘)'S для определенного i (M ‘Ss« *)' S для определенного i 0 V')' D для определенного i (Mm‘Ss‘ ')/ D для определенного i (Mm‘Ss‘)' S (M7,‘BS0< F (М’”‘ ISS‘)/ F для определенного i (М™85‘ '); F для определенного i F где обозначает множество всех эпистемологических типов си- стем УРСЗ (как нейтральных, так и направленных), таких, что общее число уровней структурированных систем и метасистем в любом системном типе не превышает I, определяет эпистемологи- ческую иерархию в системе УРСЗ (teN). Для каждого /eN, Ж — полурешетка. Только при рассмотре- нии гомогенных структурированных систем или метасистем Ж со- стоит из |^|=3 (2'н_ 1) элементов. В качестве примера на рис. 9.1 показан случай 1=2 В табл. 9.1 определена полурешетка Ж при произвольных конеч- ных I (с учетом ограничения условия гомогенности структуриро- ванных систем и метасистем). Обозначения 436
(Ssi ЛП)' X, (jvn s’<)' x используются соответственно для последовательностей Мт1 Ssi Ss2 ... Mm/Ss/X, где X обозначает системный тип, а /, пц (i^N4) — некоторые натуральные числа; допускается случай, когда тп/=0 в первой и s/=0 во второй последовательностях, и S°X, М°Х интерпретирует- ся как X. Необходимо, чтобы 3 + ▲ /еУ/ 9.2. МЕТОДОЛОГИЧЕСКИЕ ОТЛИЧИЯ (РЕЗЮМЕ) Слишком сильное обобщение ведет к бессмыслице. Наиболее плодотворным является достаточно сильное обобщение, ограниченное, по счастью, конкретными реалиями. Альфред Норт Уайтхед Каждый класс систем, характеризующийся неким эпистемоло- гическим типом, будет в дальнейшем классифицироваться с помо- щью соответствующих ему методологических отличий. Как было показано выше (разд. 2.3), суть методологических отличий состоит в том, чтобы при решении системных задач отличать системы, тре- бующие применения различных методов. Существенной проблемой архитектуры УРСЗ является выбор соответствующих методологических отличий для различных эпи- стемологических типов систем. Выбор можно начинать с наиболее общих методологических отличий, соответствующих различным си- стемным свойствам, и продолжать по мере конкретизации. Жела- тельно упорядочить результирующие методологические отличия в зависимости от степени конкретизации. Поскольку всегда ком- бинируется несколько категорий, то результирующее упорядоче- ние является только частичным. На архитектурном уровне желательно выделить основные ка- тегории методологических различий и свести их к небольшому на- бору важных и наиболее общих отличий для каждой категории. Но в то же время в архитектуре УРСЗ должна учитываться воз- можность расширения этих множеств в различных реализациях УРСЗ. 437
Таблица 9.2. Сводка важнейших методологических отличий, рассматриваемых на одном уровне архитектуры УРСЗ 1 Характеристика системы Методологиче- ские отличия Эпистемологи- ческие типы систем Варианты возмож- ного развития Ссылки Переменные Нейтральные Направленные Все Смешанные Разд. 2.5 Каналы наблю- Четкие Все Смешанные Уравнения дения Нечеткие (2.2), (2.3) Множества со- Без свойств Все Интервальные Уравнения стояний и пара- шкалы (2.8) —(2.10) метрические Разд. 2.3. 2.4 множества Содержатель- Рациональные (рис. 22, табл. 2.1) ные комбинации шкалы свойств упоря- дочения, рассто- яния и непре- рывности Другие шкалы Данные Полностью оп- ределенные Не полностью определенные D или XD Разд. 2.6 С несуществен- иыми элемента- ми Четкие D или XD Смешанные Уравнение (2.21) Нечеткие Уравнение (2.27) Периодические Апериодиче- D или XD Смешанные Разд. 2.6 Маска ские Без памяти F или XF Компактная Разд. 3.2 С памятью Разд. 3.8 Ограничиваю- щая функция Функция пове- дения ST -функ- ция Детермипиро- F или XF Функция пове- F или XF Основаны на других подмно- Уравнения (3.14), (3-16) дения или ванная жествах нечет- Уравнения ST-функция ких мер (3.18). (3.19) Вероятностная Возможностная Уравнения (3.20), (3.21) Элементы Согласованные SXF Разд. 4.3, структурирован- Несогласован- 4.4 иых систем ные 1 X обозначает последовательность операторов S н М, F — порождающие системы лю- бых типов. 438
В разных местах этой книги в связи с отдельными эпистемоло- гическими типами систем вводились методологические отличия, которые считались достаточно значимыми, чтобы выделить их в архитектуре УРСЗ. Список категорий этих существенных отли- чий приведен в табл. 9.2. Каждая категория характеризуется си- стемным свойством, для которой она определена, списком индиви- дуальных методологических отличий, эпистемологическими типами систем, к которым они приложимы, примерами возможных расши- рений н соответствующими ссылками. 9.3. УСЛОВИЯ ЗАДАЧИ Как только задача четко сформулирова- на, решить ее обычно достаточно про- сто. Роберт Розен Условия задачи определяют задачи на множестве рассматри- ваемых систем. В каждом условии рассматривается либо одна система, либо пара систем. Аналогично тому, как системы клас- сифицируются в соответствии с их типами, так и условия класси- фицируются по типам. При правильном определении любой тип условий должен быть таким, чтобы изменения отдельных условий, принадлежащих этому типу, не приводили к изменению методо- логии. Хотя конкретные условия задачи так же, как и их типы, имеют смысл только для отдельных типов систем, можно в общем случае выделить четыре широкие категории условий задачи. Каждое условие может быть либо требованием ответа на вопрос, либо требованием удовлетворить запрос, либо требованием достижения цели, либо требованием удовлетворить какому-либо ограничению. В одной задаче может быть скомбинировано несколько условий, т. е. одна или больше целей могут быть скомбинированы с одним или несколькими ограничениями. Как уже было отмечено, в ряде случаев УРСЗ должен предо- ставить пользователю возможность сделать свой собственный вы- бор конкретных условй в пределах каждого выделенного типа условий. Как только тип условия определен, что может быть сде- лано только в контексте заранее определенных одного или двух типов систем, можно предложить пользователю определить его собственный выбор конкретного варианта этого типа. Если он не воспользуется этой возможностью, то УРСЗ должен предложить ему меню подходящих вариантов, один из которых объявлен как вариант по умолчанию. Если пользователь все же не выберет ни одни из них, то в УРСЗ должен использоваться именно этот ва- риант. 439
На уровне архитектуры для каждого типа системы или пары типов желательно зафиксировать только ограниченное множество типов существенных условий. Предполагается, что это начальное множество будет постепенно в процессе эволюции УРСЗ расши- ряться (разд. 9.8). Типы условий задач нельзя определить отдельно от типов си- стем, к которым они применяются. Каждый из них вместе с рас- сматриваемым типом системы образует тип задачи. Таким обра- зом, типы условий могут быть определены только как части типов задач. Наиболее важны типы условий, введенные в различном кон- тексте в этой книге и перечисленные в следующем разделе. 9.4. СИСТЕМНЫЕ ЗАДАЧИ Необходимо ради справедливости при- знать, что никогда научная жизнь не бу- дет уже такой безоблачной и спокойной, как в дни, когда безраздельно царство- вал детерминизм. Образовавшиеся те- перь перед нами пустоты и наш тяже- лый труд частично компенсируются по- ниманием того, что наш подход к реше- нию наиболее важных задач стал более реалистичным и продуктивным. Ричард Веллман Системы и условия, относящиеся к этим системам, образуют системные задачи. Поэтому их естественно классифицировать в со- ответствии с рассмотренной классификацией систем и типов усло- вий. В ряде задач может рассматриваться одна-единственная систе- ма. Назовем эти задачи, имеющие вид вопроса или условия отно- сительно каких-либо свойств данной системы, элементарными за- дачами. Например, для данной конкретной ST-системы можно сформулировать следующий вопрос: всегда ли можно получать из одного состояния другое состояние? — или в качестве альтернати- вы можно потребовать для каждой пары состояний список крат- чайших последовательностей преобразований одного состояния в другое. Для каждого из рассматриваемых типов систем необходимо обеспечить наиболее понятную работу УРСЗ с элементарными за-; дачами. Одно из наиболее значимых подмножеств элементарных задач состоит из тестов на противоречивость (корректность) для определенных пользователем систем. Сюда, например, относятся проверка необходимых свойств рассматриваемых вероятностных или возможностных распределений, всевозможных условий совме- 440
S2F ,MSF s2d S2S MSD MSS в УРСЗ, типов систем эпистемологических систем комбинируемых типов и метасистем для любой систе- мы не превышает двух: Ж 2= Рис. 9.1. Полурешетка структурированных где число стимости и т. п. Эти тесты должны выполняться УРСЗ автоматиче- ски в процессе формулирования пользователем задачи для каж- дой, определяемой пользователем системы. Если какие-то тесты ие выполняются, система должна быть отвергнута как некоррект- ная, а пользователю сообщены причины. Все задачи, не входящие в категорию элементарных, содержат две или более систем. Задачи, содержащие две системы, в УРСЗ явно определены и описаны методологически; назовем их базо- выми задачами. Все остальные задачи, содержащие более двух систем, формулируются и рассматриваются в терминах соответст- вующих последовательностей базовых и элементарных задач. Базовые системные задачи классифицируются по типам задач. Каждый из них состоит из упорядоченной пары типов систем и множества типов условий, применимых к этим типам систем. По- скольку при решении задачи всегда приходят от некоторых задан- ных объектов к неким неизвестным объектам, то порядок типов систем неразрывно связан с этим направлением. Первый из двух типов систем рассматривается как общее описание начальной си- 441
Рис. 9.2. Пример базового типа задач первого вида (см. разд. 3.4 и 3.6) Эпистемологические типы систем системы Рис. 9.3. Пример базового типа задач первого вида (см. разд. 3.4 и 3.6) стемы, т. е. системы, заданной в конкретной задаче данного типа. Второй тип описывает класс систем решения; назовем их терми- нальными системами. В соответствии с функцией терминальных систем можно выделить два вида системных задач. Для задач первого вида существует следующая каноническая формулировка. Для данной конкретной начальной системы типа z определяются такие терминальные системы типа г', для которых выполняются данные требования (связанные с системными типа- 442
Рис. 9.4. Ядро УРСЗ: важнейшие категории задач ми 2 и z'). Таким образом, решение задач первого вида — это мно- жество конкретных систем типа z'. Для задач второго вида имеется другая каноническая форму- лировка. Для данной конкретной начальной системы типа z и кон- кретной терминальной системы типа z' определяется некоторое свойство терминальной системы, специфицированное заданными требованиями относительно начальной системы. Таким образом, решением задачи второго вида является то, что связывает две данные системы. Примером задач первого вида является задача получения из заданной системы данных всех порождающих систем, удовлетво- ряющих требованиям максимальной согласованности, минималь- ной сложности и порождающей неопределенности, маски которых являются подмасками определенной наибольшей допустимой мас- ки. Этот тип задач был сформулирован в разд. 3.4, обсуждался в разд. 3.6 и показан на рис. 9.2. Примером задач второго вида является задача определения изменения характеристики систем с поведением, обусловленного некоторыми конкретными переменными. В этом типе задач (рис. 9.3), рассмотренном в разд. 7.3, некоторое свойство начальной системы представляет собой цель, а характеристики терминальной системы отдельно и вместе с этими переменными сравниваются с точки зрения заданной характеристической функции. На рис. 9.4 показаны категории задач, составляющие ядро УРСЗ. Каждая категория задач характеризуется эпистемологиче- скими типами входящих в нее систем; на рисунке это показано стрелками, помеченными числами. Категории задач образуют кла- стеры типов задач. Каждая категория содержит типы задач, име- 443
ющих особые методологические отличия, но содержащие одни и те же пары эпистемологических типов систем. Некоторые основные типы задач, показанные на рис. 9.4, были в предыдущих главах кинги определены либо явно, либо как ча- сти более крупных задач. Ниже приводится классификация задач по категориям. Очевидно, что категории 1—6 содержат все простейшие типы задач, связанные с отдельными эпистемологическими типами си- стем, но также и многие базовые типы задач. В частности, они со- держат следующие классы базовых типов: различные типы задач, связанные с упрощением систем так же, как из разд. 3.9; различные типы задач, связанные с отношением моделиро- вания между системами, как это рассматривалось для некото- рых эпистемологических уровней в гл. 8; различные типы задач, в которых системы определенного эпистемологического уровня сравниваются по некоторому кри- терию, например по их сложности (гл. 6), характеристике от- носительно различных целей (гл. 7), потере информации (разд. 4.6—4.8) и т. п. Категории 7 и 8 содержат типы задач, в которых в соответст- вии с определенными критериями данные разбиты относительно рассматриваемых переменных или параметрического множества. Категории 9 и 10 состоят из типов задач, в которых полная система данных определяется соответственно из элементов струк- турированных систем или метасистем. Они, например, включают типы задач, в которых требуется разрешать несогласованности в данных, как это описано в разд. 4.3 для структурированных систем данных. Категории 11—13 содержат различные типы задач, в которых данные порождаются эпистемологически более высокими типами систем при определенных начальных и других условиях. Во всех задачах этих категорий УРСЗ используется в качестве средства при компьютерном моделировании. Категория 14 состоит из типов задач, в которых порождающие системы получены из заданных систем данных при определенных типах требований. Как говорилось в разд. 3.4, 3.6 и 3.10, обычно требуется, чтобы результирующая порождающая система основы- валась исключительно на масках, не превышающих определенную наибольшую допустимую маску, а порожденные ими данные пол- ностью соответствовали имеющимся данным и чтобы их порожда- емые неопределенности и сложности были минимизированы. Эти задачи могут быть дополнены другими требованиями, такими, как дальнейшие ограничения на результирующие порождающие систе- мы или критерии оптимизации, представленные как конкретные отношения предпочтения, определенные на соответствующем мно- 444
жестве порождающих систем. Сюда также относятся задачи, свя- занные с введением внутренних переменных (см. разд. 3.10). Категории 15 и 16 состоят, в основном, из тех же типов задач, что и категория 14, но каждая отдельная задача должна быть по- вторена для всех элементов данной структурированной системы данных или метасистемы данных. Категория 17 содержит типы задач, связанных с определением семейств реконструкций, однозначных реконструкций, основанных на различных типах требований, и других вопросах, обсуждав- шихся в разд. 4.6—4.8. Категорию 18 составляют типы задач, связанных с моделирова- нием порождающих систем метасистемами различных методоло- гических типов. Категория 19 включает различные типы декомпозиционных за- дач, решаемых при проектировании систем (разд. 4.5), а также некоторые задачи реконструкции (разд. 4.7, 4.8). Категория 20 содержит все типы задач, связанные с идентифи- кацией параметрических требований, обусловленных изменениями связей между переменными данной порождающей системы. При- мерами таких задач являются задачи, рассмотренные в разд. 5.6. Для большинства задач, имеющих наибольшее практическое значение, требуется решение последовательности базовых и про- стейших типов задач. Например, задачи реконструкции, введенные в разд. 4.7, представляют собой последовательность задач из ка- тегорий 4, 5, 17, 19; для некоторых типов задач проектирования необходимо решение задач из категорий 11, 14, 17, 19; ряд задач компьютерного моделирования включает задачи из категорий 11 и 17 или 11 и 18 и т. д. 445
9.5. КОНЦЕПТУАЛЬНАЯ СХЕМА УРСЗ: ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ Когда философ вводит новый способ описания действительности, он сразу сталкивается с тем, что его предшест- венники рассматривали как целое то, что он подразделяет на части, или что они выделяли составляющие из того, что в его системе именуется как целое. Все- ленная представляется чем-то напоми- нающим сыр; ее можно разрезать беско- нечным множеством способов — и когда кто-то выберет свой способ разрезания, он обнаруживает, что другие режут не- правильно. Кеннет Берк А Следующие определения связывают прилагательные «иден- тифицируемый» и «допустимый» с понятиями «система», «усло- вие», «задача». Назовем систему, условие или задачу идентифи- цируемыми, если их можно сформулировать на языке УРСЗ; на- зовем их допустимыми, если они идентифицируемы и их можно рассматривать в контексте конкретной реализации УРСЗ. Кроме того, назовем задачу решаемой, если она допустима и может быть решена с помощью методологических средств, доступных в кон- кретной реализации УРСЗ. Эти прилагательные относятся к кон- кретным системам, условиям и задачам, а также к их типам. Обозначим ЗВ множество всех допустимых эпистемологических типов систем. Тогда где S обозначает множество всех идентифицируемых эпистемоло- гических системных типов. Обычно при некотором фиксированном /^1, где Si (teN)—это множест- во всех идентифицируемых эпистемологических системных типов, в которых общее число структурированных систем меньше или равно I. Обозначим множество допустимых типов методологических отличий, и пусть 3£, — это множество всех допустимых типов си- стем. Тогда S£ — собственное подмножество ЗвувЦ, поскольку некоторые ме- тодологические отличия неприменимы ко всем эпистемологическим типам систем. Обозначим SP множество всех допустимых систем 446
(т. е. конкретных систем, а не системных типов). Тогда 3L инду- цирует разбиение ^={^z|ze^} на где 5г — множество всех допустимых систем типа г. Пусть 8г,ге^г (Z^^). Тогда sz,i — допустимая система типа z, идентифицированная (от- личающаяся от других систем типа z) идентификатором 1. Обозначим 5?г множество всех допустимых типов требований, применимых к одной системе типа z, а @г,г' множество всех до- пустимых типов требований, применимых к паре систем типов z и z'. Тогда мы можем определить и 2@= U С.г'. z, zr GE Л Очевидно, что множество £=’<2W состоит из всех допустимых типов требований. Обозначим 5?г множество всех допустимых требований (т. е. конкретных требований, а не типов требований), применимых к одной системе типа z. Тогда Qz индуцирует разбиение на 91г, где 4?г,/— множество допустимых требований типа j, при- менимых к одной системе типа z. Пусть • rz,j,u&ftz,h т. е. гг,/,и — допустимое требование типа j, применимое к одной си- стеме типа z и однозначно определенное идентификатором и. Обозначим 3?г,г/ множество всех допустимых требований, примени- мых к паре систем типов гиг'. Тогда индуцирует разбиение •Яг.г'/С.г' = | на Яг,г>, где ^г>г/,й —множество всех допустимых требований типа к, применимых к паре систем типов z и z'. Пусть ^z.z'k.u г,г'.kt т. е. гг г/ обозначает допустимое требование типа к, применимое к паре систем типов z и z' и однозначно определенное идентифи- катором и. 447
Введенные понятия допустимых систем, требований и их типов позволяют определить допустимые задачи и их типы. Обозначим соответственно и множество всех допустимых типов элемен- тарных задач и множество всех допустимых типов базовых задач. Тогда •5»={(z, qz,/) |z<=2:, 4z>l^Qz}, ^ = {(z, Z', qZt2,J I z, t'fS, Чг.г,„4С@г.г'}, a — множество всех допустимых типов задач. Хотя в выражении для 2^z может быть тем же типом системы, как и z', они исполь- зуются для двух различных систем в каждой конкретной базовой задаче. Это является отличием базовых задач от элементарных, в каждой из которых рассматривается только одна конкретная си- стема. В результате описания типов требований в множестве (z, z'ej£) множество разбивается на два подмножества 21^ и 2253 базовых типов задач соответственно первого и второго видов. Следовательно, ja=ija(j2,jaij22ja. Множество S индуцирует разбиение на где —множество всех допустимых типов элементарных задач, применимых к системам типа z. Аналогично множество 3L2 индуцирует разбиение 2^/22={2J>^, | z, z'GS} на множестве 2^, где 2Фг,г>—множество всех допустимых типов базовых задач, применимых к паре систем типов z и г'. Аналогич- ные разбиения можно определить на множествах и 22Ф. Отме- тим, что множества '<?г и 2^г г-являются категориями задач в том смысле, как это обсуждалось в разд. 9.4 и показано на рис. 9.4. Обозначим множество всех допустимых простейших задач. Тогда множество '53 индуцирует разбиение lW={W,./|ze2', Чг>/6=£г) на где —множество всех допустимых элементарных задач, определенных для одной системы типа z, и требования типа Яг./- Обозначим множество всех допустимых базовых задач. Тогда множество 253 индуцирует разбиение 2^/2^ = {2^г>г',й 1 Z, Z-C2, Чг,г,Л£@г.г'} 448
на 23>3\ где 2313'-ZtZ,k— множество всех допустимых базовых задач, определенных в терминах пары систем типов z и г' и требования типа Чгг,А. Каждое множество 23i3iZiZ><k в дальнейшем разбивается на подмножества базовых задач первого и второго вида, обозначае- мые соответственно *'&9*г'г>л и 22^3>ZtZrtk. Тогда aW= U2‘^z,z-.fe. им^г.г'.А, где объединения множеств взяты по всем z, z' G-?, a 4z,z> ,k^@-z,z'— множества всех базовых задач, соответственно, первого и второго видов. Теперь можно формально описать три основных типа допусти- мых задач: элементарные задачи, обозначаемые }ра, имеют вид ^Ра.'а= (8г,г, Tz,j,i)> где а — однозначный идентификатор четверок (z, i, j, u). Базовые задачи первого вида, обозначаемые 21рр, описываются так: Pft ~ > ^z ,г' где р — уникальный идентификатор пятерок (z, i, z', k, u). Базовые задачи второго вида, обозначаемые 22pv, описываются следующим образом: 22РТ = Sz'.t fz.z'.k.ul где у — уникальный идентификатор шестерок (z, i, z', t, k, u) Обозначим ФФ множество всех допустимых задач, определяемых УРСЗ. Тогда *, где звездочка обозначает множество всех последовательностей, которые могут быть образованы элементами множества. Аналогич- но определяется множество Ф всех допустимых типов задач УРСЗ: (i^us^u22^) *, где 21^, 22^ — конечные множества элементарных и базовых типов задач. Теперь ясно, что на глобальном уровне концептуальная схема УРСЗ может рассматриваться как язык для описания допустимых типов системных задач, алфавит которого состоит из всех допу- стимых простейших и базовых типов задач, определяемых, в свою очередь, основными эпистемологическими и методологическими ти- пами систем и типами требований. 29-6923 449
9.6. ОБЗОР АРХИТЕКТУРЫ УРСЗ Секрет успешного формирования окру- жающей нас среды — а это и есть цель архитектора — состоит в том, чтобы по- зволить человеческому фактору стать определяющим. Архитектура требует убежденности и авангардизма. Нельзя принять решение на основании желания заказчиков или опросов Института Гэл- лапа, которые обычно только изъявляют желание продолжить то, что всем хоро- шо известно. Вальтер Гропиус Назначение архитектуры заключается в определении, тщатель- ном описании тех функций проектируемого искусственного объекта (будь то здание, механизм или экспертная система), которые не- обходимы для достижения заданной цели. Ранее с различной сте- пенью детализации обсуждались выбор н описание основных функ- ций УРСЗ, цель которого состоит в том, чтобы пользователь, об- ладающий экспертными знаниями, смог решать системные задачи. Цель настоящего раздела — дать сжатый и исчерпывающий обзор этих функций. На рис. 9.5 показана блок-схема, которую читателю рекомендуется использовать как руководство при чтении следую- щего описания. Концептуальная схема, разработанная в гл. 2—8 и кратко опи- санная в разд. 9.5, является ядром УРСЗ. Она представляет со- бой язык, используемый в УРСЗ для описания выделенных типов систем, требований и задач. Когда речь идет об архитектуре, то как указывается в разд. 9.1, фиксируется только эпистемологиче- ская иерархия системных типов. Остальные понятия, такие, как типы требований или методологические отличия систем, описыва- ются в архитектуре УРСЗ только в самых общих терминах. Более точное их описание является предметом конкретной реализации УРСЗ, базирующейся на конкретном множестве системных типов, каждый из которых определяется совокупностью эпистемологиче- ских и методологических особенностей, а также конкретными мно- жествами типов требований и, как следствие, типами задач; они называются допустимыми типами систем, требований и задач (т. е. они допустимы для данной реализации УРСЗ). Как было показано в разд. 9.5, содержательные типы систем- ных задач образованы последовательностями простейших и базо- вых типов задач. Последние, в свою очередь, образованы систем- ными типами и типами требований, являющихся совместимыми в том смысле, что они могут быть применимы друг к другу. Таким образом, три основные категории, образующие концептуальную 450
Пользователь | УРСЗ Рис 9.5. Схема архитектуры УРСЗ 451
схему УРСЗ: системные типы, типы требований и типы систем — взаимосвязаны. На рис. 9.5 это показано двусторонними связями между соответствующими блоками. Концептуальная схема — это лингвистическая среда, в которой пользователь общается с УРСЗ, состоящим из соответствующей базы знаний, множества метаметодологических средств, а также блока управления. Связь пользователь — УРСЗ двусторонняя, и с каждой стороны снабжена соответствующим интерфейсом. Назо- вем интерфейс со стороны пользователя внешним интерфейсом, а со стороны УРСЗ — внутренним интерфейсом. Выделим два типа внешнего интерфейса, каждый из которых может быть включен в конкретную реализацию УРСЗ. Первый спроектирован в расчете на опытного пользователя, который в до- статочной степени знаком с концептуальной схемой УРСЗ (по меньшей мере на уровне этой книги) и ограничениями той реали- зации УРСЗ, которую он собирается использовать. Этот тип интер- фейса основан на предположении, что пользователь не нуждается в помощи при формальном определении его систем н требований, и, следовательно, единственная функция интерфейса состоит в про- верке на возможные несоответствия в формулировках пользова- теля. Другой тип внешнего интерфейса спроектирован в расчете на обычного пользователя, чье знание концептуальной схемы УРСЗ является недостаточным. Функция этого интерфейса состоит не только в проверке возможных несоответствий в формулировках пользователя, но и в том, чтобы предоставить пользователю широ- кий спектр услуг при формулировании его задачи. Это означает, что внешний интерфейс должен содержать соответствующие про- цедуры опроса для идентификации типов систем и требований, а также конкретных систем и требований заданных типов. Такие процедуры могут оказаться очень сложными (а может быть, и со- вершенно нереальными) при условии, что пользователь ничего не знает о концептуальной схеме УРСЗ. Поэтому представим себе, что в любых реализациях УРСЗ, доступных, по крайней мере, в ближайшем будущем, от обычного пользователя будет требовать- ся некоторое минимальное знание концептуальной схемы УРСЗ. Эти минимальные сведения можно сделать стандартной частью любого руководства по УРСЗ. Упомянутые процедуры опроса, позволяющие провести иденти- фикацию и являющиеся важным элементом внешнего интерфейса УРСЗ, могут быть усовершенствованы на различных уровнях в за- висимости от того минимального знания концептуальной схемы УРСЗ, которое требуется от пользователя. Чем меньше знаний, тем более сложными и менее совершенными становятся процеду- ры. В предельном случае, когда не требуется никаких знаний, соз- дание удачных процедур опроса является главной исследователь- ской проблемой. Затронутые вопросы, находящиеся вне сферы этой 452
книги, изучаются преимущественно в области искусственного ин- теллекта. Собственно УРСЗ состоит из четырех функциональных элемен- тов: множества методологических средств базы знаний, блок мета- методологической поддержки и блока управления. Все понятия УРСЗ представлены в УРСЗ в некотором стандартизованном ви- де, что осуществляется посредством внутреннего интерфейса. По- нятно, что такой блок как база знаний, а также методологические и мета методологические блоки должны обладать соответствующи- ми стратегиями рассуждения. Методологические средства — это пакеты методов (и соответ- ствующих компьютерных программ), с помощью которых могут быть решены некоторые из допустимых типов задач. Они разде- ляются на общие и специализированные пакеты. Общие пакеты предназначены для типов задач, сформулированных в терминах наиболее общих методологических отличий', доступных в данной реализации УРСЗ; специализированные пакеты предназначены для всех типов задач, основанных на менее общих методологичес- ких отличиях. Любое методологическое средство — это множество методов (и соответствующих компьютерных программ) для решения некото- рых простейших или базовых типов задач и процедура (компью- терная программа), определяющая порядок, в котором отдельные методы должны применяться. Таким образом, методологические средства образуются из общего набора методов (программ), име- ющегося для решения допустимых простейших и базовых типов задач, с помощью процедуры (управляющей программы), приме- няющей необходимые методы в соответствующем порядке. В УРСЗ учтены различные метаметодологические соображения. Они реализуются с помощью метаметодологического блока. Этот блок содержит информацию об упорядочении всех допустимых за- дач, следующей из их общности методологического статуса. Упо- рядочение по общности отражает, в основном, упорядочение ме- тодологических отличий систем и требований. Методологический статус задачи связан с ее разрешимостью, запросами на время ре- шения и требуемую память, с характеристиками соответствующих методологических средств. Теоретически неразрешимые задачи отличаются от задач, не- разрешимость которых обусловлена исключительно ограничения- ми данной реализации УРСЗ. Если задача неразрешима в послед- нем смысле, то возможны два ответа УРСЗ. Во-первых, пользова- телю могут быть предложены альтернативные формулировки зада- чи, основанные на более строгих предположениях и допускающие решение ее с помощью УРСЗ; при этом блок методологической поддержки осуществляет переход от данной методологической па- радигмы к более конкретным парадигмам. Во-вторых, может быть вызван блок базы знаний, чтобы предоставить пользователю полез- 453
ную информацию относительно исходной задачи, например ссылки на соответствующие библиотеки программ, статьи или книги. Блок мета методологи чес кой поддержки должен осуществлять необходимый анализ вычислительной сложности каждой конкрет- ной задачи, для которой в данной реализации УРСЗ имеются сред- ства решения. Если задача оказывается практически неразреши- мой, то этот блок должен, по возможности, выработать альтерна- тивные формулировки задачи (основанные на более строгих пред- положениях), которые можно численно реализовать. Кроме того, для каждой задачи, которая может быть решена данной реализа- цией УРСЗ, этот блок должен определить приблизительные вычис- лительные затраты и другие соответствующие характеристики ис- пользуемого метода. Как было отмечено выше, блок знаний содержит полезную ин- формацию о задачах, которые не могут быть решены данной реа- лизацией УРСЗ. И, кроме того, этот блок может содержать дру- гую необходимую информацию о системах и системных задачах. К ней, например, относятся теоретические или экспериментальные законы, принципы или эмпирические правила науки о системах, такие, как закон необходимого многообразия или закон необходи- мой иерархии. Связь пользователя с блоками УРСЗ осуществляется либо че- рез концептуальную схему, либо непосредственно через внешний и внутренний интерфейсы. Первая связь содержит формулировки задач, а вторая связана с различными метаметодологическими под- ходами и использованием базы знаний. Необходимая координация работы трех описанных блоков УРСЗ осуществляется блоком управления. Им в соответствии с требованиями и другими условиями, в основном принимается ре- шение о том, какой блок и как следует активизировать. 9.7. ИСПОЛЬЗОВАНИЕ УРСЗ: НЕКОТОРЫЕ ПРИМЕРЫ Бог дал нам орехи, но он не будет их колоть. Иоган Вольфганг Гёте Цель этого раздела состоит в том, чтобы привести несколько дополнительных примеров системных задач и показать, как их решает УРСЗ. Далее будут рассмотрены только задачи, связанные с описанными в этой книге методами. Основное внимание будет уделено примерам, в которых используется более одного методо- логического средства, и аспектам, на которые выше достаточного внимания не обращалось. Некоторые примеры заимствованы из литературы; в этом случае получаемые результаты сравниваются с опубликованными. Другие примеры основаны на не опублико- ванных ранее данных. 454
Необходимо отметить, что достоверность данных, которые во всех случаях были получены из различных источников, а не непо- средственно из опыта, здесь обсуждаться не будет. Цель рассма- триваемых примеров—проиллюстрировать потенциальные возмож- ности УРСЗ, а не обсуждать различные вопросы, лежащие вне компетенции УРСЗ, такие как сбор данных и интерпретация ре- зультата (чаще всего это предоставляется пользователям УРСЗ, экспертам и др.). С целью упрощения переменные обычно представлены своими идентификаторами (индексами), а подмножества переменных раз- делены косой чертой (например, рис. 9.6,6, в). Пример 9.1. В этом примере рассматриваются эксперименталь- ные данные, собранные в процессе изучения относительного роста саженцев при различных условиях. Данные были собраны для 960 сливовых деревьев (примечание 9.1) и содержат три бинарные переменных: t>i — смертность (0 — живое, 1—сухое); V2 — время посадки (0 — сразу, 1 — весна); Оз — обрезка корней (0 — длинная, 1—короткая). Данные были собраны при следующих условиях: для 240 де- ревьев регистрировалось состояние управляемых переменных v2 и «з. Эксперимент предназначался для изучения влияния времени посадки и длины обрезки корней на выживаемость саженцев де- ревьев. Посколку все переменные бинарные, то невозможно понизить их разрешающие формы. Число элементов в рассматриваемой группе в 30 раз больше числа состояний переменных; этого вполне доста- точно для вероятностного анализа. Поскольку параметрическим множеством является неупорядоченная группа, то исследование ограничено определением функции поведения и проведением ана- лиза ее реконструируемости. На рис. 9.6,а приведены частоты от- дельных состояний переменных и распределение вероятностей со- ответствующих частот. После оценки всех гипотез реконструкции в группе находим расстояния, которые показаны на рис. 9.6,6. Гипотезы реконструкции, приндалежащие множеству решений, на рисунке заштрихованы (для полноты картины заштрихована так- же и полная система). Видно, что нет необходимости в вычислении гипотез реконструкции 23/1 и 13/2, поскольку их расстояния не могут быть меньше наибольших расстояний их предшественников, т. е. меньше 0.0263, и находятся ниже гипотезы 12/3, действитель- ное расстояние которой составляет 0.0134, и, следовательно, долж- ны быть отвергнуты. Схема элементов множества решений пока- зана на рис. 9.6,в, а зависимость минимального расстояния гипо- тезы от уровня уточнения — на рис. 9.6,г. На основании приведенных на рис. 9.6 результатов можно сде- лать вывод, что на гибель деревьев влияет как время посадки, так и длина обрезки корней, но первый фактор влияет в два раза силь- 455
Bl Рис. 9.6. Приживаемость деревьев (пример 9.1) нее. Видно также, что когда речь идет о гибели деревьев, то эти две управляемые переменные являются независимыми. Пример 9.2. Хотя с методологической точки зрения этот пример мало отличается от примера 9.1, они совершенно различны в своих семантическом и прагматическом аспектах. В этом примере рас- сматриваются экспериментальные данные, собранные по наблю- дениям 114 мышей (в возрасте 90 дней) при изучении детоубийст- ва (имеется в виду убийство молодых особей своего рода). В экс- периментах изучался один из аспектов детоубийства, связанный с половой конкуренцией самцов. Эксперименты проводились с це- лью проверки гипотезы половой конкуренции, основывающейся на дарвиновском понятии полового отбора, в соответствии с которым самец, совершающий детоубийство, может повысить свои шансы за счет соперника путем убийства отпрыска соперника, а затем спаривания с матерью1. Переменными, входящими в эксперимен- ты, здесь являются Vi — доминантность (0 — доминантный, 1 — подчиненный); v2 — сексуальный опыт (0 — неопытный, 1—опытный); из — отношение к отпрыскам соперника (0 — детоубийство, 1—родительское, 2 — нейтральное). 1 Для более детального анализа этого исследования см. Science 25, с. 1270— 1272, 1982. 456
Как и в примере 9.1, мы можем только определить функцию поведения и выполнить анализ ее реконструируемости. Оконча- тельные результаты, основыванные на вероятностном описании связи между переменными, приведены на рис. 9.7. Если мы не будем обращать внимание на интерпретацию, то результаты очень похожи на результаты, полученные в примере 9.1. Можно сделать вывод, что на отношение к отпрыскам сопер- ника влияют и доминантность, и сексуальный опыт (гипотеза 13/23), но последний фактор почти в два раза больше значит (сравните расстояния 23/1 и 13/2). Видно также, что когда исклю- чается подсистема 12, то расстояние действительно не меняется. Следовательно, доминантность и сексуальный опыт независимы. Пример 9.3. Этот пример основан на данных, собранных в про- цессе изучения мнения о жилищных условиях в Копенгагене (при- мечание 9.2). Было опрошено 1881 квартиросъемщик, проживаю- щие в выбранных районах в домах, построенных в интервале меж- ду 1960 и 1968 годами, об их отношении к жилищным условиям, о контактах с другими квартиросъемщиками, мнение об их влия- нии на содержание жилья. Одновременно с этим регистрировался тип дома каждого квартиросъемщика. Таким образом, было выде- лено четыре переменных: 457
Vi — тип дома (0 — многоквартирный, 1 — меблированные комнаты, 2 — отдельный дом, 3 — дом с общими боко- выми стенами); V2 — мнение о влиянии на содержание жилья (0 — низкое, 1 — среднее, 2 — высокое); о3 — степень контакта с соседями (0 — низкая, 1 — высо- кая); о4 — степень удовлетворенности жилищными условиями (0 — низкая, 1—средняя, 2 — высокая). Поскольку было зарегистрировано 72 состояния переменных, мы можем определить лексикографическое упорядочение состоя- ний и представить данные в виде последовательности частот М(с), основанного на этом упорядочении. В предположении об упорядо- чении переменых в виде t?i, Vz, vj и о4 лексикографическое упоря- дочение единственно, и, следовательно, данные однозначно опре- деляются такой последовательностью частот М(с); 21, 21, 28, 14, 19, 37, 34, 22, 36, 17, 23, 40, 10, 11, 36, 3, 5, 23, 61, 23, 17, 78, 46, 43, 43, 35, 40, 48, 45, 86, 26, 18, 54, 15, 25, 62, 13, 9, 10, 20, 23, 20, 8, 8, 12, 10, 22, 24, 6, 7, 9, 7, 10, 21, 18, 6, 7, 57, 23, 13, 15, 13, 13, 31, 21, 13, 7, 5, 11, 5, 6, 13. Как и в предыдущих примерах, данные заданы на неупорядо- ченной группе, и, следовательно, определение маски бессмысленно. Популяция в 23 раза больше, чем число всех состояний перемен- ных. Следовательно, нет необходимости в укрупнении разрешаю- щей формы переменных. Поскольку методологически этот пример похож на предыдущие, предложим читателю только результаты, полученные с использо- ванием двух вариантов анализа реконструируемости, а их обсуж- дение и интерпретацию оставим читателю. Эти два варианта ис- пользуют соответственно вероятностную и возможиостную функ- ции поведения. В обоих случаях использовались только С-струк- туры и на каждом уровне уточнялись только те С-структуры для которых расстояние не превышает 20% от минимального на этом уровне расстояния (см. табл. 9.3). Пример 9.4. Этот пример содержит описание исследования вза- имосвязи политической ситуации и уровня цен на бирже в США (XX в.). Политическая ситуация описывается тремя бинарными переменными: »1 — политическая партия президента (0 — демократическая, 1 — республиканская); t>2 — партия, контролирующая палату представителей (0 — демократическая, 1 — республиканская); о3— партия, контролирующая сенат (0 — демократическая, 1 — республиканская). Характеристика уровня цен на бирже представлена единствен- ной переменной: о4 — уровень цен на бирже (0 — падает, 1—растет). 458
Таблица 9.3. Результаты анализа реконструируемости жилищных условий в Копенгагене (пример 9.3) а) Вероятностный вариант б) Возможностный вариант 1 Структура Расстояния 1 Структура Расстояния 1 134/234 0.0030 1 134/234 0.0197 124/234 0.0045 124/234 0.0235 123/234 0.0069 123/234 0.0312 124/134 0.0023” 124/134 0.0182* 123/134 0.0094 123/134 0.0845 123/124 0.0023” 123/124 0.0162** 2 13/14/23/24 0.0051 2 13,14/23,24 0.0360* 124/23 0.0053 124/23 0.0335* 123/24 0.0077 123/24 0.0408 124/13 0.0038” 124,13 0.0325** 123/14 0.0109 123/14 0.0957 134,24 0.0047 134/24 0.0329* 124/34 0.0062 124/34 0.0350* 12,13/24/34 0.0089 12/13/24/34 0.0478 12/134 0.0110 12/134 0.0973 3 14/13/24 0.0062” 3 14/13/24 0.0487* 124/3 0.0065* 124/3 0.0454** 12/13/24 0.0093 12/13/24 0.0585 12/13/14 0.0124 12/13/14 0.1128 4 14/24/3 0.0089” 14/24/34 0.0560 13/24 0.0104* 13/24/34 0.0693 14/13/2 0.0136 134/2 0.1095 12/3/24 0.0120 14/23/24 0.0531* 12/3/14 0.0151 12/23/24 0.0662 12/23/14 0.1119 5 1/24/3 0.0131” 12/34/24 0.0660 14,2/3 0.0163 12/34/14 0.1141 13,2.4 0.0178 13/23/24 0.0678 6 I,-2/3,4 0.0205” 13/14/23 0.1128 4 14/3,24 0.0658” 12,3/24 0.0779* 12/3,14 0.1237 13,24 0.0785* 14/13,2 0.1241 1,23/24 0.0943 14/23 0.1296 5 1/3/24 0.1087** 14/3/2 0.1427 12/3/4 0.1492 13/2/4 O.I53O 6 1/2,3/4 ' 0.1832** Уточненные структуры помечены звездочкой; уточненные структуры с минимальными расстояниями помечены двумя звездочками
Таблица 9.4. Матрица данных из примера 9.4 t I 2 3 4 5 6 7 8 9 10 11 12 13 14 1$ 16 17 18 19 20 21 V1 1 1 1 1 0 0 1 1 0 0 0 0 0 0 1 1 0 0 1 1 0 и2 1 1 1 1 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 УЗ 1 I 1 1 0 0 I 1 1 0 0 0 0 0 1 0 0 0 0 0 0 V4 1 1 1 1 0 0 0 1 1 1 0 0 I 0 1 I I 1 0 0 0 Эти переменные регистрировались в период с 1897 по 1981 год. Весь период разделен на 21 равный интервал в соответствии с че- тырехлетним периодом нахождения президента у власти. Пере- менные V2 и V3 определяются соответственно большинством в па- лате представителей и сенате в начале каждого периода. Очевидно, что исходная система представляет чрезвычайно упрощенное описание рассматриваемых характеристик. Она ис- пользуется здесь только для иллюстрации того, как УРСЗ может применяться при изучении систем этого вида. Например, можно при желании выделить больше состояний переменной и4 или раз- делить рассматриваемый период на временные интервалы (не обя- зательно равные), отличающиеся друг от друга изменением пере- менных. Можно рассмотреть некоторые дополнительные политиче- ские или экономические переменные, такие, как общая характери- стика политической ситуации в стране, инфляция, безработица, падение или рост валового национального продукта и т. д. В табл. 9.4 представлены данные, описывающие исходную си- стему. Существует много способов использования УРСЗ при об- работке данных и получении систем на более высоких эпистемоло- гических уровнях. Вот один из возможных сценариев. Сначала пользователь захотел определить допустимые маски при АМ=2 как для вероятностного, так и для возможностного подходов. Поскольку у него не было никаких определенных требо- ваний, то УРСЗ предлагает ему результаты, показанные на рис. 9.8; они основаны на обычных целевых критериях (порождающая нечеткость и размер маски), реализованных при отсутствии выбо- ра. Рисунок понятен (заштрихованными областями показаны вы- борочные переменные, связанные с отдельными масками). Видно, что оба подхода приводят к почти одинаковым множе- ствам допустимых масок, но возможностный подход содержит одну дополнительную маску для четырех выборочных переменных (мас- ка без памяти). Предварительно пользователь решил выбрать маску с пятью переменными, но при этом хотел быть уверенным в том, что среди допустимых масок нет лучших масок с пятью пе- ременными. Поэтому он запросил допустимые маски при ДМ=3 и рМ|=5. В результате он получил такую же, как раньше маску, представляющую выборочные переменные $2, $з, $5, s7, S3. Таким образом, выбор этой маски был хорошо обоснован, и пользователь 460
р=-1 О допустимая маска Рис. 9.8. Оценка масок в примере 9.4 или М=2 (рынок акций и федеральное правительство США) принял ее за основу для дальнейшей работы. Поскольку имеется всего 21 наблюдение и 32 состояния переменных, то пользователь решил осуществить анализ реконструируемости системы с поведе- нием, основывающейся на выбранной маске, только с использова- нием возможностного подхода. В табл. 9.5 с использованием тех же обозначений, что и в примере 9.3, приведены допустимые ре- конструктивные гипотезы; для удобства выборочные переменные переобозначены, как показано на рис. 9.9,а. 461
Таблица 9.5. Допустимые реконструктивные гипотезы из примера 9.4, основанные иа маске, определенной иа рис. 9.9,а 1 Структура Dl 1 1234/1345 0.0 2 123/1345 123/135/124/145 1234/135 0.0097 3 123/135/124 0.0138 4 123/124/35 0.0277 5 124/35/23 0.0333 6 12/35/23/24 0.0579 7 1/35/23/24 12/35/23/4 0.1667 8 1/35/23/4 0.2805 9 1/23/4/5 0.4138 10 1/2/3/4 0.5610 Анализ зависимости Di от I (рис. 99,6) показывает, что Di до- статочно мало при /^6 и значительно возрастает при />6. Следо- вательно, на шестом уровне структура 12/35/23/24 представляется как наиболее информативная реконструктивная гипотеза, т. е. наи- более уточненная в описываемом малыми расстояниями кластере. Ее блок-схема с указанием соответствующих связей переменных показана на рис. 9.10. Переменная 2, являющаяся единственной порождающей переменной во всей системе, рассматривается как входная переменная для отдельных подсистем; в действительности она определяется предыдущим состоянием переменной 5, а не про- извольно зависит от окружающей среды, что и показано на блок- схеме с помощью блока ЗАДЕРЖКА, связывающего эти две пере- менные. Тогда направления оставшихся переменных определяются единственным образом. Из допустимых реконструктивных гипотез, приведенных в табл. 9.5 и особенно из основной гипотезы, показанной на рис. 9.10, можно сделать некоторые общие выводы. -1 о «— Президент Р- Ч V2 V3 1 р «— Палата представителей 5 •*— Сенат — Рынок акций 2 3 Рис. 9.9. К таблице 9.5 (пример 9.4) 462
1 2 1f 2 3 *f 0 0 1 О 0 0.75 О 1 025 011 1 0 0.5 1 0 0.25 111 111 2 4 3f 3 5 *f 0 0 1 0 0 0.75 0 1 0.5 0 1 0.5 1 J 0.25 10 1 111 111 Рис. 9.10. Основная реконструктивная гипотеза для примера 9.4 (рынок акций и федеральное правительство США) 1. В течение одного периода уровень цен на бирже и боль- шинство в сенате строго взаимосвязаны (видно, что переменные 2 и 3 входят в одну подсистему во всех, кроме последней, допу- стимых гипотезах). 2. Уровень цен на бирже в течение одного временного ин- тервала строго определяет большинство в сенате в следующем интервале (переменные 3 и 5 становятся несвязанными только на девятом уровне уточнения). 3. Наиболее важной переменной изучаемой системы явля- ется большинство в сенате (переменная 2 содержится в трех подсистемах основной гипотезы реконструкции); с той же сте- пенью значимости (сравните допустимые гипотезы на шестом и седьмом уровнях) она связана с партией президента в текущем временном интервале и с партией, контролирующей палату представителей в течение следующего временного интервала. Более конкретные выводы можно получить из распределений возможностей подсистемы основной гипотезы, показанной на рис. 9.10 и, возможно, из полной системы, восстановленной из основной гипотезы с использованием различных характеристик реконструк- ции, рассмотренных в разд. 4.9 и 4.10; полная система может быть получена при соответствующем обращении к УРСЗ. Эти более де- тальные интерпретации результатов оставим заинтересованному читателю. Пример 9.5. Этот пример описывает фрагмент типичного взаи- модействия специалиста-эколога и УРСЗ. Здесь иллюстрируется возможность использования УРСЗ при обработке комбинации эко- логических и климатических данных. Эти данные связаны с оз. Онайда, самым большим озером в шт. Нью-Йорка (в среднем 33,6 км в длину и 8,8 км в ширину). Рассматриваются следующие десять переменных: 463
Di — полное содержание биомассы зоопланктона (г/л); п2 — полное содержание биомассы фитопланктона (г/л); из — хлорофилл (г/л); и4 — нитраты (г/л); v5 — растворенные реактивы кремния (г/л); и6 — растворенные реактивы фосфора (г/л); v7 — температура воды (°C); v8 — солнечная радиация (ленгли/день) •; Пэ — осадки, водный эквивалент (дюйм/день); Пю — ветер, средняя скорость (миль/час). При обращении к УРСЗ у эколога есть матрица данных 10Х XI93, содержащая состояния этих переменных, полученные в те- чение 193 дней наблюдения с 12 апреля 1977 г. по 21 октября 1977 г. (см. примечание 9.3). Поскольку переменные были измерены с высокой степенью точ- ности, а проведено только 193 наблюдения, то для получения из имеющихся данных разумных результатов представление перемен- ных должно быть сильно огрублено. Исходя из разных соображе- ний, эколог принимает решение использовать критерий равной ча- стоты (разбиение на блоки, состоящие из равных групп). Он так- же принимает решение сократить множество состояний всех пере- менных до трех состояний, кроме переменной ид, множество состо- яний которой нужно сократить до двух состояний. Основываясь на этих решениях, УРСЗ определяет разрешающие формы, показан- ные в табл. 9.6, и использует их для преобразования исходных данных к новому виду. Для экономии места этот новый вид дан- ных (матрица целых чисел 10X193), являющийся основой даль- нейшей обработки, здесь не приводится. Таблица 9.6. Разрешающие формы из примера 9.5 (оз. Онайда) Переменные Идентификаторы состояний 0 1 2 Oj (зоопланктон) 1.5—147.7) [147.7-215.2) [215.2-338.9] v2 (фитоплаоктон) 202.3—2170.4) 2170.4—5122.6) va (хлорофилл) 1.3-8.3) 8.3—12.7) 5122.6—14963.2J vt (азот) 0.0—54.5) 54.5—253.8) 12.7—27.5] ов (кремний) [25.0—337.7) 337.7—605.6) 253-8—543.8] иЙ (фосфор) 1.4.-2.1) 2.1—4.4) 605.6—1364.9] с7 (температура) 2.2-15.2) 15.2-20.2) 4.4—24.0] vg (солнечная ра- 0.0—221.2) 221.2—442.3) 20.2—23.4] диация) v9 (осадки) [0.0] [0.0—1.75] 442.3—663.5] о., (ветер) [3.7—7.6) (7.6-10.2) 10.2-18.6] 1 Ленгли — единица солнечной радиации. — Прим. ред. 464
Ясно, что даже после сильного огрубления форм представления число наблюдений слишком мало (в 204 раза меньше) по сравне- нию с числом всех состояний, определенных для переменных. Поэтому эколог принимает реше- ние использовать исключительно возможностный подход, который существенно меньше зависит от объема данных, и исследовать не- которые наиболее значимые под- Таблица 9.7. Подходящие рекон- структивные гипотезы, основанные иа переменных ...... а6 (пример 9.5) 1 Структура 1 I2345/I2356 0.0021 2 12345/1356 0.0049 3 1345/1356/1235 0.0098 4 1356/1235/345 0.0242 5 1356/123/345 0.0386 6 136/123/345/356 0.0544 множества переменных. Во-первых, определены реконструктивные свойства системы, со- держащей только переменные ..., ug. Допустимые реконструк- тивные гипотезы на первом — шестом уровнях уточнения перечис- лены в табл. 9.7; их расстояния на более высоких уровнях уточне- ния слишком велики в соответствии с определенным экологом кри- терием. Блок-схема максимально уточненной допустимой гипоте- зы, которая в дальнейшем называется гипотеза SF, показана на рис. 9.11. Некоторые разумные результаты можно получить из множест- ва решений табл. 9.7. Один из них — значимость переменной v$, которая сильно взаимосвязана со всеми остальными переменными. Гипотеза SF (рис. 9.7) может также использоваться как руковод- ство при дальнейших, более детальных исследованиях, выборе соответствующих подмножеств переменных. Поскольку в данном исследовании наибольший интерес представляет переменная 1 (зоопланктон), то эколог принимает решение в дальнейших иссле- дованиях исключить из рассмотрения переменные vt и v$, которые в гипотезе SF напрямую не связаны с переменной Кроме того, он исключает переменную v2, основываясь на том, что она хоро- шо представляется переменной из (хлорофилл); это обусловлено сильной взаимосвязью этих двух переменных, а также их эко- логической значимостью. В результате остаются переменные V], Ь’2, fs- Для более тщательного изучения переменных vIr ц3, ve эколог требует определить все допустимые маски с тремя порождающими переменными, определенные среди наибольших допустимых масок при АМ=6. Это требование приводит к двум допустимым маскам и М2, показанным на рис. 9.12. Результаты применения анализа реконструируемости к системам с поведением, полученным для этих масок из имеющихся данных, приведены в табл. 9.8 — это допустимые гипотезы реконструкции. В эту таблицу не включены уровни уточнения выше десятого, поскольку они не приемлемы по критерию эколога. Видно, что в этих двух масках идентификаторы th, ..., ug выборочных переменных имеют разный смысл. 30-6923 465
Хлорофилл Рис. 9.11. Схема основной реконструктивной гипотезы, основанной иа перемен- ных 01, ..., о6 и маске без памяти (пример 9.5) Рис. 9.12. Допустимые маски из примера 9.5 Таблица 9.8 является богатым источником для всевозможных выводов, включая и выводы, связанные с направлениями перемен- ных, но, поскольку они могут содержать подходы, отличные от системных, здесь они будут опущены. Тем не менее опишем одно дополнительное взаимодействие эколога с УРСЗ. Эколог решает дополнить три экологические переменные ui (зоопланктон), из (хлорофилл), ие (фосфор) четырьмя климатическими переменны- ми и7 (температура воды), и8 (солнечная радиация), V& (осадки), Uio (ветер) и осуществить реконструктивный анализ для системы с поведением, основанной на этих семи переменных и маске без памяти. Схема максимально уточненной реконструктивной гипоте- Таблица 9.8. Подходящие реконструктивные гипотезы, осиоваииые на масках М2 и Mi (пример 9.5, см. рис. 9.12) Маска М, Маска М2 Z Структура Dl 1 Структура Dl 1 13456/23456 0.0006 1 12346/12356 0.0003 2 1356/23456 0.0019 2 1246/1356/2346/2356 0.0010 3 1356/2456/3456 0.0032 3 1356/2346/2356 0.0017 ; 4 156/2456/3456 0.0094 4 1356/234/2356 0.0033 5 156/2456/346 0.0137 5 1356/2356/34 0.0046 6 156/2456/34 0.0159 6 1356/256/34 0.0087 7 156/245/34/256 0.0232 7 1356/25/34 0.0148 8 15/245/34/256 0.0339 8 156/25/34/356 0.0231 9 15/245/34/26 0.0401 9 16/25/34/356 0.0341 10 15/24/34/26/25 0.0549 10 16/25/34/36/56 0.0542 466
Ю(детер) Рис. 9.13. Наиболее уточненная допустимая реконструктивная гипотеза для пе ременных Vi, v3, v6—tho и маски без памяти — из примера 9.5 р= -/ О Ss(MSP) ss(SBP) S) Рис. 9.14. Наиболее уточненные допустимые ^-структуры из примера 9.6 (опера- ции иа открытом сердце) зы показана на рис. 9.13. Среди возможных результатов практиче- ский интерес для эколога представляет то, что переменная Пю (ветер) имеет такое же значение, как и переменная vs (солнечная активность). Это, по-видимому, является следствием того, что оз. Онайда чрезвычайно мелкое. Теперь эколог может использовать УРСЗ для дальнейшего изу- чения центральных переменных 1, 3, 8, 10 в последней удачной гипотезе (рис. 9.13), но предыдущее описание представляется вполне достаточным, чтобы проиллюстрировать роль УРСЗ в но- вом и творческом процессе научного исследования. Пример 9.6. В этом примере показано, как одна из имеющихся реализаций УРСЗ использовалась при изучении хирургии на от- крытом сердце (см. примечание 5). Для исходной системы важны следующие шесть физиологических параметров, которые в течение операции регистрировались у пациента с периодом в 30 с (т. е. в моменты времени 0 с, 30 с, 60 с, 90 с ...):
и, — систоличическое кровяное давление (SBP); иг — среднее кровяное давление (МВР); из — центральное венозное давление (СВР); и4— пропускная способность сердца (СО); V5 — частота пульса (HP); t>6 — остаточное артериальное давление (LAP). Для каждой переменной определено пять состояний, помечен- ных идентификаторами 1, 2, 3, 4, 5. По принятой шкале состояние 3 соответствующей характеристики означает с медицинской точки зрения норму. Состояния 1 и 5 соответствуют критическим со- стояниям, требующим незамедлительных действий, приводящих к желательным изменениям, поскольку в противном случае паци- ент может умереть. Состояния 2 и 4 нежелательны (опасны), но не критичны. Цель настоящего исследования состоит в определе- нии реконструктивных свойств системы, знание которых может по- мочь анестезиологу в ходе операции при неблагоприятных ситуа- циях. В табл. 9.9 приведена вероятностная функция поведения, свя- занная с этим примером исследования и основанная на маске, по- казанной на рис. 9.14,а. Она описывает среднего пациента — муж- чину возраста около 45 лет — и получена в результате обработки данных, собраных в ходе 100 успешных операций. Видно, что для этой категории пациентов: 1) полностью нормальное состояние, в котором все переменные находятся в состоянии 3, далеко от наи- более вероятного состояния; 2) часть переменных никогда не на- ходится в определенных нежелательных состояниях (например, состояниях 1, 2 и 5 для переменной uj. Возможно, что для раз- личных категорий пациентов (женщины, различный возраст Таблица 9.9. Функция поведения из примера 9.6 si s2 S3 s4 s5 s6 Ac) Si S2 S3 S4 s5 4 Ac) с=3 I 3 3 4 5 0.005 3 3 3 3 3 5 0.005 3 2 3 1 3 3 0.025 3 3 3 3 4 3 0.025 3 2 3 3 3 3 0.171 3 3 3 3 4 4 0.005 3 2 3 3 3 4 0.005 3 3 3 3 4 5 0.010 3 2 3 3 3 5 0.005 3 3 3 3 5 5 0.025 3 2 3 3 4 3 0.005 3 3 3 4 3 3 0.035 3 2 3 3 4 4 0.005 4 2 3 3 3 3 0.025 3 2 3 3 4 5 0.005 4 3 3 3 3 3 0.101 3 2 3 3 5 5 0.030 4 3 3 3 3 4 0.005 3 2 3 4 3 3 0.010 4 3 3 3 3 5 0.005 3 2 5 3 4 5 0.005 4 3 3 3 4 4 0.010 3 3 3 I 3 3 0.005 4 3 3 3 4 5 0.010 3 3 3 3 3 3 0.442 4 3 3 3 5 5 0.005 3 3 3 3 3 4 0.015 468
Таблица 9.10. Подходящие реконструктивные гипотезы для функции поведения, приведенной в табл. 9.9 (пример 9.6—операции на открытом сердце) а) С-структуры б) G-структуры 1 Структура Di 1 Структура Dl 1 12346/12456 0.0 1 1234/236/246/346/5 0.0127 12345/12346 0.0 2 1234/236/346/5 0.0127 2 12346/1245 0.0 3 1234/346/26/5 0.0127 3 12346/145 0.005 4 1234/26/36/46/5 0.0127 4 12346/15 0.0089 5 12346/5 0.0099 6 1234/2346/5 0.0127 и т. д.) могут быть получены разные функции поведения. Маска, для которой определена функция поведения, выделена УРСЗ как наилучшая в следующем смысле: это единственная маска при ДМ=2 с шестью выборочными переменными, которая приводит к наименее нечеткой ST-системе. Представляющая для анестезио- лога максимальный интерес ST-функция была также определена УРСЗ, но здесь в силу большого размера ее матрица 27X27 или список из 729 записей) не приводится. Для обработки данных существует много других способов ис- пользования УРСЗ. В качестве иллюстрации применим определен- ный вариант анализа реконструируемости функции поведения из табл. 9.9. Такой подход характеризуется следующими требования- ми: сначала анализируются С-структуры, а затем анализируют- ся G-структуры в классах r-эквивалентности максимально уточненных допустимых С-структур; максимально допустимый рост расстояния между уровнями уточнения С-структур составляет 0.016; G-структуры в рассматриваемых классах г-эквивалентности допустимы только тогда, когда их расстояние совпадает с рас- стоянием соответствующей С-структуры; используется расстояние Хемминга; для итерационной про- цедуры объединения А=0.0001. В соответствии с этими требованиями в табл. 9.10а перечисле- ны допустимые С-структуры на отдельных уровнях уточнения. Единственно допустимой является структура 1234/26/36/46/5; ее лучший предшественник приведен в табл. 9.106, а схема показана на рис. 9.14,6. Эта структура может значительно помочь анесте- зиологу. Например, она показывает, что систолическое кровяное давление слабо зависит от других переменных, в особенности от частоты пульса и среднего кровяного давления (см. табл. 9.10а при 1=1. 2), и что одновременно не надо рассматривать более четырех 469
(из шести) переменных. Хотя из данной структурированной систе- мы можно получить и другие результаты, их дальнейшую интер- претацию лучше предоставить соответствующим медицинским экс- пертам. Пример 9.7. Этот пример иллюстрирует применение УРСЗ в археологии. Здесь описывается малая часть большого исследова- ния, выполненного в период 1978—1980 гг. (примечание 9.5). Объ- ектом изучения являлся Браун-Нолл, доисторическое поселение в центральной части шт. Нью-Йорк. Поселение находилось на вер- шине каменистого холма в долине слияния рек Саскуэханна и Ше- невас-Крик. Из предыдущих археологических работ было известно, что на Браун-Нолл есть участки, где сохранились следы различных видов деятельности доисторических охотников — каменные инструменты, костяные и деревянные изделия, орехи, остатки очагов и жилищ и т. п., относящиеся приблизительно к периоду от 3000 до 500 года до н. э. Обычные методы археологических раскопок в этом случае были неприменимы, поскольку требовалась вертикальная страти- графия почвы, необходимая для разделения разных по времени поселений. Кроме того, местность частично была деформирована недавними пахотными работами. При проведении археологических работ использовалось два ви- да раскопок: 1) 1068 пробных расположенных в 5 м друг от друга шурфов (максимально допустимая в этом месте глубина и диаметр археологических раскопок составляет 30 см); 2) 291 более круп- ный раскоп (1X1 м). Пробные шурфы делались для определения мест концентрации археологических находок, и в дальнейшем та- кие шурфы раскапывались в квадраты. Множество положений от- дельных раскопов (пробных шурфов или квадратов) представляет в этом примере параметрическое множество. Хотя правильное рас- положение в пространстве пробных шурфов можно использовать для изучения пространственного отношения с помощью набора масок, в этом примере ограничимся масками без памяти. Находки в каждом раскопе описывались с помощью четырех переменных: нарушенные слои, блоки, обломки, целые слои. Для каждой пере- менной было выделено от двух до пяти состояний. Они были опре- делены УРСЗ. исходя из условия равных частот. В табл. 9.11 при- ведены примеры двух множеств полученных разрешающих форм. В ходе исследования были определены некоторые другие множе- ства разрешающих форм, основанные на условиях равных частот, и для каждой соответствующей системы с поведением без памяти был выполнен анализ реконструируемости. Было показано также, что такие изменения в разрешающих формах рассматриваемых переменных слабо влияют на множество решений. Это означает, что допустимые гипотезы реконструкции хорошо параметризованы. В этом примере из определенных в табл. 9.11 разрешающих форм рассматривается только множество II. Использовались три 470
Таблица 9.11. Примеры двух множеств разрешающих форм для функции иоведения, приведенной в табл. 9.9 Переменные Идентификаторы состояний 0 1 2 3 Множество 1 pj (нарушенные слои) 0 1.2 >3 — (блоки) 0 1.2 >-3 — v3 (обломки) 0 1.2 — (слои) 0—2 3—8 9—14 >*15 Множество П Переменные 0 1 2 3 4 V, (нарушенные слои) 0 — — — va (блоки) 0.1 >2 — —~ у3 (обломки) 0 >1 — vt (слои) 0 1 2 3,4 ^5 Таблица 9.12. Вероятностные функции поведения из примера 9.7 (археологические раскопки) «1 «2 «3 «4 Л (с) fl (с) /з(с) «1 и2 «3 и4 Я (с) Л (с) Уз (с) с=0 0 0 0 0.628 0211 0.437 1 0 0 0 0.002 0.023 0.011 0 0 0 1 0.103 0.137 0.119 1 0 0 1 0.007 0.012 0.009 0 0 0 2 0.050 0.114 0.081 1 0 0 2 0.004 0.008 0.006 0 0 0 3 0.042 0.123 0.079 1 0 0 3 0.005 0.025 0.014 0 0 0 4 0.056 0.142 0.095 1 0 0 4 0.016 0.027 0.020 0 0 1 0 0.012 0.016 0.014 1 0 1 0 0.002 0.002 0.002 0 0 1 1 0 0.014 0.007 1 0 1 1 0.004 0.002 0.003 0 0 1 2 0.004 0.010 0.007 1 0 1 2 0.002 0 0.001 0 0 1 3 0.002 0.012 0.007 1 0 1 3 0 0.008 0.004 0 0 1 4 0.010 0.027 0.018 1 0 1 4 0.009 0 0.005 0 1 0 0 0.004 0.012 0.008 1 1 0 0 0 0 0 0 1 0 1 0.005 0.006 0.006 1 1 0 1 0.002 0 0.001 0 1 0 2 0.002 0.010 0.006 1 1 0 2 0 0.002 0.001 0 1 0 3 0.004 0.014 0.009 1 1 0 3 0 0 0 0 1 0 4 0.016 0.020 0.018 1 1 0 4 0.007 0.002 0.005 0 1 1 0 0.002 0.004 0.003 1 1 1 0 0 0 0 0 1 1 1 0 0 0 1 I 1 1 0 0 0 0 1 1 2 0 0.004 0.002 1 1 1 2 0 0 0 0 1 1 3 0 0 0 1 1 1 3 0 0 0 0 1 1 4 0.004 0.008 0.006 1 1 1 4 0.002 0.002 0.002 471
О 12 3^55 L Рис. 9.15. Результаты рекон- структивного анализа из при- мера 9.7 (археологические раскопки) соответствующих множества данных, основанных на нераспаханных пробных шурфах; распаханных пробных шурфах; всех пробных шурфах. В табл. 9.12 приведены вероятност- ные функции поведения, полученные из этих трех множеств данных и обо- значенные соответственно fj, fz и f3. До- пустимые множества гипотез реконст- рукции (основанные исключительно на С-структурах) приведены на каж- дой из них в табл. 9.13, соответствую- щие зависимости Di от I показаны на рис. 9.15. Пример 9.8. Этот пример основан на исходной системе, опреде- ленной моим ассистентом Майклом Питарелли в соответствии с указаниями к упражнению 2.7. Он выделил следующие пять пе- ременных. каждая из которых может принимать четыре состояния (О — низкое, 1—среднее, 2—высокое, 3 — очень высокое): и, — энергетический уровень; Vz— количество потребляемых жиров; из — количество потребляемых углеводов; и4 — число упражнений; v5 — продолжительность сна (в предыдущую ночь). Каждое утро фиксировались состояния переменных ..., и4 в предыдущий день и состояние переменной v5 на текущий день. Таблица 9.13. Подходящие множества реконструктивных гипотез из примера 9.7 Номер Структура Вероят- ность Номер Структура Вероят- ность а) Нераспаханные пробные шурфы 4 14/24/3 0.0075 а) > в) (fi) 5 24/1/3 0.0095 а) 1 134/234 0.0006 б), в) 6 1/2/3/4 0.0120 а), в) 2 134/24 0.0016 Нет 3 14/24/34 0.0059 В) в) Все пробные шурфы (fs) 4 14/24'3 0.0126 б), в) 5 6 24/1/3 1/2/3/4 0.0286 0.0400 б) б), в) 1 2 134/234 14, 234 0.0007 0.0019 а), б) Нет б) Распаханные пробные шурфы (/,) 3 14/24/34 14/24/3 14,2/3 1/2/3/4 0.0036 а) 1 2 3 134/234 13/234 1/234 0.0023 0.0039 0.0058 а), в) Нет Нет 4 5 6 0.0077 0.0140 0.0208 а), б) Нет а), б) 472
Рис. 9.16. Допустимые маски при наибольшей допустимой маске М из приме- ра 9.8 (самонаблюдение) Следующая выборка данных была получена в течение начального периода (50 дней): и1Д=21101101022112221021022121021212212133321012222102 и2,/ = 221031101210223211021112112110212122221311011121212 Оз, /=2111131221123111013331122322221132201232323121331 и4,/=301001020230020100210220100002013001202030011101200 и3.#=012112221331322002212233313132130100321001121120011 Из анализа данных с целью выделения допустимых систем с по- ведением при ДМ=2 и обычном требовании (нечеткость, слож- ность) следует, что допустимые маски для вероятностного и воз- можностного подходов полностью совпадают. Они показаны на рис. 9.16,а, где выборочные переменные имеют тот же смысл, что и на рис. 9.16,6. На рис 9.16,в изображены зависимости порожда- ющих нечеткостей от размеров масок. 473
—Продолжительность сна Энергетический уровень __ Количество потребляемых жиров _ Количестдо потреб- ляемых углеводов —Число упражнений в) Рнс. 9.17. Реконструктивный анализ нз примера 9.8 Теперь можно осуществить анализ реконструируемости для си- стем с поведением, основанных на некоторых из этих допустимых масок. В качестве иллюстрации опишем здесь случай возможно- стного подхода для маски с шестью выборочными переменными (рис. 9.17,а) (для вероятностного анализа число наблюдений не- достаточно) и С-структур. Зависимость А от I для этой маски показана на рис. 9.17,6. Видно, что уровни уточнения естественным образом кластеризуются на 1=1, 2, 3. Для первых трех уровней допустимые гипотезы реконструкции единственны: 13456/23456 (/=1); 1345/2345/1456/2456 (/=2); 1345/1456/2456 (1=3) Каждая из этих гипотез четко отличается (по информационно- му расстоянию) от конкурирующих гипотез на этом же уровне уточнения. В противоположность этому на каждом уровне при ^4 возникают большие кластеры допустимых гипотез реконструк- ции. Следовательно, гипотеза 1345/1456/2456 представляется наи- более информативной. На рис. 9.17,в показана ее схема. 474
Для того чтобы показать влияние переменных и1( и2, v3 на переменные из и v3, представляющие в исследуемой системе наи- больший интерес, необходимо ввести соответствующие направле- ния для переменных. Переменная v6 определяется либо функцией 2f, либо функцией 3f (но не одновременно). Возникающая дилемма может быть решена следующим образом: определив неопределен- ности в обоих случаях, надо выбрать вариант с меньшей нечетко- стью. Тогда одна из двух функций (г[ или 3f) не используется, и соответствующую подсистему можно исключить из рассмотрения. Другая возможность решения дилеммы, связанная с управлением переменной v3, заключается в объединении подсистем 1456 и 2456 в одну большую подсистему, как показано на рис. 9.17,г. Определенная выше исходная система (или ее модификации) может также рассматриваться как метасистема. В этом случае данные необходимо разбить на отдельные фрагменты, характери- зующиеся определенными особенностями, такими, как специаль- ная диета, чрезмерные нагрузки (до и во время соревнований) и др. Каждое характерное подмножество данных должно анализи- роваться независимо от других подмножеств и результирующие системы с поведением или структурированные системы должны быть затем объединены в одну метасистему с помощью соответ- ствующей процедуры замены. Пример 9.9. Рассмотрим показанный на рис. 9.18,а простой пе- реключающий контур, состоящий из двух элементов, представля- ющих логические функции И и ИЛИ. При всех состояниях вход- ных переменных и2, ^з, Щ выходные переменные V5 и г>6 нахо- дятся в показанных на рис. 9.18,6 состояниях. Очевидно, что из-за отмеченных на рисунке состояний а и b система не детерминиро- вана; у нее есть память. Когда У]=и2= 1, а из=и4=0, то действи- тельное состояние выходных переменных v5 и v3 содержит инфор- мацию о последнем изменении входных переменных. Например, если последнее изменение связано только с переменными v} и и2, то и5=г?б=О; если оно связано только с переменными v3 и и4, то 05 = 06=1- Предположим теперь, что в силу некоторого дефекта в связях системы состояние а никогда не реализуется, а все остальное не изменилось. Предположим, что у нас для определения дефекта нет прямого доступа к системе. Тогда единственный непрямой спо- соб определения дефекта заключается в анализе реконструктивных свойств новой системы с поведением (системы без состояния а), находящейся в соседстве со структурой, представляющей коррект- ную систему, показанную на рис. 9.18,а. Рассматривая все пере- численные на рис. 9.18,6 состояния, кроме состояния а, как допу- стимые, а остальные состояния как недопустимые, в результате возможностного анализа С-уточнений корректной структуры 1256/3456 получаем две структуры с нулевым расстоянием: 125/3456/156 и 125/3456/256. Из дальнейшего уточнения каждой из 475
V1 V2 v3 V5 Ug О О О О О 0 О О О 1 a 1 0 0 1 0 0 1 0 0 110 1 0 1 0 0 0 0 о 1 0 1 о 1 0 1 10 0 1 0 1 1 1 0 1 1 О О О О 0 10 0 10 1 1 о 1 0 0 1 10 110 1 1 1 0 0 0 0 110 0 11 110 111 1110 11 111111 Рис. 9.18. Определение дефекта соединения (пример 9.9) них следует, что только структура 125/3456 имеет нулевое состоя- ние. Производя следующее уточнение, получаем, что ее остальные прямые уточнения имеют ненулевое состояние. Таким образом, структура 125/3456 представляет новую систему; ее схема показа- на на рис. 9.18,в. Теперь дефект становится очевидным: нарушена связь между переменной v6 и элементом И. В этом примере, поскольку мы предполагали изменения в свя- зях, но не разрушение переменных, применение 7?С-процедуры было достаточно. Пользователь может также использовать УРСЗ в интерактивном режиме и запросить только те структуры, кото- рые соответствуют дефектам связей, например 1256/346, 125/3456, 256/3456, 156/3456 и т. д. Отметим, что в этом примере не рассматривается, каким имен- но способом осуществлена физическая реализация системы. Каж- дая конкретная реализация может иметь какие-либо дополнитель- ные особенности, которые необходимо учитывать. Тем не менее всегда при решении задач этого типа пользователь может обра- щаться за помощью к УРСЗ. Пример 9.10. В примере 3 8 кратко был рассмотрен монитор как один из подходов к оценке производительности вычислитель- ных систем. Ниже на конкретном примере показано применение УРСЗ в этой предметной области. 476
Было отмечено, что в течение временных интервалов порядка 20 мин эффективность работы центрального процессора вычисли- тельной системы снижается со 100 до 80% и ниже. Чтобы изба- виться от этого необычного явления, был проведен мониторинг девяти тщательно отобранных переменных, характеризующих вы- числительную систему. Наблюдение осуществлялось, когда снизилась эффективность работы центрального процессора. Длительность наблюдения со- ставляла 49 мин с уровнем разрешения 30 с. Это значит, что име- лось 98 наблюдений. В каждом из наблюдений в течение соответ- ствующего интервала в 30 с регистрировалась эффективность ра- боты (в процентах) каждого рассматриваемого элемента. Затем с помощью УРСЗ эти данные были преобразованы к булевому виду. Было потребовано, чтобы состояния этих новых переменных определялись между «высокой» и «низкой» эффективностями соот- ветствующих элементов, исходя из их средних значений, опреде- ленных по исходным данным. Все булевы переменные были одина- ково определены следующим образом: (0, если эффективность меньше среднего значения, ( 1 во всех остальных случаях. Следующий список определяет взаимосвязь между переменны- ми и элементами компьютера, а также содержит среднее значение каждой переменной: Ui — центральный процессор (04 = 30%); иг — супервизор (02=43%); из — решение задачи (а3=45%); v4 — канал 1 (^4=10%); v5 — канал 3 (<25= 10%); о6 — канал 5 (а6=10%); и7 — устройство 160, связанное с центральным процессором каналом 1 (а7=3%); и8— устройство 162, связанное с центральным процессором каналом 1 (а8=56%); ид — устройство 163, связанное с центральным процессором каналом 1 (аэ=44%). В этом примере первый раз УРСЗ использовался при опреде- лении значений а,- по исходным данным, затем при приведении исходных данных к булевому виду. Матрица данных здесь не при- водится, поскольку очень велика (9X98). Затем с использованием УРСЗ данные были преобразованы к маске без памяти и была определена вероятностная функция поведения. После этого для С-структур, не требующих итерацион- ной процедуры объединения, были рассмотрены свойства реконст- рукции этой функции. Расстояние Хемминга задавалось пользова- телем. В табл. 9.14 перечислены все допустимые при данных тре- бованиях гипотезы реконструкции, на рис. 9.19 показана зависи- 477
Таблица 9.14. Подходящие реконструктивные гипотезы из примера 9.10 (оценка производительности компьютера) 1 Структура 8М 1 Структура 81,Z 1 12345678/12346789 0.0000 16 235678/1257/47/19 0.12215 12345678/12456789 0.0000 17 23578/25678/1257/47/19 0.1469 12345678/13456789 0.0000 18 23578/2567/1257/47/19 0.1594 12456789/23456789 0.0000 19 23578/267/1257/47/19 0.16855 2 12345678/1246789 0.0000 20 23578/26/1257/47/19 0.17775 12345678/1346789 0.0000 21 23578/26/1257/4/19 0.1923 2345678/12456789 0.0000 22 23578/26/127/4/19 0.20675 12345678/1456789 0.0000 23 2357/3578/26/127/4/19 0.21265 3 12345678/146789 0.0000 24 2357/578/26/127/4/19 0.24105 4 12345678/14789 0.00825 25 235/578/26/127/4/19 0.2707 5 12345678/1789 0.01515 26 235/578/6/127/4/19 0.2883 6 1235678/1245678/1789 0.02025 27 235/57/78/6/127/4/19 0.31105 7 235678/1245678/1789 0.02026 28 235/78/6/127/4/19 0.34045 8 235678/1245678/179 0.02715 29 23/35/78/6/127/4/19 0.34355 9 235678/1245678/19 0.0391 30 23/35/78/6/127/4/9 0.3507 10 234678/125678/245678/19 0.0501 31 23/35/78/6/17/27/4/9 0.36715 11 235678/12567/245678/19 0.0551 32 23/5/78/6/17/27/4/9 0.3723 12 235678/12567/24578/19 0.06655 33 3/4/5/6/78/17/27/9 0.39955 13 235678/1257/24578/19 0.08285 34 3/4/5/6/8/9/17/27 0.41165 14 235678/1257/2478/19 0.09945 35 2/3/4/5/6/8/9/17 0.4209 15 235678/1257/478/19 0.1113 36 1/2/3/4/5/6/7/8/9 0.66085 мость расстояния от уровня уточнения. Прослеживая приведенную в таблице последовательность уточнений, можно выделить наибо- лее важные проекции всех функций поведения, их степень и поло- жение в решетке уточнений. Цель состоит в обработке этой инфор- мации для выработки стратегий повышения эффективности работы вычислительной системы. Пример 9.11. Для получения количественной оценки атаки в бейсболе было предложено множество функций, основанных на переменных, характеризующих атакующие действия отдельных иг- роков. В статье «Оценка моделей атаки в высшей лиге бейсбола» предложено десять таких функций оценки атаки. В этой статье приведены данные, содержащие 5 из этих оценок для 33 лучших игроков Национальной и Американской лиги; эти оценки называ- ются ВА (средний уровень), SP (сила удара в процентах), ОА (чи- сло атак, ОРА (число результативных атак), ERPA (число резуль- тативных перебежек). Один из возможных способов количественного описания этих оценок и их относительной значимости состоит в осуществлении анализа реконструируемости данных. Система данных содержит пять переменных (пять оценок), один параметр (группа из 33 бейс- 478
Таблица 9.15. Пример 9.11 (бейсбол) а) Разрешающие формы Средний уровень (ВА): О—[0, 0.277]; 1—(0.277, 0.307); 2—[0.307, 0.8] Сила удара в процентах (SP): 0—[0, 0.443); 1—[0.443, 0.461); 2[—0.461, 0.8] Среднее число атак (ОА): О—[0, 0.515); 1—[0,515; 0.533); 2—[0.533, 0.8] Среднее число результативных атак (ОРА): О—[0, 0.472); 1—[0.472, 0.491); 2—[0.491, 0.8] Число результативных перебежек (ERPA): О—[0, 0.147); 1—[0.147, 0.16); 2—[0.16, 0.8] б) Подходящие реконструктивные гипотезы Структура Расстояние 1 1234/1345 0.0069 2 1234/145 0.0221 3 1234/45 0.0357 4 123/234/45 0.0580 5 124/34/45 0.0771 6 14/24/34/45 0.1030 7 1/24/34/45 0.1778 8 1/2/34/45 0.2777 9 1/2/3/45 0.3975 10 1/2/3/4/5 0.5309 болистов)и матрицы данных 5X33, которая здесь не приводится. Перед выполнением реконструктивного анализа пользователь при- нял решение укрупнить разрешающие формы переменных, пони- зив число состояний каждой переменной до трех. В табл. 9.15,а приведены соответствующие результаты. Затем были отобраны данные и на основании уравнения (3.33) определена возможност- ная функция поведения. В результате в множестве 5F3 были опре- делены допустимые гипотезы реконструкции; они перечислены в Рис. 9.19. Зависимость расстояния от уровня уточиеиия в примере 9.10 (оценка производительности компью- тера) Рис. 9.20. Зависимость расстояния от уровня уточнения в примере 9.11 (бейсбол) 479
табл. 9.156. Переменные обозначены цифрами: 1 — ВА; 2 — SP; 3 — ОА; 4 — ОРА; 5 — ERPA. На рис. 9.20 показано увеличение расстояния (потеря информации) по мере уточнения. Видно, что скорость изменения очень мала при /^6 и резко возрастает при Z^6. Следовательно, наиболее информативная гипотеза реконст- рукции находится на шестом уровне: 14/24/34/45. Это, с очевидно- стью, означает, что переменная представляет наиболее важную оценку, поскольку любая другая оценка может быть получена не- посредственно из нее. 9.8. ЭВОЛЮЦИЯ УРСЗ Создается впечатление, что по мере то- го, как расширяются наши возможности в решении задач, круг задач расширяет- ся с той же скоростью. В результате за горизонтом всегда оказываются новые категории задач, требующие еще боль- ших усилий. Дейвид Химмельблау В соответствии с принятой терминологией УРСЗ — экспертная система. Блестящую характеристику экспертным системам дали Брайан Гейнс и Милдред Шоу1. Экспертные системы на больших компьютерах позволяют неопытному пользо- вателю использовать в качестве руководства записанное ранее «знание» эксперта или «коллективное знание» многих экспертов. Используя экспертные системы, Вы обсуждаете с «коллегой» проблемы медицинской диагностики или поиска нефти, или сложные процессы математического открытия. Вы дискутируете с ними, спра- шиваете их мнение и в результате сотрудничества с теми, кто, может быть, давно умер, приходите к решению. Вычислительная техника затрагивает самую суть нашего существования, по- скольку общение — это сердце человеческой цивилизации. Мы представляем собой уникальный вид благодаря нашим способностям к адаптации и обучению, влия- ние которых чрезвычайно усиливается благодаря нашей способности общаться. Вполне достаточно, чтобы только один человек получил знания непосредственно из собственного опыта. Остальным можно рассказать, а среда позволяет перене- сти рассказанное через пространство и время. Новая среда действительно изме- няет наш мир, а компьютер обеспечивает самое необходимое для кодирования не самого разговора, а возможности разговаривать, не самой картины, а воз- можности ее воссоздать. Согласно Дж. Сова «Экспертная система—это система, основан- ная на знании, объединяющая достаточно знаний, чтобы достиг- нуть экспертного уровня» [296]. В то время как большинство опй- 1 Nature, 30, April 28, 1983, р. 772. 480
санных в литературе экспертных систем предоставляют пользова- телю знания о традиционных дисциплинах (например, о конкрет- ных областях медицины или права), роль УРСЗ заключается в том, чтобы помочь пользователю при рассмотрении системных за- дач. Таким образом, УРСЗ объединяет системные знания и мето- дологию, и, следовательно, его применение выходит за рамки тра- диционных дисциплин. По сравнению с экспертными системами другого вида, цель ко- торых заключается в решении задач в целом (универсальные ре- шатели задач) возможности УРСЗ ограничены, он решает исклю- чительно системные задачи. Это ограничение умышленное и отра- жает мою философскую точку зрения, что симбиоз человек — ком- пьютер представляет собой наилучшее средство для решения задач в целом и что потенциальные возможности компьютера макси- мальны в задачах, которые рассматриваются как системные. Цель УРСЗ заключается в максимальной реализации этих потенциаль- ных возможностей. Одна из главных, но недостаточно четко акцентированных ра- нее особенностей архитектуры УРСЗ, которой мы пока недоста- точно уделяли внимание, является то, что по своей природе она эволюционна. Для того чтобы более тщательно пояснить этот аспект, я должен сначала показать, что концептуальная схема УРСЗ, так же, как и используемые знания и методологические основы, не должна развиваться в изоляции от традиционных дис- циплин. В самом деле, традиционные дисциплины рассматривались как источники системных идей, из которых и должна была воз- никнуть архитектура УРСЗ. Фактически все традиционные дисциплины тем или иным обра- зом были связаны с системными задачами определенных типов и, следовательно, были разработаны методы для решения этих задач. Развитие любой из них внесло свой вклад в изучение систем и ме- тодологию их решения; результаты фактически были получены в рамках каждой из этих дисциплин. Я должен подчеркнуть, что описанная в этой книге концепту- альная схема УРСЗ в значительной степени развивалась около двух десятилетий в процессе тщательного определения понятия системы и соответствующих задач при изучении многих отдельных дисциплин, абстрагирования их от контекста, введения соответст- вующих категорий и, в конце концов, объединения их в одно связ- ное целое. Хотя настоящая схема весьма устойчива, эти процессы продолжаются, и в будущем может возникнуть необходимость в расширениях и других эволюционных изменениях этой схемы. Аналогичные процессы происходят и в процессе эволюции базы знаний УРСЗ, методологических и метаметодологических основ. Очевидно, что отбор системных понятий, методов и знаний из различных традиционных дисциплин — только часть всего процес- са развития архитектуры УРСЗ. В действительности это только 31-6923 481
0 Традиционные дисциплины Рис. 9.21. Эволюция архитектуры УРСЗ основа для настоящих исследований УРСЗ, цель которых состоит в том, чтобы, определяя и заполняя пробелы в концептуальной схеме, сделать ее по возможности полной и всесторонне совершен- ствовать знания и методологические основы, особенно в тех важ- ных областях, которые пока недостаточно развиты. Еще один дополнительный и весьма важный аспект эволюцион- ной природы архитектуры УРСЗ заключается в необходимости то- го, чтобы УРСЗ был адаптируем к нуждам его пользователей. На обычном языке это означает, что предполагается хранение записей о всех взаимодействиях пользователь — УРСЗ и использование этой информации в дальнейших исследованиях УРСЗ. Для этой 482
цели определенный интерес представляют записи и неудачных вза- имодействий пользователя н УРСЗ, поскольку они могут обозна- чить недостатки интерфейса пользователь — УРСЗ, методологиче- ски недостаточно исследованные типы задач или даже необходи- мость расширения концептуальной схемы. На рис. 9.21 показан описанный выше процесс развития архи- тектуры УРСЗ. Цифры при соответствующих связях на диаграмме имеют следующий смысл: 1 — процессы выделения, абстрагирования, введения катего- рий и объединения соответствующих понятий, знаний и методов из традиционных дисциплин; 2 — четыре области исследования УРСЗ; 3 — используемая как руководство при исследовании УРСЗ информация о взаимодействиях пользователей и УРСЗ. Поскольку среда, в которой развивается УРСЗ (традиционные дисциплины и представляющие эти дисциплины пользователи УРСЗ), имеет определяющее значение для его эволюции, то пред- ставляется возможным охарактеризовать архитектуру УРСЗ как естественную. Позвольте мне закончить этот раздел и эту книгу цитатой: Полезна полнота без полноты. Желательна завершенность без завершения. ПРИМЕЧАНИЯ 9.1. Пример 9.1 часто обсуждается в литературе по статистике. В частности, ои приведен в книге Бишопа [43, с. 87], где содержится информация об источ- нике данных. 9.2. Пример 9.3 рассмотрен с использованием статистических методов в книге D. R. Сох and Е. J. Snell Applied Statistics (Chapman and Hall, New Jork, 1981, p. 155), где содержится информация об источнике данных. 9.3. Пример 9.5 заимствован из докторской диссертации М. Хигаши в уни- верситете г. Бингемтон, шт. Нью-Йорк [156]. Экономические данные были собра- ны биологической полевой станцией Корнеллского университета; климатические данные содержатся в Local Climatological Data (Syracuse, New York, 1977), опу- бликованном министерством торговли США. Более подробная информация об исходных данных содержится в работе [156]. 9.4. Рассмотренное в примере 9.6 исследование описано в статье [319]. Ра- бота выполнялась в Академической больнице Лейденского университета при под- держке Технического университета в Эйндховене и Нидерландах в 1979 г. Обра- ботка была осуществлена с помошью пакета SAPS, представляющего собой гиб- кую систему, спроектированную в духе УРСЗ. 9.5. Пример 9.7 основан на небольшом фрагменте выполненного с использо- ванием УРСЗ проекта, осуществленного Дж. Уонсфон в университете шт. Нью- 483
Йорк с 1978 по 1980 гг. Весь проект описан в сообщении «Системное моделиро- вание археологической местности «(Systems Modeling of an Archaeological Site, Systems Science Department, SUNY-Binghamton, New York, 1980). Хотя в при- мере 9.7 используется информационное расстояние, сам проект был реализован для расстояния Хемминга. 9.6. Примененный в примере 9.6 метод преобразования данных, собранных на вычислительной системе с помощью аппаратного наблюдения, был предложен Р. Орчардом из фирмы Bell. Он также предоставил мне исходные данные и пред- ложил постановку задачи. 9.7. Хороший обзор экспертных систем, содержащий полезную библиогра- фию, выполнен Вейсом и Куликовским [355]. 9.8. Завершающая эту книгу цитата взята из книги Лао-цзы Дао Дэ Цзин. УПРАЖНЕНИЯ 9.1. Выведите формулу (9.1). 9.2. Рассматривая только существенные методологические отличия, перечис- ленные в табл. 9.2, определите полное число типов систем, основанных иа одном параметре и трех переменных, в предположении, что они являются: а) исходными системами; б) системами данных; в) порождающими системами; г) структурированными порождающими системами. 9.3. Повторите упражнение 9.2 для: а) двух параметров и четырех переменных; б) одного параметра и п переменных; в) двух параметров и п переменных. 9.4. Для каждой подзадачи, входящей в анализ реконструируемости, опреде- лите вид задачи (первый или второй). 9.5. Рассматривая только такие системы, в которых все переменные одного методологического типа и все параметры тоже одного методологического типа, определите число допустимых типов систем при условии, что перечисленные в табл. 9.1 эпистемологические типы и приведенные в той же таблице методоло- гические отличия являются допустимыми. 9.6. Осуществите расширение показанной на рис. 9.1 эпистемологической иерархии для 1=3.
ПРИЛОЖЕНИЕ А. СПИСОК ОБОЗНАЧЕНИЙ ОСНОВНЫЕ ОБОЗНАЧЕНИЯ {х, г/,...} {х | р(х)} (х1; лг,..., х„) XiJ, а, Ь] а, Ь) а, °0) — множество элементов х, у, ... — множество, определяемое свойством р — n-мерный вектор (п-ка) — матрица — замкнутый отрезок — полуинтервал — множество действительных чисел, больших х^Х X = Y X±Y X — Y XC.Y XqY 0 &X) A| XP\Y X,XY X X — Y fog i* g Г , [fl A] или равных а — принадлежность множеству — равенство множеств — неравенство множеств — разность множеств — X является подмножеством Y — X является строгим подмножеством Y — пустое множество — множество всех подмножеств множества X — мощность множества X — пересечение множеств — объединение множеств — декартово произведение множеств X и У — декартово произведение Х\Х — отображение из X в У — композиция функций f и g — объединение функций или отношений fag — функция, обратная к функции f — проекция функции поведения относительно f переменных из множества X — отношение эквивалентности, заданное функ- f XIS цией f — множество классов эквивалентности (или разбиений) множества X, основанное на от- ношении эквивалентности в= — меньше 485
< — меньше или равно, или частичное упорядоче- ние — эпистемологическое упорядочение систем — отношение включения * /\У — пересечение (наибольшая нижняя граница) в решетке х\/У — соединение (наибольшая верхняя граница) в решетке X 1 у х—* у х*—у V а 2 и тах(хъ — х при условии у — из х следует у — х тогда и только тогда, когда у — для любого — существует хотя бы одно — сумма — произведение х„..., хп) —максимальное значение из последовательно- сти Х1, х2, хп min(x1, х2 хп) —минимальное значение из последовательности хь х2, хп N No Nn Кп,т R п\ — множество положительных целых чисел — множество неотрицательных целых чисел — множество {1, 2, ..., и} — множество {п, п-}-1, .... ш} — множество действительных чисел — n-факториал (п!-п(п—1) ... 1) / п \ \ г 1 — число сочетаний из и по г (равно nl/(n—г)!г!) СПЕЦИАЛЬНЫЕ ОБОЗНАЧЕНИЯ а„ At Ь}, В} с с С — свойство и множество его проявлений — база и множество ее значений — функция I-отсечения (уравнение (3.53)) — обобщенное состояние системы (сеС) — множество всех состояний системы СХ yi Сх,у — нейтральное или направленное соединение элементов х и у структурированной системы (уравнений (4.5), (4.8)) й. п » а — множество всех С-структур с п переменными — четкие и нечеткие данные (уравнения (2.21), d, d (2.27)) — четкая матрица данных и нечеткий массив данных D, D — нейтральная и направленная система данных (уравнения (2.22), (2.24)) 486
SD, D — нейтральная и направленная система данных D с семантикой (уравнения (2.23), (2.25)) — информационное расстояние (уравнение h (4.40), (4.42)) — конкретизация обобщенной переменной щ 1 f (уравнения (2.4)) — обобщенное состояние входных переменных — обобщенное состояние всех переменных си- E E стемы, кроме входных —• множество всех входных состояния системы — множество всех обобщенных состояний систе- мы, не включающее входных 8 fe, fe — обобщенный канал конкретизации — нейтральная или направленная функция по- ведения (уравнения (3.18), (3.26)) fGB, /gb — нейтральная или направленная порожденная функция поведения (уравнения (3.22), (3.29)) fs9 Is — нейтральная или направленная ST-функция (уравнения (3.74), (3.90)) |gs, |gs — нейтральная или направленная порождающая ST-функция (уравнения (3.75), (3.91)) Fb, Fb — нейтральная или направленная система с по- ведением (уравнения (3.10), (3.27)) Fgb, Fgb — нейтральная или направленная порождающая система с поведением (уравнения (3.15), (3.30)) Fs, Fs — нейтральная или направленная ST-система (уравнения (3.77), (3.93)) Fgs, Fgs — нейтральная или направленная порождающая &SP ST-система (уравнения (3.78), (3.94)) — семейство реконструкций структурированной g, g системы SF — множество порожденных и порождающих вы- G, G борочных переменных — множество всех общих состояний порожден- ных или порождающих выборочных перемен- ных H i, i — множество всех G-структур с п переменными — энтропия Шеннона (уравнение (3.37)) — общее и конкретное нейтральное представле- ние подобной системы (уравнения (2.11), (2.12)) 487
1,1 — общее и конкретное представление направ- ленной подобной системы (уравнения (2.17), Lf (2.18)) — множество уровня распределения возможно- %v XVI M Mt стей функции f (уравнение (3.55)) — решетка переменных — решетка разрешения — маска (уравнение (3.5)) — подмаска, связанная с переменной и, (урав- нение (3.8)) Ma &M M+ MX Ob Oi — порождающая маска (уравнение (3.11)) — глубина маски М — расширенная маска — метасистема, основанная на системах типа X — частота (число наблюдений) состояния с — четкий и нечеткий каналы наблюдения пере- менной Vt (уравнения (2.2) и (2.8) или (2.9)) 0, 6 — нейтральная и направленная система объек- та (уравнения (2.1), (2.16)) о, 0 — четкий или нечеткий общий канал наблюде- ния (уравнение (2.13)) r — множество всех P-структур с п переменными — функция замены метасистемы (уравнение (5.2)) ri R ski $k — правило сдвига (уравнение (3.1)) — множество правил сдвига — выборочная переменная (уравнение (3.3)) и множество ее состояний s, s — нейтральная или направленная исходная си- стема (уравнения (2.15), (2.19)) SX — структурированная система, основанная на системах типа X u u — входной-выходной идентификатор — U-нечеткость (возможностная мера нечетко- сти информации) (уравнение (3.56)) Vb Щ Vi, vt — общая и конкретная переменная — общее и конкретное множество состояний пе- ременной Vi и in соответственно Vi — полное множество состояний переменной ц, (ieJVn) Wj, Wj W,, Wj — общий и конкретный параметр — общее и конкретное параметрическое множе- ство Wj или w/ соответственно 488
— полное параметрическое множество — конкретизация обобщенного параметра wt (уравнение (2.5)) — четкий и нечеткий параметрические каналы наблюдения &/ (уравнения (2.3), (2.10)) ПРИЛОЖЕНИЕ Б. ТОЛКОВЫЙ СЛОВАРЬ ИСПОЛЬЗУЕМЫХ МАТЕМАТИЧЕСКИХ ТЕРМИНОВ Цель данного словаря — напомнить читателю краткие опреде- ления математических понятий. Конечно, этот словарь недостато- чен для изучения соответствующих понятий, тем не менее его мож- но использовать для того, чтобы освежить в памяти важные для понимания этой книги математические аспекты. Читателям с недо- статочной математической подготовкой, у которых могут возник- нуть затруднения при понимании некоторых определений, совету- ем обратиться к следующим книгам: Bavel Z., Math Companion for Computer Sience, Reston, Virginia, 1982. Korfage, R. R. Discrete Computational Structures, Academic Press, New York, 1974. Levy, L. S., Discrete Structures of Computer Science, Wiley, New York, 1980. Preparata, F. P„ and R. T. Yeh, Introduction to Discrete Structures for Computer Science and Engineering, Affison — Wesley, Reading, MA, 1973. Stanat, D. F. and D. F. Me Allister, Discrete mathematics in Computer Science, Prentice-Hall, Englewood Cliffs, NJ, 1977. Для изучения математических понятий в относительно новой области нечетких множеств рекомендуем книгу Dubois, D., and Н. Prade, Fuzzy Sets and Systems: Theore and Applications, Aca- demic Press, New York, 1980. Имеется перевод: Д. Дюбуа, А. Прад. Теория возможностей. Приложения к представлению знаний в информатике: Пер. с франц. — М.: Радио и связь, 1989 —-288 с. СЛОВАРЬ Алгебраическая структура — строка (X, Y, ..., R2, ..., а, Ь...), элементами которой являются множества X, Y, ... отношений Rit R2, ..., часть из которых могут быть функциями или операциями, определенными на всевозможных декартовых произведениях мно- жеств и элементах множеств а, Ь, 489
Антисимметричное отношеиие — это бинарное отношение R на множестве X, такое, что из (х, y)^R и (у, x)^R следует, что х~ =У- Бинарное отношение R на множестве X — это подмножество де- картовых произведений XXX. Формально: R^X\X. Верхняя граница подмножества У частично упорядоченного множества X —• это такой элемент х^Х, что у^х для всех уе У. Взаимно однозначное соответствие между множествами X и У — это сюръективная функция (биения) f: Х->У, для которой из условия х^у следует f(x) ¥=f(y). Гиперграф Н — это пара (X, S), где X — конечное множество, a S — семейство непустых подмножеств множества X, объединение которых составляет все множество X. Формально: Н—(Х, S), где X — конечное множество; S={Si|S<=/=0 И Ui5i=X для te/}. Гомоморфизм из одной алгебраической структуры (X, R) з другую алгебраическую структуру (У, S)—это функция h: Х->-У, такая, что из (хь x2)^R следует, что (/i(xi), h(x2))^S. Если функция h такая, что (xb x2)^R тогда и только тогда, когда (ft(xi), h(x2))^S, гомоморфизм называется строгим. Граф G — это пара (X, R), где X-—непустое множество, a R— бинарное отношение на X. Элементы множества X называются вершинами, а элементы отношения R — ребрами графа. Если R— симметричное отношение, то граф называется неориентированным. Группа — это алгебраическая структура (X, °, е), где X — не- пустое множество, ° — соответствующая бинарная операция, а е — единственный элемент из множества X, обладающий следующими свойствами: 1) е - а—а\ 2) а о е=а; 3) для VxeX Ях-1еХ такой, что х«х~’ = е, элемент х~' назы- вается обратным к элементу х. Декартово произведение XiX^iX ... ХХп (или произведение множеств) — это множество всех упорядоченных n-ок, таких, что первый элемент любой л-ки принадлежит Хь второй — Х2 и т. д. Формально Х1ХХ2Х ••• Х^п={(х,х2 ... хп) (х^Хь х2еХ2, ... • • •, хп^Хп}. Изоморфизм алгебраических структур (X, R) и (У, S)—это взаимно однозначное соответствие Л:Х-<->-У, такое, что (хь x2)^R тогда и только тогда, когда (h(xt), h(x2))^S. Инверсия бинарного отношения (или функции) R полу- чается в результате перестановки всех пар R. Формально: R~'~ = {(х, У) (y,xe=R)}. Квазиупорядочение (предупорядочение)—это определенное на множестве рефлексивное и транзитивное бинарное отношение. Композиция двух бинарных отношений (или функций) R Rg еХХУ и 5еУ><Х — это бинарное отношение R°S<=XXZ, состоя- 490
щее из всех пар (х, г), таких, что (х, y)^R и (у, z)eS для неко- торого y^Y. Формально: 7? ° S={(x, z) | (х, y)^R и (у, z)^S для некоторого y&Y). Лексикографическое упорядочение на множестве Х=Х1х Х-ХгХ • • • ХА„ с линейным упорядочением определенном на каждом множестве Xi (i^Nn),— это частичное упорядочение на множестве X, при котором (хь хг, ..., хп)=С(У1, у2, ..уп) тогда и только тогда, когда х&^Уь для наименьшего значения k, при ко- тором xk^yk. Линейное упорядочение (полное упорядочение, простое упоря- дочение, совершенное упорядочение) — это связанное частичное упорядочение. Метрическое расстояние (метрика), определенное на множест- ве X, — это функция d : X\X^R, удовлетворяющая условиям: 1) d(x, у)>0; 2) d(x, y)=d(y, х); 3) d(x, у)—0, тогда и только тогда, когда х=у; 4) d (x, z)^d (x, у) Л-d (у, z). Нечеткое множество X, определенное в пределах четкого уни- версального множества U — это множество упорядоченных пар Х={(и, пгх(и)) |цеС/}, где пгх(и) —это степень к множеству X. Нижняя граница подмножества Y частично упорядоченного множества X — это элемент х из X, удовлетворяющий условию х^ для всех ye Y. Объединение двух бинарных отношений (или функций) RaXX XY и ScrYXZ — это тернарное отношение R * SaXXYXY-, со- стоящее из всех троек (х, у, г), таких, что (х, y)^R и (у, z)^S. Формально: 7?*$={(х, у, z) | (х, y)^R и (у, z)sS}. Операция — это функция о : ХП->Х. При д=1, 2, ... она назы- вается унарной операцией, бинарной и т. д. соответственно. Отношение связности — это бинарное отношение R на множе- стве X, такое, что из х^у следует, что либо (х, y)^R, либо (у, x)f=R0. Отношение совместимости — (допустимое отношение) — это рефлексивное и симметричное отношение на множестве X. Отношение эквивалентности — это бинарное, рефлексное, сим- метричное и транзитивное отношение. Разбиение л(Х) множества X — это такое семейство непустых подмножеств множества X, для которого каждый элемент из X принадлежит только одному подмножеству. Формально: z(X) = {а; । xt^sp(X), xt^=0, и Xt = х и xtn х, = о II для всех i, . Расстояние, определенное на множестве X, — это функция d : XXX-\-R, такая, что 1) d(x, у)^0; 491
2) d(x, y)=d(y, x)=0 тогда и только тогда, когда х=у, 3) d(x, z)^d(x, y)+d(y, z). Рефлексивное отношение — это определенное на множестве X бинарное отношение R, такое, что (х, х)е7? для всех хеХ. Решетка — это частично упорядоченное множество, любые под- множества которого имеют соединения и пересечения. Пересечение или верхняя (нижняя) граница подмножества ¥ частично упорядоченного множества X — это такой элемент х из X, который является нижней границей У и для любой нижней гра- ницы у из Y выполняется условие у^х. Симметричное отношение — это определенное на множестве X бинарное отношение R, такое, что из (х, y)^R следует (у, x)^R. Соединение (или наименьшая верхняя граница) подмножества Y частично упорядоченного множества X—это такой элемент х из X, который является верхней границей множества У, и для любой верхней границы у из У выполняется условие х^у. Транзитивное замыкание Rr определенного на множестве би- нарного отношения R — это наименьшее из транзитивных отноше- ний, содержащих R (т. е. R<=RT). Транзитивное отношение — это определенное на множестве X бинарное отношение R, такое, что из (х, y)^R и (у, z)^R следу- ет, что (х, z)^R. Функция f (соответствие, отображение): Х->У—это подмно- жество из декартового произведения XX У, такое, что из условий (х, y)^f и (х, z)ef следует, что у—г. Функция «на» f (сюръекция) : Х->У— это такая функция, для которой из ysY следует, что хотя бы для одного элемента хеХ выполняется (х, y)^f. Частично упорядоченное множество — это множество с опреде- ленным на нем частичным упорядочением. Частичное упорядочение — это определенное на множестве би- нарное, рефлексивное, антисимметричное и транзитивное отноше- ние. ПРИЛОЖЕНИЕ В. НЕКОТОРЫЕ ПОЛЕЗНЫЕ ТЕОРЕМЫ Цель этого приложения состоит в формулировании и доказа- тельстве некоторых теорем, непосредственно связанных с рассмот- ренными в книге вопросами. Хотя для получения общего представ- ления о таких вопросах в этом нет необходимости, тем не менее знание их будет способствовать более глубокому пониманию ма- териала. Теоремы разделены на три раздела, каждый из которых посвя- щен определенной теме. При необходимости теоремы дополнены соответствующими определениями, леммами и замечаниями. 492
В.1. МЕРА НЕОПРЕДЕЛЕННОСТИ, ОСНОВАННАЯ НА РАСПРЕДЕЛЕНИЯХ ВОЗМОЖНОСТЕЙ1 Обозначим множество распределений возможностей с хотя бы одним ненулевым элементом, которое может быть определено на любом конечном множестве с п элементами и пусть Обозначим B(Nn) множество всех перестановок Nn. Пусть для любых f— (рь Р2, • • рп)е/Г b^B(Nn) и & [f] — (р&(1), РЬ(2), • ; pb(n))^^~• Определение 1. Распределение возможностей f=(pb р2, ... ..., pn)en/F называется нормализованным распределением воз- можностей тогда и только тогда, когда шах рг = 1. i Определение 2. Для заданного распределения возможностей f= (pl, р2, • • •, рп) введем f=(pi. рг.-. к), где р/=р&(/> при некоторой перестановке b^B(Nn), удовлетворя- ющей условию р/>рй при j<k (j, k^Nn). Тогда f называется упо- рядоченным распределением возможностей функции f. Определение 3. Перестановка b^B(Nn) называется упорядо- чивающей перестановкой распределения возможностей функции f, если t=b [fJ. Определение 4. Пусть для любых f=(pi, рг, • • •> pn)s#" и Zs е[0, 1] функция с:^Х0, l-*^(ZVn) удовлетворяет условию C(f, /)={/£#„ | pf>/}. Эта функция называется функцией /-отсечения, а множество с (f, Z) —/-отсечением функции f. Определение 5. Пусть f= (рь р2, ..pn)<=/F. Тогда Ь{— {/| (ШеА/п) или /=0} называется множеством уровня функции f. 1 Этот материал, в основном, связан с разд. 3.5 и содержится в статье [157]. 493
Определение 6. Пусть для любого neN заданы два распреде- ления возможностей ч= ерь *р2» •••» ’рп)^"^, 2f= (2Р.,2Р2, .... 2Рп)е"^-. В этом случае И называется субраспределением 2f тогда и толь- ко тогда, когда *Pz<aPz Для любого i£=Nn-, будем использовать запись *f:g2f для обозначения того, что Ч яв- ляется субраспределением 2f. Теорема 1. Функция U, определенная в соответствии с уравне- ниями (3.56) или (3.57), обладает следующими свойствами: Ul) £7(рь р2, .... Pn)=t/(p&(i), р&(2)> рь(п)) при любых рас- пределениях возможностей функции feZF и любых перестановках b^B(Nn) (симметричность); U2) t/(pi, Р2, рп, 0) = [/(рь р2, ..., рп) для любого fe^F (расширяемость); U3) [/(f)^t/(4) + Z/(2f), ГДе f=(pIb р,2, .... pIn, P2I, Р22, ... • ••» Р2п, • • ., Pml, Рт2, ••• Ртп) I Ч=(!рь !Р2> • -’pm)SZF, Э *Pi== = тах/р;/, 2f= (2pi, 2рг... 2pn)e^", так что 2p/=maxi рц (суб- аддитивность) ; U4) если функции Ч и 2f в (U3) невзаи- модействующие, т. е. pi/=min (’pz, 2р/) для всех и всех /е ^Nm (аддитивность); U5) £7(1, 1)=1 (нормировка); U6) функция U непрерывна по всем своим аргументам (не- прерывность) ; U7) t/(If)^[/(2f), если 4^2f и maxz1 pi=max(-2 pi для любых Ч, 2fenZF и произвольного neN (полная монотонность); U8) для всех feiF t/(f)=O тогда и только тогда, когда pi=/=0 только для одного i^Nn (свойство минимума); U9) для всех feZF функция U (f) достигает максимального значения в пЗг тогда и только тогда, когда функция р{ принимает одно и то же значение при всех максимум функции £7(f) в п&~ равен £7(1, 1...I)=log2n (свойство максимума); U10) для всех feZF функция U(f) убывает, если t/(f)=/=O и только один максимальный элемент функции f, например элемент pio=maxipi, возрастает (частичная монотонность). Доказательство. 1) Ш и U7: при любом neN рассмотрим функции Ч, 2fenF такие, что |с(Ч, Z)|*g|c(2f, 1)\ для всех Ze [О, 1]. Тогда очевидно, что log2 |с(Ч, Z) |^log2 |c(2f, Z) | для всех Ze[0, 1] 494
и, следовательно (2f). Поэтому для функции U выпол- няется свойство U7, а по лемме 2 (см. ниже) также свойство U1. 2) U2: пусть f=(pi, Р2, •Pn)eF и f=(pi, р2.pn, 0)eF. Поэтому Lf—Lf. и c(f, Z)=c(f', I для всех /=й=0, но c(f, 0) не со- держится в формуле (3.56). Следовательно, функция U удовлет- воряет свойству U2. 3) U3: пусть функции f, ’f и 2f определены как в свойстве U3. Поскольку для любого /е[0, 1] Pv>Z предполагает 1p,= max и 2Р; = тахрм>/, получаем g{(i, /)е^тхлг„| *p,>z и 2р;>/}- = {»G ЛГт | ’рt > 1} X {i G Nn [ 2р^ > 1} = = c(’f, Z)Xc(2t I). Следовательно, |c(f, l) |^|с(Ч, Z)|X|c(2f, I) I для всех Ze[0, 1]. По определению If = maxpo = max (max p0) = max' pt = Lf. i.f i I i Аналогично lf = L-. Следовательно, 1 <7- log2 I C(’f, Z)| X I c(*f, Z)|cfZ = 1 «=-L| logjcCf, l)\dl + lf o’ 1 + -7 log2 |c(2f,Z)|d/=t/Cf) + t/(2f). Отсюда следует доказательство, что функция U удовлетворяет свойству U3. 4) U4: пусть f, И, 2f определены как в U4. Тогда очевидно, что PO^Z тогда и только тогда, когда ’pz^Z и 2p;>Z для всех Ze[0, 1]. Поэтому, как и в п. 3, получаем c(f, Z)=c(]f, Z)Xc(2f, Z), и, следо- 495
вательно, |c(f, I) | = |c(1f, I) |XIc(2f, I) | для всех Ze[0, 1J. Сле- дуя приведенной в п. 3 схеме рассуждений, можно показать, что lf=lif=ltf и окончательно — Таким образом, функция U удовлетворяет свойству U4. 5) U5: C/(l, l)=log22=l. 6) U6: пусть f=(pi, рг. •., pn)e^", aejVn— заданное целое число, a Lf={l\ h...lr}, где 0=Z,<Z2< ... <lr (=Zf). Рассмот- рим для большей ясности три случая. Случай 1. Предположим, что ра=р₽ для некоторого 0, такого, что 2^р<г—1. А) Обозначим А/ действительное число, удовлетворяющее ус- ловию 0<A/<Zb+i—а f/== (р'ь р'г, •••, (>',)—распределение возможностей, такое, что р/г=р< для всех tVa и p'a=pa-|-AZ. Тог- да для всех /е [0, 1] получаем с(Г, /)—{a} = {ieAZn|p'i>Z} — {a}={ieWn|i=#a, p'i>Z} = = {iG=Nn\i=£a, pi>Z} = {ZeAZn|pi>Z} —{a} = c(f, Z)-{a}. Для Zs=pa также получаем Z<j/a (поскольку p'a^pa) и, сле- довательно, одновременно выполняются условия aec(f, Z) и as ее (f', Z); таким образом, с(f'„ Z)=c(f, Z). Очевидно, что при ра< <Zs=pa+AZ(=p'a) одновременно a^c(f, Z) и aec(f', Z); поэтому |c(f', Z) | = |с(f, Z)|4-l. При Z>pa+AZ справедливо как a^c(f, Z), так и a^c(f', Z); поэтому опять c(f', Z)=c(f, Z). Таким образом, приходим к выводу, что C/(f')-[/(f) = J- j [log2(|c(f, Z) + 1) — log2 | с(f, Z) | ]dZ‘ f Pa где c(f, Z)=c(f, Z₽) для всех Ze [pa, pa+AZ] (поскольку Zp=pex и pa4~AZ<Zp-H). Следовательно, t/(f')-[/(f) = -L[log2 | C(f, Zp)| + + 1 —log I c(f, /р) I |AZ = 1 , lC(f’ 9 I +1 А/ ,4 = — log»——,— AZ. (*) If S2 I c(t Zp) I V ’ Так как Tf^ I C(f, Zp) 1 + 1 I /p) | константа, уравнение (*) означает, что функция U непрерывна по аргументу f справа относительно аргумента 0а. 496
Б) Пусть Zp-i—Z₽<AZ<0 и пусть f' определена так же, как в п. А. Тогда, следуя использованным в п. А рассуждениям, по- лучаем । I ze-t) I что означает непрерывность функции U слева относительно аргу- мента ра. Из пп. А и Б получаем, что функция U непрерывна относитель- но аргумента ра. Случай II. Предположим, что ра==-Ь- А) Пусть /г<1, а 0<А/<1—1Г. Аналогично использованным в случае I, А рассуждениям получаем | C7(F) — LZ(f) [ = / * -_L\.C = \ Ч' if I =-------------Ы < — Д/, lr где С = J 1°£г I с (f> О I dl и /г2 — коястанты. Следовательно, функ- о ция U непрерывна справа. Рассмотрим ситуацию, когда 1Г—1г-\< <А/<0. Предположим, что |c(f, lr) | = 1. Тогда следуя рассужде- ниям п. А этого случая, получаем | Z7(f') —[7(f) | | Д/| , Mr— 1 ег-1 где С = j log2 | с (f, /) | dl, lrlr_t постоянные величины, Следо- о вательно, U непрерывна слева. Если |с(f, lr) l^l, то все утверж- дения случая I, Б остаются верными, и мы получаем уравнение (**), означающее, что функция U непрерывна слева. Следова- тельно, функция U непрерывна относительно аргумента ра. Б) Пусть /,= 1. Все утверждения второй части п. А остаются верными, поэтому функция U непрерывна слева относительно ар- гумента ра. Случай III. Предположим, что ра—Z|=0. Тогда все утверждения случая I, А остаются верными, и функция U непрерывна справа относительно аргумента ра. Из случаев I, II, III следует, что для любых функция U непрерывна относительно любых своих аргументов. 7) U8: пусть f= (рь р2, • •рп)е^ и Lf={li, 12, ..., 1Г}. Тогда из определения функции U получаем t/(f)=O-<->|c(f, I2| = I, r=2 ►Pi^ О 497
только для одного элемента teWn. Следовательно, функция U удовлетворяет свойству U8. 8) U9: пусть nsN, f=(pi, рг, •••, Рп) и L={h, 12, .... ir=lf}- Поскольку | с (f, k+t) \^п для всех получаем Г—1 г—I u (f)=X(//+i ~z,) logj 1 c (f*lt+i} 1 <7- S(Z,+x ~z,) lo°! n= <=I r <=1 r— 1 = -^-log2ra JJ (/,+! — /,•) = log2n. <=i Следовательно, U(t)^\og2ri, где равенство выполняется тогда и только тогда, когда г=2 и |c(f, 12) |=п, т. е. тогда и только тог- да, когда pi=l2 при некотором постоянном значении 12>0 и всех i^Nn- Таким образом, мы получаем,' что функция U удовлетворя- ет свойству U9. 9) U10: рассмотрим f= (pi, рг, ..., Рп)^^"> причем U(t)¥=O. Пусть If={i^Nn\pi^pi для всех j^Nn}. Поскольку t/(f)=/=O из п. 7 следует, что | {teVn|pi>0} |^2, и, следовательно, рг>0 для всех 1^1 {. Пусть Рассмотрим fx= (рЛ, рг\ • •рпх)^^”, причем ( = рг при 1=^2, р/ < О Pi ПРИ 1 — Тогда очевидно, что C(fx = ПрИ 0<Z<Pv I W при p?<Z<p>:. Следовательно, log I c(f\ l)\dl = 1 Px px f\ I) I dl+ jlog I c(f\ I) . 0 PX px P2 f log I c(f\ I) I d/ + j (log l)rfZ = 0 -----T-(Pi (/(!)]- pj 498
Px Поскольку Px<Ph 4-<l « t7(f)=^O, Px получаем неравенство Z7(fx)<[/(f), доказывающее, что функция U удовлетворяет свойству U10. Итак, пп. 1—10 выполняются, что и требовалось доказать. Лемма 1. Пусть Ч н 2fenZF и мощности /-отсечений Ч и 2f обо- значены |с(Ч, 1} | и | с (2f, I) | соответственно. Тогда (Vte[0, 1])|с(Ч, I) |^|c(2f, Z) |]. (1) (2) [Я6б=В(АГ„)] (Ч<6 [2f]). (3) Доказательство. Пусть 4 = (zp1( /р2,..., Ч = (/р1, 7р....>р„), в Ч = '6[Ч], где /=1, 2. 1. Докажем сначала, что из (1) следует (2). Предположим, что выполняется (1). Пусть Zt='pi для любого i^Nn- Поскольку ,Р*ь<%) = ’P*>’Pi = li ДЛЯ всех k<ib получаем с(Ч, /<) = {•&(!), >6(2), .... '&(/)}. Поскольку |с(Ч, /() из (1), получаем |c(2f, для всех i^Nn. Отсюда, учитывая, что 2P*b(k) 2Р2ь(/> ПРИ />^> слеДУет» что с(2f, М = {2Ь(1), 2Ь(2), .... 26(/)}. Так как ap2b(fc)>’/ для всех k<i, то ар» = ap«b(/) > Zj ='р, для всех i G N„. Отсюда по определению 6 следует, что Ч > Ч. 2. Докажем, что из (2) следует (3). Предположим, что выпол- няется (2). Тогда, поскольку 4=^6 [Ч] (/=1, 2), получаем 26 [2fJ^]6 [Ч], и очевидно, что 'Ь-1 рь [2f]]>b-' ['6 [Ч]] = Ч, где lb~l^B(Nn) обозначает инверсию биекции >6. Следовательно, b [2fJ>4, где b=2b° Отсюда следует (3). 3. Докажем, что из (3) следует (1). Предположим, что выпол- няется (3). Пусть /е[0, 1] и с(Ч, Z) = {Ib(t‘i), }b(i2), .... при некотором k^Nn. Тогда из предположения о выполнении (3) получаем 2раь<4) 499
для /=1, 2, ..., k. Поэтому c(2f,/)2{2й(ч), Ш).................... 2b(ik)}, и, следовательно, | с (2f, I) |^=|c(’f, I) |. Итак, из пп. 1 2, 3 следует (1) -<->• (2) -<-► (3), что и требовалось доказать. Лемма 2. Пусть *f, 2fen^". Тогда свойство U1 плюс свойство U7 эквивалентны свойствам. (U7') [/('f)^t/(2f), если шах ’р, = max 2рг и (g b G В (Nn)) ff < b [af]), i i — а также (U 1")U ('f)<Z/(2f), если max'рг = max 2pj i i и (v/ep, i])[ i c(*f, о । <C(2f, z) । j. Доказательство. Пусть ]f, и max? р(=тахг-2 р/. 1. Предположим, что рассматриваемая функция V: ZF->[0, со) удовлетворяет свойствам U1 и U7. Предположим также, что ут- верждение [2f]) истинно. Тогда из свойства U7 получаем U(4)<U(b [2f]), а из свойства U1 U(b [2fJ) = U (2f). Следовательно, U(2f). 2. Предположим, что функция U удовлетворяет свойству U7' и *f^2f. Очевидно, что тогда Ч—b [2t], где b^B(Nn)—однознач- ная функция на Мп, и по свойству U7' Z7(’f)^[/(2f). Отсюда сле- дует, что выполняется свойство U7. Предположим теперь, что ут- верждение [Шн=В(Мп)](Ч=Ь [2f]) истинно. Тогда *f^Z> [2f] и lf^b [2f] и из свойства U7' получаем, что U(4)^U(b [2f]), U(4)>U(b [2fJ). Значит, U(4) = U(b [2f]), откуда следует Ul. Из пп. 1,2 получаем: свойства Ш и U7 эквивалентны свойству U7'. Непосредственно из леммы 1 следует: свойство U7' эквива- лентно свойству U7", что и требовалось доказать. 500
В.2. ПРОЦЕДУРА ОБЪЕДИНЕНИЯ И НЕСМЕЩЕННАЯ1 (С МАКСИМАЛЬНОЙ ЭНТРОПИЕЙ) РЕКОНСТРУКЦИЯ ДЛЯ ВЕРОЯТНОСТНЫХ СИСТЕМ Теорема 2. Если заданная вероятностная и непротиворечивая структурированная система с поведением SF, элементы которой характеризуются функциями поведения kf такова, что в процессе базовых процедур объединения не возникает противоре- чий, то процедура определяет несмещенную (с максимальной эн- тропией) реконструкцию для системы SF. Доказательство ([208]). Пусть и f" являются функ- циями поведения двух реконструкций из S. Начнем с неравенства - 2 Г («) log /"(«)<- 2 /" («) log f (а), а а хорошо известного в теории информации как теорема Гиббса. Тог- да функцию f'(а) можно представить в виде Г(а)=П где ‘0<(аи */(*Р*) в данном доказательстве обозначают либо ба- зисную, либо условную вероятность для отдельных процедур объ- единения. Следовательно, - 2 г («) Jog г («)=- 2 г («) log П kf (*Р) = а а k = 2/"(«)2и*/(*Р), а k где *0-<(а. Поскольку является реконструкцией для системы SF, то члены в последнем выражении можно сгруппировать при каж- дом способом, описываемым формулой - 2 г (*) log W), а>*р которую можно записать в виде -W) logvep). В результате получаем -22W)iog*K*P). k * Этот материал связан с разд. 4.6 н 4.7 и содержится в статье [65]. 601
что в точности совпадает с энтропией f'(a); действительно, по- вторяя предыдущие рассуждения, получаем: — 2 Г (“) log /' (а) = — 2 /' (“) 2 kg */(*₽). а a k где )> а, и, поскольку f (а) является реконструкцией для системы SF, можно сгруппировать члены в последнем выражении таким же, как и выше, способом и в результате получить то же выраже- ние. Следовательно, - 2 Г ’ («) log Г (а) < 2 Г («) log Г(а), а а н исходное неравенство превращается в неравенство —2 f" (“) los (“)<—2 (а)log f а а что и требовалось доказать. Для обоснования итерационной процедуры объединения отме- тим, что являющаяся вырождающейся процедурой объ- единения, может быть представлена в виде f (а) = If (/р)- где /р=а. Эта итерационная процедура в точности совпадает с процедурой, предложенной Брауном, и основана на идее пропор- ционального соответствия [55] ft (а) = ft г (а)-- :—. Поэтому, чтобы обосновать итерационную процедуру, воспользу- емся доказательствами Брауна, которые подробно рассмотрены также в книге Бишопа [43] в следующих теоремах: 1) итерационная процедура объединения сходится к функции поведения, соответствующей структурированным системам SF; 2) процедура объединения сходится к функции поведения не- смещенной реконструкции для системы SF. В.З. ПРОЦЕДУРА ОБЪЕДИНЕНИЯ И НЕСМЕЩЕННОЕ (С МАКСИМАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЬЮ! РАСПОЗНАВАНИЕ ДЛЯ ВОЗМОЖНОСТНЫХ СИСТЕМ1 Теорема 3. min[*f(a, ₽), 2f(y|0)]=min [•/(«, 0), 2f(₽, y)J. Доказательство. Очевидно, что маргинальная возможность f(0) должна удовлетворять неравенству f (p)^max [’/(а, р), 2f([J, у)]. 1 Приведенные здесь теоремы связаны с разд. 4.6 и 4.7 и содержатся в статье [68]. 602
Используя уравнение (3.113), необходимо рассмотреть четыре слу- чая, каждый из которых приводит к определенному результату для min [7 (а, Р), 7(ylP)J: О ПР) = 7(а’ Р) и НР)>7(Р. у); в этом случае 7(у|Р) = =7(Р> у), и, следовательно, теорема верна. 2) f(P)>‘f(a- Р) и f(P)=7(P. У)! в этом случае 2f(у|р) = =[7(Р> У), 1] и ’/(а, РХ7(Р» у): следовательно, min [7(a, р), [7(Р, у), lj] = 7(a> Р)> и теорема верна. 3) /(р)=7(«> Р) и f(p)=2f(p, у), в этом случае 7(у|р) = = [7(Р. у), 11 и min[7(a, р), [2/(р, у), lj]=7(a, Р)=7(Р. у), т. е. теорема также верна. 4) ПР)>7(a, Р) и f(P)>2f(P. У); в этом случае 7(у|р) = =7(Р, у), и теорема верна, что и требовалось доказать. Теорема 4. min[7(p), 7(y|p)J=min f7(P), 7(Р> у)]. Доказательство. Необходимо рассмотреть только два случая. Если И(р)>7(р, у), то 7(у, Р)=7(Р> У), и теорема верна. Если 7(Р)=7(Р> у)» то 7(у1Р) = [7(Р. у), I] и min[7(p), [7(р, у), 1J] = 7(P) =7(Р> У), и теорема также верна, что и требовалось доказать. Теорема 5. Для заданной возможностной непротиворечивой си- стемы с поведением SF, элементы которой характеризуются функ- циями поведения kf (k^Nq), базовая процедура объединения оп- ределяет несмещенную (с максимальной ^-неопределенностью) реконструкцию для системы SF. Доказательство. Поскольку [f | *У|(Ар) = ma^^ftpfa) для лю- бого k, то максимальные значения для всех возможных распределе- ний сохраняются во всех проекциях, т. е. если таково, что Л«тах) = тахае?с)(а) и *Р<а, то */(*₽) = Н%ах) ДЛЯ любого k и некоторого р. Следовательно, значения функции f(amax) сохраня- ются в каждом члене семейства реконструкций. Рассмотрим теперь реконструкцию состояния, представленно- го соединением трех непересекающихся подсостояний ai, Рь уь т. е. (аь Рь yi)eC. Пусть следующий список включает значения полного возможностного распределения для всех агрегатных со- стояний, связанных с определением значения функции 7(аь Pi), проекции функции 7: f(ab Рь У1)=П|(=х), Наь Рь Уз) =0.2, К^,^Др)^Ьр. Тогда 7(аь Pi)=maxt-ai. Аналогично пусть значениями полного возможностного распределения для всех состояний, связанных с определением значения функций 7(Рь yi)» проекции функций 2f, 503
являются значения f(ai. Pi, yi) = bi(=x), f(a2, Pi, yi)=k>, f (ar, Pi, yi) = br. Тогда 7 (Pi, yi)=max/6/. По теореме 3 [7*7[(ai, Рь Yi)=min [7(ab pO, 7(pi, y,)J. Возможностями, связанными с определением этого значения объ- единения функций 7*7, являются: 1) max at = х, i либо 2) щах at = у=£ х(у> х), i либо 3) max bt = х, i либо 4) max bt = z х (г > х). I Следовательно, можно рассмотреть четыре случая: 1 и 3: [7*7] (ai, Pi, Yi) =х\ 1 и 4: [7*2f] (ai, Pi, vi)=min [х, z]=x; 2 и 3: [7*2Л (ai, Pi,Yi)=min [(/, х]=х; 2 и 4: [7*7] (ai, pi,Yi)=min [у, г]. Первые три случая очевидны; они приводят к корректному вос- становленному значению, которое в точности равно значению каж- дого члена семейства реконструкции. В случаях 2, 4 одновременно у>х и 2>х н min [у, z] —это максимальное возможное значение для состояния (ai, Pi, Yi), удовлетворяющего проекциям 7 и 2f- Действительно, если бы в семействе реконструкции был член с наи- большим возможным значением, скажем w(w>y и w>z), то должно бы выполняться 7(аь р^ — w и 7(аь ?i)= w> что противо- речит предположению. Поскольку состояние (аь рь у!) выбрано произвольно, те же выводы справедливы для любого состояния из множества С. Кро- ме того, если (аь Рь yi) является только подсостоянием состояния, мы можем прийти к тем же выводам с помощью расширения каж- дого из предыдущих рассмотренных состояний до множества состояний, выделенных некоторыми дополнительными ситуациями, например аь а2...ага. 504
Рассуждения, сделанные для первой операции объединения можно выполнить и для второй операции объединения 7* [7" 7L и т- д- Поскольку все члены семейства реконструкций имеют одинако- вые максимумы и операция объединения определяет для каждого состояния максимальное возможное значение, не нарушаемое за- данными проекциями, то непосредственно из свойства U7 разд. В1 следует, что операция объединения определяет реконструкцию с максимальной U-неопределенностью. В завершение мы должны исследовать влияние циклов в данной структурированной системе на результат операции объединения. В цикле содержится по крайней мере два объединения, обозначен- ные 3f* [7* 7], так что 7 : X.XX^tO, 1], 7:Х2ХХз^[0, 1], 7:Х,ХХз->[0, 1]. Рассмотрим опять реконструкцию объединенного состояния («1, рь yJeC, где aieXi; р^Л/, Пусть функции 7. 2f и 7*2/ такие же, как выше в данном доказательстве, и пусть сле- дующий список содержит значения полного распределения возмож- ностей всех объединенных состояний, связанных с определением значения функции 7(«ь Vi), проекции 3f: f(ai, Pi, Yi)=ci( = x), f(ab fe, ъ)=с2, f(ah ps, Yi) =cs. Тогда 7(ab у1)=тавд и [7 с [7* 7]] (ah Pi, у,) =min[7(ai, yj), [»f*7] (aI; Pi, yi)]. Как и раньше, существуют две возможности, связанные с определением этого значения: 1) шахсг = й, i либо 2) шах Ci = w ={= х (ю> л) i И 3) [7 *2Л (ai, Pl, У1)=х, либо 4) [7*2Л (ai, Pi> yi)=min[y, z]>x. Как и выше, случаи 1, 3, 1, 4 и 2, 3 приводят к корректному восстановленнному значению, которое в точности равно значению каждого члена семейства реконструкции. В случаях 2, 4 [7 * [7 * 7 ] I (®ь Л. Тж) = min [®. min [<Л ?]] =• min [а-, у, г]. На основании использованных в данном доказательстве рассуж- дений min[w, у, z] — это максимальное возможное значение для со- 505
стояния (си, Pi, vi), удовлетворяющее всем трем проекциям 'f, 2f, 3f. Следовательно, теорема верна и для структурированных систем с циклами. Это означает, что нет необходимости в итерационных процедурах для систем с циклами, что и требовалось доказать. В.4. ОБЩЕЕ ИНФОРМАЦИОННОЕ РАССТОЯНИЕ ДЛЯ РАСПРЕДЕЛЕНИЯ ВОЗМОЖНОСТЕЙ1 В этом разделе для удобства символы V и А используются для обозначения операторов максимума и минимума соответственно. Введем сначала частичное упорядочение распределений возмож- ностей, определенное на одном и том же множестве, которое явля- ется основным в наших рассуждениях. Определение 7. Для любой пары нормализованных распределе- ний возможностей !f, 2teZF 4<2f тогда и только тогда, когда 7 (x)^2f (х) для всех хеХ. Очевидно, что (ЗД —частичное упорядочение. Существует единственная верхняя граница, скажем *f, определяемая условием *7(х) = 1 для всех хеА'. Для любой пары Ч, объединение 4\/2f существует на этом частично упорядоченном множестве и определяется уравнением (7V2f) (х) —f' (х) Vf2W для всех хеХ. Пересечение существующее только для некоторых пар И, 2fe^-, определяется из соотношения (lfA2f) (х) = 'f(x) A2f(x) для всех хеХ. Точнее, пересечение ЧДЧ существует тогда и только тогда, когда существует хотя бы один хеХ, при котором 1f(x)—2f(x) = l; если такого х не существует, то это пересечение не является нормали- зованным, и, следовательно, ЧД21^^~. Определение 8. Для любой пары Ч, 2fe5r, такой, что Ч<J2f, определим прирост информации g(lf, 2f) при замене 2f на Ч сле- дующим образом: 1 gCK Ч) = (7(Ч)-[/(Ч) = (В.1) о Замечание 1. Поскольку из 4<J2f следует, что с(Ч, /)sc(2f, /) для всех/е[0,1], то из определения 8 сразу следует, что g(4, Замечание 2. Для любых Ч, 2f, таких, что 4^2f^3f, при- рост информации аддитивен, т. е. g(4, 3f)=g(4, 2f)+g(2f, 3f). 1 Приведенные здесь результаты относятся к разд. 4.9 и содержатся в статье [158]. 506
Действительно, g('t, 3f) = f/(3f)_i/(If) = p(3f)-t/(2f)] + p(2f)_(7(.f)]== =£(2f, 3f)+g(*f, 2f). Некоторые дополнительные свойства прироста информации (см. определение 8), необходимые прн нашем дальнейшем рассмо- трении, сформулированы в следующих двух леммах. Лемма 3. Для любых ‘f, 2fe^", таких, что 4^2f, g('f, 2f)=0 тогда и только тогда, когда ‘f=2f (т. е. 7(х) =2f (х) при всех х<=Х. Доказательство. Пусть K(/),slog2|c(2f, /) |—log2|c(’f, I) | для всех /е[0,1]. Тогда gff, 2f)=J/<(Z)dZ. о Поскольку из !fSi2f следует c(*f, Z)sc(f2, I) и, следовательно, |c(*f, I) | |c(2f, Z)|, мы получаем K(Z)^O для всех Ze[0, 1]. Тогда gff, 2f)=0-<->-K(Z)=0 для всех Z<=[0,1]-<->-|с(Ч,I) | = |c(2f, Z) | для всех Ze[0,1]. Поскольку с(Ч, Z)sc(2f, Z) для всех Ze[0,1], получаем, что для таких Z |c(’f, Z)| = |c(2f, Z)|^c('f, Z)=c(2f, Z). Если ’f=2f, то последнее уравнение с очевидностью удовлетворяет- ся. Если *f=5^2f, т. е. ’f (х0) =7(*о) при некотором хоеХ, то Ч(х0)< <2f(x0), следовательно, x0^c(If, Zo) и x0ec(2f, Zo) при некотором Zo, таком, что 7(х0) <lo<2f(x0), например l0= [7(x)+2f(*)]/2. Здесь предполагается, что c(’f, Z0)=/=c(2f, Zo). Следовательно, c(’f, Z0)=c(2f, Zo) при всех Ze[0,1] тогда и только тогда, когда ]f=2f, поэтому g(’f, 2f)=0 тогда и только тогда, когда ‘f=2f, что и тре- бовалось доказать. Лемма 4. Пусть Ч, 2f, и 4^2f^3f. Тогда g(4, 3f) ^g(4, 2f), причем равенство выполняется тогда и только тогда, когда 2f=3f. Доказательство. Из замечания 2 следует, что g('f, 3f)-g(4, 2f)=g(2f, 3f), а из замечания 1—g(2f, 3f) ^0, причем, равенство выполняется тогда и только тогда, когда 2f=3f (лемма 3). Следовательно, пред- положение верно, что и требовалось доказать. Частичное упорядочение, введенное в определении 7, задается отношением /?={(Т, Ч)е^Х^|Ч<Я|}. Коэффициент передачи информации, введенный в определе- нии 8, может тогда рассматриваться как функция на этом отноше- нии, т. е. g:Я-ЧО, сю), 507
что по лемме 3 удовлетворяет требованию невырожденности ме- трических расстояний; выполнив соответствующее расширение, легко также удовлетворить требование симметрии. Определение 9. Симметричным расширением функции g (опре- деление 8) называется функция ЯиЯ-1->[0, оо), где 7?-1 — отношение, обратное к R, которое обладает следующими свойствами: g 1) Пусть g|7?— ограничение области функции g на множест- во тогда £|7?=gI; g2) Пусть g(;f, /f) =g('f, 'f) для всех (‘f, тогда функция g симметричная. Лемма 5. Пусть функция g — симметричное расширение функ- ции g (см. определение 9). Тогда только для этой функции выпол- няетг 'оотношение g(4, 2f)=|L/(2f)-L/(’f)|. (В.2) Доказательство. Пусть (’f; 2f)e7?. Тогда из свойства gl полу- чаем g('f, 2f)=g('f, 2f) = (7(2f)—[/(’f). Пусть ’f, 2f)eR-1. Тогда из свойства g? следует, что £(‘f, 2f)=£(2ff,’f) и из свойства gi, что m ’f) =g(2f> it)=i7(if)-f/(2f)=it/(2f)-t/(if)i. Следовательно, ^(>f, 2f) = ] LZ(2f) —t/(if) | для всех (if, 2f) eflUfl-’, И, наоборот, очевидно, что функция g, определенная уравне- нием (62), является функцией, отображающей в [0, оо). Поэтому функция g удовлетворяет одновременно свойствам gi и gz, что и требовалось доказать. Поскольку функция g характеризует информационное разли- чие, но не выделяет случаи потери или приобретения информации, то разумно называть ее информационным отличием. Очевидно, что функция g симметрична и невырожденна. Кроме того, она адди- тивна в том же смысле, что и функция g (замечание 2). Таким образом, имеет смысл рассматривать информационное отличие £ ' В этом разделе для любой функции а: А-+В через а\С обозначено ограни- чение функции а иа множество С, где С<=.А. 508
как меру информационной близости между распределениями воз- можностей на ограниченном множестве {кинет. Определение 10. Метрическим расстоянием на множестве 9Г, построенном на информационной близости называется функция d:^X^"^[0> оо), такая, что выполняются следующие свойства: dl) d(*f, 2f)=0 тогда и только тогда, когда *f=2f (невырожден- ность); d2)d(]f, 2f)=d(2f, ’f) (симметричность); d3) d(]f, 3f)^d('f, 2f)-\-d(2f, 3f) (правило треугольника); d4) (ограничение d на множество /?(J#-1). Определение функции, которую можно рассматривать как ме- трическое расстояние, введенное в определении 10, сводится к до- казательству трех приведенных ниже лемм. Основные результаты этого поиска сформулированы в теоре- мах 6 и 7. Лемма 6. Пусть ’f, 2f, 3fe^" и ]f^2f. Тогда g('f, ]f\/3f)^ >g(2f, 2fV3f), (B.3) Причем равенство выполняется тогда и только тогда, когда c(‘f, Z) = c(2f, /) или с(3f, Z)£c(*f, Z) для всех Ze[0,1]. Доказательство. Из условия ]f^2f следует, что c('f, Z)sc(2f, Z) для всех Ze[0, 1]. Для произвольного Ze[0, 1] положим а= = |c(’f, Z) |, p=|c(2f, Z) |, -у= [cpf, Очевидно, что Р^а>0. Положим 6=|c(*f, Z)f|c(3f, Z) | и O=|c(2f, Z)f|c(3f, Z)|. Очевидно, что у^О^б^О. Следовательно, |c(‘fV3t 0 1 |c(afV3f. 0 1 I с(Ч. I) II c(’f. I) | |c(4, Z) | 1 c(2f, /| “ C(if,/) — _ I c(gf, Z) и с(V. Z) । а + г-а_о + т— e C(4O ~ a p — Y (p—<X)4-aS — у (p — a)-|-aS — P9 (y — ») (P — a) n —------------------------ - - s= — ————— U. «Р aP оф где первое неравенство является следствием того, что р^0 и 0^6, а второе неравенство — того, что у^0 и р^а. Поэтому неравенст- во I С Pf, I) U С (°f, I) I > Г Cf2f, Z) Ц с (3f. 0| I С (*f, /) I " I С (2f, /) | 1 ’ выполняется при всех Ze[0, 1]. Применяя формулу (В.1) к обеим частям этого неравенства, сразу получаем искомый результат — неравенство g(*f, *f\/3f)(2f, 2f\/3f). 509
Если существует такое I, при котором неравенство (В.4) не вы- полняется, то не выполняется равенство и в (В.З). Следовательно", равенство в (В.З) выполняется тогда и только тогда, когда при всех Ze[0, 1] выполняется равенство в (В.4), что эквивалентно равенствам у=О=б или а=р, которые выполняются, так как c(’f, Z)5c(af, ОП c(’f, t)^c(’f, l) П c(’f, 0. c(2f, l)^c (’f, Z) тогда и только тогда, когда c(3f, Z) = c(2f, Z)Dc(3f, Z)=c('f, Z)0c(3f, 0» или C(2f, Z)=C(If, 0. т. e. c(’f, Z)Cc(‘f, 0, или C(2f,O=c(1f, Z). что и требовалось доказать. Лемма 7. Пусть G(’f, 2f)=g('f, *fV2f)+g(2t *fV2D (B.5) для всех *f, 2fe^“. Тогда а) для любых !f, 2f, 3feZF G ('f, 3f)<G(1f, 2f) + G(2f, 3f), причем равенство выполняется тогда и только тогда, когда 21^Ч\/3{ и, кроме того, c('f, Z)sc(2f, Z) или с(3f, 1)<=с(2f, Z) для всех Ze [О,1]; б) при любом 'feZF (i=l, 2, ..., п) выполняется соотношение л—I G('f, "f)<£G(zf, z+‘f). :=1 Доказательство, а) Поскольку *f=SCJf\/3f^*f\/2f\/3f, из леммы 4 следует, что gff, !fV3f) (’f, *fV2fV3f)> причем равенство вы- полняется тогда и только тогда, когда !fV3f=IfV2fV3f> т- е> 2f^'f\/3f. Из аддитивности функции g (замечание 2) следует, что §(>г, >fV2fV3n=^(’t 1fV2D4-£f(,fV2f, 'fV2fV3f)- Поскольку 2f^'f\/2f, из леммы 6 получаем, что g('fV2f, ’fV2fV3f) ^£(2f> 2fV3f). причем равенство выполняется тогда и только тогда, когда, c(2f, Z) =c(IfV2f, Z), т. е. c(*f, Z)=c(2f, I) или c(3f, Z)sc(2f, Z) для всех Ze [0,1]. Следовательно, g(>f, irv3f)<g(if, ’fv'n+get 2tv3f), (b.6) 510
причем равенство выполняется тогда и только тогда, когда 2f<fV3f и, кроме того, с(Ч, Z)sc(2f, I) или с(3f, I) sc (2f, I) при всех Ze[0,1]. Те же рассуждения можно повторить, поменяв функции Ч и 3f местами. В результате получаем неравенство g (3f, *fV3f) (3f, 3fV2f) +g (2t 2fV!f), (B.7) причем равенство выполняется при тех же условиях, что и равен- ство (В.6). Непосредственно из неравенств (В.6) и (В.7) следует утверждение а). Повторив рассуждения для утверждения а), сра- зу получаем утверждение б), что и требовалось доказать. Лемма 8. Пусть для любых Ч, 2feZF. Тогда выпол- няется неравенство g(’f, 'fv2f)+^(2f, 4v2f)C£(4A2f, ‘f)+g(’Wt 2f), (B.8) причем равенство выполняется тогда и только тогда, когда с(Ч, Z)sc(2f, Z) или с(Ч, Z3c(2f, Z) при всех Ze [О,1]. Доказательство. Предположим, что 4V2fs^” и 3f=’f/\2f. Тог- да *f\/2f=4 и, очевидно, g(4, 4\/2f) =0. Следовательно, g('fA2f, 4)=g(f3, Ч) =g(3f, 4V3f)+g(4, 4Vf3) = G(4,3f). Аналогично 2fV3f=2f, g(2f, 2f\/3f)=0, откуда g(4A2f, 2f)=g(3f, 2f)=g43f, 2fV3f)+^(2f, 2fV3f) = G(3f, 2f). Теперь ясно, что g(4, A2t ’f)+g('fA2f, 2f)=G(43, f)4-G(3f, 2f). Поскольку G(4,2f)=g(4, 4V2f)+g(2f, 4V2f), Из леммы 7 сразу следует неравенство (В.8), а также то, что ра- венство в (В.8) выполняется тогда и только тогда, когда 3f^4\/2f (т. е. 4A2f^4V2f, что всегда верно) и с(Ч, Z)c=c(3f, Z)=c(4A2f, Z) = c(4, ОПс(2Г, Z), или c(2f, Z)<=c (3f, Z)=c(4A2f, Z)=C(4, I) nc(2f, Z), t. e. c(4, Z)sc(2f, I), или c(2f, Z)=c(4, Z) при всех Ze [0,1], что и требовалось доказать. Интересно отметить, что если с(Ч, Z)=c(2f, Z) или c(2f, Z)s Sc(4, Z) при всех Ze[0,1], то 4A2fe^” всегда. Действительно, с(Ч, Z)=c(2f, Z) или c(2f, Z)ec(4, Z), c(4A2f, 1)=с(Ч, 1) Ac(2f, 1) и равно с(Ч, или c(2f, 1)^0, Следовательно, c(4A2f, 1)#= ¥=0, т. е. ЧАЧе^. 511
Теперь можно сформулировать основные результаты этого раз- дела в виде двух теорем. Но сначала с целью упрощения как фор- мулировок, так и доказательств введем некоторые удобные обозна- чения. Пусть <Dn={(fi-M (h, fa) ••• (f„_I,f„)|VteN„)((f(,fi+I)eW-1)}, где Nn={l, 2, ..., n} для любого n^N обозначает множество всех путей из п элементов множестваZ?" (распределениевозможностей), элементы которого (f(, fi+!) упорядочены, т. е. f^fi+i или fi^f^i, и пусть O=U®n- Для удобства элементы каждого пути множества Ф будем назы- вать узлами пути. Назовем функцию е: Ф-^Х#", такую, что е(ф) — (fb fn) для любого пути <р= (fb f2) (f2, fa). • • (fn-ь fn), идентификатором ребра. Очевидно, что функция е единственна и многозначна; для данного пути <реФ функция е определяет его ребра (первый и последний узлы). Для заданной траектории ф= (fb f2) (f2, f3) ... (fn_b У£Ф обозначим N (ф) последовательность узлов пути, т. е. М(ф) = = (f 1 > fa> • • •, fn) и назовем функцию ZX П~I £(<P)=S /=1 длиной пути. Очевидно, что для любых ’f, выполняется G('f, 2f)=£((p*), где ф.= (if, ifV2f) ('fV2f, 2f)ee-I('f, 2f). Теорема 6. a) min (£(ф) = О(’Т, 2f), где фее-!(’Т, 2f); б) если d — метрическое расстояние в множестве ST, основанное на функ- ции §•, то d(‘f, 2f)^G(‘f, 2f) при любых ’f, 2fe^". Доказательство, а) Пусть ’f, Рассмотрим произвольный путь ф, такой, что ф = е ] (’f, 2f) и 2У(ф)= (fb f2, ..., fn), т. е. *f=ft И 2f=fn. Пусть на ф определено следующее множество: Mp={fi|te{2, 3.....П—1}, или ff-i^f,^f,+i и fi— l^fiT^fi+l}" Предположим, что zV<F={hI, h2, ..., hm), где hft=f,A и ik<ik+\ при k^Nm. Случай I. Предположим, что УФ=0. Тогда либо ’f=fi^f2^... • • -^fn=2f, либо ]f=fi^f2. .^fn=2f. Вследствие аддитивности функции g (замечание 2), а также функции g получаем, что £(ф)=£('^ 2f)- Поскольку либо ’f^2f, либо ’f^2f, то соответственно либо !f\/2f=2f, либо 3f\/2f=1f. 512
Следовательно, £(!f, 2f)=g('f, >fV2f)+g(2f. ,fV2f) = G(If. 2f). t. e. £(<P) = G(If, 2f). Случай II. Предположим, что Nv=£0. Пусть h0='f, hm+]=2f и <p'=(h0, M (h„ h2) ... (hm, twOee-'ff, 2П^Ф- Тогда из аддитивности функции g следует, что £(ф)=£(ф')- 1. Предположим, что ho^h] и hm^hm+I. Тогда т нечетное и при любом k^Nm hft_I^hfe^hfe+I, если k нечетное; hft_1 ^hft^hfc+i, если k четное. Следовательно, при k=2j(j=0, 1, (m-}-l)/2) hft\/h/f+2^hft+! и по лемме 4 получаем O==Sg(hft, hfeVhft+2)sCg(hft, hft+1), 0==Sg(hft+2, ИД/Ьн-г) =^£(hft+2, hft+i). Поэтому g(<p) = g(<p') = g g(hb hft+1)^ S G(h2>,K7-+), Л=1 /=0 и, поскольку по лемме 7 ( и—0/2 S G(h^, hy+a)^=G(h0, hm+1), /=о получаем g’(<p)^G(h0, hm+I)=G(*f, 2f). 2. Предположим сначала, что h0^hi и hm^hm+1. Тогда ho^hi^h2 и, следовательно, hi^h0/\h2. По лемме 4 g(hi, h0) +g(hi, h2)^g(h0/\h2, ho)+g(ho/\h2, h2), а по лемме 8 ^(ЬоДЬг, h0)+g(h0/\h2, h2)^g(ho, ho\/h2) (h2, hoV^)- Следовательно, g(hi, h0)+g(hb h2)>g(h0, hoVh2)+g(h2, h0\/h2). Поэтому для <p"=(h0, h0\/h2) (h0Vh2, h2)(h2, h3)...(hm, (*f, 2f) получаем, что £(q/)Преобразуя функцию ср" так же, как и функцию ф, получаем: ф'"=(Ь0, hoVM (h0\/h2, h3)(h3, h4) ... (hm, hm+1)er<(>f, 2f) 33—6923 513
и g(q>")=g(q"'). Таким образом ^(ф) =gf(<₽") 525 g (<₽")= ^ (<₽"')• Пусть = (ho, hj, .... h„). Тогда ho<h,' и K_i>hm- Предположим теперь, что h0=S^ h] и hm^hm+i. Используя тот же подход, что и в предыдущем случае, ф можно преобразовать в ф'ее-1 (!f, 2f) так, что £(ф)^£(ф'), и h'^hh, и h1m>h’m, где ^(ф‘) = (h0, hb ..., h'm). В третьем случае, т. е. при hQ>h! и hm^hm+i, можно сначала преобразовать ф в ф'", а затем применить к ф'" те же преобразо- вания, что и к ф при получении ф1. В результате получаем ф2ее-'(1Г, 2f), причем g(<p)>g (<p'")>g'(<р2) и //o<hi , hm_i>h^_b где ЛГ(фа) = = (h§, h?..h2.,). Следовательно, во всех трех случаях мы можем преобразовать Ф в ф3ее-1 (Ч, 2f) так, что g (ф) > g (ф3) и h30 < h?, h? > h?+1, где N (ф3)= (hg, h?.h?+1). Используя теперь результаты п. 1, получаем: £(ф)>£(ф3)>О(Ч, 2П- Из случая I и случая II следует, что £(ф)>С(«Л 7) (В.9) при любом фее-1(Ч, 2f). Поскольку G (И, Ч)=£(ф*), где ф* = = (Ч, 4V2f) (4V2t 2f)se-1 (Ч, 2f), из неравенства (В.9) следует, что ти1£(ф) = 0(Ч, 2f), где оператор min применяется ко всем элементам ф=е-1(Ч, 2f) б) Предположим, что Ч, 2f&^. Поскольку d удовлетворяет не- равенству треугольника (определение 10), то d(4, 2f)^d(4, !fV2f)-WfV2t 2П- Так как (Ч, 4V2f)e/?, (4V2f, 2f)s/?-> и получаем d(4, 4V2f)=g(4, 4V2f), d(4V2f, 2f)=£(4V2f, 2f) =g(2f, 4V2f). Следовательно, ^(’f> 2П^(Ч, 4V2f)+g(2f, 4V2f) = G(4, 2f), что и требовалось доказать. 514
Теорема 7. Функция G (введенная в лемме 7) является метри- ческим расстоянием в множестве основанном на информацион- ной близости (определение 10). Доказательство. Надо показать, что функция G удовлетворяет требованиям dl—d4 из определения 10. dl) G (Ч, Ч) (Ч, 4V2f) +g(2t IfV2f) =0 Ч—>g(’f, 'fV2f)=0 и g(4, ]fv2f)=o Ч—>>f=>f\/2f H2f = 'fV2f (по лемме 3) «4=4; d2) G (4,2f) = G (2f, !f) — это очевидно; d3) следует из леммы 7; d4) при (Ч, 4)ePU#-1, либо Ч^Ч; либо Ч^Ч и, таким обра- зом, либо G(4, 4)=g(4, Ч), либо G(4, 4)=g(4, Ч) соответствен- но. Следовательно, G(4, Ч)=£(Ч, Ч), что и требовалось доказать. ПРИЛОЖЕНИЕ Г. РЕШЕТКИ УТОЧНЕНИЯ Помещенные в этом приложении три таблицы содержат полное описание решеток уточнения (5F//, и (Ф/i, при п=3, 4, 5, а также характеристику классов /-эквивалентности в этих ре- шетках. Каждый класс /-эквивалентности G-структур представлен в таблицах одной определенной G-структурой, являющейся пред- ставителем соответствующего класса i-эквивалентности. Эти пред- ставители обозначены в шестой колонке каждой из таблиц под- множествами Nn (п=3, 4, 5), разделенными косыми чертами. Остальные колонки в таблицах имеют следующий смысл: g — идентификатор классов i-эквивалентности G-структур; 1(g) — степень уточнения (класс /-эквивалентности) G-структур функ- ции g-, с — идентификатор С-структур; / — идентификатор, с по- мощью которого выделяются классы i-эквивалентности в каждом классе r-эквивалентности (классы i-эквивалентности Р-структур размещены в конце каждого класса /-эквивалентности); 1(c) — степень уточнения идентификатора С-структур; — число раз- личных G-структур в каждом классе /-эквивалентности; s(g) — множество классов /-эквивалентности, являющихся непосред- ственными преемниками класса /-эквивалентности, обозначен- ного g-, #$(g) —множество чисел, непосредственных преемников класса /-эквивалентности g, по одному для каждого из классов i-эквивалентности в s(g): отдельные классы /-эквива- лентности в каждом множестве s(g) перечислены (в терминах их идентификаторов) вместе с соответствующими числами в множе- стве #$(£) в виде пар, разделенных косыми чертами; пары в круг- лых скобках — пары преемников из отличного от упомянутой G-структуры g класса /-эквивалентности. 33* 515
Таблица Г.1. Решетки (G3/i, и (^э/i, 0 Ke) c J 1(c) Подсистемы #0 s(0)/#«(0) 1 1 1 1 1 123 I 2/1 2 2 2 12/13/23 1 .(3/3) 3 3 2 1 2 12/23 3 (4/2) 4 4 3 1 3 12/3 3 (5/D 5 5 4 I 4 .1/2/3 1 Нет Таблица Г.2. Решетки (G4/i, и ('8’4/1, ^=) 0 '(0) c J 1(c) Подсистемы #0 s(0)/#s(0) 1 1 1 1 1 1234 1 2/1 2 2 2 123/124/134/234 1 3/4 3 3 3 123/124/134 4 4/3- 4 4 4 123/124/34 6 5/2 (7/1) 5 5 5 123/14/24/34 4 6/1 (8/3) 6 6 6 12/13/14/23/24/34 1 9/6 7 5 2 1 2 123/124 6 8/2 8 6 2 123/14/24 12 9/1 (Ю/2) 9 7 3 12/13/14/23/24 6 (H/412/1) 10 7 3 1 3 123/14 12 11/1(13/1) 11 8 2 12/13/14/23 12 (14/1 15/1 16/2) 12 8 4 1 3 13/14/23/24 3 (16/4) 13 8 5 1 4 123/4 4 14/1 14 9 2 12/13/23/4 4 (17/3) 15 9 6 1 4 12/13/14 4 (17/3) 16 9 7 1 4 13/14/23 12 (17/2 18/1) 17 10 8 1 5 13/14/2 12 (19/2) 18 10 9 1 5 14/23 3 (19/2) 19 11 10 1 6 14/2/3 6 (20/1) 20 12 11 1 7 1/2/3/4 1 Нет Обозначим #$ (g, g') число непосредственных преемников каж- дой общей структуры класса i-эквивалентности g в классе i-экви- валентности g' и пусть #p(g', g) —число непосредственных пред- шественников любой общей структуры класса i-эквивалентности g' в классе i-эквивалентности g. Тогда очевидно, *£•#*(£. g') = #g'-#P(g', g)- Следовательно, #P(g', g) = #g-s(g, g') (Г.1) 516
Таблица Г.З. Решетки (Gs/i, и sg) в Кв) С‘ i 1(c) Подсистемы #0 1 1 1 1 1 12345 1 2/1 2 2 2 1234/1235/1245/1345/2345 1 3/4 3 3 3 1235/1245/1345/2345 5 4/4 4 4 4 123/1245/1345/2345 10 5/1 6/4 J 5 5 1245/1345/2345 10 7/3 6 5 6 123/124/125/1345/2345 10 7/3 8/2 7 6 7 124/125/1345/2345 30 9/2 10/2 8 6 8 123/124/125/134/135/145/2345 5 10/6 1I/I 9 7 9 125/1345/2345 30 12/1 13/2 10 7 10 124/125/134/135/145/2345 30 12/4 14/1 15/1 11 7 11 123/124/125/134/135/145/234/ 235/245/345 1 15/10 12 8 12 12/1345/2345 10 16/2 (55/1) В 8 13 125/134/135/145/2345 60 16/1 17/1 18/2 19/1 14 8 14 124/125/134/135/2345 15 18/4 20/1 15 8 15 124/125/134/135/145/234/235/ 245/345 10 19/6 20/3 16 9 16 12/134/135/145/2345 20 21/3 22/1 (56/2) 17 9 17 125/135/145/2345 20 21/3 23/1 18 9 18 125/134/145/2345 60 21/2 24/1 25/1 19 9 19 125/134/135/145/234/235/245/345 30 22/1 23/2 25/4 26/1 20 9 20 124/125/134/135/234/235/245/345 15 25/4 26/4 21 10 21 12/135/145/2345 60 27/2 28/1 (57/1) 22 10 22 12/134/135/145/234/235/245/345 10 28/6 29,1 23 10 23 125/135/145/234/235/245/345 20 28/3 30/1 31,3 24 10 24 125/134/2345 15 27/2 32/1 25 го 25 125/134/145/234/235/245/345 60 28/2 31/2 32/1 33/2 26 10 26 125/134/I35/145/234/235/245 30 29/1 31/2 33/4 27 11 27 12/13/145/2345 30 34/1 35/1 (59/2) 28 11 28 12/135/145/234/235/245/345 60 35/2 36/1 37/2 38/1 (60/1) 29 11 29 12/134/135/145/234/235/245 10 38/6 (60/1) 30 II 30 125/135/145/235/245/345 5 36/6 31 11 31 125/135/145/234/245/345 60 36/1 38/3 39/2 32 11 32 125/134/234/235/245/345 15 35/2 39/4 33 11 33 125/134/145/234/235/345 60 37/1 38/2 39/2 40,1 34 12 34 12/13/14/15/2345 5 41,1 (63/4) 35 12 35 12/13/145/234/235/245/345 30 41,1 42/2 43/2 (62,2) 36 12 36 12/135/145/235/245/345 30 42/4 44/1 (65/1) 37 12 37 12/135/145/234/245/345 60 42/2 43/2 45,1 (66/1) 38 12 38 12/135/145/234/235/245 60 43/2 44,1 45/2 (64,1) 39 12 39 125/135/145/234/345 60 42/1 43,1 45,2 46,1 40 12 40 125/134/145/234/235 12 45/5 41 13 41 12/13/14/15/234/235/245/345 5 47/4 (69,4) 42 13 42 12,13/145/235/245/345 60 47,1 48/1 49,2 (68/2) 43 13 43 12/13/145/234/235/345 60 47,1 49.2 50 1 (67,1 70,1) 44 13 44 12/135,145/235/245/34 15 49/4 (71,2) 45 13 45 12/135,145/234/245 60 49,2 50,2 (72,1) 46 13 46 125,135/145/234 10 48,1 50 3 . 47 14 47 12/13/14,15/235/245/345 20 51/3 (74,1 77/3) 48 14 48 12/13,145/23/245,345 10 51,3 (76 3) S17
ПРИЛОЖЕНИЕ Д. КЛАССЫ СТРУКТУР, СВЯЗАННЫЕ С АНАЛИЗОМ РЕКОНСТРУИРУЕМОСТИ Термин структура используется в анализе реконструируемости (АР) для семейств подмножеств заданного множества перемен- ных, например множества V. При п переменных существует 22 структур этого вида. На схеме рис. Д.1 показаны различные спе- циальные классы структур. Стрелками на диаграмме показано отношение подмножеств между классами. К отдельному классу структур, в определенной степени связан- ными с АР, относятся структуры, удовлетворяющие требованию неизбыточности. В этой книге они называются расширенные общие структуры или О+-структуры. Другой специальный класс структур известен как гиперграфы. Гиперграф — это семейство подмножеств множества V, покрывающее все элементы этого множества (т. е. удовлетворяющее условию покрытия) и не содержащее пустого множества. К отдельному классу гиперграфов относятся G-струк- туры, представляющие гипотезы реконструкции в АР. Они удовле- творяют условию покрытия и неизбыточности. 518
Пять классов G-структур, показанных на рис. Д.1, основаны на неориентированных и рефлексивных графах (симметричных и реф- лексивных отношениях), определенных на множества V. Р-струк- туры и С-структуры рассмотрены в разд. 4.7. P-структура состоит из всевозможных пар (V{, Vj) различных переменных (£'¥=/), что соответствует ребрам соответствующего графа и всем одиночным неизбыточным переменным. G-структура состоит только из макси- мально совместимых классов (клик) соответствующего графа. При п переменных их в точности 2п(п-1)/2. М-структуры также состоят из максимально совместимых клас- сов соответствующего графа, но (в отличие от С-структур) не требуется, чтобы они содержали все классы. Следовательно, класс Л4-структур шире, чем класс С-структур. 1-структуры состоят из несократимых покрытий соответствующего графа максимально совместимыми классами. С-структуры и /-структуры частично перекрываются, но не являются подмножествами друг друга. Ациклические структуры определены как структуры, не содер- жащие циклов следующего вида: пусть Eke Ek,> •••’ ^km — последовательность элементов данной структуры (последова- тельность подмножеств множества V), такая, что Eki A^f+1^0 и в этом случае данная последовательность является цик- лом тогда и только тогда, когда существует переменная vx^V, такая, что vx GzEk, vx^Ekm и ^G/^при t=/=l, m. Ацикличе- ские структуры образуют особый класс С-структур так же, как и особый класс /-структур.
СПИСОК ЛИТЕРАТУРЫ 1. Ackoff, R. L., Systems, organizations and interdisciplinary research. General Systems Yearbook, vol. 5, I960, pp. 1-8. 2. Ackoff, R. L., The Art of Problem Solving. Wiley-Interscience, New York, 1978. 3. Aczel, J., Lectures on Functional Equations and Their Applications. Academic Press, New York, 1966. 4. Aczel, J., and Z. Daroczy, On Measures of Information and Their Characterizations. Academic Press, New York, 1975. 5. Aczel, J., B. Forte, and С. T. Ng, Why the Shannon and Hartley entropies are “natural.” Advances in Applied Probability, 6, 1974, pp. 131-146. 6. Albin, P. S., Calculation of a complexity parameter for graphs. PAIS-79, 1979, pp. 575-583. 7. Alexander, C., Notes on the Synthesis of Form. Harvard University Press, Cambridge, Massachusetts, 1964. 8. Allen, T. F. H., and T. B. Starr, Hierarchy. University of Chicago Press, Chicago, 1982. 9. AUsopp, B., A Modern Theory of Architecture. Routledge & Kegan Paul, Boston, 1977. 10. Amdahl, G. M., G. A. Blaanw, and F. P. Brooks, Architecture of the IBM System/360. IBM Journal of Research and Development, 8, No. 2. 1964. • 11. Amoroso, S., Maps preserving the uniformity of neighborhood interconnection patterns in tessellation structures. Information and Control, 25, 1974, pp. 1-9. 12. Amoroso, S., and G. Cooper, Tessellation structures for reproduction of arbitrary patterns. Journal of Computer and Systems Sciences, 5, 1971, pp. 455-464. *13. Arblb, M. A., Automatic theory and control theory: A rapprochement. Automatica, 3, 1966, pp. 161-189. 14. Arbib, M. A., and E. G. Manes, Arrows, Structures, and Functors: The Categorical Imperative. Academic Press, New York, 1975. 15. Arbib, M. A., J. L. Rhodes, and B. R. Tils, Complexity and group complexity of finite- state machines and finite semi-groups. In: Algebraic Theory of Machines, Languages, and Semi-groups, edited by M. A. Arbib, Academic Press, New York, 1968, pp. 127- 145. * 16. Ashby, W. R., Design for a Brain. Wiley, New York, 1952. ★ 17. Ashby, W. R., An Introduction to Cybernetics. Wiley, New York, 1956. 18. Ashby, W. R., Requisite variety and its implications for the control of complex systems. Cybemetica, 1, 1958, pp. 83-99. 19. Ashby, W. R., Constraint analysis of many dimensional relations, General Systems Yearbook, 9, 1964, pp. 99-105. 20. Ashby, W. R., Measuring the internal informational exchange in a system. Cybemetica, 1, No. 1, 1965, pp. 5-22. 520
21. Ashby, W. R., Mathematical models and computer analysis of the function of the central nervous system. Annual Review of Physiology, 28, 1966, pp. 89-106. 22. Ashby, W. R., Some consequences of Bremermann’s limit for information-processing systems. In: Cybernetic Problems in Bionics, edited by H. Oestreicher and D. Moore, Gordon and Breach, New York, 1968, pp. 69-76. 23. Ashby, W. R., Two tables of identities governing information flows within large systems. ASC Communications, 1, No. 2, 1969, pp. 3-8. 24. Ashby, W. R., Analysis of the system to be modeled. In: The Process ofModel-Building, edited by R. M. Stogdill, Ohio Univ. Press, Columbus, 1970, pp. 94-114. 25. Ashby, W. R., Information flows within co-ordinated systems. In: Progress in Cybernetics, Vol. 1, edited by J. Rose, Gordon and Breach, London, 1970, pp. 57-4Л, 26. Ashby, W. R., Systems and their informational measures. In: Trends in General Systems Theory, edited by G. J. Kiir, Wiley-Interscience, New York, 1972, pp. 78-97. 27. Ashby, W. R., Some peculiarities of complex systems. Cybernetic Medicine, 9, No. 2, 1973, pp. 1-7. 28. Atkin, R. H., Mathematical Structure in Human Affairs. Heinemann, London, 1974 29. Aulin, A., The Cybernetic Laws of Social Progress. Pergamon Press, New Y ork, 1982. 30. Anlin-Ahmavaara, A. Y., The law of requisite hierarchy. Kybernetes, 8,1979, pp. 259— 266. 31. Bahm, A. J., Wholes and parts. The Southwestern Journal of Philosophy, 3, 1972, pp. 17-22. 32. Balakrishnan, A. V., On the state space theory of linear systems. Journal of Mathematical Analysis and Applications, 14, No. 3, 1966, pp. 371-391. 33. Barto, A. G., Discrete and continuous models. International Journal of General Systems, 4, No. 3, 1978, pp. 163-177. 34. Bateson, G., Mind and Nature. Dutton, New York, 1979. 35. Bell, D., The Coming of Post-Industrial Society. Basic Books, New York, 1973. * 36. Belhnann, R., Dynamic Programming. Princeton Univ. Press, Princeton, New Jersey, 1957. ★ 37. Bellmann, R., Adaptive Control Processes: A Guided Tour. Princeton Univ. Press, Princeton, New Jersey, 1972. 38. Bellmann, R., and С. P. Smith, Simulation in Human Systems: Decision-Making in Psychotherapy. Wiley-Interscience, New York, 1973. 39. Berge, C., Graphs and Hypergraphs. North-Holland/American Elsevier, Amsterdam and New York, 1973. 40. Bertalanffy, L. von, Zu einer allgemeinen Systemlehre. Blatter fiir Deutsche Philosophic, 18, Nos. 3 and 4, 1945. 41. Bertalanffy, L. von, An outline of general systems theory. British Journal of the Philosophy of Science, 1, 1950, pp. 134-164. 42. Bertalanffy, L. von, General Systems Theory. Braziller, New York, 1968. 43. Bishop, Y. M. M,, S. E. Fienberg, and P. W. Holland, Discrete Multivariate Analysis. MIT Press, Cambridge, Massachusetts 1975. • 44 Blaanw, G. A., von, Computer architecture. Elektronische Rechenanlagen, 14, No. 4, 1972, pp. 154-159. S21
45. Ыаск, M., Caveats and Critiques (Chapter II, Induction and Experience). Cornell Univ. Press, Ithaca, New York, 1975. 46. Blauberg, 1. V., V. N. Sadovsky, and E. G. Yudin, Systems Theory: Phihsophical and Methodological Problems. Progress, Moscow, 1977. 47. Booth, T. L., Sequential Machines and Automata Theory. Wiley, New York, 1967. 43. Bounding, K. L., General systems theory—The skeleton of science. Management Science, 2, 1956, pp. 197-208. (Reprinted in General Systems Yearbook, 1, 1956, pp. 11-17.) 49. Bremennann, H. J., Optimization through evolution and recombination. In: Self- Organising Systems, edited by M. C. Yovits and S. Cameron, Spartan, Washington, D.C., 1962, pp. 93-106. 50. Brememann, H. J., Quantifiable aspects of goal-seeking self-organizing systems. In Progress in Theoretical Biology, edited by M. Snell, Academic Press, New York, 1967. pp. 59-77. 51. Broekstra, G., Constraint analysis and structure identification. Annals of Systems Research, I: 5, 1976, pp. 67-80; II: 6, 1977, pp. 1-20. 52. Broekstra, G., On the representation and identification of structure systems. International Journal of Systems Science, 9, No. 11, 1978, pp. 1271-1293. 53. Broekstra, G., C-analysis of C-structures. International Journal of General Systems, 7, No. 1, 1981, pp. 33-61. 54. Brooks, F. P., Architectural philosophy. In: Planning a Computer System, edited by W. Buchholz, McGraw-Hill, New York, 1962, pp. 5-16. 55/ Brown, D. T., A note on approximations to discrete probability distributions. Information and Control, 2, No. 4, 1959, pp. 386-392. 5б£ Brown, F. M., Equational logic. IEEE Transactions on Computers, C-23, No. 12,1974, pp. 1228-1237. 57. Brown, G. S., Probability and Scientific Inference. Longmans, Green and Co., London, 1957. 58. Buckley, W. (ed.), Modern Systems Research for the Behavioral Scientist. Aldine, Chicago, 1968. 59,'Bmge, M., The GST challenge to the classical philosophies of science. International Journal of General Systems, 4, No. 1, 1977, pp. 29-37. ★60. Casti, J. L., Connectivity, Complexity and Catastrophe in Large-Scale Systems. Wiley- Interscience, New York and London, 1979. 6) Cavallo, R. E. (ed.), Systems Research Movement: Characteristics, Accomplishments, and Current Developments. Special Issue of General Systems Bulletin, 9, No. 3, 1979. 62., Cavallo, R. E., The Role of Systems Methodology in Social Science Research. Martinus Nijhoflf, Boston, 1979. 63. Cavallo, R. E., and G. J. Kiir, A conceptual foundation for systems problem solving. International Journal of Systems Science, 9, No. 2, 1978, pp. 219-236. 64.; Cavallo, R. E., and G. Kiir, Reconstructability analysis of multi-dimensional: ' relations: A theoretical basis for computer-aided determination of acceptable systems models. International Journal of General Systems, 5, No. 3, 1979, pp. 143-171. 651 Cavallo, R. E., and G. J. Kiir, Reconstructability analysis: Evaluation of reconstruc- tion hypotheses. International Journal of General Systems, 7, No. 1, 1981, pp. 7-32. 522
66, Cavallo, R, E., and G. J. Kiir, Decision making in reconstructability analysis. International Journal of General Systems, 8, No. 4, 1982, pp. 243-255. 67. Cavallo, R. E., and G. J. Kiir, Reconstructability analysis: Overview and bibliography. - International Journal of General Systems, 7, No. 1, 1981, pp. 1-6. 68. Cavallo, R. E;, and G. J. Kiir, Reconstruction of possibilistic behavior systems. Fuzzy Sets and Systems, 8, No. 2, 1982, pp. 175-197. 69. Ceny, E., and M. A. Marin, A computer algorithm for the synthesis of memoryless logic circuits. IEEE Transactions on Computers, C-23, No. 5,"1974, pp. 455-465. 70. Cerny, E., and M. A. Marin, An approach to unified methodology of combinational switching circuits. IEEE Transactions on Computers, C-26, No. 8, 1977, pp. 745-756. 71. Chaffin, G., On the length of programs for computing finite binary sequences. ACM Journal, 16, 1969, pp. 145-159. 72. Chaitin, G., Information-theoretic computation complexity. IEEE Transactions on Information Theory, IT-20, No. 1, 1974, pp. 10-15. 73. Chang, A. I. T., The Tao of Architecture. Princeton Univ. Press, Princeton, New Jersey, 1956. 74. Checkland, P., Systems Thinking, Systems Practice, Wiley, New York, 1981. 75. Christensen, R., Entropy Minimax Sourcebook. Vol. I.: General Description. Entropy, Lincoln, Massachusetts, 1981. 76. Christensen, R., Entropy Minimax Sourcebook. Vol. II.: Philosophical Origins. Entropy, Lincoln, Massachusetts, 1980. 77. Christensen, R., Entropy Minimax Sourcebook. Vol. III.: Computer Implementation. Entropy, Lincoln, Massachusetts, 1980. 78. Christensen, R., Entropy Minimax Sourcebook. Vol. IV.:. Applications. Entropy, Lincoln, Massachusetts, 1981. 79. Christensen, R., Foundations of Inductive Reasoning. Entropy, Lincoln, Massachusetts. 1980. 80. Church, A., An unsolvable problem of elementary number theory. American Journal of Mathematics, 58, 1936, pp. 345-363. Si. Churchman, C. W., The Design of Inquiring Systems. Basic Books, New York, 1971. 82. Churchman, C. W., The Systems Approach and Its Enemies. Basic Books, New York, 1979. 83. Comstock, F. L„ and H. J. J., Uyttenhove, A systems approach to grading of flight simulator students. Journal of Aircraft, 16, No. 11, 1979, pp. 780-786. 84. Conant, R. C., Information Transfer in Complex Systems, With Applications to Regulation. Technical Report No. 13, Biological Computer Laboratory, University of Illinois, Urbana, Illinois, January 1968. 85. Conant, R. C., The information transfer required in regulatory processes. IEEE Transactions on Systems Science and Cybernetics, SSC-5, No. 4, 1969, pp. 334-338. 86. Conant, R. C., Laws of information which govern systems. IEEE Transactions on Systems, Man, and Cybernetics, SMC-6, No. 4, 1976, pp. 240-255. 87. Conant, R. C., Structural modelling using a simple information measure. International Journal of Systems Science, II, No. 6, 1980, pp. 721-730. 88. Conant, R. C., Detection and analysis of dependency structures. International Journal of General Systems, 7, No. 1,. 1981, pp..81 -91. 523
89. Conant, R. C., Set-theoretic structure modelling. International Journal of General Systems, 7, No. 1, 1981, pp. 93-107. 90. Conant, R. C., (ed.) Mechanisms of Intelligence: Ross Ashby’s Writings on Cybernetics. Intersystems, Seaside, California, 1981. 91. Conant, R. C., and W. Ross Ashby, Every good regulator of a system must be a model of that system. International Journal of Systems Science, 1, No. 2, 1970, pp. 89-97. 92. Cook, S. A., The complexity of theorem-proving procedures. Proc. 3rd Ann. ACM Symp. on Theory of Computing, 1971, pp. 151-158. 93. Cornacchio, J. V., Maximum-entropy complexity measures. International Journal of General Systems, 3, No. 4, 1977, pp. 215-225. 94. Cornacchio, J. V., System complexity—A bibliography. International Journal of General Systems, 3, No. 4, 1977, pp. 267-271. 95. Davis, M., Computability and Unsolvability. McGraw-Hill, New York, 1958. 96. De Znrko, E. R., Origins of Functionalist Theory. Columbia University Press, 1957. 97. Distefano, J. J. and W. Stubberud, Feedback and Control Systems. Schaum, New York, 1967. 98. Dnbois, D., and H. Prade, Fuzzy Sets and Systems: Theory and Applications. Academic Press, New York, 1980. 99. Dnbois, D., and H. Prade, A class of fuzzy measures based on triangular norms: A general framework for the combination of uncertain information. International Journal of General Systems, 8, No. 1, 1982. A-10 0. Dnbois, D., and H. Prade, Unfair coins and necessity measures: Towards a possibilistic interpretation of histograms. Fuzzy Sets and Systems, 10, No. 1, 1983, pp. 15-20. 101. Dussauchoy, R. L., Generalized information theory and decomposability of systems. International Journal of General Systems, 9, No. 1. 1982, pp. 13-36. 102. Ellis, B., Basic Concepts of Measurement. Cambridge Univ. Press, Cambridge, 1968. 103. Feinstein, A., Foundations of Information Theory. McGraw-Hill, New York, 1958. 104. Ferdinand, A. E., Quality in programming. IBM Technical Report 21.485, Kingston, New York, June 1972. 105. Ferdinand, A. E., A theory of system complexity. International Journal of General Systems', 1, No. 1, 1974, pp. 19-33. 106. Fienberg, S. E., The Analysis of Cross-Classified Categorical Data. MIT Press, Cambridge, Massachusetts, 1977. 107. Fine, T. L., Theories of Probability: An Examination of Foundations. Academic Press, New York, 1973. 108. Flagle, C. D., W. H. Huggins, and R. H. Roy, (eds.), Operations Research and Systems Engineering. The John Hopkins Press, Baltimore, 1960. 109. Foerster, H. von, Observing Systems. Intersystems, Seaside, California, 1983. *110. Forrester, J. W., Industrial Dynamics. MIT Press, Cambridge, Massachusetts, 1961. *111. Forrester, J. W., World Dynamics. Wright-Allen, Cambridge, Massachusetts, 1971. 112. Forte, B., Why Shannon entropy. Symposia Mathematica, XV, Academic Press, New York, 1975, pp. 137-152. 524
113. Gaines, В. R., Axioms for adaptive behavior. International Journal of Man-Machine Studies, 4, 1972, pp. 169-199. 114. Gaines, B. R., Systems identification, approximation and complexity. International Journal of General Systems, 3, No. 3, 1977, pp. 145-174. 115. Gaines, B. R., Progress in general systems research. In: Applied General Systems Research, edited by G. J. Kiir, Plenum Press, New York, 1978, pp. 3-28. 116. Gaines, B. R., General Systems research: Quo vadis? General Systems Yearbook, 24, 1979, pp. 1-9. 117. Gallopin, G. C., The abstract concept of environment. International Journal of General Systems, 7, No. 2, pp. 139-149. 118. Gardner, M. R., and W. R. Ashby, Connectance of large dynamic (cybernetic) systems: Critical values of stability. Nature, 228, 1970, p. 784. *119- Garey, M. R., and D. S. Johnson, Computers and Intractability. A Guide to theTheory of N P-Completeness. W. H. Freeman, San Francisco, 1979. 120. Ganse, D4 and G. M. Weinberg, Are Your Lights On? Winthrop, Cambridge, Massachusetts, 1982. 121. Gelfand, A. E., and С. C. Walker, The distribution of cycle lengths in a class of abstract systems. International Journal of General Systems, 4, No. 1, 1977, pp. 39-45. 122. George, L., Tests for system complexity. International Journal of General Systems, 3, No. 4, 1977, pp. 253-258. 123. Gerardy, R4 Probabilistic finite state system identification. International Journal of General Systems, 8, No. 4, 1982, pp. 229-242. 124. Gerardy, R., Experiments with some methods for the identification of finite-state systems. International Journal of General Systems, 9, No. 4, 1983, pp. 197-203. 125. Gershuny, J., After Industrial Society? Humanities, Atlantic Highlands, NJ., 1978. 126. Givone, D. D., M. E. Liebier, and R. P. Roesser, A method of solution of multiple- valued logic expressions. IEEE Transactions on Computers, C-20, No. 4, 1971, pp. 464-467. 127. Goguen, J. A., and F. J. Varela, Systems and distinctions: Duality and complemen- tarity. International Journal of General Systems, 5, No. 1, 1979, pp. 31-43. 128. Goldblatt, R., Topoi: The Categorical Analysis of Logic. North-Holland, Amsterdam, 1979. 129. Goodman, L. A., Analyzing Qualitative/Categorical Data. Abt, Cambridge, Massachusetts, 1978. 130. Gottinger, H. W., Complexity and information technology in dynamic systems. Kybernetes, 4, 1975, pp. 129-141. 131. Greenspan, D., Discrete Models. Addison-Wesley, Reading, Massachusetts, 1973. 132. Greenspan, D., An arithmetic, particle theory of fluid mechanics. Computer Methods in Applied Mechanics and Engineering, 3, 1974, pp. 293-303. 133. Greenspan, D., A completely arithmetic formulation of classical and special relativistic physics. International Journal of General Systems, 4, No. 2, 1978, pp. 105-112. 134. Greenspan, D., Discrete modeling in microcosm and in the macrocosm. International Journal of General Systems, 6, No. 1, 1980, pp. 25-45. 135. Greenspan, D., Arithmetic Applied Mathematics. Pergamon Press, Oxford, 1980. 525
* 136. Gropius, W., Scope of Total Architecture. Harper & Row, New York, 1943. 137. Guiasu, S., Information Theory with Applications. McGraw-Hill, New York, 1977. 138. Guida, G., D. MaodrioK and M. Somalvico, An integrated model of problem solver. Information Sciences, 13, No. 1, 1977, pp. 11-33. ★139. Gukbman, A. A., Introduction to the Theory of SindHarity. Academic Press, New York, 1965. 140. Gusev, L. A., and A. A. Ta), The possibilities of constructing algorithms for the abstract synthesis of sequential machines using the questionnaire language. Automation and Remote Control, 6, No. 3, 1965, pp. 507-514. 141. Hai, A., and G. J. Kiir, An empirical investigation Of reconstructability analysis. International Journal of Man-Machine Studies, 22, 1985. ★ 142. Hajek, P., and T. Havranek, Mechanizing Hypothesis Formation. Springer-Verlag, New York, 1978. 143. Hahne, A., R. P. Hamalainen, and O. Ristaniemi (eds.\ Topics in SystemsTheory. Acta Polytechnics Scandinavica, Mathematics and Computer Science Series No. 31, Helsinki, 1979. 144. Hamilton, W. L., Reproduction in tessellation structures. Journal of Computer and System Science, 10, No. 2, 1975, pp. 248-225. 145. Hammer, P. C, (ed.), Advances in Mathematical Systems Theory. Pennsylvania State Univ. Press, University Park, Pennsylvania, 1969. *146. Hanken, A. F. G., arid H. A. Renver, Social Systems and Learning Systems. Martinus Nijhoff, Boston, 1981. 147. Happ, H. H. (ed.\ Gabriel Kron and System Theory. Union College Press, Schenectady, New York, 1973. ★148. Harary, F., Graph Theory. Addison-Wesley. Reading, Massachusetts, 1969. 149. Hartley, R. V. L., Transmirsion of information. The Bell System Technical Journal, 7, 1928, pp. 535-563. 150. Hartmanis, J., Feasible Computations and Provable Complexity Properties. SIAM, Philadelphia, 1978. 151. Hartnett, W. E. (ed.), Systems: Approaches, Theories, Applications. Reidel, Boston, 1977. 152. Hayes, P., Trends in artificial intelligence. International Journal of Man-Machine Systems, 10, No. 3, 1978, pp. 295-299. * 153. Heise, D. R., Causal Analysis. Wiley-In terscience, New York, 1975. 154. Herman,' G. T., and G. Rosenberg (eds.), Developmental Systems and Languages. North-Holland, Amsterdam, 1975. 155. Herrlkh, H., and G. E. Strecker, Category Theory. Allyn and Bacon, Boston, 1973. 156*.Higashi, M., A systems modelling methodology: probabilistic and possibilistic approaches. Ph.D. dissertation, School of Advanced Technology, SUNY-Binghamton, 1983. 157» Higashi, M., and G. J. Kiir, Measures of uncertainty and information based On possibility distributions. International Journal of General Systems, 9, No. 1, 1983, pp. 43-58. 526
158. Higashi, M., and G. J. Kiir, On the notion of distance representing information . closeness: Possibility and probability distributions. International Journal of General Systems, 9, No. 2, 1983, pp. 103-115. 859. Higashi, M., G. J. Kiir, and M. Ptttareili, Reconstruction families of possibilistic structure systems. Fuzzy Sets and Systems, 11, No. 3, 1983. 160. Himmelbiau, D. M. (ed.), Decomposition of Large-Scale Problems. North-Holland, Amsterdam, 1973. 161. Hisdsd, E., Conditional possibilities, independence and noninteraction. Fuzzy Sets and Systems, 1, No. 4, 1978, pp. 283-297. 162. Holland, J. H., Adaptation in Natural and Artificial Systems. University of Michigan Press, Ann Arbor, 1975. ★ 163. Hsu, J. C., and A. U. Meyer, Modern Control Principles and Applications. McGraw- Hill, New York, 1968. 164. Ingham, H. S., Uscretus Calculus. Philosophical Library, New York, 1964. 165. Jaynes, E. T., Prior probabilities. IEEE Transactions on Systems Science and Cybernetics, SSC-4, No. 3, 1968, pp. 227-241. _ 166. Jaynes, E. T., Where do we stand on maximum entropy? In: The Maximum Entropy Formalism, edited by R. L. Levine and M. Tribus, MIT Press, Cambridge, Massachusetts, 1979, pp. 15-118. 167. Jones, B., Determination of reconstruction families. International Journal of General Systems, 8, No. 4, 1982, pp. 225-228. 168. Kapur, J. N., On maximum-entropy complexity measures. International Journal of General Systems, 9, No. 2, 1983, pp. 95-102. 169. Karp, R. M., Reducibility among combinatorial problems. In: Complexity of Computer Computations, edited by R. E. Miller and J. W. Thatcher, Plenum Press, New York, 1972, pp. 85-103. 170. Katz, M. B., Questions of Uniqueness and Resolution in Reconstruction from Projections. Springer-Verlag, New York, 1978. 171. Kauffman, S. A., Metabolic stability and epigenesis in randomly constructed genetic sets. Journtd of Theoretical Biology, 22, 1969, pp. 437-467. 172. Kellerman, E., A formula for logical cost. IEEE Transactions on Computers, E-17, No. 9, 1968„pp. 881-884. 173. Kemeny, J. G., A Philosopher Looks at Science. D. Van Nostrand, Princeton, New Jersey, 1959. Kemeny, J. G., Man and the Computer. Charles Scribner’s Sons, New York, 1972. 175. Khinchin, A. Iw Mathematical Foundations of Information Theory. Dover, New York, 1957. 176. Kleene, S. C., General recursive functions of natural numbers. Mathematische Annalen, II, 1936, pp. 727-742 177. Kiir, G. J., The general system as a methodological tool. General Systems Yearbook, 10, 1965, pp. 29-42. 178. Kiir, G. J., An Approach to General Systems Theory. Van Nostrand Reinhold, New York. 1969. 179. Kiir, G. J. jedj, Trends.in General Systems Theory. Wiley-Jnterscience, New. York, 197Z 527
180. Kiir, G. J4 Introduction to the Methodology of Switching Circuits. Van Nostrand ' Reinhold, New York, 1972 181. Kiir, G. J4 A study of organizations of self-organizing systems; Proceedings of the Sixth International Congress on Cybernetics, Namur (Belgium), 1972, pp. 165—186. 182,-Kiir, G. J4 Identification of generative structures in empirical data. International Journal of General Systems, 3, No. 2,1976, p. 89-104. 183. Kiir, G. J4 The general systems research movement. In: Systems Models for Decision Making, edited by N. Sharif and P. Adulbhan, Asian Institute of Technology, Bangkok,1978, pp. 25-70. 184. Kiir, G. J. (ed.), Applied General Systems Research. Plenum Press, New York, 1978. 185. Kiir, G. Architecture of structure systems: A basis for the reconstructability analysis. Acta Polytechnica Scandinavica, Mathematics and Computer Science Series, No. 31, Helsinki, 1979, pp. 33-43. 186. Kiir, G. J., General systems problem solving methodology. In: Modelling and Simulation Methodology, edited by B. Zeigler, M. S. Elzas, G. J. Kiir, and T. I. Oren, North-Holland, Amsterdam, 1979, pp, 3-28. 187. Kiir, G. J4 Computer-aided systems modelling. In: Theoretical Systems Ecology, edited by E. Halfon, Academic Press, New York, 1979, pp. 291-323. 188. Kiir, G. J4 On systems methodology and inductive reasoning: The issue of parts and - wholes. General Systems Yearbook, 26, 1981, pp. 29-38. 18 9., Kiir, G. J., and H. J. J. Uyttenhove, Computerized methodology for structure -modelling. Annals of Systems Research, 5, 1976, pp. 29-66. 190. Kiir, G. J4 and H. J. J. Uyttenhove, On the problem of computer-aided structure identification: Some experimental observations and resulting guidelines. International Journal of Man-Machine Studies, 9, No. 5, 1977, pp. 593-628. 191. Kiir, G. J., and H. J. J. Uyttenhove, Procedures for generating reconstruction hypotheses in the reconstructability analysis. International Journal of General Systems, 5, No. 4, 1979, pp. 231-246. 192. Kiir, G. J., and M. Valacb, Cybernetic Modelling. IllifTe, London, 1967. 193. Koestler, A., The Ghost in the Machine. Macmillan, New York, 1967. 194. Koestler, A., and J. R. Sinythies (eds.), Beyond Reductionism. Hutchinson, London, 1969. '*195. Kolmogorov, A. N., Foundations of theTheory of Probability. Chelsea, New York, 1950. * 196. Kolmogorov, A., Three approaches to quantitative definition of information. Problems of Information Transmission, 1, No. l, 1965, pp. 1-7. 197. Krantz, D. H., R. D. Luce, P. Snppes, and A. Tversky, Foundations of measurement, ' Vol. I: Additive and Polynomial Representations. Academic Press, New York, 1971. 198. Krippendorff, K., An algorithm for identifying structural models Of multivariable data. International Journal of General Systems, 7, No. 1, 1981, pp. 63-79. 199., Krohn, D., R. Langer, and J. Rhodes, Algebraic principles for the analysis of biochemical systems; Journal of Computer and Systems Science, 1, No. 2, 1967, pp. 119-136. 200. Krohn, К. B., and J. L. Rhodes, Algebraic theory of machines. In: MathematicalTheory . of Automata, edited by J. Fox, Polytechnic Press, Brooklyn, New York, 1963, pp. 341-384. S9S
201. Krohn, К. В., and J. L. Rhodes, Complexity of finite semigroups. Annals if Mathematics, 88, 1968, pp. 128-160. *202. Kullback, S., Information Theory and Statistics. John Wiley, New York, 1959. • (Reprinted by Dover, New York, 1968.) 2O3. 'Lange, O., Wioles and Parts. Pergamon Press, Oxford, 1965. 204. Langhaar, H. L., Dimensional Analysis and Theory of Models. John Wiley, New York, 1964. 205. Lasker, G. E. (ed.) Applied Systems and Cybernetics, (six volumes). Pergamon Press, New York, 1981. 206. Laszlo, E. (ed.), The Relevance of General Systems Theory. Braziller, New York, 1972. 207. Lerner, D. (ed.), Parts and Wholes. Free Press, New York, 1963. 208. Lewis,- P. M. II, Approximating probability distributions to reduce storage require- ments. Information and Control, 2, No. 3, 1959, pp. 214-225. 209. Lilienfeld, Robert, The Rise of Systems Theory': An Ideological Analysis. Wiley- Interscience, New York, 1978. 210. Lindenmayer, A., Mathematical models for cellular interactions in development. Journal of Theoretical Biology, 18, 1968, pp. 280-315. 211. Lindenmayer, A., Developmental systems without cellular interactions, their languages and grammars. Journal of Theoretical Biology, 30, 1971, pp. 455-484. 212. Lindenmayer, A., Developmental algorithms for multicellular organisms: A survey of L-systems. Journal of Theoretical Biology, 54, 1975, pp, 3-22. 213. Lindenmayer, A., Developmental algorithms: Lineage versus interactive control mechanisms. In: Developmental Order: Its Origin and Regulation, edited by S. Subtelny and P. B. Green, Alan R. Liss, New York 1982, pp. 219-245. 214. Lindenmayer, A., and G. Rozenberg (eds.), Automata, Languages, Development..North- Holland, Amsterdam, 1976. 215. Lofgren, L., Complexity of descriptions of systems: a foundational study. International Journal of General Systems, 3,No. 4,1977, pp. 197-214. 216. Lofgren, L., Some foundational views on general systems and the Hempel paradox. International Journal of General Systems, 4, No. 4, 1978, pp. 243-253. 217. Loveiand, D. W., A variant of the Kolmogorov concept of complexity. Information and Control, 15, 1969, pp. 510-526. 218. Lucadou, W., von, and K. Kornwachs, The problem of rqductionism from a system theoretical4 viewpoint. Zeitschrift fur Allgemeine Wissenschaftstheorie, 1983, pp. 338-349. 219. Maciejowski, J. M., The Modelling of Systems with Small Observation Sets. Springer- Verlag, New York, 1978. 220. Madden, R. F., and W. R. Ashby, On the identification of many-dimensional relations. International Journal of Systems Science, 3, No. 4, 1972, pp. 343-356. 221. Makridakis, S., and C. Faucbenx, Stability properties of general systems. General Systems Yearbook, 18, 1973, ,pp. 3-12. ★ 222. Markov, A. A., The Theory of Algorithms. National Science Foundation, Washington, D. C., 1961. (Russian original published in 1954.) 223. ' Martin-Lof, P., The definition of random sequences. Information and Control, 9,1966, pp. 602-619. КОЛ
224. Matteesich, R., Instrumental Reasoning and Systems Methodology: An Epistemology of the Applied and Social Sciences. Reidel, Boston, 1978. 225. Mesarovic, M. D. (ed.), Views on General Systems Theory. Wiley, New York, 1964. ★ 226. Mesarovic, M. D., D. Macko, and Y. Takahara, Theory of Hierarchical Multilevel Systems. Academic Press, New York, 1970. ★ 227. Mesarovic, M. D., and Y. Takahara, General Systems Theory: Mathematical Foundations. Academic Press, New York, 1975. 228. Mihram, D., and G. A. Mihram, Human knowledge: The role of models, metaphors, and analogy. International Journal of General Systems, 1, No. 1, 1974, pp. 41-60. 229. Morris, C., Foundations of the Theory of Signs (two volumes). University of Chicago Press, Chicago, 1938. 230. Morris, C., Signs, Language, and Behavior. Prentice-Hall, New York, 1946. 231. Morris, C., Signification and Significance. MIT Press, Cambridge, Massachusetts, 1964. 232. Moshowitz, A., Entropy and the complexity of graphs. Bulletin of Mathematical Biophysics, 30, Nos. 1 and 2, 1968, pp. 175-204, 225-240. 233. Naisbitt, J., Megatrends. Warner Books, New York, 1982. 234. Naylor, A. W., On decomposition theory: Generalized dependence. IEEE Transactions on Systems, Man, and Cybernetics, SMC-U, No. 10, 1981, pp. 699-713. 235. Negoita, С. V., Fuzzy Systems. Abacus, Tunbridge Wells (U. K.), 1981. 236. Negoita, С. V., and D. A. Ralescu, Applications of Fuzzy Sets to Systems Analysis. Birkhauser, Basel and Stuttgart, 1975. 237. Newell, A., and H. A. Simon, Human Problem Solving. Prentice-Hall, Englewood Cliffs, New Jersey, 1972. 238. Nguyen, H. T., On conditional possibility distributions. Fuzzy Sets and Systems, 1, No. 4, 1978, pp. 299-309. 239. Norgerg-Schulz, C., Intentions in Architecture. MIT Press, Cambridge, Massachusetts, 1965. 240. Oren, T. I., В. P. Zeigler, and M. S. Elzas (eds.), Simulation and Model-Based Methodologies. Springer-Verlag, New York, 1983. 241. Ostraad, T. J., Pattern reproduction in tessellation automata in arbitrary dimensions. Journal of Computer and System Science, 5, 1971, pp. 623-628. 242. Padulo, L., and M. A. Arbib, System Theory. W. B. Saunders, Philadelphia, 1974. 243. Pask, G., Conversation Theory: Applications in Education and Epistemology. Elsevier, Amsterdam and New York, 1976. 244. Pattee, H. H. (ed.), HierarchyTheory.The Challenge of Complex Systems. Braziller, New York, 1973. 245. Patten, В. C., Systems approach to the concept of environment. Ohio Journal of Science, 78, No. 4, 1978, pp. 206-222. 246. Pearl, J., On the connection between the complexity and credibility of inferred models. International Journal of General Systems, 4, No. 4, 1978, p. 255-264. ★ 247. Pfanzagl, J., Theory of Measurement. Wiley, New York, 1968. 248. Phillips, D. C., HolisticThought in Social Science. Stanford University Press, Stanford, California, 1976. 249. Pippenger, N., Complexity theory. Scientific American, 238, No. 6,1978, pp. 114-124. 530
★ 250. Poincare, H., Science and Hypothesis. Dover, New York, 1952. 251. Polya, G., Kombinatorische Anzahlbestimmungen ftir Gruppen, Graphen und Chemische Verbindungen. Acta Mathematica, 68, 1937, pp. 145-254. 252. Polya, L., An empirical investigation of the relations between structure and behavior for nonlinear second-order systems. Ph.D. dissertation, School of Advanced Technology, SUNY-Binghamton, 1981. 253. Porter, B., Requisite variety in the systems and control sciences. International Journal of General Systems, 2, No. 4, 1976, pp. 225-229. 254. Post, E. L., Finite combinatory processes—Formulation. The Journal of Symbolic Logic, 1, 1936, pp. ,103-105. 255. Puri, M. L., and D. Ralescu, A possibility measure is not a fuzzy measure. Fuzzy Sets and Systems. 1, No. 3, 1982, pp. 311-313. 256. Rapoport, A., et al.. Response Models for Detection of Change. Reidel, Boston, 1979. 257. Renyi, A., Probability Theory. North-Holland, Amsterdam, 1970 (Appendix: Introduction to information theory, pp. 540-616). 258. Rescher, N., Scientific Explanation. Free Press, New York, 1970. 259. Rescher, N., and R. Brandom, The Logic of Inconsistency. Blackwell, Oxford, 1980. 260. Rescher, N., The Primacy of Practice. Blackwell, Oxford, 1973. 261. Rescher, N., The Coherence Theory of Truth. Oxford Univ. Press, Oxford, 1973. 262. Rescher, N., Plausible Reasoning. Van Gorcum, Amsterdam, 1976. 273. Rescher, N., Methodological Pragmatism: Systems-Theoretic Approach to theTheory of Knowledge. New York Univ. Press, New York, 1977. 264. Rescher, N., Scientific Progress. Blackwell, Oxford, 1978. 265. Rescher, N., Cognitive Systematization: A Systems-Theoretic Approach to a Coherent' Theory of Knowledge. Blackwell, Oxford, 1979. 266. Rescher, N., Induction. Blackwell, Oxford, 1980. 267. Rescher, N., and R. Manor, On inference from inconsistent premisses. Theory and Decision, 1, No. 2, 1970, pp. 179-217. 268. Reza, F. M., An Introduction to Information Theory. McGraw-Hill, New York, 1961. 269. Robertshaw, J. E., S. J. Mecca, and M. N. Rerick, Problem Solving: A Systems Approach. McGraw-Hill, New York, 1979. ★ 270. Rogers, H., Theory of Recursive Functions and Effective Computability. McGraw-Hill, New York, 1967. 271. Roosen-Runge, P. H., Toward a theory of parts and wholes: An algebraic approach. General Systems Yearbook, 11, 1966, pp. 13-18. 272. Rosen, R., Dynamical System Theory in Biology, Wiley-Interscience, New York, 1970. 273. Rosen, R., Complexity as a system property. International Journal of General Systems, 3, No. 4, 1977, pp. 227-232. 274. Rosen, R., Fundamentals of Measurement and Representation of Natural Systems. North-Holland, New York, 1978. 275. Rosen, R., Old trends and new trends in general systems research. International Journal of General Systems, 5, No. 3, 1979, pp. 173-184. 276. Rosen, R., Anticipatory Systems. Pergamon Press, Oxford, 1985. 531
277. Rozenberg, G. and A. Salomaa (eds.), L. Systems. Springer Verlag, New York, 1974. 278. Rnbiustein, M. F., Patterns of Problem Solving. Prentice-Hall, Englewood Cliffs, New Jersey, 1975. 279. Sage, A. P., Optimum Systems Control. Prentice-Hall, Englewood Cliffs, New Jersey, 1968. /80. Saacedo, R., and E. E. Schiring, Introduction to Continuous and Digital Control Systems. Macmillan, New York, 1968. 281. Shackle, G. L. S., Decision, Order and Time in Human Affairs. Cambridge Univ. Press, Cambridge, 1969. 282. Shafer, G., A MathematicalTheory of Evidence. Princeton Univ. Press, Princeton, New Jersey 1976. 283. Shannon, С. E., A mathematical theory of communication. Bell System Technical Journal, 27, July and October 1948, pp. 379-423, 623-656. ★ 284. Shannon, С. E., and W. Weaver, The Mathematical Theory of Communication. University of Illinois Press, Urbana, 1964. 285. Shore, J. E., and R. W. Johnson, Axiomatic derivation of the principle of maximum entropy and the principle of minimum cross-entropy. IEEE Transactions on I (formation ‘ Theory, ГГ-26, No. 1, 1980, pp. 26-37. 286. Simon, H. A., The architecture of complexity. Proceedings ofthe American Philosophical Society, 106, 1962, pp. 467-482. (Reprinted in the Sciences of the Artificial, MIT Press, Cambridge, Massachusetts, 1969.) 287. Simon, H. A., Complexity and the representation of patterned sequences of symbols. Psychological Reviews, 79, 1972, pp. 369-382. 288. Simon, H. A., Does scientific discovery have a logic? Philosophy of Science, 40, Dec. 1973, pp. 441-480. 289. Simon,H. A., How complex are complex systems? In: PSA 1976, Volume 2, edited by F. Suppe and P. D. Asquith, Philosophy of Science Association, East Lansing, Michigan, 1977, pp. 507-522. 290. Simon, H. A., Models of Discovery. Reidel, Boston, 1977. 291. Skoglnnd, V., Similitude: Theory and Applications. International Textbook Co., Scranton. Pennsylvania, 1967. 292. Sloane, N. J. A., A Handbook of Integer Sequences. Academic Press, New York, 1973, p. 64. 293. Sloman, A., The Computer Revolution in Philosophy. The Harvester Press, Hassocks (U.K.), 1978. 294. Smnts, J. C., Holism and Evolution. Macmillan, London, 1926. 295. Sowa, J. F., Conceptual Structures: Information Processing in Mind and Machine. Addison-Wesley, Reading, Massachusetts, 1984. 296. Spriet, J. A4 and G. C. Vansteenkiste, Computer-Aided Modelling and Simulation. Academic Press, New York, 1982. 297. Streeter, D. N., The Scientific Process and the Computer. Wiley-Interscience, New York, 1974. 298. Sogeno, M4 Fuzzy measures and fuzzy integrals: A survey. In: Fuzzy Automata and Decision Processes, edited by M. M. Gupta, G. N. Saridis, and B. R. Gaines, North- Holland, Amsterdam and New York, 1977, pp. 89-102. 532
299. Suppes, P., Models of data. In: Logic, Methodology and Philosophy of Science, edited'by E. Nagel et al., Stanford Univ. Press, Stanford, 1962, pp. 252-261. 300. Sappes, P., Some remarks about complexity. In: PSA 1976, Volume 2, edited by F. Suppe and P. D. Asquith, Philosophy of Science Assoc., East Lansing, Michigan, 1977, pp. 543-547. 301. Svoboda, A., Synthesis of logical systems of given activity. IEEE Transactions on Electronic Computers, EC-12, 1963, No. 6, pp. 904-910. 302. Svoboda, A., Behaviour classification in digital systems. Information Processing Machines, 10, Czechoslovak Academy of Sciences Press, Prague, 1964, pp. 25-42. 303. Svoboda, A., A model of the instinct of self-preservation (in French). Information Processing Machines, Academia, Prague, 1^)60, pp. 147-155. 304. Svoboda, A., and D. E. White, Advanced Logical Circuit Design Techniques. Garland STPM Press, New York, 1979. 305. Szucz, E., Similitude and Modelling. Elsevier, Amsterdam, 1980. 306. Takahara, Y., and B. Nakao, A characterization of interactions. International Journal of General Systems, 7, No. 2, 1981, pp. 109-122. 307. Tai, A. A., Questionnaire language and the abstract synthesis of minimal sequential machines. Automation and Remote Control, 25, No. 6, 1964, pp. 846-859. 308. Tai, A. A., The abstract synthesis of sequential machines from the answers to questions of the first kind in the questionnaire language. Automation and Remote Control, 26, 4, 1965, pp. 675-680. 309. Teller, E., The Pursuit of Simplicity. Pepperdine University Press, Malibu, California, 1980. 310. Torgenson, W. S., Theory and Methods of Scaling. Wiley, New York, 1958. 311. Towner, G., The Architecture of Knowledge. University Press of America, Washington, D. C„ 1980. 312. Tranoy, К. E., Wholes and Structures. Munksgaard, Copenhagen, 1959. 313. Trappl, R. (ed.), Cybernetics: Theory and Applications. Hemisphere, Washington, D. C, 1983. * 314. Tsypkin, Y. Z., Adaptation and Learning in Automatic Systems. Academic Press, New York, 1971. 315. Tnring, A. M., On computable numbers, with an application to the Entscheidungs problem. Proceedings of the London Mathematical Society, Series 2, 1936, 42, pp. 230-265, 43, pp. 544-546. 316. Uyttenhove, H. J., Computer-aided systems modelling: An assemblage of meth- odological tools for systems problem solving. Ph.D. dissertation, School of Advanced Technology, SUNY-Binghamton, 1978. 317. Uyttenhove, H. J., SAPS (Systems Approach Problem Solver): An Introduction and Guide. Computing and Systems Consultants, Binghamton, New York, 1981. 318. Uyttenhove, H. J., Systems approach problem solver and the open heart surgery patient. In: Cybernetics and Systems Research, edited by R. Trappl, North-Holland, Amsterdam, 1982, pp. 655-661. 319. * Valdes-Perez, R. E., and R. C. Conant, Information loss^due to data quantization in reconstructability analysis. International Journal of General Systems, 9, No. 4, 1983. 533
320. Van Emden, M. H4 An Analysis of Complexity. Mathematical Centre, Amsterdam, .1971. 321. Van Gigch, J. P., Applied General Systems Theory. Harper & Row, New York, 1974. 322. Varela, F. J., Principles of Biological Autonomy. North-Holland, New York, 1979. 323. Varela, F. J., H. R. Maturana, and R. B. Uribe, Autopoiesis: The organization of living systems, its characterization and a model. Biosystems, 5, No. 4, 1974, pp. 187-196. ★ 324. Vitruvius Polio, M., Ten Books on Architecture. Dover, New York. 325. Walker, C. C., Behavior of a class of complex systems: The effect of system size on properties of terminal cycles. Journal of Cybernetics, 1, No. 4, 1971, pp. 55-67. 326. Walker, С. C., and W. R. Ashby, On temporal characteristics of behavior in certain complex systems. Kybernetik, 3, No. 2, 1966, pp. 100-108. 327. Wanser, J. C., Systems modelling of an archaelogical site. General Systems Workshop Project, Department of Systems Science, SUNY-Binghamton, 1980. 328. Warfield, J. N., Societal Systems. Wiley-Interscience, New York, 1976. 329. Wartofsky, M. W., Models. Reidel, Boston, 1979. 330. Watanabe, S., Knowing and Guessing. Wiley, New York, 1969. 331. Watanabe, S., Pattern recognition as a quest for minimum entropy. Pattern Recognition, 13, No. 5, 1981, pp. 381-387. 332. Weaver, W., Science and complexity. American Scientist, 36, 1968, pp. 536-544. 333. Wedde, H., (ed.) Adequate Modelling of Systems. SpringCr-Verlag, Berlin, 1983. 334. Weinberg, G. M., An Introduction to General Systems Thinking. Wiley-Interscience, New York, 1975. 335. Weiss, S. M. and C. A. Knlikowski, A Practical Guide to Designing Expert Systems. Roman and Allerheld, Totowa, New Jersey, 1984. 336. Whitebead, A. N., Science and the Modern World. Free Press, New York, 1967. 337. Whitebead, A. N., Modes of Thought. Free Press, New York, 1968. 338. Whittemore, B. J., and M. C. Yovits, The quantification and analysis of information used in decision processes. Information Sciences, 2, 1974, pp. 171-184. ★ 339. Wiener, N., Cybernetics. M. I. T. Press, Cambridge, Massachusetts, 1948. 340. Wilson, K. A., MISP: A computer simulation of a model for the instinct of self- preservation. SAT Document Series 74/05/07, School of Advanced Technology, SUNY- Binghamton, 1974. 341. Windeknecht, T. G., General Dynamical Processes. Academic Press, New York, 1971. 342. Wymore, A. W., A MdthematicalTheory of Systems Engineering: The Elements. Wiley, New York, 1969. 343. Wymore, A. W., Systems Engineering Methodology for Interdisciplinary Teams. Wiley- Interscience, New York, 1976. 344. Yager, R. R., A foundation for a theory of possibility. Journal of Cybernetics, 10, Nos. 1-3, 1980, pp. 177-204. 345. Yamada, H., Structural and behavioral equivalences of tessellation automata. Information and Control, 18, 1971, pp. 1-31. 346. Yamada, H., and S. Amoroso, Tessellation automata. Information and Control, 14, No. 3, 1969, pp. 299-317. 534
34 7., Yamada, H., and S. Amoroso, A completeness problem for pattern generation in tessellation automata. Journal of Computer and Systems Sciences, 4, No. 2, 1970, pp. 137-176. 348. Yamada, H., and S. Amoroso, A completeness problem for pattern generation in tessellation automata. Irformation and Control, 18, No. 1, 1971, pp. 1-31. 349. Zadeh, L. A., From circuit theory to systems theory. IRE Proceedings, 50, No. 5,1962, pp. 856-865. 350. Zadeh, L. A., On the definition of adaptivity. Proceedings of the IEEE, 51,1963, p. 469, 351. Zadeh, L. A., Fuzzy sets. Information and Control, 8, No. 3, 1965, pp. 338-353. 352. Zadeh, L. A., Outline of a new approach to the analysis of complex systems and decision processes. IEEE Transactions on Systems, Man, and Cybernetics, SMC-I, No. 1. 1973, pp. 28-44. 353. Zadeh, L. A., Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems, 1, No. 1, 1978, pp. 3-28. ★ 354. Zadeh, L.A.,andC.A. Desoer, Linear System Theory. McGraw-Hill, New York, 1963. 355. Zadeh, L. A., and E. Polak (eds.). System Theory. McGraw-Hill, New York, 1969. 356. Zeigler, В. P., A conceptual basis for modelling and simulation. International Journal of General Systems, 1, No. 4, 1974, pp. 213-228. 357. Zeigler, В. P.,Theory of Modelling and Simulation. Wiley-Interscience, New York, 1976. 358. Zeigler, В. P., The hierarchy of system specifications and the problem of structural inference. In: PSA 1976, edited by F. Suppe and P. P. Asquith, Philosophy of Science Association, East Lansing, Michigan, 1976, pp. 227-239. 359. Zeleny, M. (editor), Autopoiesis: A Theory of Living Organization. Elsevier North- Holland, New York, 1981. 360. Zeleny, M., Multiple Criteria Decision Making. McGraw-Hill, New York, 1982. 361. Zemanek, H., Formal definition and generalized architecture. In: Operations Research 1972; edited by M. Ross, North-Holland, Amsterdam, 1973, pp. 59-73. 362. Zemanek, H., Abstract architecture. Paper for the Winter School on Abstract Software Specification, Danish Univ, of Technology, Copenhagen, 1979. СПИСОК РАБОТ, ИМЕЮЩИХСЯ НА РУССКОМ ЯЗЫКЕ 13. Арбиб М. Алгебраическая теория автоматов. — М.: Статистика, 1975. 16. Эшби У. Конструкция мозга. Происхождение адаптивного поведения. — М.: ИЛ, 1962. 17. Эшби У. Р. Введение в кибернетику. — М.: ИЛ, 1959. 36. Веллман Р. Динамическое программирование. — М.: ИЛ, 1960. 37. Веллман Р. Процессу регулирования с адаптацией. — М.: Наука, 1964. 60. Касти Дж. Большие системы: связность, сложность и катастрофы. — М.: Мир, 1982. ПО. Форрестер Дж. Динамика развития города. — М.: Прогресс, 1974. 111. Форрестер Дж. Мировая динамика. — М.: Наука, 1978. 119. Гэри М., Джонсон Д. Вычислительные машины и трудноразрешимые за- дачи. — М.: Мир, 1982. 136. Гропиус В. Границы архитектуры. — М.: Искусство, 1971. 139. Гухман А. Введение в теорию подобия — 2-е изд.—М.: Высшая шко- ла, 1973. 535
142. Гаек П., Гавранек Т. Автоматическое образование гипотез.— М., Наука, 1984. 148. Харрари Ф. Теория графов. — М.: Мир, 1973. 153. Хейс Д. Причинный анализ в статических исследованиях. — М.: Финан- сы и статистика, 1981. 163. Ск> Дж., Мейер А. Современная теория автоматического регулирования и ее применения. — М.: Машиностроение, 1972. 195. Колмогоров А. Н. Основные понятия теории вероятностей.—2-е изд.— М.: Наука, 1974. 196. Колмогоров А. Н. Три подхода к определению понятия «количество ин- формации»// Проблемы передачи информации.— 1965. — Т. 1, № 1. 202. Кульбак С. Теория информации и статистика. — М.: Наука, 1954. 222. Марков А. А. Теория алгоритмов,—М.—Л.: Изд-во АН СССР, 1954. 226. Месарович М. и др. Теория иерархических многоуровневых систем. — М.: Мир, 1973. 227. Месарович М., Такахара Я. Общая теория систем: математиечские осно- вы. — М.: Мир, 1978. 247. Пфанцагль И. Теория измерений — М.: Мир, 1976. 250. Пуанкаре А. Наука и гипотеза// Анри Пуанкаре о науке. — М.: Наука, 1983. 270. Роджерс X. Теория рекурсивных функций и эффективная вычисли- мость.—М.: Мнр, 1972. 284. Шеннон К., Уивер У. Математическая теория связи// Шенион К. Рабо- ты по теории информации и кибернетике. — М.: ИЛ, 1963. 314. Цыпкин Я. Д. Адаптация и обучение в автоматических системах. — М.: Наука, 1968. 324. Витрувий Поллиои, Марк. Десять книг об архитектуре.—М„: Всесоюз. академия архитектуры, 1936. 339. Винер Н. Кибернетика или управление и связь в животном и машине,— Изд. 2-е. — М., Наука, 1983. 354. Заде Л. Теория линейных систем. Метод пространства состояний.—М: Наука, 1970.
ОГЛАВЛЕНИЕ Предисловие к русскому изданию . Предисловие ...•••• Благодарности................... Глава 1. Введение......................................... 1.1. Наука о системах..............................., • 1.2. Решение системных задач . ................. 1.3. Иерархия эпистемологических уровней систем . . . . 1.4. Роль математики . .................................. 1.5. Роль вычислительной техники.......................... 1.6. Архитектура решения системных задач.................. Примечания................................................ 13 13 19 24 28 32 36 41 Глава 2. Исходные системы и системы данных.........................43 2.1. Объекты и системы объектов.....................................43 2.2. Переменные и параметры.........................................49 2.3. Методологические отличия.......................................57 2.4. Дискретное и непрерывное.......................................64 2.5. Представляющие и исходные системы..............................67 2.6. Системы данных.................................................80 Примечания..........................................................94 Упражнения..........................................................95 Глава 3. Порождающие системы.........................................97 3.1. Эмпирическое исследование.......................................97 3.2. Системы с поведением...........................................102 3.3. Методологические отличия.......................................112 3.4. От систем данных к системам с поведением.......................118 3.5. Меры нечеткости................................. . , . . 129 3.6. Поиск подходящих систем с поведением...........................142 3.7. Системы с изменяющимися состояниями........................... 150 3.8. Порождающие системы............................................165 3.9. Упрощение порождающих систем...................................167 3.10. Исследование и проектирование систем..........................178 Примечания..........................................................183 Упражнения..........................................................187 Глава 4. Структурированные системы..................................194 4.1. Целое и части..................................................194 4.2. Системы, подсистемы, суперсистемы..............................199 4.3. Структурированные исходные системы и структурированные системы данных..............................................................204 4.4. Структурированные системы с поведением.........................211 4.5. Задачи проектирования систем...................................223 4.6. Задачи идентификации...........................................230 537
4.7. Задача реконструкции................................... 4.8. Анализ реконструируемости.............................. 4.9. Вычислительные эксперименты............................ 4.10. Индуктивное рассуждение . . ...................... 4.11. Несогласованные структурированные системы............. Примечания.................................................. Упражнения.................................................. Глава 5. Метасистемы........................................ 5.1. Изменение и инвариантность............................. 5.2. Первичные и вторичные характеристики системы - - 5.3. Метасистемы............................................ 5.4. Метасистемы и структурированные системы................ 5.5. Многоуровневые метасистемы............................. 5.6. Идентификация изменения................................ Примечания.................................................. Упражнения.................................................. 246 280 287 296 304 307 311 317 317 321 324 333 336 339 343 344 Глава 6. Сложность.................................................344 6.1. Сложность при решении системных задач.........................344 6.2. Три степени сложности.........................................348 6.3. Меры сложности систем.........................................354 6.4. Предел Бреммерманна...........................................357 6.5. Вычислительная сложность .....................................362 6.6. Сложность в УРСЗ..............................................369 Примечания.........................................................372 Упражнения.........................................................374 Глава 7. Целенаправленные системы...................................374 7.1. Примитивные базовые и дополнителиьые понятия...................374 7.2. Цель и характеристика . . 376 7.3. Целенаправленные системы...................................... 377 7.4. Структурированные системы как парадигмы целенаправленных систем с поведением........................................................382 7.5. Проектирование целенаправленных систем.........................386 7.6. Адаптивные системы.............................................388 7.7. Самовоспроизводящиеся системы..................................397 Примечания..........................................................401 Упражнения..........................................................402 Глава 8. Подобие систем.............................................402 8.1. Подобие......................................................402 8.2. Подобие и модели систем......................................406 8.3. Модели исходных систем.......................................410 8.4. Модели систем данных.........................................413 8.5. Модели порождающих систем....................................417 8.6. Модели структурированных систем..............................427 8.7. Модели метасистем............................................430 Примечания........................................................431 Упражнения........................................................432 Глава 9. УРСЗ: архитектура, применение, эволюции.......................435 9.1. Эпистемологическая иерархия систем: формальное определение . 435 9.2. Методологические отличия (резюме).................................437 9.3. Условия задачи....................................................439 9.4. Системные задачи..................................................440 538
9.5. Концептуальная схема УРСЗ: формальное определение..............446 9.6. Обзор архитектуры УРСЗ.........................................450 9.7. Использование УРСЗ: некоторые примеры..........................454 9.8. Эволюция УРСЗ..................................................480 Примечания..........................................................483 Упражнения..........................................................484 Приложение А. Список обозначений....................................485 Основные обозначения................................................485 Специальные обозначения.............................................486 Приложение Б. Толковый словарь используемых математических тер- минов ..............................................................489 Словарь.............................................................489 Приложение В. Некоторые полезные теоремы..........................492 В.1. Мера неопределенности, основанная на распределениях возможностей 493 В.2. Процедура объединения и несмещенная (с максимальной энтропией) реконструкция для вероятностных систем...........................501 В.З. Процедура объединения и несмещенное (с максимальной неопреде- ленностью) распознавание для возможностных систем .... 502 В.4. Общее информационное расстояние для распределения возможностей 506 Приложение Г. Решетки уточнения............................515 Приложение Д. Классы структур, связанные с анализом реконструи- руемости ...........................................................518 Список литературы..........................................520 Список работ, имеющихся на русском языке...................535
Научное издание КЛИР ДЖОРДЖ СИСТЕМОЛОГИЯ Автоматизация решения системных задач Заведующий редакцией Ю. Г. Ивашов Редакторы Л. Ю. Камочкина, М. Г. Коробочкина Переплет художника Б. И. Николашина Художественный редактор А. С. Широков Технический редактор Т. Н. Зыкина Корректор О. Е. Иваницкая ИБ № 1844 Сдано в набор 17.11.89 Подписано в печать 29.03.90 Формат 60Х88</1« Бумага офсетная №2 Гарнитура литературная Печать высокая Усл. печ. л.33.32 Усл. кр.-отт,33.32 Уч. изд. л. 35,21 Тираж 12600 экз. Изд. № 22518 Зак. № 6923 Цена Зр.80 к. Издательство «Радио и связь». 101000 Москва, Почтамт, а/я 693 Ордена Октябрьской Революции н ордена Трудового Красного Знамени МПО «Первая Образ- цовая типография» Государственного комитета СССР по печати. II3O54. Москва, Валовая, 23.